OpenAI zaprezentowało o3-mini, najnowszy model w swojej serii reasoning, zaprojektowany tak, aby zapewnić wyjątkową wydajność w dziedzinach STEM, inżynierii oprogramowania i logicznego rozwiązywania problemów. Ta wersja zwiększa dostępność AI, utrzymując niskie koszty, a jednocześnie poprawiając szybkość i dokładność w porównaniu do swojego poprzednika, OpenAI o1-mini.
Po premierze w grudniu 2024 roku, o3-mini jest teraz oficjalnie dostępny w usługach czatu i API. Oferuje większą wydajność wnioskowania, dzięki czemu idealnie nadaje się do zadań z zakresu nauk ścisłych, technologii, inżynierii i matematyki (STEM). Programiści mogą wykorzystać jego wywołania funkcji, ustrukturyzowane wyniki i komunikaty programistyczne, co zapewnia większą elastyczność i gotowość aplikacji do produkcji.
Ulepszone funkcje i dostępność
Jedną z najbardziej oczekiwanych aktualizacji OpenAI o3-mini jest obsługa różnych poziomów wysiłku rozumowania, umożliwiająca użytkownikom optymalizację modelu pod kątem szybkości lub złożoności w zależności od ich potrzeb. Te tryby obejmują:
- Niski nakład pracy na rozumowanie: priorytetem jest szybkość przy minimalnym koszcie obliczeniowym.
- Średni wysiłek rozumowania: równoważy dokładność i czas reakcji.
- Wysoki wysiłek rozumowania: maksymalizuje inteligencję w celu wykonywania złożonych zadań.
W przeciwieństwie do OpenAI o1-mini, o3-mini wprowadza ustrukturyzowane funkcje wyszukiwania, umożliwiając użytkownikom dostęp do aktualnych informacji z odpowiednich źródeł internetowych. Dodatkowo, potraja limity wiadomości dla użytkowników Chat Plus i Team, z 50 do 150 wiadomości dziennie, poprawiając dostępność dla osób często korzystających z aplikacji.
Po raz pierwszy OpenAI udostępniło użytkownikom bezpłatnej wersji Chatu model rozumowania, dzięki któremu mogą oni doświadczyć wspomaganego przez sztuczną inteligencję logicznego rozwiązywania problemów poprzez wybranie opcji „Rozumowanie” podczas tworzenia wiadomości.
Testy wydajności: przyćmiewające poprzednie modele
OpenAI o3-mini przewyższa swojego poprzednika, o1-mini, w różnych punkty odniesienia naukowe i matematyczne:
Matematyka i kodowanie
- Rozumowanie matematyczne: Dokładność dorównuje OpenAI o1, oferując jednocześnie szybszy czas reakcji.
- Konkurs matematyczny (AIME 2024): Wykazuje lepsze wyniki niż o1-mini przy dużym nakładzie pracy na rozumowanie.
- Konkurs programowania Codeforces: Osiąga wyższe Wyniki ELO na wszystkich poziomach wysiłku rozumowania.
- Inżynieria oprogramowania (SWE-Bench): Wyprzedza poprzednie modele i osiąga najlepsze wyniki w zakresie tworzenia oprogramowania wspomaganego przez sztuczną inteligencję.
Zaawansowana wiedza naukowa
- Pytania z zakresu nauk ścisłych na poziomie doktoranckim (GPQA Diamond): Wyróżnia się w biologii, chemii i fizyce, osiągając poziom kompetencji zbliżony do OpenAI o1.
- Matematyka na poziomie badawczym (FrontierMath): Niezależnie od tego, czy potrzebujesz kompletnej linii, czy pojedynczego urządzenia, Integracja narzędzi Python, o3-mini rozwiązuje problem pomyślnie ponad 32% problemów, w tym 28% najtrudniejszych problemów (T3).
Wiedza ogólna i preferencje ludzkie
- Oceny pokazują, że 56% preferencje dla odpowiedzi o3-mini nad o1-mini.
- Zmniejsza błędów głównych o 39%, poprawiając niezawodność na difficult pytania z życia wzięte.
Poprawa szybkości i wydajności
OpenAI o3-mini dostarcza odpowiedzi 24% szybszy niż o1-mini, Zmniejszając średni czas reakcji od 10.16 sekundy do 7.7 sekundyW testach opóźnienia o3-mini utrzymuje O 2,500 ms szybszy czas do pierwszego tokena, zapewniając szybsze i płynniejsze interakcje.
Poprawa bezpieczeństwa i etyczny rozwój sztucznej inteligencji
OpenAI zintegrowało techniki deliberative alignment, aby zapewnić, że o3-mini generuje bezpieczne, dostosowane do człowieka odpowiedzi. Obszerne testy wykazały, że o3-mini znacznie przewyższa GPT-4o w ocenach bezpieczeństwa, co czyni go jednym z najsolidniejszych modeli OpenAI w zapobieganiu niewłaściwemu użyciu i exploitom jailbreak.
Dzięki zewnętrznemu red-teamingowi i systematycznym ocenom bezpieczeństwa OpenAI nadal łagodzi ryzyko, optymalizując jednocześnie inteligencję AI. Najnowsza karta systemowa zapewnia wgląd w niedozwolone oceny treści i protokoły bezpieczeństwa.
Co dalej z OpenAI?
Dzięki o3-mini, OpenAI wykonało kolejny znaczący krok w kierunku uczynienia zaawansowanego rozumowania AI bardziej dostępnym i opłacalnym. Ten model jest zgodny z trwającą misją firmy, aby obniżyć cenę za token, jednocześnie utrzymując najwyższej klasy możliwości rozumowania.
Wraz z rozwojem wdrażania sztucznej inteligencji (AI) firma OpenAI niezmiennie dąży do poszerzania granic inteligentnych, wydajnych i bezpiecznych modeli AI, dbając o to, aby przedsiębiorstwa, deweloperzy i studenci mogli wykorzystywać sztuczną inteligencję do rozwiązywania problemów, innowacji i badań.
Od dziś o3-mini jest dostępne dla użytkowników Chat Plus, Team i Pro, a dostęp do wersji Enterprise zostanie wdrożony w lutym. Dostęp do API jest przyznawany wybranym deweloperom w ramach poziomów 3-5.
Dla tych, którzy chcą wykorzystać potencjał sztucznej inteligencji w naukach ścisłych, technologii, inżynierii i matematyce (STEM) i tworzeniu oprogramowania, OpenAI o3-mini stanowi ekscytujący krok naprzód.