OpenAI o3-mini: brži, pametniji AI za STEM i programere

Veljače 5, 2025

OpenAI je predstavio o3-mini, najnoviji model u svojoj seriji razmišljanja, dizajniran za pružanje iznimnih performansi u STEM poljima, softverskom inženjerstvu i logičkom rješavanju problema. Ovo izdanje poboljšava AI pristupačnost održavanjem niskih troškova uz poboljšanje brzine i točnosti u usporedbi sa svojim prethodnikom, OpenAI o1-mini.

Nakon što je predstavljen u prosincu 2024., o3-mini je sada službeno dostupan u uslugama Chat i API. Nudi veći kapacitet zaključivanja, što ga čini idealnim za zadatke u znanosti, tehnologiji, inženjerstvu i matematici (STEM). Programeri mogu iskoristiti njegovo pozivanje funkcija, strukturirane izlaze i poruke za programere, osiguravajući veću fleksibilnost i aplikacije spremne za produkciju.

Poboljšane značajke i pristupačnost

Jedno od najočekivanijih ažuriranja s OpenAI o3-mini je njegova podrška za različite razine napora zaključivanja, omogućujući korisnicima da optimiziraju model za brzinu ili složenost na temelju svojih potreba. Ti načini rada uključuju:

  • Nizak napor rasuđivanja: daje prioritet brzini uz minimalne računalne troškove.
  • Srednji napor rasuđivanja: Uravnotežuje točnost i vrijeme odziva.
  • High Reasoning Effort: Maksimalno povećava inteligenciju za složene zadatke.

Za razliku od OpenAI o1-mini, o3-mini uvodi strukturirane mogućnosti pretraživanja, omogućujući korisnicima pristup ažurnim informacijama s relevantnim web izvorima. Osim toga, utrostručuje ograničenja poruka za korisnike Chat Plusa i Teama, s 50 na 150 poruka dnevno, poboljšavajući pristupačnost za česte korisnike.

OpenAI je prvi put korisnicima besplatne verzije u Chatu omogućio model zaključivanja, omogućujući im da iskuse logičko rješavanje problema potpomognuto umjetnom inteligencijom odabirom opcije "Razum" u sastavljaču poruka.

Referentne vrijednosti performansi: nadmašivanje prethodnih modela

OpenAI o3-mini nadmašuje svog prethodnika, o1-mini, u raznim znanstvena i matematička mjerila:

Matematika i kodiranje

  • matematičko obrazloženje: Usklađuje se s OpenAI o1 u točnosti dok nudi brže vrijeme odziva.
  • Matematičko natjecanje (AIME 2024): Nadmašuje o1-mini s velikim naporom rasuđivanja.
  • Codeforces Natjecateljsko programiranje: Postiže više Elo pogađa preko razina napora zaključivanja.
  • Softversko inženjerstvo (SWE-Bench): Nadmašuje prethodne modele, pokazujući najbolje rezultate u razvoju softvera potpomognutog umjetnom inteligencijom.

Napredno znanstveno znanje

  • Znanstvena pitanja na doktorskoj razini (GPQA Diamond): Izvrstan je u biologiji, kemiji i fizici, postižući razine performansi bliske OpenAI o1.
  • Matematika na razini istraživanja (FrontierMath): Kontakt Integracija Python alata, o3-mini uspješno rješava preko 32% problema, Uključujući i 28% najizazovnijih (T3) problema.

Opće znanje i ljudske preferencije

  • Procjene pokazuju a 56% preferencija za o3-mini odgovore u odnosu na o1-mini.
  • Smanjuje velike pogreške za 39%, poboljšavajući pouzdanost na razlcult pitanja iz stvarnog svijeta.

Poboljšanja brzine i učinkovitosti

OpenAI o3-mini daje odgovore 24% brži od o1-mini, Smanjujući prosječno vrijeme odziva od 10.16 sekundi do 7.7 sekundi. U testovima latencije, o3-mini održava a 2,500 ms brže vrijeme do prvog tokena, osiguravajući brže i fluidnije interakcije.

Poboljšanja sigurnosti i etički razvoj umjetne inteligencije

OpenAI ima integrirane tehnike promišljenog usklađivanja kako bi osigurao da o3-mini generira sigurne odgovore usklađene s ljudima. Opsežna testiranja otkrila su da o3-mini značajno nadmašuje GPT-4o u sigurnosnim procjenama, što ga čini jednim od najsnažnijih OpenAI modela u sprječavanju zlouporabe i jailbreak exploita.

Putem vanjskog red-teaminga i sustavnih sigurnosnih procjena, OpenAI nastavlja ublažavati rizike dok optimizira AI inteligenciju. Najnovija kartica sustava pruža uvid u nedopuštene procjene sadržaja i sigurnosne protokole.

Što je sljedeće za OpenAI?

S o3-mini, OpenAI je napravio još jedan značajan korak prema tome da napredno AI razmišljanje učini pristupačnijim i isplativijim. Ovaj model usklađen je s tijeku misije tvrtke da smanji cijene po tokenu uz zadržavanje vrhunskih sposobnosti zaključivanja.

Kako se usvajanje umjetne inteligencije širi, OpenAI ostaje predan pomicanju granica inteligentnih, učinkovitih i sigurnih modela umjetne inteligencije, osiguravajući da tvrtke, programeri i studenti mogu iskoristiti umjetnu inteligenciju za rješavanje problema, inovacije i istraživanje.

Od danas, o3-mini je dostupan za korisnike Chat Plus, Team i Pro, a Enterprise pristup će biti uveden u veljači. API pristup je odobren odabranim programerima u razinama 3-5.

Za one koji žele iskoristiti snagu umjetne inteligencije u STEM i razvoju softvera, OpenAI o3-mini predstavlja uzbudljiv korak naprijed.