OpenAI o1: Wprowadzamy nową erę rozumowania AI

Września 13, 2024

Gigant sztucznej inteligencji przesuwa granice dzięki ulepszonym modelom rozwiązywania problemów

W znaczącym kroku naprzód dla sztucznej inteligencji, OpenAI wprowadziło pierwsze modele w swojej przełomowej serii „o1”. Modele te zostały zaprojektowane tak, aby podnieść sprawność rozumowania AI, umożliwiając im rozwiązywanie złożonych problemów z niespotykaną dotąd wydajnością.

OtwórzAI o1

Nowy paradygmat w rozumowaniu AI

Seria o1 reprezentuje zmianę paradygmatu w rozwoju AI, stawiając na pierwszym miejscu bardziej rozważne, przemyślane podejście do rozwiązywania problemów. Te modele, podobne do ludzkiego poznania, są trenowane, aby „myśleć” przed reakcją, symulując proces udoskonalania myśli, eksplorowania różnych strategii i uczenia się na błędach.

Bezkonkurencyjna wydajność w złożonych domenach

Rygorystyczne testy OpenAI ujawniły niezwykłe możliwości o1. Nadchodząca aktualizacja modelu, obecnie w fazie rozwoju, wykazuje wydajność porównywalną z doktorantami w wymagających zadaniach testowych z zakresu fizyki, chemii i biologii. Ponadto o1 wykazuje wyjątkowe umiejętności w matematyce i kodowaniu. W egzaminie kwalifikacyjnym do Międzynarodowej Olimpiady Matematycznej (IMO) istniejący model GPT-4o osiągnął 13% wskaźnik sukcesu, podczas gdy model o1 uzyskał imponujące 83%. Ponadto umiejętności kodowania o1 zostały ocenione w konkursach kodowania, w których osiągnął 89. percentyl.

Wczesny podgląd z obiecującym potencjałem

Chociaż o1-preview to wczesna wersja, brakuje jej niektórych funkcji, które czynią Chata przyjaznym dla użytkownika, takich jak przeglądanie stron internetowych, przesyłanie plików i przetwarzanie obrazu. W przypadku wielu typowych zadań, GPT-4o pozostaje bardziej wydajnym rozwiązaniem w krótkiej perspektywie.

Niemniej jednak o1 oznacza znaczący postęp w zdolności AI do radzenia sobie ze złożonymi zadaniami rozumowania, zapowiadając nowy poziom możliwości AI. To przełomowe osiągnięcie skłoniło OpenAI do zresetowania licznika modeli, oznaczając tę ​​serię jako „OpenAI o1”.

Bezpieczeństwo jako najważniejsza kwestia

OpenAI wdrożyło nowatorskie podejście do szkolenia w zakresie bezpieczeństwa, które wykorzystuje możliwości rozumowania o1, aby zapewnić przestrzeganie wytycznych dotyczących bezpieczeństwa i dostosowania. Umożliwiając o1 rozumowanie o zasadach bezpieczeństwa kontekstowo, może je stosować skuteczniej.

OpenAI mierzy bezpieczeństwo różnymi metodami, w tym testując, jak dobrze modele opierają się próbom obejścia zasad bezpieczeństwa, znanym jako „jailbreaking”. W jednym z najtrudniejszych testów jailbreakingu GPT-4o uzyskał 22 punkty (w skali od 0 do 100), podczas gdy model o1-preview uzyskał znacznie wyższy wynik, 84.

Wzmocnione środki bezpieczeństwa

Aby uzupełnić ulepszone możliwości tych modeli, OpenAI wzmocniło swoje protokoły bezpieczeństwa, wewnętrzne zarządzanie i współpracę z rządami federalnymi. Środki te obejmują rygorystyczne testy i oceny przy użyciu ich Preparedness Framework, najlepszych w swojej klasie red teaming i procesów przeglądu na poziomie zarządu, w tym nadzoru przez ich Safety & Security Committee.

Współpraca na rzecz bezpieczeństwa AI

OpenAI sformalizowało umowy z amerykańskimi i brytyjskimi instytutami bezpieczeństwa AI, przyznając im wczesny dostęp do wersji badawczej modelu o1. Ten wspólny wysiłek ma na celu ustanowienie solidnego procesu badań, oceny i testowania przyszłych modeli, zarówno przed, jak i po ich publicznym wydaniu.

Zastosowania w różnych dziedzinach

Ulepszone możliwości rozumowania o1 mają ogromny potencjał rozwiązywania złożonych problemów w różnych dziedzinach, w tym w nauce, kodowaniu, matematyce i pokrewnych dziedzinach. Badacze opieki zdrowotnej mogą wykorzystać o1 do adnotacji danych sekwencjonowania komórek, fizycy mogą generować skomplikowane wzory matematyczne dla optyki kwantowej, a deweloperzy ze wszystkich dziedzin mogą konstruować i wykonywać wieloetapowe przepływy pracy.

OpenAI o1-mini: ekonomiczna alternatywa

Seria o1 wyróżnia się dokładnym generowaniem i debugowaniem złożonego kodu. Aby sprostać potrzebom deweloperów poszukujących bardziej wydajnego rozwiązania, OpenAI wydało również o1-mini, szybszy i bardziej przystępny cenowo model rozumowania, który jest szczególnie biegły w zadaniach kodowania. Przy 80% niższym koszcie niż o1-preview, o1-mini oferuje przekonującą opcję dla aplikacji wymagających możliwości rozumowania bez potrzeby rozległej wiedzy o świecie.

Dostępność i dostępność

Użytkownicy Chat Plus i Team mogą od dziś uzyskiwać dostęp do modeli o1 w Chat. Zarówno o1-preview, jak i o1-mini można wybierać ręcznie w selektorze modeli. Początkowo tygodniowe limity wiadomości będą wynosić 30 wiadomości dla o1-preview i 50 dla o1-mini. OpenAI aktywnie pracuje nad zwiększeniem tych limitów i umożliwieniem Chatowi automatycznego wyboru odpowiedniego modelu dla danego komunikatu.

Użytkownicy Chat Enterprise i Edu uzyskają dostęp do obu modeli w przyszłym tygodniu. Programiści, którzy kwalifikują się do poziomu 5 w zakresie użytkowania API, mogą rozpocząć prototypowanie obu modeli w API już dziś, z zastrzeżeniem limitu 20 RPM. OpenAI planuje zwiększyć te limity po dodatkowych testach.

OpenAI ma również zamiar rozszerzyć dostęp o1-mini na wszystkich użytkowników Chat Free.

Przyszły rozwój

To wydanie stanowi wczesną wersję zapoznawczą modeli wnioskowania o1 w Chat i API. OpenAI planuje wprowadzenie przeglądania, przesyłania plików i obrazów oraz innych funkcji, które zwiększą ich użyteczność dla wszystkich użytkowników. Ponadto firma zobowiązała się do ciągłego rozwoju i udostępniania modeli zarówno w serii GPT, jak i OpenAI o1.

Podsumowanie

Wprowadzenie serii o1 przez OpenAI oznacza niezwykły kamień milowy w ewolucji sztucznej inteligencji. Skupiając się na ulepszonych możliwościach rozumowania i stawiając na pierwszym miejscu bezpieczeństwo, OpenAI toruje drogę do przyszłości, w której AI może stawiać czoła coraz bardziej złożonym wyzwaniom i wnosić znaczący wkład w różnorodne dziedziny ludzkich wysiłków.