OpenAI представила o3-mini, останню модель у своїй серії міркувань, розроблену для забезпечення виняткової продуктивності в областях STEM, розробки програмного забезпечення та вирішення логічних проблем. Цей випуск покращує доступність штучного інтелекту, зберігаючи низькі витрати, підвищуючи швидкість і точність порівняно з його попередником, OpenAI o1-mini.
Після попереднього перегляду в грудні 2024 року, o3-mini тепер офіційно доступний у сервісах Chat та API. Він пропонує вищу здатність до міркувань, що робить його ідеальним для завдань у галузі науки, технологій, інженерії та математики (STEM). Розробники можуть використовувати його виклики функцій, структуровані виводи та повідомлення для розробників, забезпечуючи більшу гнучкість та готовність до роботи застосунків.
Розширені функції та доступність
Одним із найбільш очікуваних оновлень OpenAI o3-mini є підтримка різних рівнів міркування, що дозволяє користувачам оптимізувати швидкість або складність моделі відповідно до своїх потреб. Ці режими включають:
- Низький рівень міркувань: надає пріоритет швидкості з мінімальними обчислювальними витратами.
- Середнє міркування: балансує точність і час відгуку.
- High Reasoning Effort: максимізує інтелект для складних завдань.
На відміну від OpenAI o1-mini, o3-mini пропонує можливості структурованого пошуку, що дозволяє користувачам отримувати доступ до актуальної інформації з відповідних веб-джерел. Крім того, він потроює обмеження на кількість повідомлень для користувачів Chat Plus та Team, з 50 до 150 повідомлень на день, покращуючи доступність для частих користувачів.
OpenAI вперше зробив модель міркувань доступною для користувачів безкоштовного рівня в Chat, дозволяючи їм випробувати логічне вирішення проблем за допомогою штучного інтелекту, вибравши опцію «Міркування» в редакторі повідомлень.
Показники продуктивності: перевершує попередні моделі
OpenAI o3-mini перевершує свого попередника, о1-міні, в різних науково-математичні орієнтири:
Математика та кодування
- Математичні міркування: Збігається з OpenAI o1 за точністю, пропонуючи швидший час відгуку.
- Змагання з математики (AIME 2024): Перевершує o1-mini з високими зусиллями аргументації.
- Конкурсне програмування Codeforces: Досягає вищого Ело забиває між рівнями міркувань.
- Розробка програмного забезпечення (SWE-Bench): Перевершує попередні моделі, демонструючи найкращі результати в розробці програмного забезпечення за допомогою ШІ.
Передові наукові знання
- Наукові запитання рівня PhD (GPQA Diamond): Відмінно володіє біологією, хімією та фізикою, досягаючи рівнів продуктивності, близьких до OpenAI o1.
- Математика дослідницького рівня (FrontierMath): З Інтеграція інструментів Python, o3-mini успішно вирішує понад 32% проблем, У тому числі 28% найскладніших (T3) проблем.
Загальні знання та переваги людини
- Оцінки показують a 56% віддають перевагу відповідям o3-mini над o1-mini.
- Зменшує основні помилки на 39%, підвищення надійності на дифcult питання реального світу.
Покращення швидкості та ефективності
OpenAI o3-mini надає відповіді На 24% швидше, ніж o1-mini, Зниження середній час відповіді від 10.16 секунд до 7.7 секунд. У тестах затримки o3-mini підтримує a На 2,500 мс швидше до першого токена, забезпечуючи швидшу та плавнішу взаємодію.
Підвищення рівня безпеки та етичний розвиток ШІ
OpenAI інтегрував методи обдуманого вирівнювання, щоб гарантувати, що o3-mini генерує безпечні відповіді, узгоджені з людиною. Широке тестування показало, що o3-mini значно перевершує GPT-4o в оцінках безпеки, що робить його однією з найнадійніших моделей OpenAI у запобіганні зловживанням і джейлбрейку.
Завдяки зовнішньому об’єднанню та систематичному оцінюванню безпеки OpenAI продовжує зменшувати ризики, одночасно оптимізуючи інтелект ШІ. Остання системна картка надає інформацію про заборонені оцінки вмісту та протоколи безпеки.
Що далі для OpenAI?
Завдяки o3-mini OpenAI зробив ще один важливий крок до того, щоб зробити розширене мислення ШІ більш доступним і економічно ефективним. Ця модель узгоджується з поточною місією компанії щодо зниження ціни за токен, зберігаючи при цьому можливості аргументації найвищого рівня.
По мірі розширення впровадження штучного інтелекту OpenAI продовжує розширювати межі інтелектуальних, ефективних і безпечних моделей штучного інтелекту, гарантуючи, що компанії, розробники та студенти можуть використовувати ШІ для вирішення проблем, інновацій та досліджень.
Починаючи з сьогоднішнього дня, o3-mini доступний для користувачів Chat Plus, Team та Pro, а доступ Enterprise буде запроваджено у лютому. Доступ до API надається вибраним розробникам рівнів 3-5.
Для тих, хто хоче використовувати потужність ШІ в STEM і розробці програмного забезпечення, OpenAI o3-mini представляє захоплюючий крок вперед.