OpenAI представила o3-mini, последнюю модель в своей серии reasoning, разработанную для обеспечения исключительной производительности в областях STEM, разработки программного обеспечения и решения логических задач. Этот релиз повышает доступность ИИ, сохраняя низкие затраты и одновременно повышая скорость и точность по сравнению с его предшественником OpenAI o1-mini.
После анонса в декабре 2024 года o3-mini теперь официально доступен в ChatGPT и API-сервисы. Он предлагает более высокую способность к рассуждению, что делает его идеальным для задач в области науки, технологий, инженерии и математики (STEM). Разработчики могут использовать его вызов функций, структурированные выходные данные и сообщения разработчика, обеспечивая большую гибкость и готовые к производству приложения.
Расширенные функции и доступность
Одним из самых ожидаемых обновлений OpenAI o3-mini является поддержка различных уровней усилий рассуждения, что позволяет пользователям оптимизировать модель по скорости или сложности в зависимости от их потребностей. Эти режимы включают:
- Низкие затраты на рассуждение: приоритет отдается скорости при минимальных вычислительных затратах.
- Средний уровень мыслительных усилий: обеспечивает баланс между точностью и временем реакции.
- Высокая степень мыслительной деятельности: максимизирует интеллект для решения сложных задач.
В отличие от OpenAI o1-mini, o3-mini вводит структурированные возможности поиска, позволяя пользователям получать доступ к актуальной информации с релевантными веб-источниками. Кроме того, он утраивает лимиты сообщений для ChatGPT Пользователи Plus и Team — от 50 до 150 сообщений в день, что повышает доступность для постоянных пользователей.
Впервые OpenAI предоставила модель рассуждений пользователям бесплатного уровня ChatGPT, что позволяет им испытать логическое решение проблем с помощью ИИ, выбрав опцию «Причина» в редакторе сообщений.
Показатели производительности: превосходят предыдущие модели
OpenAI o3-mini превосходит своего предшественника, о1-мини, в разных научные и математические показатели:
Математика и кодирование
- Математическое обоснование: По точности соответствует OpenAI o1, обеспечивая при этом более быстрое время отклика.
- Математика соревнований (AIME 2024): Превосходит o1-mini при высоких затратах на рассуждение.
- Соревновательное программирование Codeforces: Достигает более высокого Очки Эло на разных уровнях усилий по рассуждению.
- Программная инженерия (SWE-Bench): Превосходит предыдущие модели, демонстрируя наилучшие результаты в разработке программного обеспечения с использованием ИИ.
Расширенные научные знания
- Вопросы по естественным наукам на уровне доктора наук (GPQA Diamond): Преуспевает в биологии, химии и физике, достигая уровня производительности, близкого к OpenAI o1.
- Математика исследовательского уровня (FrontierMath): В Интеграция инструментов Python, o3-mini успешно решает более 32% проблем, включая 28% самых сложных (T3) задач.
Общие знания и человеческие предпочтения
- Оценки показывают 56% предпочитают ответы o3-mini по сравнению с o1-mini.
- Уменьшает серьезные ошибки на 39%, повышение надежности на дифcult реальные вопросы.
Повышение скорости и эффективности
OpenAI o3-mini выдает ответы На 24% быстрее, чем o1-mini, Снижение среднее время отклика от 10.16 секунд до 7.7 секунд. В тестах на задержку o3-mini поддерживает На 2,500 мс меньше времени до первого токена, обеспечивая более быстрое и плавное взаимодействие.
Повышение безопасности и этическая разработка ИИ
OpenAI интегрировал методы делиберативного выравнивания, чтобы гарантировать, что o3-mini генерирует безопасные, согласованные с человеком ответы. Обширное тестирование показало, что o3-mini значительно превосходит GPT-4o в оценках безопасности, что делает его одной из самых надежных моделей OpenAI в предотвращении нецелевого использования и джейлбрейка.
Благодаря внешнему red-teaming и систематическим оценкам безопасности OpenAI продолжает снижать риски, оптимизируя интеллект ИИ. Последняя системная карта дает представление о неразрешенных оценках контента и протоколах безопасности.
Что ждет OpenAI дальше?
С o3-mini OpenAI сделала еще один значительный шаг к тому, чтобы сделать продвинутые рассуждения ИИ более доступными и экономически эффективными. Эта модель соответствует текущей миссии компании по снижению цен за токен, сохраняя при этом возможности рассуждений высшего уровня.
По мере расширения внедрения ИИ OpenAI по-прежнему стремится расширять границы интеллектуальных, эффективных и безопасных моделей ИИ, гарантируя, что предприятия, разработчики и студенты смогут использовать ИИ для решения проблем, инноваций и исследований.
С сегодняшнего дня o3-mini доступен для ChatGPT Plus, Team и Pro пользователи, с Enterprise доступом, который будет запущен в феврале. Доступ к API предоставляется избранным разработчикам на уровнях 3-5.
Для тех, кто хочет использовать возможности искусственного интеллекта в области STEM и разработки программного обеспечения, OpenAI o3-mini представляет собой захватывающий шаг вперед.