OpenAI o1: открытие новой эры ИИ-рассуждений

сентябрь 13, 2024

Гигант искусственного интеллекта расширяет границы с помощью усовершенствованных моделей решения проблем

В значительном шаге вперед для искусственного интеллекта, OpenAI представила первые модели в своей новаторской серии 'o1'. Эти модели разработаны для повышения рассудочной мощи ИИ, позволяя ему решать сложные проблемы с беспрецедентной эффективностью.

ОпенАИ о1

Новая парадигма в рассуждениях ИИ

Серия o1 представляет собой смену парадигмы в развитии ИИ, отдавая приоритет более осознанному, вдумчивому подходу к решению проблем. Эти модели, родственные человеческому познанию, обучены «думать» перед реакцией, имитируя процесс совершенствования мысли, исследуя различные стратегии и извлекая уроки из ошибок.

Непревзойденная производительность в сложных областях

Тщательное тестирование OpenAI выявило замечательные возможности o1. Предстоящее обновление модели, которое в настоящее время находится в разработке, демонстрирует производительность на уровне аспирантов в сложных контрольных задачах по физике, химии и биологии. Кроме того, o1 демонстрирует исключительные способности в математике и кодировании. На отборочном экзамене Международной математической олимпиады (IMO) существующая модель GPT-4o достигла 13% успеха, тогда как модель o1 набрала впечатляющие 83%. Кроме того, способности o1 к кодированию оценивались в конкурентных конкурсах по кодированию, где она достигла 89-го процентиля.

Ранний просмотр с многообещающим потенциалом

Хотя o1-preview является ранней итерацией, в ней отсутствуют некоторые функции, которые делают ChatGPT удобным для пользователя, такие как просмотр веб-страниц, загрузка файлов и обработка изображений. Для многих распространенных задач GPT-4o остается более подходящим вариантом в краткосрочной перспективе.

Тем не менее, o1 означает значительный прогресс в способности ИИ справляться со сложными задачами рассуждения, возвещая о новом уровне возможностей ИИ. Этот прорыв побудил OpenAI сбросить счетчик моделей, обозначив эту серию как «OpenAI o1».

Безопасность как первостепенная задача

OpenAI внедрила новый подход к обучению безопасности, который использует возможности рассуждения o1 для обеспечения соблюдения правил безопасности и выравнивания. Позволяя o1 рассуждать о правилах безопасности в контексте, он может применять их более эффективно.

OpenAI измеряет безопасность различными методами, включая тестирование того, насколько хорошо модели противостоят попыткам обойти правила безопасности, известным как «джейлбрейк». В одном из самых сложных тестов джейлбрейка, ГПТ-4о оценка 22 (по шкале от 0 до 100), тогда как модель o1-preview набрала значительно более высокий балл — 84.

Усиленные меры безопасности

Чтобы дополнить расширенные возможности этих моделей, OpenAI усилила свои протоколы безопасности, внутреннее управление и сотрудничество с федеральными правительствами. Эти меры включают в себя строгое тестирование и оценки с использованием их Рамочной основы готовности, лучшую в своем классе команду экспертов и процессы обзора на уровне совета директоров, включая надзор со стороны Комитета по безопасности и защите.

Сотрудничество для безопасности ИИ

OpenAI оформила соглашения с Институтами безопасности искусственного интеллекта США и Великобритании, предоставив им ранний доступ к исследовательской версии модели o1. Эти совместные усилия направлены на создание надежного процесса исследования, оценки и тестирования будущих моделей как до, так и после их публичного выпуска.

Применение в различных областях

Расширенные возможности рассуждения o1 содержат огромный потенциал для решения сложных проблем в различных областях, включая науку, кодирование, математику и смежные области. Исследователи в области здравоохранения могут использовать o1 для аннотирования данных секвенирования клеток, физики могут генерировать сложные математические формулы для квантовой оптики, а разработчики во всех областях могут создавать и выполнять многоэтапные рабочие процессы.

OpenAI o1-mini: экономичная альтернатива

Серия o1 отличается точной генерацией и отладкой сложного кода. Чтобы удовлетворить потребности разработчиков, ищущих более эффективное решение, OpenAI также выпустила о1-мини, более быстрая и доступная модель рассуждений, которая особенно хороша в задачах кодирования. При стоимости на 80% ниже, чем o1-preview, o1-mini предлагает убедительный вариант для приложений, требующих возможностей рассуждений без необходимости обширных знаний о мире.

Доступ и доступность

Пользователи ChatGPT Plus и Team могут получить доступ к моделям o1 в ChatGPT с сегодняшнего дня. Как o1-preview, так и o1-mini можно выбрать вручную в средстве выбора моделей. Первоначально недельные ограничения будут составлять 30 сообщений для o1-preview и 50 для o1-mini. OpenAI активно работает над увеличением этих ограничений и позволяет ChatGPT автоматически выбирать подходящую модель для заданного запроса.

Пользователи ChatGPT Enterprise и Edu получат доступ к обеим моделям на следующей неделе. Разработчики, которые соответствуют требованиям уровня использования API 5, могут начать прототипирование с обеими моделями в API сегодня, при условии ограничения скорости в 20 RPM. OpenAI планирует увеличить эти ограничения после дополнительного тестирования.

OpenAI также намерена предоставить доступ к o1-mini всем пользователям ChatGPT Free.

Будущие разработки

Этот релиз знаменует собой ранний просмотр моделей рассуждений o1 в ChatGPT и API. OpenAI планирует ввести просмотр, загрузку файлов и изображений и другие функции для повышения их полезности для всех пользователей. Кроме того, они стремятся к постоянной разработке и выпуску моделей как в серии GPT, так и в серии OpenAI o1.

Заключение

Представление OpenAI серии o1 знаменует собой знаменательную веху в развитии искусственного интеллекта. Сосредоточившись на расширенных возможностях рассуждения и уделяя первостепенное внимание безопасности, OpenAI прокладывает путь в будущее, в котором ИИ сможет решать все более сложные задачи и вносить значимый вклад в различные области человеческой деятельности.