OpenAI запускает глубокое исследование: многошаговый анализ Интернета с использованием искусственного интеллекта

7 февраля, 2025

OpenAI объявила о запуске Deep Research, новаторского агента ИИ, предназначенного для проведения многошаговых исследований в Интернете. Эта новая функция, доступная в ChatGPT, позволяет пользователям выполнять сложные задачи онлайн-исследований, синтезируя огромные объемы информации за считанные минуты.

Deep Research, созданный на основе усовершенствованной версии будущей модели OpenAI o3, преуспевает в анализе данных, синтезе знаний и веб-ориентированном обосновании. Модель самостоятельно ищет, анализирует и компилирует данные, создавая отчеты на уровне аналитика исследований с понятными цитатами и ссылками.

В настоящее время эта функция доступна ChatGPT Пользователи Pro, а затем доступ получат пользователи Plus и Team.

Почему OpenAI разработала глубокие исследования

Deep Research был создан для профессионалов и исследователей, которым требуются глубокие знания в таких областях, как финансы, наука, политика и инженерия. Инструмент также предназначен для потребителей, ищущих гиперперсонализированные рекомендации, что делает его ценным активом для тщательного сравнения продуктов при покупке таких товаров, как автомобили, бытовая техника и технологии.

В отличие от традиционных моделей ИИ, которые предоставляют краткие сводки, Deep Research способен:

  • Просмотр и анализ сотен интернет-источников
  • Создание хорошо документированных отчетов
  • Предоставление структурированных цитат для проверки фактов
  • Синтез неинтуитивных и труднодоступных идей

Это достижение представляет собой важный шаг на пути к долгосрочной цели OpenAI — созданию общего искусственного интеллекта (AGI), который включает в себя способность генерировать новые знания, а не просто извлекать существующие данные.

Как работают глубокие исследования

Пользователи могут активировать Deep Research в ChatGPT выбрав опцию «Глубокое исследование» в редакторе сообщений. После ввода запроса, например, конкурентного анализа потоковых сервисов или отчета о тенденциях внедрения электромобилей, ИИ начинает углубленное исследование.

Ключевые особенности:

  • Многоэтапное исследование: Deep Research автономно планирует и реализует сложные исследовательские траектории, корректируя их на основе результатов, получаемых в режиме реального времени.
  • Поддержка файлов и электронных таблиц: Пользователи могут загружать файлы или электронные таблицы для улучшения контекстного понимания.
  • Живое отслеживание: Боковая панель содержит обновленную информацию об этапах исследования, использованных источниках и ходе анализа.
  • Комплексные отчеты: В течение 5–30 минут, ChatGPT предоставляет подробный отчет об исследовании, полный цитат.
  • Предстоящие улучшения: В будущих обновлениях будут представлены встроенные изображения, визуализации данных и аналитические графики для улучшения отчетов.

В отличие от GPT-4o, который отлично подходит для мультимодальных взаимодействий в реальном времени, Deep Research предназначен для обширных исследований в конкретных областях, требующих тщательной проверки фактов и синтеза.

Тест производительности: новый стандарт в исследованиях ИИ

Deep Research значительно превосходит предыдущие модели ИИ в экспертных оценках исследований, демонстрируя превосходную рассудительность и точность.

Выступление на последнем экзамене человечества

В «Последнем экзамене человечества» — строгом тесте ИИ, проверяющем рассуждения экспертного уровня среди более чем 100 испытуемых — Deep Research достигла рекордной точности в 26.6%, превзойдя все основные модели ИИ.

Модель Точность (%)
ГПТ-4о 3.3
Грок-2 3.8
Клод 3.5 Сонет 4.3
Мышление Близнецов 6.2
ОпенАИ о1 9.1
DeepSeek-R1 9.4
OpenAI o3-mini (высокий) 13.0
Глубокие исследования OpenAI 26.6

Deep Research преуспевает в химии, гуманитарных, социальных науках и математике, используя свои передовые возможности рассуждения для поиска и интерпретации сложных данных более эффективно, чем предыдущие модели.

Результаты сравнительного анализа GAIA

Deep Research также установила новый рекорд по уровню развития технологий (SOTA) на GAIA — публичном бенчмарке, который проверяет способность ИИ справляться с реальными многоэтапными исследовательскими задачами.

Уровень теста Предыдущий SOTA (%) Глубокое исследование Пропуск@1 (%) Консенсус глубокого исследования@64 (%)
Level 1 67.92 74.29 78.66
Level 2 67.44 69.06 73.21
Level 3 42.31 47.6 58.03
Средняя 63.64 67.36 72.57

Эти результаты подтверждают, что Deep Research не только быстрее и эффективнее, но и способен решать высокотехнологичные исследовательские задачи с большей точностью.

Проблемы и будущие улучшения

Несмотря на свои передовые возможности, Deep Research все еще находится на ранней стадии развития и имеет некоторые ограничения:

  • Факт Галлюцинация: Хотя это и значительно сокращено, иногда могут возникать неверные толкования или неточные выводы.
  • Проблемы с калибровкой уверенности: Модель не всегда может точно выражать неопределенность, что может привести к излишней уверенности в некоторых ответах.
  • Ошибки форматирования и цитирования: Незначительные несоответствия форматирования и проблемы с размещением цитат исправляются.

По мере развития Deep Research OpenAI планирует повысить надежность, улучшить точность и расширить доступ к дополнительным специализированным источникам данных.

Наличие и доступ

Кому могут пригодиться глубокие исследования?

  • Профессиональные пользователи: Доступно уже сейчас, с лимитом в 100 запросов в месяц.
  • Пользователи Plus и Team: Скоро будет доступен доступ.
  • Корпоративные пользователи: Планируется выпуск в будущем.

В настоящее время Deep Research недоступен в Великобритании, Швейцарии и ЕЭЗ, но OpenAI активно работает над расширением регионального доступа.

Предстоящие улучшения

  • Более экономичная версия: Более компактная, быстрая и эффективная модель Deep Research скоро станет доступна всем платным пользователям.
  • Интеграция мобильных устройств и ПК: Deep Research будет развернут в ChatGPTмобильные и настольные приложения в течение следующего месяца.
  • Расширенный доступ к данным: В будущих обновлениях будут интегрированы источники данных на основе подписки и внутренние источники данных, что сделает исследования еще более всеобъемлющими.

Будущее исследований с использованием искусственного интеллекта

Глубокие исследования OpenAI представляют собой большой шаг вперед в способности ИИ проводить независимые многошаговые рассуждения. Объединяя интеллектуальный синтез данных, просмотр веб-страниц в реальном времени и расширенную отчетность, OpenAI прокладывает путь для более автономных исследовательских инструментов на базе ИИ.

Заглядывая вперед, OpenAI предвидит еще более сложных агентов ИИ, способных выполнять асинхронные онлайн-исследования и реальные задачи. Интеграция Deep Research с будущим агентом OpenAI, Operator, обещает переопределить роль ИИ в исследованиях, автоматизации и принятии решений.

На данный момент Deep Research намерена произвести революцию в том, как профессионалы, исследователи и потребители собирают и обобщают информацию, превращая часы работы в минуты.