OpenAI объявила о запуске Deep Research, новаторского агента ИИ, предназначенного для проведения многошаговых исследований в Интернете. Эта новая функция, доступная в ChatGPT, позволяет пользователям выполнять сложные задачи онлайн-исследований, синтезируя огромные объемы информации за считанные минуты.
Deep Research, созданный на основе усовершенствованной версии будущей модели OpenAI o3, преуспевает в анализе данных, синтезе знаний и веб-ориентированном обосновании. Модель самостоятельно ищет, анализирует и компилирует данные, создавая отчеты на уровне аналитика исследований с понятными цитатами и ссылками.
В настоящее время эта функция доступна ChatGPT Пользователи Pro, а затем доступ получат пользователи Plus и Team.
Почему OpenAI разработала глубокие исследования
Deep Research был создан для профессионалов и исследователей, которым требуются глубокие знания в таких областях, как финансы, наука, политика и инженерия. Инструмент также предназначен для потребителей, ищущих гиперперсонализированные рекомендации, что делает его ценным активом для тщательного сравнения продуктов при покупке таких товаров, как автомобили, бытовая техника и технологии.
В отличие от традиционных моделей ИИ, которые предоставляют краткие сводки, Deep Research способен:
- Просмотр и анализ сотен интернет-источников
- Создание хорошо документированных отчетов
- Предоставление структурированных цитат для проверки фактов
- Синтез неинтуитивных и труднодоступных идей
Это достижение представляет собой важный шаг на пути к долгосрочной цели OpenAI — созданию общего искусственного интеллекта (AGI), который включает в себя способность генерировать новые знания, а не просто извлекать существующие данные.
Как работают глубокие исследования
Пользователи могут активировать Deep Research в ChatGPT выбрав опцию «Глубокое исследование» в редакторе сообщений. После ввода запроса, например, конкурентного анализа потоковых сервисов или отчета о тенденциях внедрения электромобилей, ИИ начинает углубленное исследование.
Ключевые особенности:
- Многоэтапное исследование: Deep Research автономно планирует и реализует сложные исследовательские траектории, корректируя их на основе результатов, получаемых в режиме реального времени.
- Поддержка файлов и электронных таблиц: Пользователи могут загружать файлы или электронные таблицы для улучшения контекстного понимания.
- Живое отслеживание: Боковая панель содержит обновленную информацию об этапах исследования, использованных источниках и ходе анализа.
- Комплексные отчеты: В течение 5–30 минут, ChatGPT предоставляет подробный отчет об исследовании, полный цитат.
- Предстоящие улучшения: В будущих обновлениях будут представлены встроенные изображения, визуализации данных и аналитические графики для улучшения отчетов.
В отличие от GPT-4o, который отлично подходит для мультимодальных взаимодействий в реальном времени, Deep Research предназначен для обширных исследований в конкретных областях, требующих тщательной проверки фактов и синтеза.
Тест производительности: новый стандарт в исследованиях ИИ
Deep Research значительно превосходит предыдущие модели ИИ в экспертных оценках исследований, демонстрируя превосходную рассудительность и точность.
Выступление на последнем экзамене человечества
В «Последнем экзамене человечества» — строгом тесте ИИ, проверяющем рассуждения экспертного уровня среди более чем 100 испытуемых — Deep Research достигла рекордной точности в 26.6%, превзойдя все основные модели ИИ.
Модель | Точность (%) |
---|---|
ГПТ-4о | 3.3 |
Грок-2 | 3.8 |
Клод 3.5 Сонет | 4.3 |
Мышление Близнецов | 6.2 |
ОпенАИ о1 | 9.1 |
DeepSeek-R1 | 9.4 |
OpenAI o3-mini (высокий) | 13.0 |
Глубокие исследования OpenAI | 26.6 |
Deep Research преуспевает в химии, гуманитарных, социальных науках и математике, используя свои передовые возможности рассуждения для поиска и интерпретации сложных данных более эффективно, чем предыдущие модели.
Результаты сравнительного анализа GAIA
Deep Research также установила новый рекорд по уровню развития технологий (SOTA) на GAIA — публичном бенчмарке, который проверяет способность ИИ справляться с реальными многоэтапными исследовательскими задачами.
Уровень теста | Предыдущий SOTA (%) | Глубокое исследование Пропуск@1 (%) | Консенсус глубокого исследования@64 (%) |
---|---|---|---|
Level 1 | 67.92 | 74.29 | 78.66 |
Level 2 | 67.44 | 69.06 | 73.21 |
Level 3 | 42.31 | 47.6 | 58.03 |
Средняя | 63.64 | 67.36 | 72.57 |
Эти результаты подтверждают, что Deep Research не только быстрее и эффективнее, но и способен решать высокотехнологичные исследовательские задачи с большей точностью.
Проблемы и будущие улучшения
Несмотря на свои передовые возможности, Deep Research все еще находится на ранней стадии развития и имеет некоторые ограничения:
- Факт Галлюцинация: Хотя это и значительно сокращено, иногда могут возникать неверные толкования или неточные выводы.
- Проблемы с калибровкой уверенности: Модель не всегда может точно выражать неопределенность, что может привести к излишней уверенности в некоторых ответах.
- Ошибки форматирования и цитирования: Незначительные несоответствия форматирования и проблемы с размещением цитат исправляются.
По мере развития Deep Research OpenAI планирует повысить надежность, улучшить точность и расширить доступ к дополнительным специализированным источникам данных.
Наличие и доступ
Кому могут пригодиться глубокие исследования?
- Профессиональные пользователи: Доступно уже сейчас, с лимитом в 100 запросов в месяц.
- Пользователи Plus и Team: Скоро будет доступен доступ.
- Корпоративные пользователи: Планируется выпуск в будущем.
В настоящее время Deep Research недоступен в Великобритании, Швейцарии и ЕЭЗ, но OpenAI активно работает над расширением регионального доступа.
Предстоящие улучшения
- Более экономичная версия: Более компактная, быстрая и эффективная модель Deep Research скоро станет доступна всем платным пользователям.
- Интеграция мобильных устройств и ПК: Deep Research будет развернут в ChatGPTмобильные и настольные приложения в течение следующего месяца.
- Расширенный доступ к данным: В будущих обновлениях будут интегрированы источники данных на основе подписки и внутренние источники данных, что сделает исследования еще более всеобъемлющими.
Будущее исследований с использованием искусственного интеллекта
Глубокие исследования OpenAI представляют собой большой шаг вперед в способности ИИ проводить независимые многошаговые рассуждения. Объединяя интеллектуальный синтез данных, просмотр веб-страниц в реальном времени и расширенную отчетность, OpenAI прокладывает путь для более автономных исследовательских инструментов на базе ИИ.
Заглядывая вперед, OpenAI предвидит еще более сложных агентов ИИ, способных выполнять асинхронные онлайн-исследования и реальные задачи. Интеграция Deep Research с будущим агентом OpenAI, Operator, обещает переопределить роль ИИ в исследованиях, автоматизации и принятии решений.
На данный момент Deep Research намерена произвести революцию в том, как профессионалы, исследователи и потребители собирают и обобщают информацию, превращая часы работы в минуты.