OpenAI, 심층 연구 출시: AI 기반 다단계 인터넷 분석

2025 년 2월 7일

OpenAI는 인터넷에서 다단계 연구를 수행하도록 설계된 획기적인 AI 에이전트인 Deep Research를 출시했습니다. Chat에서 제공되는 이 새로운 기능을 통해 사용자는 복잡한 온라인 연구 작업의 부담을 덜고 방대한 양의 정보를 단 몇 분 만에 종합할 수 있습니다.

다가올 OpenAI o3 모델의 고급 버전을 기반으로 구축된 Deep Research는 데이터 분석, 지식 합성 및 웹 기반 추론에 탁월합니다. 이 모델은 독립적으로 데이터를 검색, 분석 및 컴파일하여 명확한 인용 및 참조가 포함된 연구 분석가 수준의 보고서를 생성합니다.

이 기능은 현재 Chat Pro 사용자에게만 제공되고 있으며, 앞으로 Plus 및 Team 사용자에게도 제공될 예정입니다.

OpenAI가 심층 연구를 개발한 이유

Deep Research는 금융, 과학, 정책, 엔지니어링과 같은 분야에 걸쳐 심층적인 지식이 필요한 전문가와 연구자를 위해 구축되었습니다. 이 도구는 또한 매우 개인화된 추천을 원하는 소비자를 위해 설계되어 자동차, 가전제품, 기술과 같은 구매에 대한 철저한 제품 비교에 귀중한 자산이 됩니다.

간략한 요약을 제공하는 기존 AI 모델과 달리 Deep Research는 다음을 수행할 수 있습니다.

  • 수백 개의 온라인 소스 탐색 및 분석
  • 잘 문서화된 보고서 생성
  • 사실 확인을 위한 구조화된 인용 제공
  • 직관적이지 않고 찾기 어려운 통찰력을 종합합니다.

이러한 발전은 기존 데이터를 검색하는 것이 아니라 새로운 지식을 생성하는 능력을 포함하는 인공 일반 지능(AGI)에 대한 OpenAI의 장기적인 목표를 향한 중요한 진전을 나타냅니다.

심층 연구의 작동 방식

사용자는 메시지 작성기에서 "심층 조사" 옵션을 선택하여 채팅에서 심층 조사를 활성화할 수 있습니다. 스트리밍 서비스 경쟁 분석이나 전기차 도입 동향 보고서와 같은 쿼리를 입력하면 AI가 심층 조사를 시작합니다.

주요 특징:

  • 다단계 연구: Deep Research는 복잡한 연구 경로를 자율적으로 계획하고 실행하며, 실시간 결과에 따라 조정합니다.
  • 파일 및 스프레드시트 지원: 사용자는 파일이나 스프레드시트를 업로드하여 상황에 따른 이해를 높일 수 있습니다.
  • 실시간 추적: 사이드바에서는 연구 단계, 사용된 소스, 분석 진행 상황에 대한 업데이트를 제공합니다.
  • 포괄적 인 보고서: Chat은 5~30분 내에 인용문이 포함된 자세한 연구 보고서를 제공합니다.
  • 향후 개선 사항: 향후 업데이트에서는 보고서를 향상시키기 위해 내장된 이미지, 데이터 시각화, 분석 그래프가 도입될 예정입니다.

실시간 멀티모달 상호작용에 뛰어난 GPT-4o와 달리, Deep Research는 꼼꼼한 사실 확인과 종합이 필요한 광범위하고 도메인별 조사를 위해 설계되었습니다.

벤치마크 성능: AI 연구의 새로운 표준

Deep Research는 전문가 수준의 연구 평가에서 기존 AI 모델보다 훨씬 우수한 성능을 보이며 뛰어난 추론 능력과 정확성을 입증했습니다.

인류의 마지막 시험 성적

100개 이상의 과목에 걸쳐 전문가 수준의 추론을 테스트하는 엄격한 AI 벤치마크 테스트인 인류의 마지막 시험에서, Deep Research는 26.6%의 기록적인 정확도를 달성하여 모든 주요 AI 모델을 능가했습니다.

모델 정확도 (%)
GPT-4o 3.3
그록-2 3.8
클로드 3.5 소네트 4.3
쌍둥이자리 생각 6.2
오픈AI o1 9.1
깊은 안마Seek- R1 9.4
OpenAI o3-mini(높음) 13.0
OpenAI 심층 연구 26.6

Deep Research는 화학, 인문학, 사회 과학 및 수학 분야에서 뛰어난 성과를 거두고 있으며, 고급 추론 기능을 사용하여 이전 모델보다 더욱 효과적으로 복잡한 데이터를 검색하고 해석합니다.

GAIA 벤치마크 결과

Deep Research는 또한 AI가 현실 세계의 다단계 연구 과제를 처리하는 능력을 테스트하는 공개 벤치마크인 GAIA에서 새로운 최첨단(SOTA) 기록을 세웠습니다.

테스트 레벨 이전 SOTA(%) 심층 연구 통과@1(%) 심층 연구 합의@64(%)
레벨 1 67.92 74.29 78.66
레벨 2 67.44 69.06 73.21
레벨 3 42.31 47.6 58.03
평균 63.64 67.36 72.57

이러한 결과는 딥 리서치가 더 빠르고 효율적일 뿐만 아니라, 더욱 정밀하게 기술적인 연구 과제를 해결할 수 있다는 것을 확인시켜 줍니다.

과제와 향후 개선 사항

고급 기능에도 불구하고 Deep Research는 아직 초기 단계에 있으며 몇 가지 제한 사항이 있습니다.

  • 사실 환각: 상당히 감소하였지만, 가끔 오해나 부정확한 추론이 발생할 수 있습니다.
  • 신뢰도 교정 문제: 이 모델은 항상 불확실성을 정확하게 표현하지 못할 수 있으며, 이는 일부 응답에 대한 과신으로 이어질 가능성이 있습니다.
  • 서식 및 인용 오류: 사소한 서식 불일치 및 인용 위치 문제가 개선되고 있습니다.

심층 연구가 발전함에 따라 OpenAI는 신뢰성을 높이고, 정확도를 개선하며, 추가적인 전문 데이터 소스에 대한 접근성을 확대할 계획입니다.

가용성 및 액세스

누가 심층 연구를 활용할 수 있는가?

  • 프로 사용자: 지금 이용 가능하며, 월 100건의 쿼리로 제한됩니다.
  • 플러스 및 팀 사용자: 곧 접속이 가능합니다.
  • 기업 사용자: 향후 출시 예정.

Deep Research는 현재 영국, 스위스, EEA에서 이용할 수 없지만 OpenAI는 지역별 접근성 확대를 위해 적극적으로 노력하고 있습니다.

향후 개선 사항

  • 더 비용 효율적인 버전: 더 작고, 더 빠르고, 더 효율적인 Deep Research 모델이 곧 모든 유료 사용자에게 제공될 예정입니다.
  • 모바일 및 데스크탑 통합: Deep Research는 다음 달 안에 Chat의 모바일 및 데스크톱 앱에 출시될 예정입니다.
  • 확장된 데이터 액세스: 향후 업데이트에서는 구독 기반 및 내부 데이터 소스가 통합되어 연구가 더욱 포괄적으로 진행될 예정입니다.

AI 기반 연구의 미래

OpenAI의 심층 연구는 AI가 독립적이고 다단계 추론을 수행하는 능력에 있어서 큰 도약을 나타냅니다. OpenAI는 지능형 데이터 합성, 실시간 웹 브라우징, 고급 보고를 결합하여 보다 자율적인 AI 기반 연구 도구의 길을 개척하고 있습니다.

앞으로 OpenAI는 비동기 온라인 연구와 실제 작업 실행을 수행할 수 있는 더욱 정교한 AI 에이전트를 구상합니다. Deep Research와 OpenAI의 차기 에이전트인 Operator의 통합은 연구, 자동화 및 의사 결정에서 AI의 역할을 재정의할 것을 약속합니다.

현재 Deep Research는 전문가, 연구자, 소비자가 정보를 수집하고 종합하여 몇 시간 걸리던 작업을 몇 분 만에 끝내는 방식을 혁신할 예정입니다.