OpenAI startet Deep Research: KI-gestützte mehrstufige Internetanalyse

7. Februar 2025

OpenAI hat die Einführung von Deep Research angekündigt, einem bahnbrechenden KI-Agenten für mehrstufige Internetrecherchen. Diese neue Funktion, die im Chat verfügbar ist, ermöglicht es Nutzern, komplexe Online-Rechercheaufgaben auszulagern und riesige Informationsmengen in wenigen Minuten zu synthetisieren.

Deep Research basiert auf einer erweiterten Version des kommenden OpenAI o3-Modells und zeichnet sich durch Datenanalyse, Wissenssynthese und webbasiertes Denken aus. Das Modell sucht, analysiert und kompiliert Daten selbstständig und erstellt Berichte auf dem Niveau eines Forschungsanalysten mit klaren Zitaten und Referenzen.

Die Funktion ist derzeit für Chat Pro-Benutzer verfügbar, Plus- und Team-Benutzer werden als Nächstes Zugriff erhalten.

Warum OpenAI Deep Research entwickelt hat

Deep Research wurde für Fachleute und Forscher entwickelt, die fundiertes Wissen in Bereichen wie Finanzen, Wissenschaft, Politik und Ingenieurwesen benötigen. Das Tool ist auch für Verbraucher konzipiert, die nach hyperpersonalisierten Empfehlungen suchen, was es zu einem wertvollen Hilfsmittel für gründliche Produktvergleiche bei Käufen von Autos, Haushaltsgeräten und Technologie macht.

Im Gegensatz zu herkömmlichen KI-Modellen, die kurze Zusammenfassungen liefern, kann Deep Research:

  • Durchsuchen und Analysieren von Hunderten von Online-Quellen
  • Erstellen gut dokumentierter Berichte
  • Bereitstellung strukturierter Zitate zur Faktenüberprüfung
  • Synthese nicht intuitiver und schwer zu findender Erkenntnisse

Dieser Fortschritt stellt einen wichtigen Schritt in Richtung des langfristigen Ziels von OpenAI dar, nämlich der Entwicklung einer künstlichen allgemeinen Intelligenz (Artificial General Intelligence, AGI). Dazu gehört die Fähigkeit, neues Wissen zu generieren, anstatt einfach nur vorhandene Daten abzurufen.

So funktioniert Deep Research

Nutzer können die Tiefenanalyse im Chat aktivieren, indem sie im Nachrichteneditor die Option „Deep Research“ auswählen. Nach Eingabe einer Anfrage, beispielsweise einer Wettbewerbsanalyse von Streaming-Diensten oder eines Berichts über Trends bei der Nutzung von Elektrofahrzeugen, beginnt die KI mit einer eingehenden Untersuchung.

Hauptmerkmale

  • Mehrstufige Forschung: Deep Research plant und führt komplexe Forschungsverläufe autonom aus und nimmt Anpassungen auf der Grundlage von Echtzeiterkenntnissen vor.
  • Datei- und Tabellenkalkulationsunterstützung: Benutzer können Dateien oder Tabellen hochladen, um das Kontextverständnis zu verbessern.
  • Live-Tracking: Eine Seitenleiste bietet Updates zu Rechercheschritten, verwendeten Quellen und Analysefortschritt.
  • Umfassende Berichte: Innerhalb von 5 bis 30 Minuten liefert der Chat einen ausführlichen Forschungsbericht, komplett mit Zitaten.
  • Kommende Verbesserungen: Zukünftige Updates werden eingebettete Bilder, Datenvisualisierungen und analytische Diagramme zur Verbesserung der Berichte einführen.

Im Gegensatz zu GPT-4o, das sich durch multimodale Interaktionen in Echtzeit auszeichnet, ist Deep Research für umfangreiche, domänenspezifische Untersuchungen konzipiert, die eine sorgfältige Überprüfung und Synthese der Fakten erfordern.

Benchmark-Leistung: Ein neuer Standard in der KI-Forschung

Deep Research übertrifft frühere KI-Modelle bei Forschungsbewertungen auf Expertenniveau deutlich und weist eine bessere Argumentation und Genauigkeit auf.

Die letzte Prüfungsleistung der Menschheit

Beim „Humanity's Last Exam“, einem anspruchsvollen KI-Benchmark, der das logische Denken auf Expertenniveau bei über 100 Probanden testet, erreichte Deep Research eine Rekordgenauigkeit von 26.6 % und übertraf damit alle wichtigen KI-Modelle.

Modell Richtigkeit (%)
GPT-4o 3.3
Grok-2 3.8
Claude 3.5 Sonett 4.3
Zwillingsdenken 6.2
OpenAI o1 9.1
TiefSeek-R1 9.4
OpenAI o3-mini (hoch) 13.0
OpenAI-Tiefenforschung 26.6

Deep Research zeichnet sich durch herausragende Leistungen in den Bereichen Chemie, Geisteswissenschaften, Sozialwissenschaften und Mathematik aus und nutzt seine erweiterten Denkfähigkeiten, um komplexe Daten effektiver zu durchsuchen und zu interpretieren als frühere Modelle.

GAIA Benchmark-Ergebnisse

Deep Research hat außerdem einen neuen State-of-the-Art-Rekord (SOTA) bei GAIA aufgestellt, einem öffentlichen Benchmark, der die Fähigkeit der KI testet, reale, mehrstufige Forschungsaufgaben zu bewältigen.

Testlevel Vorheriger SOTA (%) Tiefgründige Recherche bestanden@1 (%) Konsensus bei eingehender Forschung@64 (%)
Level 1 67.92 74.29 78.66
Level 2 67.44 69.06 73.21
Level 3 42.31 47.6 58.03
Durchschnittlich 63.64 67.36 72.57

Diese Ergebnisse bestätigen, dass Deep Research nicht nur schneller und effizienter ist, sondern auch in der Lage ist, hochtechnische Forschungsherausforderungen mit größerer Präzision anzugehen.

Herausforderungen und zukünftige Verbesserungen

Trotz seiner fortgeschrittenen Fähigkeiten befindet sich Deep Research noch in der Anfangsphase und weist einige Einschränkungen auf:

  • Tatsache Halluzination: Obwohl erheblich reduziert, kann es gelegentlich zu Fehlinterpretationen oder ungenauen Schlussfolgerungen kommen.
  • Probleme bei der Vertrauenskalibrierung: Das Modell drückt Unsicherheit möglicherweise nicht immer genau aus, was möglicherweise zu übermäßigem Vertrauen in einige Antworten führt.
  • Formatierungs- und Zitatfehler: Kleinere Formatierungsinkonsistenzen und Probleme bei der Platzierung von Zitaten werden behoben.

Mit der Weiterentwicklung von Deep Research plant OpenAI, die Zuverlässigkeit und Genauigkeit zu verbessern und den Zugriff auf weitere spezialisierte Datenquellen zu erweitern.

Verfügbarkeit und Zugriff

Wer kann Deep Research nutzen?

  • Pro-Benutzer: Jetzt verfügbar, mit einem Limit von 100 Abfragen pro Monat.
  • Plus- und Team-Benutzer: Der Zugriff wird in Kürze verfügbar sein.
  • Unternehmensbenutzer: Zukünftige Veröffentlichung geplant.

Deep Research ist derzeit in Großbritannien, der Schweiz und dem EWR nicht verfügbar, aber OpenAI arbeitet aktiv daran, den regionalen Zugriff zu erweitern.

Kommende Verbesserungen

  • Eine kostengünstigere Version: Ein kleineres, schnelleres und effizienteres Deep Research-Modell wird bald allen zahlenden Benutzern zur Verfügung stehen.
  • Mobile & Desktop-Integration: Deep Research wird im nächsten Monat in den mobilen und Desktop-Apps von Chat eingeführt.
  • Erweiterter Datenzugriff: Zukünftige Updates werden abonnementbasierte und interne Datenquellen integrieren, um die Recherche noch umfassender zu gestalten.

Die Zukunft der KI-gestützten Forschung

Die Deep Research-Funktion von OpenAI stellt einen großen Fortschritt in der Fähigkeit der KI dar, unabhängige, mehrstufige Schlussfolgerungen zu ziehen. Durch die Kombination intelligenter Datensynthese, Echtzeit-Webbrowsing und erweiterter Berichterstellung ebnet OpenAI den Weg für autonomere KI-gestützte Forschungstools.

Für die Zukunft plant OpenAI noch ausgefeiltere KI-Agenten, die asynchrone Online-Recherchen und die Ausführung realer Aufgaben durchführen können. Die Integration von Deep Research mit dem kommenden Agenten von OpenAI, Operator, verspricht eine Neudefinition der Rolle der KI in Forschung, Automatisierung und Entscheidungsfindung.

Derzeit ist Deep Research dabei, die Art und Weise zu revolutionieren, wie Fachleute, Forscher und Verbraucher Informationen sammeln und zusammenfassen, und so stundenlange Arbeit in Minuten zu verwandeln.