OpenAI lancerer Deep Research: AI-drevet multi-trins internetanalyse

Februar 7, 2025

OpenAI har annonceret lanceringen af ​​Deep Research, en banebrydende AI-agent designet til at udføre flertrinsforskning på internettet. Denne nye funktion, der er tilgængelig i Chat, giver brugerne mulighed for at aflaste komplekse onlineforskningsopgaver og syntetisere enorme mængder information på få minutter.

Bygget på en avanceret version af den kommende OpenAI o3-model, udmærker Deep Research sig inden for dataanalyse, vidensyntese og webbaseret ræsonnement. Modellen søger, analyserer og kompilerer uafhængigt data og producerer rapporter på forskningsanalytikerniveau med klare citater og referencer.

Funktionen er i øjeblikket tilgængelig for Chat Pro-brugere, og Plus- og Team-brugere får adgang som de næste.

Hvorfor OpenAI udviklede Deep Research

Deep Research blev bygget til fagfolk og forskere, der kræver dybdegående viden på tværs af områder som finans, videnskab, politik og teknik. Værktøjet er også designet til forbrugere, der søger hyper-personlige anbefalinger, hvilket gør det til et værdifuldt aktiv for grundige produktsammenligninger ved køb som biler, apparater og teknologi.

I modsætning til traditionelle AI-modeller, der giver korte opsummeringer, er Deep Research i stand til:

  • Gennemse og analysere hundredvis af onlinekilder
  • Generering af veldokumenterede rapporter
  • Tilvejebringelse af strukturerede citater til faktabekræftelse
  • Syntetiserer ikke-intuitiv og svær at finde indsigt

Dette fremskridt repræsenterer et stort skridt mod OpenAI's langsigtede mål om Artificial General Intelligence (AGI), som inkluderer evnen til at generere ny viden i stedet for blot at hente eksisterende data.

Sådan fungerer Deep Research

Brugere kan aktivere dybdegående research i chatten ved at vælge indstillingen "Dybdegående research" i beskedskriveren. Efter at have indtastet en forespørgsel, såsom en konkurrenceanalyse af streamingtjenester eller en rapport om tendenser inden for elbiler, starter AI'en en dybdegående undersøgelse.

Nøglefunktioner:

  • Multi-Step Research: Deep Research planlægger og udfører selvstændigt komplekse forskningsforløb, justerer baseret på resultater i realtid.
  • Understøttelse af filer og regneark: Brugere kan uploade filer eller regneark for at forbedre kontekstuel forståelse.
  • Live tracking: En sidebjælke giver opdateringer om forskningstrin, anvendte kilder og analysefremskridt.
  • Omfattende rapporterInden for 5 til 30 minutter leverer Chat en detaljeret forskningsrapport, komplet med citater.
  • Kommende forbedringer: Fremtidige opdateringer vil introducere indlejrede billeder, datavisualiseringer og analytiske grafer for at forbedre rapporter.

I modsætning til GPT-4o, som udmærker sig ved multimodale interaktioner i realtid, er Deep Research designet til omfattende, domænespecifikke forespørgsler, der kræver omhyggelig faktatjek og syntese.

Benchmark Performance: En ny standard inden for AI-forskning

Deep Research overgår betydeligt tidligere AI-modeller i forskningsevalueringer på ekspertniveau, hvilket viser overlegen ræsonnement og nøjagtighed.

Menneskehedens sidste eksamenspræstation

I Humanity's Last Exam, en streng AI-benchmark-testning af ræsonnement på ekspertniveau på tværs af 100+ emner, opnåede Deep Research en rekordhøj nøjagtighed på 26.6 %, hvilket overgik alle større AI-modeller.

Model Nøjagtighed (%)
GPT-4o 3.3
Grok-2 3.8
Claude 3.5 sonet 4.3
Tvilling tænkning 6.2
ÅbenAI o1 9.1
DybSeek-R1 9.4
OpenAI o3-mini (høj) 13.0
OpenAI Deep Research 26.6

Deep Research udmærker sig inden for kemi, humaniora, samfundsvidenskab og matematik ved at bruge sine avancerede ræsonnementer til at søge og fortolke komplekse data mere effektivt end tidligere modeller.

GAIA benchmark resultater

Deep Research har også sat en ny state-of-the-art (SOTA) rekord på GAIA, et offentligt benchmark, der tester AI's evne til at håndtere den virkelige verden, multi-step forskningsopgaver.

Testniveau Tidligere SOTA (%) Deep Research Pass@1 (%) Deep Research Consensus@64 (%)
Niveau 1 67.92 74.29 78.66
Niveau 2 67.44 69.06 73.21
Niveau 3 42.31 47.6 58.03
Gennemsnit 63.64 67.36 72.57

Disse resultater bekræfter, at Deep Research ikke kun er hurtigere og mere effektiv, men også i stand til at tackle højtekniske forskningsudfordringer med større præcision.

Udfordringer og fremtidige forbedringer

På trods af sine avancerede muligheder er Deep Research stadig i sin tidlige fase og har nogle begrænsninger:

  • Fakta Hallucination: Selvom det er væsentligt reduceret, kan der forekomme lejlighedsvise fejlfortolkninger eller unøjagtige slutninger.
  • Tillidskalibreringsproblemer: Modellen udtrykker muligvis ikke altid usikkerhed nøjagtigt, hvilket potentielt kan føre til overtillid til nogle svar.
  • Formaterings- og citationsfejl: Mindre formateringsinkonsekvenser og problemer med citatplacering er ved at blive forfinet.

Efterhånden som Deep Research udvikler sig, planlægger OpenAI at øge pålideligheden, forbedre nøjagtigheden og udvide adgangen til yderligere specialiserede datakilder.

Tilgængelighed og adgang

Hvem kan bruge dyb forskning?

  • Pro-brugere: Tilgængelig nu med en grænse på 100 forespørgsler om måneden.
  • Plus- og teambrugere: Adgang udrulles snart.
  • Virksomhedsbrugere: Fremtidig udgivelse planlagt.

Deep Research er i øjeblikket ikke tilgængelig i Storbritannien, Schweiz og EØS, men OpenAI arbejder aktivt på at udvide den regionale adgang.

Kommende forbedringer

  • En mere omkostningseffektiv version: En mindre, hurtigere og mere effektiv Deep Research-model vil snart blive tilgængelig for alle betalte brugere.
  • Mobil & Desktop IntegrationDeep Research vil blive rullet ud til Chats mobil- og desktopapps inden for den næste måned.
  • Udvidet dataadgang: Fremtidige opdateringer vil integrere abonnementsbaserede og interne datakilder, hvilket gør forskningen endnu mere omfattende.

Fremtiden for AI-drevet forskning

OpenAI's Deep Research repræsenterer et stort spring fremad i AI's evne til at udføre uafhængig ræsonnement i flere trin. Ved at kombinere intelligent datasyntese, web-browsing i realtid og avanceret rapportering baner OpenAI vejen for mere autonome AI-drevne forskningsværktøjer.

Når vi ser fremad, forestiller OpenAI sig endnu mere sofistikerede AI-agenter, der er i stand til at udføre asynkron online research og udføre opgaver i den virkelige verden. Integrationen af ​​Deep Research med OpenAI's kommende agent, Operator, lover at omdefinere AI's rolle i forskning, automatisering og beslutningstagning.

For nu er Deep Research sat til at revolutionere, hvordan fagfolk, forskere og forbrugere indsamler og syntetiserer information og forvandler arbejdstimer til minutter.