OpenAI har tillkännagivit lanseringen av Deep Research, en banbrytande AI-agent utformad för att utföra flerstegsforskning på internet. Den här nya funktionen, som finns tillgänglig i Chat, låter användare avlasta komplexa onlineforskningsuppgifter och syntetisera stora mängder information på bara några minuter.
Byggd på en avancerad version av den kommande OpenAI o3-modellen, utmärker sig Deep Research i dataanalys, kunskapssyntes och webbaserade resonemang. Modellen söker självständigt, analyserar och sammanställer data och producerar rapporter på forskningsanalytikernivå med tydliga citat och referenser.
Funktionen är för närvarande tillgänglig för Chat Pro-användare, medan Plus- och Team-användare får åtkomst härnäst.
Varför OpenAI utvecklade djup forskning
Deep Research byggdes för yrkesverksamma och forskare som kräver djupgående kunskaper inom områden som finans, vetenskap, politik och teknik. Verktyget är också designat för konsumenter som söker hyper-personifierade rekommendationer, vilket gör det till en värdefull tillgång för grundliga produktjämförelser vid köp som bilar, apparater och teknik.
Till skillnad från traditionella AI-modeller som ger korta sammanfattningar kan Deep Research:
- Bläddra och analysera hundratals onlinekällor
- Generera väldokumenterade rapporter
- Tillhandahålla strukturerade citeringar för faktaverifiering
- Syntetiserar icke-intuitiva och svåra att hitta insikter
Detta framsteg representerar ett stort steg mot OpenAI:s långsiktiga mål med artificiell allmän intelligens (AGI), som inkluderar förmågan att generera ny kunskap snarare än att bara hämta befintlig data.
Hur djupforskning fungerar
Användare kan aktivera djupgående forskning i chatten genom att välja alternativet "Djupgående forskning" i meddelandeskrivaren. Efter att ha skrivit in en fråga, till exempel en konkurrensanalys av streamingtjänster eller en rapport om trender inom elfordon, påbörjar AI:n en djupgående undersökning.
Nyckelfunktioner:
- Flerstegsforskning: Deep Research planerar och genomför självständigt komplexa forskningsbanor, justerar baserat på realtidsfynd.
- Stöd för fil och kalkylblad: Användare kan ladda upp filer eller kalkylblad för att förbättra kontextuell förståelse.
- Live spårning: Ett sidofält ger uppdateringar om forskningssteg, använda källor och analysframsteg.
- Omfattande rapporterInom 5 till 30 minuter levererar Chat en detaljerad forskningsrapport, komplett med hänvisningar.
- Kommande förbättringar: Framtida uppdateringar kommer att introducera inbäddade bilder, datavisualiseringar och analytiska grafer för att förbättra rapporter.
Till skillnad från GPT-4o, som utmärker sig vid multimodala interaktioner i realtid, är Deep Research designad för omfattande, domänspecifika förfrågningar som kräver noggrann faktakontroll och syntes.
Benchmark Performance: En ny standard inom AI-forskning
Deep Research överträffar avsevärt tidigare AI-modeller i forskningsutvärderingar på expertnivå, vilket visar överlägset resonemang och noggrannhet.
Mänsklighetens sista examensföreställning
I Humanity's Last Exam, ett rigoröst AI-riktmärke som testade resonemang på expertnivå över 100+ ämnen, uppnådde Deep Research en rekordprecision på 26.6 % och överträffade alla större AI-modeller.
| Modell | Noggrannhet (%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Claude 3.5 sonett | 4.3 |
| Tvillingtänkande | 6.2 |
| OpenAI o1 | 9.1 |
| DjupSeek-R1 | 9.4 |
| OpenAI o3-mini (hög) | 13.0 |
| OpenAI Deep Research | 26.6 |
Deep Research utmärker sig inom kemi, humaniora, samhällsvetenskap och matematik och använder sina avancerade resonemangsmöjligheter för att söka och tolka komplexa data mer effektivt än tidigare modeller.
GAIA benchmark-resultat
Deep Research har också satt ett nytt toppmodernt (SOTA) rekord på GAIA, ett offentligt riktmärke som testar AI:s förmåga att hantera verkliga forskningsuppgifter i flera steg.
| Testnivå | Tidigare SOTA (%) | Deep Research Pass@1 (%) | Deep Research Consensus@64 (%) |
|---|---|---|---|
| Nivå 1 | 67.92 | 74.29 | 78.66 |
| Nivå 2 | 67.44 | 69.06 | 73.21 |
| Nivå 3 | 42.31 | 47.6 | 58.03 |
| Genomsnitt | 63.64 | 67.36 | 72.57 |
Dessa resultat bekräftar att Deep Research inte bara är snabbare och effektivare utan också kan hantera högtekniska forskningsutmaningar med större precision.
Utmaningar och framtida förbättringar
Trots sina avancerade funktioner är Deep Research fortfarande i ett tidigt skede och har vissa begränsningar:
- Fakta Hallucination: Även om det är avsevärt reducerat, kan ibland feltolkningar eller felaktiga slutsatser förekomma.
- Konfidenskalibreringsproblem: Modellen kanske inte alltid uttrycker osäkerhet korrekt, vilket kan leda till övertro på vissa svar.
- Formaterings- och citeringsfel: Mindre formateringsinkonsekvenser och problem med citatplacering förfinas.
I takt med att Deep Research utvecklas planerar OpenAI att förbättra tillförlitligheten, förbättra noggrannheten och utöka tillgången till ytterligare specialiserade datakällor.
Tillgänglighet och åtkomst
Vem kan använda djup forskning?
- Pro-användare: Tillgängligt nu, med en gräns på 100 frågor per månad.
- Plus- och teamanvändare: Tillgång rullas ut snart.
- Företagsanvändare: Framtida release planerad.
Deep Research är för närvarande inte tillgängligt i Storbritannien, Schweiz och EES, men OpenAI arbetar aktivt med att utöka den regionala åtkomsten.
Kommande förbättringar
- En mer kostnadseffektiv version: En mindre, snabbare och mer effektiv Deep Research-modell kommer snart att bli tillgänglig för alla betalda användare.
- Mobil & Desktop IntegrationDeep Research kommer att lanseras till Chats mobil- och datorappar inom nästa månad.
- Utökad dataåtkomst: Framtida uppdateringar kommer att integrera prenumerationsbaserade och interna datakällor, vilket gör forskningen ännu mer omfattande.
Framtiden för AI-driven forskning
OpenAI:s Deep Research representerar ett stort steg framåt i AI:s förmåga att föra oberoende resonemang i flera steg. Genom att kombinera intelligent datasyntes, webbsurfning i realtid och avancerad rapportering banar OpenAI vägen för mer autonoma AI-drivna forskningsverktyg.
När vi blickar framåt ser OpenAI för sig ännu mer sofistikerade AI-agenter som kan utföra asynkron onlineforskning och verkliga uppgifter. Integrationen av Deep Research med OpenAI:s kommande agent, Operator, lovar att omdefiniera AI:s roll inom forskning, automatisering och beslutsfattande.
För närvarande är Deep Research inställd på att revolutionera hur proffs, forskare och konsumenter samlar in och syntetiserar information och förvandlar timmars arbete till minuter.