OpenAI heeft de lancering aangekondigd van Deep Research, een baanbrekende AI-agent die is ontworpen om meerstapsonderzoek op het internet uit te voeren. Deze nieuwe functie, beschikbaar in Chat, stelt gebruikers in staat om complexe online onderzoekstaken uit te besteden en enorme hoeveelheden informatie in slechts enkele minuten te synthetiseren.
Deep Research is gebaseerd op een geavanceerde versie van het aankomende OpenAI o3-model en blinkt uit in data-analyse, kennissynthese en webgebaseerd redeneren. Het model zoekt, analyseert en compileert onafhankelijk data en produceert rapporten op het niveau van onderzoeksanalisten met duidelijke citaten en referenties.
De functie is momenteel beschikbaar voor Chat Pro-gebruikers. Plus- en Team-gebruikers krijgen binnenkort toegang.
Waarom OpenAI diepgaand onderzoek heeft ontwikkeld
Deep Research is gebouwd voor professionals en onderzoekers die diepgaande kennis nodig hebben op gebieden zoals financiën, wetenschap, beleid en techniek. De tool is ook ontworpen voor consumenten die op zoek zijn naar hypergepersonaliseerde aanbevelingen, waardoor het een waardevolle tool is voor grondige productvergelijkingen bij aankopen zoals auto's, apparaten en technologie.
In tegenstelling tot traditionele AI-modellen die korte samenvattingen bieden, kan Deep Research:
- Bladeren door en analyseren van honderden online bronnen
- Het genereren van goed gedocumenteerde rapporten
- Het verstrekken van gestructureerde citaten voor feitenverificatie
- Synthetiseren van niet-intuïtieve en moeilijk te vinden inzichten
Deze vooruitgang vormt een belangrijke stap in de richting van OpenAI's langetermijndoelstelling van algemene kunstmatige intelligentie (AGI). Hierbij gaat het onder meer om de mogelijkheid om nieuwe kennis te genereren in plaats van alleen bestaande gegevens op te halen.
Hoe diepgaand onderzoek werkt
Gebruikers kunnen Diepgaand Onderzoek in Chat activeren door de optie 'Diepgaand Onderzoek' te selecteren in de berichtopsteller. Na het invoeren van een zoekopdracht, zoals een concurrentieanalyse van streamingdiensten of een rapport over trends in de adoptie van elektrische voertuigen, start de AI een diepgaand onderzoek.
Belangrijkste kenmerken:
- Meerstappenonderzoek:Deep Research plant en voert zelfstandig complexe onderzoekstrajecten uit, waarbij aanpassingen worden gedaan op basis van realtime bevindingen.
- Ondersteuning voor bestanden en spreadsheets: Gebruikers kunnen bestanden of spreadsheets uploaden om het contextuele begrip te verbeteren.
- Live-tracking: Een zijbalk biedt updates over de onderzoeksstappen, gebruikte bronnen en de voortgang van de analyse.
- Uitgebreide rapporten: Binnen 5 tot 30 minuten levert Chat een gedetailleerd onderzoeksrapport, compleet met citaten.
- Aankomende verbeteringen:Toekomstige updates introduceren ingesloten afbeeldingen, datavisualisaties en analytische grafieken om rapporten te verbeteren.
In tegenstelling tot GPT-4o, dat uitblinkt in realtime multimodale interacties, is Deep Research ontworpen voor uitgebreide, domeinspecifieke onderzoeken waarbij nauwkeurige feitencontrole en synthese vereist zijn.
Benchmarkprestaties: een nieuwe standaard in AI-onderzoek
Deep Research presteert aanzienlijk beter dan eerdere AI-modellen bij onderzoeksevaluaties op expertniveau en toont superieure redenering en nauwkeurigheid.
De laatste examenprestatie van de mensheid
Bij het Humanity's Last Exam, een strenge AI-benchmark die het redeneren op expertniveau testte bij meer dan 100 proefpersonen, behaalde Deep Research een recordnauwkeurigheid van 26.6%. Daarmee presteerde het beter dan alle belangrijke AI-modellen.
| Model | Nauwkeurigheid (%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Claude 3.5 Sonnet | 4.3 |
| Tweelingen denken | 6.2 |
| Open AI o1 | 9.1 |
| DiepSeek-R1 | 9.4 |
| OpenAI o3-mini (hoog) | 13.0 |
| OpenAI Diepgaand Onderzoek | 26.6 |
Deep Research blinkt uit in scheikunde, geesteswetenschappen, sociale wetenschappen en wiskunde. Dankzij geavanceerde redeneermogelijkheden kan Deep Research complexe gegevens effectiever doorzoeken en interpreteren dan met eerdere modellen mogelijk was.
GAIA Benchmark-resultaten
Deep Research heeft bovendien een nieuw SOTA-record gevestigd op GAIA, een openbare benchmark die de capaciteit van AI test om echte, uit meerdere stappen bestaande onderzoekstaken uit te voeren.
| Test niveau | Vorige SOTA (%) | Diepgaand onderzoek geslaagd@1 (%) | Diepgaand onderzoeksconsensus@64 (%) |
|---|---|---|---|
| Niveau 1 | 67.92 | 74.29 | 78.66 |
| Niveau 2 | 67.44 | 69.06 | 73.21 |
| Niveau 3 | 42.31 | 47.6 | 58.03 |
| Gemiddelde | 63.64 | 67.36 | 72.57 |
Deze resultaten bevestigen dat Deep Research niet alleen sneller en efficiënter is, maar ook zeer technische onderzoeksuitdagingen met grotere precisie kan aanpakken.
Uitdagingen en toekomstige verbeteringen
Ondanks de geavanceerde mogelijkheden bevindt Deep Research zich nog in een vroeg stadium en kent het enkele beperkingen:
- Feit Hallucinatie: Hoewel de resultaten aanzienlijk zijn verminderd, kunnen er af en toe verkeerde interpretaties of onjuiste gevolgtrekkingen voorkomen.
- Problemen met vertrouwenskalibratie: Het model drukt de onzekerheid niet altijd nauwkeurig uit, wat kan leiden tot overmoed bij sommige antwoorden.
- Opmaak- en citatiefouten: Kleine inconsistenties in de opmaak en problemen met de plaatsing van citaten worden verholpen.
Naarmate Deep Research zich verder ontwikkelt, wil OpenAI de betrouwbaarheid en nauwkeurigheid verbeteren en de toegang tot aanvullende gespecialiseerde gegevensbronnen uitbreiden.
Beschikbaarheid en toegang
Voor wie is diepgaand onderzoek geschikt?
- Pro-gebruikers: Nu beschikbaar, met een limiet van 100 query's per maand.
- Plus- en teamgebruikers: Toegang wordt binnenkort beschikbaar.
- Bedrijfsgebruikers: Toekomstige release gepland.
Deep Research is momenteel niet beschikbaar in het Verenigd Koninkrijk, Zwitserland en de EER, maar OpenAI werkt actief aan het uitbreiden van regionale toegang.
Aankomende verbeteringen
- Een kosteneffectievere versie: Binnenkort is er een kleiner, sneller en efficiënter Deep Research-model beschikbaar voor alle betalende gebruikers.
- Mobiele en desktopintegratie: Deep Research wordt de komende maand uitgerold naar de mobiele en desktop-apps van Chat.
- Uitgebreide gegevenstoegang:Toekomstige updates zullen op abonnementen gebaseerde en interne gegevensbronnen integreren, waardoor onderzoek nog uitgebreider wordt.
De toekomst van AI-aangedreven onderzoek
OpenAI's Deep Research vertegenwoordigt een grote sprong voorwaarts in het vermogen van AI om onafhankelijke, meerstaps redeneringen uit te voeren. Door intelligente datasynthese, realtime web browsen en geavanceerde rapportage te combineren, baant OpenAI de weg voor meer autonome AI-aangedreven onderzoekstools.
Vooruitkijkend voorziet OpenAI nog geavanceerdere AI-agenten die asynchroon online onderzoek en real-world taakuitvoering kunnen uitvoeren. De integratie van Deep Research met OpenAI's aankomende agent, Operator, belooft de rol van AI in onderzoek, automatisering en besluitvorming opnieuw te definiëren.
Deep Research gaat een revolutie teweegbrengen in de manier waarop professionals, onderzoekers en consumenten informatie verzamelen en synthetiseren, waardoor uren werk in minuten worden omgezet.