Firma OpenAI ogłosiła wprowadzenie Deep Research, przełomowego agenta AI zaprojektowanego do przeprowadzania wieloetapowych badań w internecie. Ta nowa funkcja, dostępna w Czacie, pozwala użytkownikom odciążyć się od skomplikowanych zadań badawczych online, syntetyzując ogromne ilości informacji w ciągu kilku minut.
Zbudowany na zaawansowanej wersji nadchodzącego modelu OpenAI o3, Deep Research wyróżnia się w analizie danych, syntezie wiedzy i rozumowaniu opartym na sieci. Model niezależnie przeszukuje, analizuje i kompiluje dane, tworząc raporty na poziomie analityka badań z jasnymi cytatami i odniesieniami.
Funkcja ta jest obecnie dostępna dla użytkowników Chat Pro, a użytkownicy Plus i Team wkrótce uzyskają do niej dostęp.
Dlaczego OpenAI opracowało głębokie badania
Deep Research zostało stworzone dla profesjonalistów i badaczy, którzy potrzebują dogłębnej wiedzy z takich dziedzin jak finanse, nauka, polityka i inżynieria. Narzędzie jest również przeznaczone dla konsumentów poszukujących hiper-personalizowanych rekomendacji, co czyni je cennym zasobem do dokładnego porównywania produktów przy zakupach, takich jak samochody, urządzenia i technologia.
W przeciwieństwie do tradycyjnych modeli sztucznej inteligencji, które zapewniają krótkie podsumowania, Deep Research jest w stanie:
- Przeglądanie i analizowanie setek źródeł internetowych
- Generowanie dobrze udokumentowanych raportów
- Zapewnianie strukturalnych cytatów w celu weryfikacji faktów
- Synteza nieintuicyjnych i trudnych do znalezienia spostrzeżeń
Postęp ten stanowi ważny krok w kierunku długoterminowego celu OpenAI, jakim jest sztuczna inteligencja ogólna (AGI), która obejmuje zdolność do generowania nowej wiedzy, a nie tylko pobierania istniejących danych.
Jak działa głębokie badanie
Użytkownicy mogą aktywować funkcję Deep Research w czacie, wybierając opcję „Deep Research” w edytorze wiadomości. Po wprowadzeniu zapytania, na przykład analizy konkurencji usług streamingowych lub raportu na temat trendów w adopcji pojazdów elektrycznych, sztuczna inteligencja rozpoczyna dogłębne badanie.
Kluczowe cechy:
- Badania wieloetapowe:Deep Research autonomicznie planuje i realizuje złożone ścieżki badawcze, dostosowując je na podstawie bieżących ustaleń.
- Obsługa plików i arkuszy kalkulacyjnych:Użytkownicy mogą przesyłać pliki lub arkusze kalkulacyjne w celu lepszego zrozumienia kontekstu.
- Śledzenie na żywo:Pasek boczny zawiera aktualizacje dotyczące etapów badań, wykorzystanych źródeł i postępów analizy.
- Kompleksowe raporty:W ciągu 5–30 minut Chat dostarczy szczegółowy raport badawczy wraz z odnośnikami do źródeł.
- Nadchodzące ulepszenia:Przyszłe aktualizacje wprowadzą osadzone obrazy, wizualizacje danych i wykresy analityczne w celu ulepszenia raportów.
W przeciwieństwie do GPT-4o, które doskonale sprawdza się w interakcjach multimodalnych w czasie rzeczywistym, Deep Research jest przeznaczone do obszernych badań dotyczących konkretnych dziedzin, wymagających skrupulatnej weryfikacji faktów i syntezy.
Wydajność porównawcza: nowy standard w badaniach nad sztuczną inteligencją
Deep Research znacząco przewyższa poprzednie modele sztucznej inteligencji w ocenach badań na poziomie eksperckim, wykazując się lepszym rozumowaniem i dokładnością.
Ostatni egzamin ludzkości
W Humanity's Last Exam, rygorystycznym teście porównawczym sztucznej inteligencji, testującym rozumowanie na poziomie eksperckim w zakresie ponad 100 przedmiotów, Deep Research osiągnął rekordową dokładność na poziomie 26.6%, przewyższając wszystkie główne modele sztucznej inteligencji.
| Model | Precyzja (%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Klaudiusz 3.5 Sonet | 4.3 |
| Myślenie Bliźniąt | 6.2 |
| OtwórzAI o1 | 9.1 |
| GłębokiSeek-R1 | 9.4 |
| OpenAI o3-mini (wysoki) | 13.0 |
| Głębokie badania OpenAI | 26.6 |
Deep Research specjalizuje się w chemii, naukach humanistycznych, społecznych i matematyce, wykorzystując swoje zaawansowane możliwości rozumowania do wyszukiwania i interpretowania złożonych danych skuteczniej niż poprzednie modele.
Wyniki testów porównawczych GAIA
Firma Deep Research ustanowiła również nowy rekord stanu wiedzy (SOTA) w narzędziu GAIA, publicznym teście porównawczym sprawdzającym zdolność sztucznej inteligencji do radzenia sobie z rzeczywistymi, wieloetapowymi zadaniami badawczymi.
| Poziom testowy | Poprzedni SOTA (%) | Głębokie badania Pass@1 (%) | Głęboki konsensus badawczy@64 (%) |
|---|---|---|---|
| Level 1 | 67.92 | 74.29 | 78.66 |
| Level 2 | 67.44 | 69.06 | 73.21 |
| Level 3 | 42.31 | 47.6 | 58.03 |
| Średni | 63.64 | 67.36 | 72.57 |
Wyniki te potwierdzają, że metoda Deep Research jest nie tylko szybsza i wydajniejsza, ale także pozwala na podejmowanie wysoce technicznych wyzwań badawczych z większą precyzją.
Wyzwania i przyszłe ulepszenia
Pomimo zaawansowanych możliwości, Deep Research jest wciąż na wczesnym etapie rozwoju i ma pewne ograniczenia:
- Fakt Halucynacja:Choć ryzyko znacznego ograniczenia może się czasami zdarzyć, że pojawią się błędne interpretacje lub nieścisłe wnioski.
- Problemy z kalibracją pewności:Model nie zawsze dokładnie wyraża niepewność, co może prowadzić do nadmiernej pewności siebie w niektórych odpowiedziach.
- Błędy formatowania i cytowania:Udoskonalamy drobne nieścisłości w formatowaniu i umieszczaniu cytowań.
W miarę rozwoju Deep Research firma OpenAI planuje zwiększyć niezawodność, poprawić dokładność i rozszerzyć dostęp do dodatkowych specjalistycznych źródeł danych.
Dostępność i dostęp
Kto może korzystać z dogłębnych badań?
- Użytkownicy profesjonalni: Dostępne już teraz, z limitem 100 zapytań miesięcznie.
- Użytkownicy Plus i Team: Dostęp wkrótce.
- Użytkownicy korporacyjni: Planowane jest wydanie w przyszłości.
Usługa Deep Research jest obecnie niedostępna w Wielkiej Brytanii, Szwajcarii i Europejskim Obszarze Gospodarczym, jednak OpenAI aktywnie pracuje nad rozszerzeniem dostępu regionalnego.
Nadchodzące ulepszenia
- Bardziej ekonomiczna wersja:Mniejszy, szybszy i wydajniejszy model Deep Research wkrótce będzie dostępny dla wszystkich użytkowników płacących.
- Integracja urządzeń mobilnych i komputerów stacjonarnych:W ciągu najbliższego miesiąca Deep Research zostanie udostępniony w aplikacjach mobilnych i stacjonarnych Chat.
- Rozszerzony dostęp do danych:Przyszłe aktualizacje będą integrować subskrypcyjne i wewnętrzne źródła danych, dzięki czemu badania staną się jeszcze bardziej kompleksowe.
Przyszłość badań wspomaganych sztuczną inteligencją
Deep Research firmy OpenAI stanowi duży krok naprzód w zdolności AI do prowadzenia niezależnego, wieloetapowego rozumowania. Łącząc inteligentną syntezę danych, przeglądanie stron internetowych w czasie rzeczywistym i zaawansowane raportowanie, OpenAI toruje drogę dla bardziej autonomicznych narzędzi badawczych opartych na AI.
Patrząc w przyszłość, OpenAI przewiduje jeszcze bardziej wyrafinowanych agentów AI zdolnych do wykonywania asynchronicznych badań online i wykonywania zadań w świecie rzeczywistym. Integracja Deep Research z nadchodzącym agentem OpenAI, Operator, obiecuje zdefiniować na nowo rolę AI w badaniach, automatyzacji i podejmowaniu decyzji.
Na chwilę obecną Deep Research ma zrewolucjonizować sposób, w jaki profesjonaliści, badacze i konsumenci zbierają i syntetyzują informacje, zamieniając godziny pracy w minuty.