OpenAI Meluncurkan Riset Mendalam: Analisis Internet Multi-Langkah Bertenaga AI

Februari 7, 2025

OpenAI telah mengumumkan peluncuran Deep Research, agen AI inovatif yang dirancang untuk melakukan riset multi-tahap di internet. Fitur baru ini, yang tersedia di Chat, memungkinkan pengguna untuk mengalihkan tugas riset daring yang kompleks, mensintesis sejumlah besar informasi dalam hitungan menit.

Dibangun berdasarkan versi lanjutan dari model OpenAI o3 yang akan datang, Deep Research unggul dalam analisis data, sintesis pengetahuan, dan penalaran berbasis web. Model ini secara independen mencari, menganalisis, dan menyusun data, menghasilkan laporan tingkat analis riset dengan kutipan dan referensi yang jelas.

Fitur ini saat ini tersedia untuk pengguna Chat Pro, dengan pengguna Plus dan Team yang akan mendapatkan akses berikutnya.

Mengapa OpenAI Mengembangkan Penelitian Mendalam

Deep Research dibuat untuk para profesional dan peneliti yang membutuhkan pengetahuan mendalam di berbagai bidang seperti keuangan, sains, kebijakan, dan teknik. Alat ini juga dirancang untuk konsumen yang mencari rekomendasi yang sangat personal, menjadikannya aset berharga untuk perbandingan produk menyeluruh pada pembelian seperti mobil, peralatan, dan teknologi.

Tidak seperti model AI tradisional yang memberikan ringkasan singkat, Penelitian Mendalam mampu:

  • Menjelajahi dan menganalisis ratusan sumber online
  • Menghasilkan laporan yang terdokumentasi dengan baik
  • Menyediakan kutipan terstruktur untuk verifikasi fakta
  • Mensintesis wawasan yang tidak intuitif dan sulit ditemukan

Kemajuan ini merupakan langkah besar menuju tujuan jangka panjang OpenAI yaitu Kecerdasan Umum Buatan (AGI), yang mencakup kemampuan menghasilkan pengetahuan baru dan bukan sekadar mengambil data yang sudah ada.

Cara Kerja Penelitian Mendalam

Pengguna dapat mengaktifkan Riset Mendalam di Chat dengan memilih opsi "Riset Mendalam" di pembuat pesan. Setelah memasukkan pertanyaan, seperti analisis kompetitif layanan streaming atau laporan tren adopsi kendaraan listrik, AI akan memulai investigasi mendalam.

Fitur Utama:

  • Penelitian Multi-Langkah: Deep Research secara mandiri merencanakan dan menjalankan lintasan penelitian yang kompleks, menyesuaikannya berdasarkan temuan waktu nyata.
  • Dukungan File dan Spreadsheet:Pengguna dapat mengunggah berkas atau lembar kerja untuk meningkatkan pemahaman kontekstual.
  • Pelacakan Langsung: Bilah sisi memberikan pembaruan mengenai langkah-langkah penelitian, sumber yang digunakan, dan kemajuan analisis.
  • Laporan Komprehensif:Dalam waktu 5 hingga 30 menit, Chat memberikan laporan penelitian terperinci, lengkap dengan kutipan.
  • Peningkatan MendatangPembaruan mendatang akan memperkenalkan gambar tertanam, visualisasi data, dan grafik analitis untuk menyempurnakan laporan.

Tidak seperti GPT-4o, yang unggul dalam interaksi multimoda waktu nyata, Deep Research dirancang untuk pertanyaan spesifik domain yang luas yang memerlukan pemeriksaan fakta dan sintesis yang cermat.

Kinerja Benchmark: Standar Baru dalam Penelitian AI

Penelitian Mendalam secara signifikan mengungguli model AI sebelumnya dalam evaluasi penelitian tingkat ahli, menunjukkan penalaran dan akurasi yang unggul.

Pertunjukan Ujian Terakhir Kemanusiaan

Dalam Ujian Terakhir Kemanusiaan, sebuah tolok ukur AI ketat yang menguji penalaran tingkat ahli pada 100+ subjek, Penelitian Mendalam mencapai rekor akurasi 26.6%, mengungguli semua model AI utama.

Pilih Model Akurasi (%)
GPT-4o 3.3
Grok-2 3.8
Claude 3.5 Soneta 4.3
Gemini Berpikir 6.2
OpenAI o1 9.1
DalamSeek-R1 9.4
OpenAI o3-mini (tinggi) 13.0
Penelitian Mendalam OpenAI 26.6

Deep Research unggul dalam bidang kimia, humaniora, ilmu sosial, dan matematika, menggunakan kemampuan penalaran tingkat lanjutnya untuk mencari dan menafsirkan data kompleks secara lebih efektif daripada model sebelumnya.

Hasil Benchmark GAIA

Deep Research juga telah menetapkan rekor terkini (SOTA) pada GAIA, sebuah tolok ukur publik yang menguji kemampuan AI dalam menangani tugas-tugas penelitian multi-langkah di dunia nyata.

Tingkat Tes SOTA sebelumnya (%) Lulus Penelitian Mendalam @1 (%) Konsensus Penelitian Mendalam@64 (%)
tingkat 1 67.92 74.29 78.66
tingkat 2 67.44 69.06 73.21
tingkat 3 42.31 47.6 58.03
Biasa saja 63.64 67.36 72.57

Hasil-hasil ini menegaskan bahwa Penelitian Mendalam tidak hanya lebih cepat dan lebih efisien tetapi juga mampu menangani tantangan-tantangan penelitian yang sangat teknis dengan presisi yang lebih tinggi.

Tantangan dan Perbaikan Masa Depan

Meskipun kemampuannya sudah sangat maju, Deep Research masih dalam tahap awal dan masih memiliki beberapa keterbatasan:

  • Fakta Halusinasi:Meskipun berkurang secara signifikan, kesalahan penafsiran sesekali atau kesimpulan yang tidak akurat dapat terjadi.
  • Masalah Kalibrasi Kepercayaan:Model tersebut mungkin tidak selalu mengungkapkan ketidakpastian secara akurat, yang berpotensi menimbulkan rasa percaya diri yang berlebihan pada beberapa respons.
  • Kesalahan Pemformatan dan Kutipan: Ketidakkonsistenan format kecil dan masalah penempatan kutipan sedang diperbaiki.

Seiring berkembangnya Penelitian Mendalam, OpenAI berencana untuk meningkatkan keandalan, meningkatkan akurasi, dan memperluas akses ke sumber data khusus tambahan.

Ketersediaan dan Akses

Siapa yang Dapat Menggunakan Penelitian Mendalam?

  • Pengguna Pro: Tersedia sekarang, dengan batas 100 pertanyaan per bulan.
  • Pengguna Plus & Tim: Akses akan segera diluncurkan.
  • Pengguna Perusahaan: Rilis mendatang telah direncanakan.

Deep Research saat ini tidak tersedia di Inggris, Swiss, dan EEA, tetapi OpenAI secara aktif berupaya memperluas akses regional.

Peningkatan Mendatang

  • Versi yang Lebih Hemat Biaya:Model Penelitian Mendalam yang lebih kecil, lebih cepat, dan lebih efisien akan segera tersedia untuk semua pengguna berbayar.
  • Integrasi Seluler & Desktop:Penelitian Mendalam akan diluncurkan ke aplikasi seluler dan desktop Chat dalam bulan depan.
  • Akses Data yang DiperluasPembaruan di masa mendatang akan mengintegrasikan sumber data internal dan berbasis langganan, sehingga membuat penelitian menjadi lebih komprehensif.

Masa Depan Penelitian Berbasis AI

Riset Mendalam OpenAI merupakan lompatan besar ke depan dalam kemampuan AI untuk melakukan penalaran mandiri dan bertahap. Dengan menggabungkan sintesis data cerdas, penelusuran web waktu nyata, dan pelaporan tingkat lanjut, OpenAI membuka jalan bagi alat riset bertenaga AI yang lebih otonom.

Ke depannya, OpenAI membayangkan agen AI yang lebih canggih yang mampu melakukan riset daring asinkron dan eksekusi tugas di dunia nyata. Integrasi Deep Research dengan agen OpenAI yang akan datang, Operator, menjanjikan untuk mendefinisikan ulang peran AI dalam riset, otomatisasi, dan pengambilan keputusan.

Untuk saat ini, Deep Research akan merevolusi cara para profesional, peneliti, dan konsumen mengumpulkan serta mensintesis informasi yang mengubah jam kerja menjadi menit.