OpenAI telah meluncurkan o3-mini, model terbaru dalam seri penalarannya, yang dirancang untuk memberikan kinerja luar biasa dalam bidang STEM, rekayasa perangkat lunak, dan pemecahan masalah logis. Rilis ini meningkatkan aksesibilitas AI dengan mempertahankan biaya rendah sekaligus meningkatkan kecepatan dan akurasi dibandingkan pendahulunya, OpenAI o1-mini.
Setelah pratinjau pada Desember 2024, o3-mini kini resmi tersedia di layanan Chat dan API. O3-mini menawarkan kapasitas penalaran yang lebih tinggi, sehingga ideal untuk tugas-tugas di bidang sains, teknologi, teknik, dan matematika (STEM). Pengembang dapat memanfaatkan pemanggilan fungsinya, keluaran terstruktur, dan pesan pengembang, memastikan fleksibilitas yang lebih tinggi dan aplikasi yang siap produksi.
Fitur dan Aksesibilitas yang Ditingkatkan
Salah satu pembaruan yang paling diantisipasi dengan OpenAI o3-mini adalah dukungannya terhadap berbagai tingkat upaya penalaran, yang memungkinkan pengguna mengoptimalkan model untuk kecepatan atau kompleksitas berdasarkan kebutuhan mereka. Mode-mode ini meliputi:
- Upaya Penalaran Rendah: Mengutamakan kecepatan dengan biaya komputasi minimal.
- Upaya Penalaran Sedang: Menyeimbangkan akurasi dan waktu respons.
- Upaya Penalaran Tinggi: Memaksimalkan kecerdasan untuk tugas-tugas kompleks.
Berbeda dengan OpenAI o1-mini, o3-mini menghadirkan kemampuan pencarian terstruktur, yang memungkinkan pengguna mengakses informasi terkini dengan sumber web yang relevan. Selain itu, o3-mini melipatgandakan batas pesan untuk pengguna Chat Plus dan Tim, dari 50 menjadi 150 pesan per hari, sehingga meningkatkan aksesibilitas bagi pengguna yang sering menggunakan layanan.
Untuk pertama kalinya, OpenAI menyediakan model penalaran bagi pengguna gratis di Chat, yang memungkinkan mereka merasakan pemecahan masalah logis berbantuan AI dengan memilih opsi "Penalaran" di pembuat pesan.
Tolok Ukur Performa: Mengungguli Model Sebelumnya
OpenAI o3-mini melampaui pendahulunya, o1-mini, dalam berbagai tolok ukur ilmiah dan matematika:
Matematika dan Coding
- Penalaran Matematika: Akurasinya setara dengan OpenAI o1 sekaligus menawarkan waktu respons yang lebih cepat.
- Kompetisi Matematika (AIME 2024): Mengungguli o1-mini dengan upaya penalaran yang tinggi.
- Pemrograman Kompetitif Codeforces: Mencapai lebih tinggi Skor Elo di seluruh tingkat upaya penalaran.
- Rekayasa Perangkat Lunak (SWE-Bench): Melampaui model sebelumnya, menunjukkan hasil terbaik dalam pengembangan perangkat lunak berbantuan AI.
Pengetahuan Ilmiah Tingkat Lanjut
- Pertanyaan Sains Tingkat PhD (GPQA Diamond): Unggul dalam biologi, kimia, dan fisika, mencapai tingkat kinerja yang mendekati OpenAI o1.
- Matematika Tingkat Penelitian (FrontierMath): Dengan Integrasi alat Python, o3-mini berhasil memecahkan lebih dari 32% masalah, termasuk 28% dari masalah yang paling menantang (T3).
Pengetahuan Umum dan Preferensi Manusia
- Evaluasi menunjukkan bahwa 56% preferensi untuk respon o3-mini dibandingkan o1-mini.
- Mengurangi kesalahan besar sebesar 39%, meningkatkan keandalan pada kesulitancult pertanyaan dunia nyata.
Peningkatan Kecepatan dan Efisiensi
OpenAI o3-mini memberikan respons 24% lebih cepat dari o1-mini, Mengurangi waktu respons rata-rata dari 10.16 detik menjadi 7.7 detikDalam tes latensi, o3-mini mempertahankan Waktu 2,500 ms lebih cepat untuk token pertama, memastikan interaksi yang lebih cepat dan lancar.
Peningkatan Keamanan dan Pengembangan AI yang Etis
OpenAI telah mengintegrasikan teknik penyelarasan yang disengaja untuk memastikan o3-mini menghasilkan respons yang aman dan selaras dengan manusia. Pengujian ekstensif mengungkapkan bahwa o3-mini secara signifikan melampaui GPT-4o dalam evaluasi keamanan, menjadikannya salah satu model OpenAI yang paling tangguh dalam mencegah penyalahgunaan dan eksploitasi jailbreak.
Melalui tim red-teaming eksternal dan evaluasi keamanan sistematis, OpenAI terus mengurangi risiko sekaligus mengoptimalkan kecerdasan AI. Kartu sistem terbaru memberikan wawasan tentang evaluasi konten yang tidak diizinkan dan protokol keamanan.
Apa yang Selanjutnya untuk OpenAI?
Dengan o3-mini, OpenAI telah mengambil langkah signifikan lainnya untuk membuat penalaran AI tingkat lanjut lebih mudah diakses dan hemat biaya. Model ini sejalan dengan misi perusahaan yang sedang berjalan untuk mengurangi harga per token sambil mempertahankan kemampuan penalaran tingkat atas.
Seiring meluasnya adopsi AI, OpenAI tetap berkomitmen untuk mendorong batasan model AI yang cerdas, efisien, dan aman, memastikan bahwa bisnis, pengembang, dan pelajar dapat memanfaatkan AI untuk pemecahan masalah, inovasi, dan penelitian.
Mulai hari ini, o3-mini tersedia untuk pengguna Chat Plus, Team, dan Pro, dengan akses Enterprise yang akan diluncurkan pada bulan Februari. Akses API diberikan kepada pengembang terpilih di tingkatan 3-5.
Bagi mereka yang ingin memanfaatkan kekuatan AI dalam STEM dan pengembangan perangkat lunak, OpenAI o3-mini menghadirkan lompatan maju yang menarik.