OpenAI ChatGPT: Sekarang Mendengarkan, Berbicara dan Menanggapi Gambar

September 25, 2023

Chatbot AI populer dari OpenAI, kini telah belajar berkomunikasi menggunakan bahasa lisan, seperti siri dan Alexa, menandai lompatan signifikan dalam komunikasi AI.

Dengan perkembangan baru ini, pengguna dapat berinteraksi dengan Chat melalui interaksi suara, menjadikannya lebih mudah diakses dan serbaguna. Startup AI yang berbasis di San Francisco, OpenAI, baru-baru ini meluncurkan versi chatbot ini, yang mendorong batasan komunikasi AI.

Sebagai inovasi baru, Chat kini dapat merespons gambar. Misalnya, pengguna dapat mengunggah foto bagian dalam kulkas mereka, dan chatbot dapat menyarankan hidangan potensial berdasarkan bahan-bahan yang tersedia. Fitur inovatif ini bertujuan untuk membuat Chat lebih ramah pengguna dan bermanfaat.

OpenAI telah mengembangkan perangkat AI-nya dengan pesat. Baru-baru ini, OpenAI meluncurkan versi generator gambar DALL-E dan mengintegrasikannya ke dalam Chat. Sejak diluncurkan pada bulan November, Chat telah menarik ratusan juta pengguna dan menginspirasi layanan serupa dari perusahaan lain.

Bot baru ini mengungguli para pesaingnya seperti Google Bard sekaligus menantang teknologi lama seperti Alexa dan Siri. Asisten digital ini secara tradisional memfasilitasi interaksi dengan perangkat melalui suara. Namun, chatbot yang lebih baru seperti Chat dan Google Bard memiliki kemampuan bahasa yang unggul, memungkinkan mereka untuk membuat email, menulis puisi, dan mendiskusikan hampir semua topik secara instan.

Penawaran terbaru OpenAI secara efektif menggabungkan kedua metode komunikasi ini. Perusahaan memandang berbicara sebagai cara yang lebih intuitif untuk berinteraksi dengan chatbot-nya. OpenAI mengklaim bahwa suara sintetis Chat, yang tersedia dalam lima pilihan berbeda, mengungguli suara yang digunakan oleh asisten digital populer.

Chatbot baru ini akan tersedia untuk semua pelanggan Chat Plus, layanan dengan biaya $20 per bulan, dalam dua minggu ke depan. Namun, bot ini hanya dapat merespons dengan suara saat digunakan di iPhone, iPad, dan perangkat Android.

Meskipun antarmuka suara Chat mungkin mengingatkan pengguna pada asisten sebelumnya, teknologi yang mendasarinya pada dasarnya berbeda. Hal ini terutama didorong oleh model bahasa besar (LLM) yang menghasilkan bahasa dengan menganalisis sejumlah besar teks dari seluruh internet.

Obrolan dapat menanggapi pertanyaan apa pun dalam hitungan detik, berbeda dengan asisten digital lama seperti Alexa dan Siri, yang hanya dapat melakukan sejumlah tugas terbatas atau menjawab daftar pertanyaan terprogram yang terbatas.

Saat OpenAI mengembangkan Chat menjadi sesuatu yang mirip dengan Alexa atau Siri, perusahaan seperti Amazon dan Apple mengubah asisten digital mereka agar menyerupai Chat.

Amazon baru-baru ini meninjau sistem Alexa yang diperbarui yang bertujuan untuk percakapan lebih lancar tentang “topik apa pun”, yang sebagian didorong oleh LLM baru. Sementara itu, Apple telah menguji prototipe LLM-nya untuk produk masa depan, menurut orang dalam.

Chat baru ini juga dapat merespons gambar saat digunakan melalui web, serta di iPhone, iPad, dan perangkat Android. Fitur ini dapat menjadi sangat berharga bagi pengguna dengan gangguan penglihatan.

OpenAI awalnya mendemonstrasikan alat gambar ini pada musim semi tetapi menunda peluncuran publiknya hingga mereka lebih memahami potensi penyalahgunaannya. Misalnya, ada kekhawatiran bahwa alat ini dapat berfungsi sebagai layanan pengenalan wajah yang digunakan untuk mengidentifikasi orang dalam foto dengan cepat.

Terlepas dari kemajuan ini, bot masih memiliki area yang perlu ditingkatkan. Misalnya, ia dapat bergulat dengan homonim, namun ia dapat mengoreksi dirinya sendiri, menunjukkan kemampuan pembelajaran tingkat lanjut dari bot tersebut.

Kesimpulannya, versi terbaru Chat dari OpenAI menandai lompatan signifikan dalam komunikasi AI, menawarkan interaksi pengguna yang lebih baik dan fleksibilitas. Seiring AI terus berkembang, akan menarik untuk melihat bagaimana raksasa seperti Amazon dan Apple merespons kemajuan ini.