ChatGPT Menampilkan 72% Akurasi Diagnostik dalam Pengambilan Keputusan Klinis

Agustus 30, 2023

Dalam dunia teknologi medis yang berkembang pesat, kecerdasan buatan (AI) telah muncul sebagai alat yang kontroversial namun menjanjikan. Penerapan AI dalam skenario medis yang kompleks telah memicu banyak perdebatan di kalangan profesional kesehatan. Sebuah studi baru-baru ini yang mengeksplorasi kemampuan AI untuk membantu pengambilan keputusan klinis telah membawa diskusi ini ke fokus yang lebih tajam.

Dilakukan oleh peneliti di Brigham Jenderal MassaStudi ini mengevaluasi kinerja Chat OpenAI dalam mendiagnosis kondisi medis berdasarkan studi kasus buku teks. Yang mengejutkan, Chat mencapai tingkat keberhasilan 72% dalam pengambilan keputusan klinis, menunjukkan potensinya sebagai alat pendukung dalam diagnosis medis.

Seiring sistem layanan kesehatan di seluruh dunia bergulat dengan meningkatnya biaya dan kompleksitas, AI dapat menawarkan solusi untuk meningkatkan efisiensi dan akurasi diagnostik. Dengan kontribusi layanan kesehatan terhadap sekitar 18% PDB AS pada tahun 2021, hampir dua kali lipat rata-rata di antara negara-negara maju, kebutuhan akan metode diagnostik yang lebih efektif menjadi jelas. Perangkat AI seperti Chat berpotensi merevolusi sektor layanan kesehatan, menjadikan diagnostik lebih cepat, lebih akurat, dan hemat biaya.

Studi ini merupakan salah satu studi pertama yang menilai kemampuan model bahasa besar dalam spektrum perawatan klinis yang luas. Performa Chat dievaluasi mulai dari interaksi awal pasien hingga manajemen perawatan pascadiagnosis. Model AI menunjukkan tingkat keberhasilan 77% dalam diagnosis akhir, tetapi tingkat keberhasilannya lebih rendah, yaitu 60%, dalam diagnosis banding, yang melibatkan pemahaman semua kemungkinan kondisi yang mungkin ditunjukkan oleh serangkaian gejala.

Meskipun hasilnya menjanjikan, penting untuk dicatat bahwa efektivitas penerapan AI di lingkungan klinis dunia nyata dapat sangat bervariasi dari lingkungan penelitian yang terkontrol. Kritikus berpendapat bahwa banyak penelitian AI tidak didasarkan pada kebutuhan klinis yang sebenarnya dan sering mengabaikan tantangan praktis dalam penerapan AI di lingkungan layanan kesehatan dunia nyata, seperti risiko malpraktik.

Marc Succi, direktur eksekutif inkubator inovasi Mass General Brigham dan salah satu penulis laporan tersebut, mengakui kesenjangan ini. Dia menunjukkan bahwa meskipun AI menunjukkan potensi besar dalam perawatan pasien tahap awal ketika informasi terbatas, AI memerlukan perbaikan yang signifikan dalam diagnosis banding sebelum dapat diintegrasikan sepenuhnya ke dalam sistem layanan kesehatan.

Succi menyamakan kemampuan Chat saat ini dengan kemampuan seorang dokter yang baru lulus. Namun, tanpa adanya tolok ukur yang jelas untuk tingkat keberhasilan di antara dokter dengan berbagai tingkat senioritas, sulit untuk mengukur nilai tambah yang diberikan AI terhadap pekerjaan seorang dokter.

Ke depannya, Succi menyerukan lebih banyak penelitian tolok ukur, panduan regulasi, dan peningkatan tingkat keberhasilan diagnostik. Ia yakin, hal ini krusial untuk memfasilitasi penerapan model AI seperti Chat di rumah sakit. Peran AI dalam layanan kesehatan masih terus berkembang, dan meskipun pencapaian Chat patut dicatat, jelas bahwa kita baru berada di tahap awal pemahaman tentang bagaimana AI dapat dimanfaatkan untuk mentransformasi layanan kesehatan.