ChatGPT Демонструє 72% діагностичної точності при прийнятті клінічних рішень

Серпень 30, 2023

У світі медичних технологій, що швидко розвивається, штучний інтелект (ШІ) став суперечливим, але багатообіцяючим інструментом. Застосування штучного інтелекту в складних медичних сценаріях викликало значні дебати серед медичних працівників. Нещодавнє дослідження, присвячене дослідженню здатності штучного інтелекту допомагати в прийнятті клінічних рішень, звернуло увагу на цю дискусію.

Проведено дослідниками в Массачусетс Генерал БригамУ дослідженні оцінювалася ефективність чату OpenAI у діагностиці захворювань на основі тематичних досліджень з підручників. Дивно, але Chat досяг 72% успішності у прийнятті клінічних рішень, що свідчить про його потенціал як допоміжного інструменту в медичній діагностиці.

Оскільки системи охорони здоров'я в усьому світі стикаються зі зростанням витрат і складності, штучний інтелект може запропонувати рішення для підвищення ефективності та точності діагностики. З огляду на те, що у 2021 році охорона здоров'я становила приблизно 18% ВВП США, що майже вдвічі перевищує середній показник серед розвинених країн, потреба в ефективніших методах діагностики є очевидною. Інструменти штучного інтелекту, такі як Chat, потенційно можуть революціонізувати сектор охорони здоров'я, зробивши діагностику швидшою, точнішою та економічно ефективною.

Це дослідження було одним із перших, яке оцінило можливості моделей великих мов у широкому спектрі клінічної допомоги. Продуктивність Chat оцінювалася від початкової взаємодії з пацієнтом до ведення догляду після встановлення діагнозу. Модель штучного інтелекту продемонструвала 77% успішності у постановці остаточного діагнозу, але мала нижчий рівень успішності – 60%, коли йшлося про диференціальну діагностику, яка передбачає розуміння всіх можливих станів, на які може вказувати набір симптомів.

Незважаючи на те, що результати є багатообіцяючими, важливо зазначити, що ефективність програм ШІ в реальних клінічних умовах може значно відрізнятися від контрольованих дослідницьких середовищ. Критики стверджують, що багато досліджень штучного інтелекту не ґрунтуються на реальних клінічних потребах і часто ігнорують практичні проблеми впровадження штучного інтелекту в реальних умовах охорони здоров’я, наприклад ризики недбалості.

Марк Суччі, виконавчий директор інноваційного інкубатора Mass General Brigham і співавтор звіту, визнає цю прогалину. Він зазначає, що хоча штучний інтелект демонструє великий потенціал на ранніх стадіях лікування пацієнтів, коли інформація обмежена, він потребує значних удосконалень у диференціальній діагностиці, перш ніж його можна буде повністю інтегрувати в систему охорони здоров’я.

Суччі порівнює поточні можливості Чата з можливостями лікаря-новоспеченого випускника. Однак, без встановлених орієнтирів щодо рівня успішності серед лікарів різного рівня старшинства, важко кількісно оцінити цінність, яку штучний інтелект додає до роботи лікаря.

Забігаючи вперед, Суччі закликає до проведення додаткових досліджень, розробки нормативних актів та покращення показників успішної діагностики. Він вважає, що це має вирішальне значення для сприяння впровадженню моделей штучного інтелекту, таких як Chat, у лікарнях. Роль штучного інтелекту в охороні здоров'я все ще розвивається, і хоча досягнення Chat варті уваги, очевидно, що ми лише на початку розуміння того, як штучний інтелект можна використовувати для трансформації охорони здоров'я.