Складна мовна модель OpenAI, Chat-4.0, зробила значний крок вперед на перетині штучного інтелекту та охорони здоров'я. У нещодавньому дослідженні перевірки концепції ця велика мовна модель (LLM) успішно пройшла іспит з клінічної неврології, правильно відповівши на 85% запитань. Це вражаюче досягнення свідчить про те, що з подальшим удосконаленням LLM можуть зайняти значну нішу в галузі клінічної неврології.
Новаторське дослідження було проведено командою дослідників з Університетської лікарні Гейдельберга та Німецького центру дослідження раку в Гейдельберзі. Результати, опубліковані 7 грудня, підкреслюють потенціал штучного інтелекту в зміні системи охорони здоров’я. Проведений тест Чат-4.0 включав набір питань від Американської ради з психіатрії та неврології, доповнений добіркою від Європейської ради з неврології.
Чат-4.0 перевершив свого попередника, Чат-3.5, який правильно відповів на 1,306 із 1,956 запитань, досягнувши балу 66.8%. Однак новіша модель відзначила досягнення, правильно відповівши на 1,662 запитання, що становить 85% успішності. Для порівняння, середній бал людини становить 73.8%, що свідчить про те, що Chat-4.0 перевершив людські показники. Більше того, враховуючи, що 70% є стандартним прохідним балом в академічних колах, можна з упевненістю сказати, що Chat-4.0 успішно склав іспит з неврології.
Однак дослідження також висвітлило області, де моделі можна покращити. Наприклад, обидві моделі продемонстрували нижчу продуктивність у завданнях, що вимагають «мислення вищого рівня», порівняно з тими, що потребують лише «мислення нижчого порядку». Це вказує на те, що, незважаючи на те, що магістратури є багатообіцяючими в галузі клінічної неврології, все ще є місце для вдосконалення.
Незважаючи на ці обмеження, дослідники, які беруть участь у дослідженні, оптимістично дивляться на потенційне застосування LLMs у клінічній неврології. Доктор Варун Венкатарамані, один із авторів дослідження, пояснив Cointelegraph: "Ми розглядаємо наше дослідження більше як доказ концепції можливостей LLM. Потрібна розробка та, ймовірно, навіть конкретне налаштування LLM, щоб зробити їх належним чином застосовними для клінічної неврології".
Успішне використання штучного інтелекту у важливих завданнях охорони здоров'я, таких як дослідження раку AstraZeneca або боротьба з надмірним призначенням антибіотиків у Гонконзі, підкреслює потенціал цієї технології. Нещодавнє досягнення Chat-4.0 у успішному проходженні неврологічного іспиту сигналізує про захопливе майбутнє штучного інтелекту в охороні здоров'я, що є ще одним кроком уперед на шляху до медичних досягнень на основі штучного інтелекту.