I den snabbt utvecklande världen av medicinsk teknik har artificiell intelligens (AI) dykt upp som ett kontroversiellt men lovande verktyg. Tillämpningen av AI i komplexa medicinska scenarier har väckt stor debatt bland vårdpersonal. En nyligen genomförd studie som undersöker förmågan hos AI att hjälpa till i kliniskt beslutsfattande har fört denna diskussion i skarpare fokus.
Utförs av forskare vid Massgeneral Brigham, utvärderade studien prestandan hos OpenAI:s Chat vid diagnostisering av medicinska tillstånd baserat på fallstudier ur läroböcker. Överraskande nog uppnådde Chat en framgångsgrad på 72 % i kliniskt beslutsfattande, vilket indikerar dess potential som ett stödjande verktyg vid medicinsk diagnos.
I takt med att hälso- och sjukvårdssystem världen över brottas med ökande kostnader och komplexitet, skulle AI kunna erbjuda en lösning för att förbättra effektiviteten och noggrannheten i diagnostik. Med en sjukvård som stod för cirka 18 % av USA:s BNP år 2021, nästan dubbelt så mycket som genomsnittet bland avancerade ekonomier, är behovet av mer effektiva diagnostiska metoder uppenbart. AI-verktyg som Chat skulle potentiellt kunna revolutionera hälso- och sjukvårdssektorn och göra diagnostik snabbare, mer exakt och kostnadseffektiv.
Studien var en av de första som utvärderade kapaciteten hos stora språkmodeller inom ett brett spektrum av klinisk vård. Chats prestanda utvärderades från initial patientinteraktion till vårdhantering efter diagnos. AI-modellen visade en framgångsgrad på 77 % vid den slutliga diagnosen men hade en lägre framgångsgrad på 60 % när det gällde differentialdiagnos, vilket innebär att förstå alla möjliga tillstånd som en uppsättning symtom kan indikera.
Även om resultaten är lovande, är det viktigt att notera att effektiviteten av AI-tillämpningar i verkliga kliniska miljöer kan variera avsevärt från kontrollerade forskningsmiljöer. Kritiker hävdar att många AI-studier inte är förankrade i faktiska kliniska behov och ofta förbiser de praktiska utmaningarna med att implementera AI i verkliga vårdmiljöer, som risker för felbehandling.
Marc Succi, verkställande direktör vid Mass General Brighams innovationsinkubator och medförfattare till rapporten, erkänner denna lucka. Han påpekar att även om AI visar stor potential inom patientvård i tidiga skeden när informationen är begränsad, behöver den betydande förbättringar av differentialdiagnostik innan den kan integreras helt i sjukvården.
Succi liknar Chats nuvarande förmågor med en nyutexaminerad läkares. Utan etablerade riktmärken för framgångsgraden bland läkare på olika senioritetsnivåer är det dock svårt att kvantifiera det värde som AI tillför en läkares arbete.
Framöver efterlyser Succi mer riktmärkesforskning, regulatorisk vägledning och förbättringar av diagnostiska framgångsfrekvenser. Detta, anser han, är avgörande för att underlätta implementeringen av AI-modeller som Chat på sjukhus. AI:s roll inom hälso- och sjukvården utvecklas fortfarande, och även om Chats framsteg är anmärkningsvärda, är det tydligt att vi bara är i början av att förstå hur AI kan utnyttjas för att omvandla hälso- och sjukvården.