OpenAIs sofistikerede sprogmodel, Chat-4.0, har gjort et betydeligt fremskridt i krydsfeltet mellem kunstig intelligens og sundhedspleje. I et nyligt proof-of-concept-studie bestod denne store sprogmodel (LLM) en klinisk neurologieksamen og besvarede 85% af spørgsmålene korrekt. Denne imponerende præstation antyder, at LLM'er med yderligere forbedringer kan skabe sig en betydelig niche inden for klinisk neurologi.
Den banebrydende undersøgelse blev udført af et team af forskere fra Universitetshospitalet Heidelberg og det tyske cancerforskningscenter i Heidelberg. Resultaterne, der blev offentliggjort den 7. december, understreger AI's potentiale til at omforme sundhedsvæsenet. Testen afgivet til Chat-4.0 omfattede et sæt spørgsmål fra American Board of Psychiatry and Neurology, suppleret med et udvalg fra European Board for Neurology.
Chat-4.0 klarede sig bedre end sin forgænger, Chat-3.5, som besvarede 1,306 ud af 1,956 spørgsmål korrekt og opnåede en score på 66.8%. Den nyere model opnåede dog en præstation ved at besvare 1,662 spørgsmål korrekt, hvilket svarer til en succesrate på 85%. For at sætte dette i perspektiv ligger den gennemsnitlige menneskelige score på 73.8%, hvilket indikerer, at Chat-4.0 overgik menneskelig præstation. Da 70% er standardbeståelsesscore i den akademiske verden, kan man desuden roligt sige, at Chat-4.0 bestod neurologieksamenen.
Undersøgelsen fremhævede dog også områder, hvor modellerne kunne forbedres. For eksempel viste begge modeller en svagere præstation i opgaver, der kræver "højere ordenstænkning" sammenlignet med dem, der kun har brug for "lavere ordenstænkning." Dette indikerer, at mens LLM'er viser løfte inden for klinisk neurologi, er der stadig plads til forbedring.
På trods af disse begrænsninger er forskerne involveret i undersøgelsen optimistiske med hensyn til de potentielle anvendelser af LLM'er i klinisk neurologi. Dr. Varun Venkataramani, en af forfatterne til undersøgelsen, forklarede til Cointelegraph: "Vi ser vores undersøgelse mere som et bevis på konceptet for LLM'ers muligheder. Der er stadig behov for udvikling og sandsynligvis endda specifik finjustering af LLM'er for at gøre dem korrekt anvendelige til klinisk neurologi."
Den succesfulde brug af AI i betydelige sundhedsopgaver, såsom AstraZenecas kræftforskning eller bekæmpelse af overordination af antibiotika i Hong Kong, understreger potentialet i denne teknologi. Den nylige præstation med Chat-4.0 i at bestå en neurologisk eksamen signalerer en spændende fremtid for AI inden for sundhedsvæsenet og markerer endnu et skridt fremad på rejsen mod AI-drevne medicinske fremskridt.