Chat-4.0 od OpenAI překonává lidský výkon v neurologických vyšetřeních

12

Sofistikovaný jazykový model OpenAI, Chat-4.0, učinil významný krok vpřed v oblasti propojení umělé inteligence a zdravotní péče. V nedávné studii ověření konceptu tento rozsáhlý jazykový model (LLM) úspěšně prošel zkouškou z klinické neurologie a správně zodpověděl 85 % otázek. Tento působivý úspěch naznačuje, že s dalším vylepšením by si LLM mohl vydobýt významné místo v oblasti klinické neurologie.

Průlomovou studii provedl tým výzkumníků z Univerzitní nemocnice Heidelberg a Německé centrum pro výzkum rakoviny v Heidelbergu. Výsledky zveřejněné 7. prosince podtrhují potenciál umělé inteligence při přetváření zdravotnictví. Test zadán Chat-4.0 zahrnovala sadu otázek od Americké rady pro psychiatrii a neurologii, doplněnou o výběr z Evropské rady pro neurologii.

Chat-4.0 překonal svého předchůdce, Chat-3.5, který správně zodpověděl 1 306 z 1 956 otázek, což představuje skóre 66.8 %. Novější model však zaznamenal úspěch, když správně zodpověděl 1 662 otázek, což představuje 85% úspěšnost. Pro srovnání, průměrné lidské skóre je 73.8 %, což naznačuje, že Chat-4.0 překonal lidský výkon. Navíc, vzhledem k tomu, že 70 % je standardní skóre pro úspěšné absolvování v akademické sféře, lze s jistotou říci, že Chat-4.0 úspěšně složil neurologickou zkoušku.

Studie však také zdůraznila oblasti, kde by se modely mohly zlepšit. Oba modely například prokázaly slabší výkon v úkolech vyžadujících „myšlení vyššího řádu“ ve srovnání s těmi, které vyžadují pouze „myšlení nižšího řádu“. To naznačuje, že zatímco LLM jsou slibné v oblasti klinické neurologie, stále existuje prostor pro zlepšení.

Navzdory těmto omezením jsou výzkumníci zapojení do studie optimističtí ohledně potenciálních aplikací LLM v klinické neurologii. Dr. Varun Venkataramani, jeden z autorů studie, vysvětlil Cointelegraphu: „Naši studii vnímáme spíše jako důkaz koncepce schopností LLM. Stále je zapotřebí vývoj a pravděpodobně i specifické doladění LLM, aby byly správně použitelné pro klinickou neurologii.“

Úspěšné využití umělé inteligence ve významných oblastech zdravotnictví, jako je výzkum rakoviny společnosti AstraZeneca nebo boj proti nadměrnému předepisování antibiotik v Hongkongu, podtrhuje potenciál této technologie. Nedávný úspěch v testu Chat-4.0, kterým bylo složení neurologického vyšetření, signalizuje vzrušující budoucnost umělé inteligence ve zdravotnictví a představuje další krok vpřed na cestě k lékařskému pokroku řízenému umělou inteligencí.