ChatGPT Zeigt eine diagnostische Genauigkeit von 72 % bei der klinischen Entscheidungsfindung

30. August 2023

In der sich schnell entwickelnden Welt der Medizintechnik hat sich künstliche Intelligenz (KI) zu einem umstrittenen, aber vielversprechenden Werkzeug entwickelt. Der Einsatz von KI in komplexen medizinischen Szenarien hat unter Angehörigen der Gesundheitsberufe erhebliche Debatten ausgelöst. Eine aktuelle Studie, die die Fähigkeit von KI zur Unterstützung der klinischen Entscheidungsfindung untersucht, hat diese Diskussion in den Mittelpunkt gerückt.

Durchgeführt von Forschern bei Messe General BrighamDie Studie bewertete die Leistung von OpenAIs Chat bei der Diagnose von Erkrankungen anhand von Fallstudien aus Lehrbüchern. Überraschenderweise erreichte Chat eine Erfolgsquote von 72 % bei klinischen Entscheidungen, was auf sein Potenzial als unterstützendes Instrument bei der medizinischen Diagnose hinweist.

Da Gesundheitssysteme weltweit mit steigenden Kosten und Komplexität zu kämpfen haben, könnte KI eine Lösung bieten, um die Effizienz und Genauigkeit der Diagnostik zu verbessern. Da das Gesundheitswesen im Jahr 2021 rund 18 % des US-BIP ausmachte – fast doppelt so viel wie der Durchschnitt der Industrieländer –, ist der Bedarf an effektiveren Diagnosemethoden offensichtlich. KI-Tools wie Chat könnten den Gesundheitssektor revolutionieren und die Diagnostik schneller, präziser und kostengünstiger machen.

Die Studie war eine der ersten, die die Fähigkeiten großer Sprachmodelle in einem breiten Spektrum der klinischen Versorgung untersuchte. Die Leistung von Chat wurde von der ersten Patienteninteraktion bis zum postdiagnostischen Behandlungsmanagement bewertet. Das KI-Modell zeigte eine Erfolgsquote von 77 % bei der endgültigen Diagnose, hatte jedoch eine geringere Erfolgsquote von 60 % bei der Differentialdiagnose, bei der alle möglichen Erkrankungen, auf die eine Reihe von Symptomen hinweisen könnte, verstanden werden müssen.

Obwohl die Ergebnisse vielversprechend sind, ist es wichtig zu beachten, dass die Wirksamkeit von KI-Anwendungen in realen klinischen Umgebungen erheblich von der Wirksamkeit kontrollierter Forschungsumgebungen abweichen kann. Kritiker argumentieren, dass viele KI-Studien nicht auf tatsächlichen klinischen Bedürfnissen basieren und häufig die praktischen Herausforderungen der Implementierung von KI in realen Gesundheitsumgebungen, wie etwa das Risiko von Kunstfehlern, außer Acht lassen.

Marc Succi, Geschäftsführer des Innovationsinkubators von Mass General Brigham und Mitautor des Berichts, erkennt diese Lücke an. Er weist darauf hin, dass KI zwar großes Potenzial in der Patientenversorgung im Frühstadium zeigt, wenn die Informationen begrenzt sind, sie jedoch erhebliche Verbesserungen in der Differentialdiagnose erfordert, bevor sie vollständig in das Gesundheitssystem integriert werden kann.

Succi vergleicht die aktuellen Fähigkeiten von Chat mit denen eines frisch diplomierten Arztes. Ohne etablierte Benchmarks für die Erfolgsquoten von Ärzten unterschiedlicher Dienstaltersstufen ist es jedoch schwierig, den Mehrwert zu quantifizieren, den KI für die Arbeit eines Arztes bringt.

Mit Blick auf die Zukunft fordert Succi mehr Benchmark-Forschung, regulatorische Leitlinien und Verbesserungen der diagnostischen Erfolgsraten. Dies sei seiner Ansicht nach entscheidend, um den Einsatz von KI-Modellen wie Chat in Krankenhäusern zu erleichtern. Die Rolle von KI im Gesundheitswesen entwickelt sich noch weiter, und obwohl die Erfolge von Chat bemerkenswert sind, steht klar, dass wir erst am Anfang des Verständnisses stehen, wie KI zur Transformation des Gesundheitswesens genutzt werden kann.