ChatGPT מציג 72% דיוק אבחון בקבלת החלטות קלינית

אוגוסט 30, 2023

בעולם המתפתח במהירות של טכנולוגיה רפואית, בינה מלאכותית (AI) התגלתה ככלי שנוי במחלוקת אך מבטיח. היישום של בינה מלאכותית בתרחישים רפואיים מורכבים עורר ויכוח רב בקרב אנשי מקצוע בתחום הבריאות. מחקר שנערך לאחרונה שחקר את היכולת של AI לסייע בקבלת החלטות קלינית הביא את הדיון הזה למוקד חד יותר.

נערך על ידי חוקרים ב גנרל המיסה בריגהם, המחקר העריך את ביצועי צ'אט של OpenAI באבחון מצבים רפואיים על סמך מחקרי מקרה מספרי לימוד. באופן מפתיע, צ'אט השיג שיעור הצלחה של 72% בקבלת החלטות קליניות, דבר המצביע על הפוטנציאל שלו ככלי תומך באבחון רפואי.

בעוד מערכות בריאות ברחבי העולם מתמודדות עם עלויות ומורכבות גוברות, בינה מלאכותית יכולה להציע פתרון לשיפור היעילות והדיוק באבחון. כיוון ששירותי הבריאות מהווים כ-18% מהתמ"ג של ארה"ב בשנת 2021, כמעט כפול מהשיעור הממוצע בקרב כלכלות מפותחות, הצורך בשיטות אבחון יעילות יותר ניכר. כלי בינה מלאכותית כמו צ'אט עשויים לחולל מהפכה במגזר הבריאות, ולהפוך את האבחון למהיר, מדויק וחסכוני יותר.

המחקר היה אחד הראשונים שהעריך את יכולותיהם של מודלים של שפה רחבה במגוון רחב של טיפול קליני. ביצועי הצ'אט הוערכו החל מהאינטראקציה הראשונית עם המטופל ועד לניהול הטיפול לאחר האבחון. מודל הבינה המלאכותית הדגים שיעור הצלחה של 77% באבחון הסופי, אך היה לו שיעור הצלחה נמוך יותר של 60% בכל הנוגע לאבחון מבדל, הכולל הבנת כל המצבים האפשריים שקבוצת תסמינים עשויה להצביע עליהם.

למרות שהתוצאות מבטיחות, חשוב לציין שהיעילות של יישומי בינה מלאכותית במסגרות קליניות בעולם האמיתי יכולה להשתנות באופן משמעותי מסביבות מחקר מבוקרות. המבקרים טוענים שמחקרי בינה מלאכותית רבים אינם מבוססים על צרכים קליניים בפועל ולעתים קרובות מתעלמים מהאתגרים המעשיים של יישום בינה מלאכותית במסגרות בריאות בעולם האמיתי, כמו סיכוני רשלנות.

מארק סוצ'י, מנכ"ל בחממת החדשנות של מאס גנרל בריגהם ומחבר שותף של הדו"ח, מכיר בפער הזה. הוא מציין כי בעוד שבינה מלאכותית מראה פוטנציאל גדול בטיפול בחולים בשלבים מוקדמים כאשר המידע מוגבל, היא זקוקה לשיפורים משמעותיים באבחון דיפרנציאלי לפני שניתן יהיה לשלב אותה במלואה במערכת הבריאות.

סוצ'י משווה את היכולות הנוכחיות של צ'אט לאלו של רופא שסיים את לימודיו לאחרונה. עם זאת, ללא מדדים מבוססים לשיעורי הצלחה בקרב רופאים ברמות ותק שונות, קשה לכמת את הערך שמוסיפה בינה מלאכותית לעבודתו של רופא.

במבט קדימה, סוצ'י קורא למחקר נוסף בתחום, הנחיות רגולטוריות ושיפורים בשיעורי ההצלחה באבחון. הוא מאמין שזה חיוני להקלת פריסת מודלים של בינה מלאכותית כמו Chat בבתי חולים. תפקידה של בינה מלאכותית בתחום הבריאות עדיין מתפתח, ובעוד שהישגי Chat ראויים לציון, ברור שאנחנו רק בתחילת הדרך בה אנו מבינים כיצד ניתן למנף בינה מלאכותית כדי לשנות את שירותי הבריאות.