Mô hình ngôn ngữ tinh vi Chat-4.0 của OpenAI đã có những bước tiến đáng kể trong lĩnh vực giao thoa giữa trí tuệ nhân tạo và chăm sóc sức khỏe. Trong một nghiên cứu chứng minh khái niệm gần đây, mô hình ngôn ngữ lớn (LLM) này đã vượt qua kỳ thi thần kinh học lâm sàng, trả lời đúng 85% số câu hỏi. Thành tựu ấn tượng này cho thấy với những cải tiến hơn nữa, LLM có thể tạo ra một vị thế đáng kể trong lĩnh vực thần kinh học lâm sàng.
Nghiên cứu mang tính đột phá này được thực hiện bởi một nhóm các nhà nghiên cứu đến từ Bệnh viện Đại học Heidelberg và Trung tâm Nghiên cứu Ung thư Đức ở Heidelberg. Kết quả được công bố vào ngày 7 tháng XNUMX, nhấn mạnh tiềm năng của AI trong việc định hình lại hoạt động chăm sóc sức khỏe. Bài kiểm tra được thực hiện để Trò chuyện-4.0 bao gồm một bộ câu hỏi từ Hội đồng Tâm thần và Thần kinh học Hoa Kỳ, được bổ sung bởi tuyển tập từ Hội đồng Thần kinh học Châu Âu.
Chat-4.0 vượt trội hơn phiên bản tiền nhiệm của nó, Trò chuyện-3.5, Chat-4.0 đã trả lời đúng 1,306/1,956 câu hỏi, đạt điểm 66.8%. Tuy nhiên, mô hình mới hơn đã ghi nhận thành tích khi trả lời đúng 1,662 câu hỏi, tương đương với tỷ lệ thành công 85%. Để so sánh, điểm trung bình của con người là 73.8%, cho thấy Chat-4.0 đã vượt trội hơn hiệu suất của con người. Hơn nữa, với 70% là điểm chuẩn để đỗ trong học viện, có thể khẳng định Chat-4.0 đã vượt qua kỳ thi thần kinh học một cách an toàn.
Tuy nhiên, nghiên cứu cũng nhấn mạnh những lĩnh vực mà mô hình có thể cải thiện. Ví dụ, cả hai mô hình đều thể hiện hiệu suất yếu hơn trong các nhiệm vụ đòi hỏi “tư duy bậc cao” so với những mô hình chỉ cần “tư duy bậc thấp”. Điều này chỉ ra rằng mặc dù LLM cho thấy nhiều hứa hẹn trong lĩnh vực thần kinh lâm sàng nhưng vẫn còn chỗ để cải thiện.
Bất chấp những hạn chế này, các nhà nghiên cứu tham gia nghiên cứu vẫn lạc quan về những ứng dụng tiềm năng của LLM trong thần kinh lâm sàng. Tiến sĩ Varun Venkataramani, một trong những tác giả của nghiên cứu, giải thích với Cointelegraph: “Chúng tôi coi nghiên cứu của mình nhiều hơn như một bằng chứng khái niệm về khả năng của LLM. Vẫn cần có sự phát triển và thậm chí có thể tinh chỉnh LLM cụ thể để làm cho chúng có thể áp dụng phù hợp cho thần kinh lâm sàng.”
Việc ứng dụng thành công AI trong các nhiệm vụ chăm sóc sức khỏe quan trọng, chẳng hạn như nghiên cứu ung thư của AstraZeneca hay chống kê đơn kháng sinh quá liều ở Hồng Kông, càng khẳng định tiềm năng của công nghệ này. Thành tích gần đây của Chat-4.0 trong việc vượt qua kỳ thi thần kinh học báo hiệu một tương lai đầy hứa hẹn cho AI trong lĩnh vực chăm sóc sức khỏe, đánh dấu một bước tiến mới trên hành trình hướng tới những tiến bộ y tế dựa trên AI.