要點:
由馬薩諸塞大學和複旦大學的研究團隊開發的GPT-4V,在醫學執照考試中的准確率超過大部分醫學生,爲人工智能在醫學臨床中的應用提供了理論基礎。
盡管人工智能在醫學影像診斷中取得長足進展,但醫生難以在未經嚴格測試的情況下信任其診斷結果,因爲理解人工智能的判別需要額外認知成本。
研究測試了GPT-4V在美國醫學執照考試題上的能力,表現出高准確率。然而,其解釋質量和可靠性仍需改進,以適應真實臨床場景。
站長之家(ChinaZ.com) 11月21日 消息:近期研究顯示,GPT-4V在醫學執照考試中表現優異,准確率遠超過大部分醫學生。這爲AI在醫學臨床中的應用提供了新的可能性。盡管人工智能在醫學影像診斷方面取得了顯著進展,醫生仍難以完全信任其診斷結果,需要額外的認知成本。
爲了增強醫生對人工智能的信任,研究團隊建議通過醫學執照考試來評估AI的專業知識和技能。研究還指出GPT-4V在解釋質量方面存在局限性,強調了人機協作在未來醫療診斷中的重要性。
論文地址:https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能,结果显示在美国医学执照考试禑猃个考试上,GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。
盡管在解釋正確時醫療專業人士對GPT-4V的解釋較爲認可,但當回答錯誤時,存在圖像誤解等問題。研究團隊提出通過提示來改進GPT-4V的解釋質量,展示了GPT-4V作爲影像診斷輔助工具的潛力。然而,研究也指出GPT-4V仍需改進解釋質量和可靠性,以適應真實臨床場景。
綜合而言,GPT-4V在醫學執照考試中的表現爲人工智能在醫學領域取得了顯著進展提供了證據。然而,要將其應用于真實臨床環境,還需要進一步改進解釋質量和可靠性。這一研究爲未來開發更精細的人工智能協作系統提供了方向,以使其成爲可靠的醫學輔助工具。
(舉報)