網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了？

2023-11-21 17:34 · 稿源：站長之家

要點:
由馬薩諸塞大學和複旦大學的研究團隊開發的GPT-4V，在醫學執照考試中的准確率超過大部分醫學生，爲人工智能在醫學臨床中的應用提供了理論基礎。
盡管人工智能在醫學影像診斷中取得長足進展，但醫生難以在未經嚴格測試的情況下信任其診斷結果，因爲理解人工智能的判別需要額外認知成本。
研究測試了GPT-4V在美國醫學執照考試題上的能力，表現出高准確率。然而，其解釋質量和可靠性仍需改進，以適應真實臨床場景。

站長之家(ChinaZ.com) 11月21日消息:近期研究顯示，GPT-4V在醫學執照考試中表現優異，准確率遠超過大部分醫學生。這爲AI在醫學臨床中的應用提供了新的可能性。盡管人工智能在醫學影像診斷方面取得了顯著進展，醫生仍難以完全信任其診斷結果，需要額外的認知成本。

爲了增強醫生對人工智能的信任，研究團隊建議通過醫學執照考試來評估AI的專業知識和技能。研究還指出GPT-4V在解釋質量方面存在局限性，強調了人機協作在未來醫療診斷中的重要性。

論文地址：https://www.medrxiv.org/content/10.1101/2023.10.26.23297629v3

AI医疗医生人工智能

圖源備注：圖片由AI生成，圖片授權服務商Midjourney

该研究使用了涉及不同医学领域的带有图像的选择题来测试GPT-4V的性能，结果显示在美国医学执照考试禑猃个考试上，GPT-4V的准确率分别达到了86.2%、62.0%和73.1%。

盡管在解釋正確時醫療專業人士對GPT-4V的解釋較爲認可，但當回答錯誤時，存在圖像誤解等問題。研究團隊提出通過提示來改進GPT-4V的解釋質量，展示了GPT-4V作爲影像診斷輔助工具的潛力。然而，研究也指出GPT-4V仍需改進解釋質量和可靠性，以適應真實臨床場景。

綜合而言，GPT-4V在醫學執照考試中的表現爲人工智能在醫學領域取得了顯著進展提供了證據。然而，要將其應用于真實臨床環境，還需要進一步改進解釋質量和可靠性。這一研究爲未來開發更精細的人工智能協作系統提供了方向，以使其成爲可靠的醫學輔助工具。

（舉報）

相關推薦

關鍵詞：

GPT-4V

OpenAI發布GPT-5-Codex：可完成7小時單次編程任務

OpenAI宣布推出新一代AI编程模型GPT-5-Codex，其最大亮点是创新的动态时间分配系统。不同于传统AI追求秒级响应”，该模型可根据任务复杂度灵活调整处理时长，从数秒到7小时不等，以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称，传统模型在任务初期即固定计算资源，而GPT-5-Codex能实时评估需求：动态决定加速推进、暂停语法核?

?GPT-5-Codex ?動態時間分配 ?AI編程模型
德國萊茵T?V權威驗證！澄一科技獨創多氣流組合IQV淨煙技術亮相IFA展

澄一科技在IFA展上發布搭載IQV淨煙技術的淨煙機，通過高速風機與三種氣流組合技術，從源頭捕捉油煙顆粒，有效防止油煙泄漏和PM2.5汙染。該技術解決了傳統油煙機吸力不足、清潔困難等問題，獲得德國萊茵T?V認證，推動行業從“大風量”向“淨煙效果”轉型，展示了中國企業在廚電領域的創新實力。

?油煙機 ?淨煙技術 ?米家生態鏈
百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

今天，在WAVE SUMMIT深度学习开发者大会2025上，百度文心大模型X1.1正式发布，在事实性、指令遵循、智能体等能力上均提升显著。百度王海峰介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架。一方面通过混合强化学习，同时提升通用任务和智能体任务的效果；另一方面通过自蒸馏数据的迭代式生产及训练

?百度文心大模型 ?深度學習 ?智能體
HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败，如今AI时代带来消费原子化、决策流线化和主体去人化三大变革，使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易，重构互联网经济逻辑，让HTTP 402从理想变为AI经济的支付基石。

?HTTP402 ?微支付 ?Roy
刷新历史记录！OPPO Find X9系列跑分首曝：404万

OPPO Find系列产品负责人周意保今天发文晒图，公布了OPPO Find X9 Pro卫星通信版的跑分，安兔兔V11成绩4045997分，刷新手机行业历史记录。该机将搭载天玑9500，周意保强调：天玑上限一直看OPPO就够了”。

?OPPO ?Find ?X9
在胡同与北海间流转的光影佳能EOS R50 V秋日氛围感体验

文章分享了作者使用佳能EOS R50V微单相机在北京胡同咖啡厅和北海公园拍摄秋日景色的体验。相机配备2420万像素APS-C画幅传感器和DIGIC X处理器，支持4K视频和多种专业视频规格，画质细腻、色彩还原精准。其轻巧机身仅373克，便于携带，适合户外拍摄。内置多种创意滤镜和肤色优化功能，提升人像拍摄效果。操作界面简洁，配备翻转触摸屏，支持自拍和竖屏拍摄。整体而言，EOS R50V是一款适合视频创作和摄影爱好者的便携设备。

?秋日攝影 ?佳能EOS ?R50V
OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

OpenAI正式发布语音模型GPT-realtime。据介绍，GPT-realtime是一款专注于语音AI Agent的多模态模型，能够生成高度自然流畅的语音，精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解，并可结合语音或文本对话使用，非常适合应用于客服、教育、金融、医疗等领域，用于构建高质量的语音智能体。官方表示，新模型在复杂指令遵循、工具精确调用以及生成更自然、?

?語音模型 ?GPT-realtime ?多模態模型
薦全球图生视频榜单第一，爱诗科技PixVerse V5如何改变一亿用户的视频创作

好玩好用的明星视频生成产品再更新，用户操作基础，模型技术就不基础。熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。在图像生成领域，纳米香蕉在短期内获得了巨量的影响力，凭着「照片变手办」的超高真实感的创意玩法横扫整个社交媒体，尤其触动了毛孩子家长们的心。

?文章搜索 ?核心標簽 ?AI生成
苹果Apple Watch高血压通知功能上线

苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能，该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验，但加拿大等部分市场尚未开放，中国大陆地区仍需等待监管审批。该功能依托光学心率传感器，可实时监测用户血管对心跳的反应，识别慢性高血压迹象，并在检测到异常时发出提醒。系统会分析用户最近30天的数据，通过先进算法判断是否需要发出通知。

?蘋果 ?Apple ?Watch
薦AI日報：海螺AI首尾幀功能上線；元石科技發布問小白5；OpenAI發布全新語音模型GPT-Realtime

AI日报栏目每日提供人工智能领域熱點内容，聚焦开发者，帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括：MiniMax海螺AI首尾帧功能上线；元石科技发布问小白5挑战GPT-5；OpenAI推出语音模型GPT-Realtime；谷歌Gemini AI优化表格处理；腾讯黑科技实现AI配音；百度计划培养千万AI人才；MathGPT.ai反作弊功能推广；苹果Xcode集成Claude Sonnet4；微软发布自研AI模型MAI系列；xAI推出高效编码模型Grok Code Fast1；SuperCLUE多模态评测Gemini-2.5-Pro居首；9月1日起AI内容标识新规实施，违规将承担法律风险。

?AI ?人工智能 ?技術趨勢

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

GPT-4V医学考试成绩超过多数医学生 AI看病稳妥了？

OpenAI發布GPT-5-Codex：可完成7小時單次編程任務

德國萊茵T?V權威驗證！澄一科技獨創多氣流組合IQV淨煙技術亮相IFA展

百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

刷新历史记录！OPPO Find X9系列跑分首曝：404万

在胡同与北海间流转的光影佳能EOS R50 V秋日氛围感体验

OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

薦全球图生视频榜单第一，爱诗科技PixVerse V5如何改变一亿用户的视频创作

苹果Apple Watch高血压通知功能上线

薦AI日報：海螺AI首尾幀功能上線；元石科技發布問小白5；OpenAI發布全新語音模型GPT-Realtime

今日大家都在搜的詞：

熱文

AI日報：阿裏雲開源通義DeepResearch；誇克推醫師考試大模型；

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

盧偉冰：9月19日將直播在線解答小米17系列17個問題

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

蘋果承諾修複iPhone17拍照黑色方塊、白色曲線等問題

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米17 Pro系列外观公布：搭载“妙享背屏”

小米16改名小米17 本月发布：现已上架开启预约

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

小米手机官博头像上熱搜：泄密17 Pro系列或配备背屏

小米17官宣本月发布卢伟冰称有信心直面iPhone17

尚界H5小订突破10万台预售16.98万起

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

理想i6定檔9月26日上市：官方定義新形態五座SUV

站長商机