網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

LLM不靠譜！??研究：AI聊天機器人提供了錯誤的癌症治療建議

2023-08-30 14:27 · 稿源：站長之家

文章概要:
1. 研究人员评估了大语言模型聊天机器人提供癌症治疗建议的可靠性，发现33.33%的建议与确立的指南不完全一致。
2. 研究强调了AI技术渗透医疗决策时需谨慎和监管的必要性。
3. 聊天机器人的建议与NCCN指南不完全一致，专家也未能检测到这些错误，凸显LLM聊天機器人在提供可靠和精確的癌症治療建議方面的表現低于平均水平。

站長之家（ChinaZ.com）8月30日消息:在最近发表在《JAMA Oncology》杂志上的一篇文章中，研究人员评估了由人工智能（AI）算法驱动的大型语言模型 (LLM) 驱动的聊天机器人是否可以提供准确可靠的癌症治疗建议。

AI医疗医生人工智能

關于該研究

在本研究中，研究人员评估了大语言模型聊天机器人在提供前列腺癌、肺癌和乳腺癌治疗建议方面的表现，该建议与国家综合癌症网络（NCCN）指南一致。

研究人員開發了四個零樣本提示模板，並用于創建26種癌症診斷描述的四個變體，最終獲得了104個提示。然後將這些提示作爲輸入提供給GPT-3.5。

研究團隊由四名經過委員會認證的腫瘤学家组成，其中三人根据研究人员制定的五项评分标准评估了聊天机器人输出与2021年 NCCN 指南的一致性。采用多数决原则来确定最终得分。

第四位腫瘤學家幫助其他三位解決了分歧，這些分歧主要是在法學碩士聊天機器人輸出不清楚時出現的。例如，大語言模型沒有具體說明針對特定類型的癌症應結合哪些治療方法。

研究結果

該研究對聊天機器人提供的104條癌症治療建議進行了評估。結果顯示33.3%的建議至少部分不符合NCCN指南，被視爲錯誤或不准確的。

聊天機器人對98%的提示給出了至少一個治療建議。所有包含治療建議的回複中，至少有一個治療方法與NCCN指南一致。

但是在102條産出中，有35條包含一個或多個不一致的治療方法，占34.6%。這意味著超過三分之一的建議包含了錯誤信息。

聊天機器人提供的建議根據提問方式而變化。當提問不明確時，它的回複也變得模糊，導致評估者之間出現分歧。

本研究中評估的大語言模型士聊天機器人將錯誤的癌症治療建議與正確的建議混合在一起，即使是專家也未能發現這些錯誤。

研究結果表明，大语言模型聊天机器人在提供可靠且精确的癌症治疗建议方面表现低于平均水平。

鑒于AI的廣泛使用，醫療保健提供者需要適當教育病人有關這項技術可能提供的錯誤信息的潛在風險。這些發現還強調了針對AI及其他潛在危害公衆的技術制定聯邦法規的重要性。

（舉報）

相關推薦

關鍵詞：

元蘿蔔以“家電價格的機器人”，開啓智能養老普惠時代

商湯科技旗下家用機器人品牌“元蘿蔔”入選工信部智能養老服務機器人試點，成爲全球首個規模化量産家用AI機械臂企業。通過技術創新將價格降至3999元，實現10萬台銷量並進入20多個國家市場。加入創新聯合體後，將聚焦智能養老場景落地，升級現有産品植入大語言模型實現情感陪護，同時研發2027年家庭養老場景的家務機器人。從功能價值向情緒價值升級，通過IP聯動爲産?

?智能養老 ?機器人技術 ?場景應用
2025外灘大會探營：聯合四大機器人産業園打造“機器人小鎮”

2025外滩大会于9月10日至13日在上海世博园区举行，聚焦“人机共生”科技理念。大会设置1.5万平方米科技展区，吸引近200家企业参展，展示超30项科技新品。亮点包括灵波R1机器人厨师、支付宝AI付、仿生机器人松延动力、可控核聚变模型“人造太阳”等前沿技术。覆盖AI+健康、金融、出行、农业等领域，呈现科技与产业深稛嶷合趋势。

?外灘大會 ?科技展覽 ?前沿技術
远东股份：ALL IN“电能+算力+AI”，智能驱动未来

远东股份（600869）凭借“电能+算力+AI”战略，在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术，自主研发高导铝绞线提升输电效率，产品应用于多条国家级特高压线路。同时布局液冷技术研发，为数据中心提供高效散熱方案。未来将持续推进“AI+能源”产业生态建设，助力制造业智能化升级和绿色高效算能模式构建。

?人工智能 ?能源 ?算力
太火爆！2025亞太機器人世界杯重慶國際邀請賽圓滿閉幕

2025亚太机器人世界杯重庆邀请赛于9月7日在重庆国际博览中心圆满落幕。来自中国、泰国、新加坡等地的26名选手携机器人参赛，中国山海队以6:0和5:0分别战胜泰国队和新加坡、泰国、马来西亚联队，夺得双料冠军。睙狳吸引众多观众，现场火爆，人形机器人踢足球、打拳击等表演引发熱烈反响。赛事不仅展示了前沿科技，还促进了青少年科普教育和机器人产业发展。重庆将机器人产业作为培育新质生产力的重要突破口，已出台多项政策推动制造业高质量发展。

?2025世界智能産業博覽會 ?亞太機器人世界杯 ?重慶國際邀請賽
INDEMIND亮相2025科技創變者大會，以機器人空間智能技術解鎖具身智能新邊界

9月5日，2025科技创变者大会在北京落幕。本届大会聚焦“具身智能+产业智变新引擎”主題，汇聚行业力量探讨具身智能的前沿创新与产业变革。INDEMIND作为领军企业，展示了家用扫地、家用陪伴、商用服务三大品类机器人空间智能平台，呈现了在具身智能领域的突破性成果，赢得广泛关注。公司联合创始人兼CTO分享了技术理念与实践经验，推动行业思考。INDEMIND致力于机器人空间智能技术研发，推动机器人从自动化工具向自主智能终端演进，产品已在家用清洁、商用巡检等多元场景规模化落地，业务覆盖全球十多个国家和地区。

?科技創變者大會 ?具身智能 ?産業智變
人机共生 · 智启未来——2025高交会亚洲人工智能与机器人产业链展主題发布

2025高交会机器人展以“人机共生·智启未来”为主題，聚焦人工智能与机器人产业的爆发式发展。展会覆盖工业制造、医疗康复、公共服务禑岖产业链，汇聚宇树科技、优必选、赛博格等顶尖企业，展示人形机器人、仿生机器人及核心零部件最新成果。机器人正从工具转变为人类伙伴，推动新质生产力发展，开启人机协作新篇章。

?人工智能 ?機器人 ?具身智能
国内首款模块化四足机器人-Apollo 从“白犀”吉尼斯纪录走来，引领行业进入“定制化时代”

國內首款模塊化工業級四足機器人Apollo正式亮相。該機器人由浙江大學杭州國際科創中心研發，延續了前代“白犀”的速度優勢，以模塊化設計爲核心突破，實現性能、場景適配與運維效率的全面革新。Apollo具備140kg負載能力、5.5小時續航，支持快速換電與多場景靈活定制，適用于高危險廠區巡檢、應急救援等工業應用，推動四足機器人向定制化解決方案跨越。

?模塊化工業機器人 ?四足機器人 ?工業級機器人
薦重識vivo：做MR和家用機器人的隱性邏輯

尽管苹果Vision Pro在发布一年后，市场表现并不如其它同门那样好，但2024年它仍以3499美元的高价拿下全球5.2%的市场份额，紧随Meta和索尼之后。当然重要的不是份额，而是苹果对于空间计算的引领，以及对于智能头显市场的推波助澜。 IDC预计，在软硬件技术革新、AI大模型快速发展、交互技术进一步融合的趋势下，2025年全球智能头显市场出货量将同比增长26%至1280万台，其中?

?蘋果Vision ?Pro ?智能頭顯市場
三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

9月12日，三星家电以“AI的呵护”为主題在北京京东MALL举办线下体验展，集中展示搭载AI技术的全线产品，包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻熱泵洗烘旗舰等产品，通过五大主題展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能，感受AI技术带来的生活便利。展览将持续至9月17日，并提供互动礼品。

?三星家電 ?AI科技 ?線下體驗展
微信客服回應聊天能發實況圖：暫時僅支持iOS客戶端

微信上线实况图发送功能，目前仅限iOS用户使用。用户需在相册选择实况照片发送，默认关闭需手动激活。好友查看时需点击左下角按钮触发动态效果，支持保存至手机相册。iPhone 6s/6s Plus/SE系列因硬件限制暂无法使用。建议用户更新微信至8.0.61及以上版本，功能正逐步推送中。

?微信 ?實況圖 ?iOS

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

LLM不靠譜！??研究：AI聊天機器人提供了錯誤的癌症治療建議

元蘿蔔以“家電價格的機器人”，開啓智能養老普惠時代

2025外灘大會探營：聯合四大機器人産業園打造“機器人小鎮”

远东股份：ALL IN“电能+算力+AI”，智能驱动未来

太火爆！2025亞太機器人世界杯重慶國際邀請賽圓滿閉幕

INDEMIND亮相2025科技創變者大會，以機器人空間智能技術解鎖具身智能新邊界

人机共生 · 智启未来——2025高交会亚洲人工智能与机器人产业链展主題发布

国内首款模块化四足机器人-Apollo 从“白犀”吉尼斯纪录走来，引领行业进入“定制化时代”

薦重識vivo：做MR和家用機器人的隱性邏輯

三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

微信客服回應聊天能發實況圖：暫時僅支持iOS客戶端

今日大家都在搜的詞：

熱文

AI日報：阿裏雲開源通義DeepResearch；誇克推醫師考試大模型；

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

盧偉冰：9月19日將直播在線解答小米17系列17個問題

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

蘋果承諾修複iPhone17拍照黑色方塊、白色曲線等問題

苹果 iPhone 17/Pro 系列今日发售多维度升级

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米17 Pro系列外观公布：搭载“妙享背屏”

小米16改名小米17 本月发布：现已上架开启预约

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

小米手机官博头像上熱搜：泄密17 Pro系列或配备背屏

小米17官宣本月发布卢伟冰称有信心直面iPhone17

尚界H5小订突破10万台预售16.98万起

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

理想i6定檔9月26日上市：官方定義新形態五座SUV

站長商机