網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

OpenAI和科大訊飛，瞄准了同一件事

2025-08-12 09:18 · 稿源：站長之家用户

夏季大模型行業的密集上新隨著上周GPT-5的推出終于落下帷幕。北京時間8月8日淩晨，OpenAI正式發布下一代旗艦模型GPT-5，距離上代模型GPT-4的推出已經過去了29個月。

但GPT-5上線初期的反饋卻有些兩極分化。GPT-5仍然是當前能力最爲全面的模型，但和此前OpenAI一直保持著斷代式的模型性能领先相比，GPT-5并未与市场主流模型拉开显著差距，部分基准测试场景下甚至被马斯克的Grok4或者同期发布的Claude Opus4.1超越。

部分原因在于OpenAI的先發優勢正在減弱，但更關鍵的原因或許在于OpenAI試圖將大模型從“能用”推向“好用”。和此前發布的旗艦模型不同，OpenAI在此次GPT-5發布會中尤其強調他們在減少模型幻覺、提升指令遵循能力和降低模型谄媚性方面的進展。

这和此前国内大模型代表星火 X1的升级不谋而合。作为当前市面上唯一全棧自主可控的全國産大模型，星火X1在7月25日的升級同樣著重強調對大模型實用痛點尤其是幻覺問題的精准攻克上。

在對模型幻覺問題治理上，星火X1取得顯著突破，無論是對自身生成內容真實性的把控（事實性幻覺治理），還是參考外部資料時對原文的忠實程度都有顯著改善(忠誠性幻覺治理)，大大提升了大模型在行業應用中的可靠性。

甚至二者在技術路線的探索上都頗爲一致。OpenAI在官網介紹，針對模型幻覺問題，他們在GPT-5訓練中加入了多目標獎勵機制以及思維鏈監控等手段，來改善模型幻覺問題。多目標獎勵改變了此前模型單一獎懲機制容易迎合用戶的弊病，即便模型給出不確定性回答也可以得到正向反饋，思維鏈監控則可以有限防止推理模型在深度思考過程中的幻覺問題。

大模型幻覺的後果

在強化學習技術上，科大訊飛同樣試圖改進大模型粗糙的數值獎勵機制，將評語模型與細粒度反饋的強化學習技術結合起來，就像是給AI配了一個耐心的老師，能在解題的每個環節給出具體建議。這種做法讓複雜的數學推理訓練變得更加高效，也解決了強化學習訓練中“獎勵太少”的痛點問題。

此外，科大訊飛提出的基于多路徑采樣驗證及事實性約束強化學習的幻覺治理技術，則可以在大模型思考過程及恢複生成階段，實現客觀問題與標准答案的深度對齊，從而大幅減少慢思考下的幻覺率。

但在治理模型幻觉问题上，作为大模型国家队的科大讯飞还是比OpenAI更多走了一步。科大讯飞不仅从模型训练与监督角稛犭手，还深入介入了大模型训练更前置的数据环节。

在此前已經建立行業高質量數據集以及訊飛知識工程平台的基礎上，科大訊飛還開創性地提出了基于多路徑采樣驗證及事實性約束強化學習的幻覺治理技術，在大模型思考過程及回複生成階段，實現客觀問題與標准答案的深度強對齊，大幅減少了在慢思考下的幻覺率讓大模型回複通用常識及專業知識問題更加可靠。

從全國産大模型代表的星火X1，到海外大模型代表的GPT-5，全球頂尖大模型同時強調模型可靠性的升級。這背後是因爲，大模型已經日益深入到社會應用的方方面面，在性能穩步提升的同時，也對模型的可靠性和易用性提出了更高要求。

“我們的核心追求的是模型的實際應用價值以及大衆的可訪問性/可負擔性。我們可以發布更智能的模型，但更重要的這次的模型可以讓超過十億人受益。”OpenAI創始人兼CEO薩姆·奧爾特曼說。

纵观此次OpenAI针对GPT-5的升级，你可能会感到些许熟悉。在发布会中，模型性能的提升一笔带过，更多时间都用在了讲述GPT-5的具体行业应用，尤其是编程、写作以及医疗禑猃个大模型核心应用场景上。

其实，大模型行業中最早呼吁关注模型行业应用价值的正是科大讯飞。早在科大讯飞立项攻坚大模型时，就确立了“1+N”的研发方向，在研发一个通用大模型的同时，也同步推出教育、医疗、法律等行业大模型。过去几年来，讯飞星火围绕医疗、教育、法律、汽车、科研等多个重点行业发布多个行业大模型，同时与多个行业龙头、央国企展开深入合作，共同推进大模型落地应用。

7月25日全新升級的星火X1，更是科大訊飛推動模型從“能用”走向“好用”的關鍵一步。二者雖然只一字之差，但背後的技術深度和應用廣度完全不同。升級後的星火X1已全面賦能教育、醫療、企業應用、代碼、科研等行業大模型和智能體，在複雜行業場景任務上進一步滿足用戶核心需求。

星火代碼大模型已深度賦能金融、制造、能源、科技等100余家關鍵領域客戶，在典型應用場景中驅動研發效率提升超過50%。測試集合來源:測試集合來自認知智能全國重點實驗室構建的代碼實用場景測試集

大模型産業已經到了産業化與規模化落地的關鍵時期，大模型不僅要能用，更要好用。作爲大模型産業真正的國家隊代表，星火X1更是肩負著中國大模型産業真正自主可控的使命要求。在保持性能領先的同時，也要真正賦能關乎社會民生的重點行業，爲世界提供第二種選擇。

量子位智庫

星火X1能夠先于GPT-5提出大模型要從“能用”走向“好用”，要在智能領先的同時擁有更廣的行業應用，這背後彰顯了中國人工智能産業已經從追趕逐漸走向領先階段。

今年是國家《新一代人工智能發展規劃》“第二步”的關鍵之年，在人工智能基礎理論實現重大突破的同時，尤爲強調在技術與應用達到世界領先水平，人工智能成爲帶動我國産業升級和經濟轉型的主要動力。

作为大模型国家队的突出代表，星火X1更要率先解决横亘在大模型行業落地难的关键技术与应用难题。从这个角度上来说，星火X1已经交出了一份出色的答卷。

（推廣）

特別聲明：以上内容(如有图片或视频亦包括在内)均为站長傳媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站長之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站長之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（點擊查看反饋聯系地址）。本網站在收到上述法律文件後，將會依法依規核實信息，溝通刪除相關內容或斷開相關鏈接。

相關推薦

關鍵詞：

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式發布GPT-5，與Claude4Opus和Gemini2.5Pro進行對比測試。GPT-5在編程能力(SWE-bench測試74.9%)和數學推理(AIME2025測試94.6%)表現突出；Claude4Opus編程優異(72.5%)但數學較弱(33.9%)；Gemini2.5Pro擅長長文本處理(100萬token窗口)和多模態應用。價格方面，GPT-5和Gemini2.5Pro定價相近($1.25-$10)，Claude4Opus較高($15-$75)。建議根據需求選擇：GPT-5適合綜合應用，Claude4Opus適合專業編程，Gemini2.5Pro適合長文檔?

?GPT-5發布 ?大語言模型 ?性能對比
OpenAI正式发布GPT-5模型网友：写作像诗人

OpenAI在直播活动中正式推出新一代人工智能模型GPT-5，宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域，实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）形容，与GPT-5交互如同与各领域专家对话，其多维度能力突破将重塑人机协作模式。分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送，免费用户与付?
GPT-5有望明天发布 OpenAI：免费无限使用

OpenAI宣布將于太平洋時間7月4日上午10點（北京時間7月5日淩晨1點）舉辦重要直播活動。官方預告中"LIVESTREAM"誤寫爲"LIVE5TREAM"，引發網友猜測可能暗示GPT-5即將發布。消息稱免費版ChatGPT將在標准設置下開放GPT-5對話功能，但會設置防濫用阈值；Plus和Pro用戶則可享受更智能的GPT-5服務，包括語音交互、繪圖創作等高級功能。此前CEO奧特曼曾透露GPT-5將整合多項前沿技術。若屬實，這將是AI愛好者的重大福利，也將進一步提升ChatGPT的實用性和用戶體驗。

?OpenAI ?GPT-5 ?直播活動
博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

上周末OpenAI公司发布了传闻已久的GPT-5大模型，号称迄今为止最先进的人工智能模型，具备博士级别的智能水平。 GPT-5發布之后在多个榜单上确实刷榜了，包括编程、数学等，总计拿到了25个榜单的第一，评分表现很震撼。然而上线之后，GPT-5的实际表现引发质疑，跑分第一不代表实际体验第一，甚至被不少用户认为表现倒退了，反应也变慢，这可能是OpenAI翻车最快的旗舰大?

?GPT-5發布 ?人工智能模型 ?OpenAI整改
GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

2025年8月7日，OpenAI正式发布GPT-5，官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升，在AIME2025测试中取得94.6%的高分，处理速度也有明显改善。但与竞争对手相睙嵩存在差距：Claude4在代码生成和逻辑推理方面表现优异，支持200K token长文本；Gemini2.5具备2M超大上下文窗口和全模态支持；国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI?
薦因爲GPT-5，這群人決定在Reddit上起義。

?这个周末，对OpenAI的抗诉，好像从未如此熱闹过。起因自然还是因为GPT-5。 OpenAI上了GPT-5当天，做了一个非常神奇的操作，他们只保留了GPT-5，然后把GPT-4.5、GPT-4o、o3什么的，全都砍掉了。

?GPT-5
减少幻觉、不再谄媚！OpenAI：即日起史上最强大的GPT-5将免费提供给用户

这是我们迄今为止最智能、最快、最实用的模型，具有内置思维，可将专家级智能交到每个人手中。” OpenAI在官方新闻稿中写道，这是我们迄今为止最优秀的人工智能系统。GPT-5的智能性能远超我们之前的所有模型，在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。 GPT-5 不仅在基准测试中超越了之前的模型，回答问题的速度也更快，而且最重要的是，它对现?

?GPT-5發布 ?人工智能模型 ?OpenAI
薦AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

《AI日报》精选AI领域最新动态：1)OpenAI发布GPT-5模型，具备强大多模态能力但推理任务仍有局限；2)知网推出AIKBase V2.0多模态数据管理系统；3)Ideogram新增"角色"功能实现图像风格统一；4)Cursor发布CLI版本支持终端AI编程；5)百度即将推出全新推理模型和文心5.0大模型；6)dots.ocr推出1.7B参数多语言文档解析工具；7)特斯拉解散Dojo超算团队转向英伟达合作；8)谷歌Pixel 10引入AI相?

?GPT
GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI發布最強AI模型GPT-5，但引發用戶強烈不滿。新模型上線後反應速度變慢、回答質量下降，且官方突然下架GPT-4o等8個舊模型，導致付費用戶抗議。部分用戶對舊版産生情感依賴，認爲GPT-4o更具人性化溫暖。第三方測試顯示GPT-5在複雜任務上雖有提升，但交互體驗明顯退步。CEO承認低估用戶對舊版的喜愛，承諾將恢複部分舊模型並提供更多定制服務。專家指出大模型邊際效益遞減，面臨數據質量和算力成本限制。總體而言，GPT-5在技術指標進步的同時，犧牲了情感交互體驗。

?GPT-5發布 ?OpenAI ?AI模型淘汰
薦GPT5發布，槽點竟多過亮點：AGI沒來，AI公司肉搏時代來了

?我们至今不知道让奥特曼“瘫倒在椅子上”的是什么力量。因为人们等待许久的GPT-5發布，至少从大家第一时间对发布会的感受来看，居然是槽点，甚至笑料多过了亮点…… 几个月前，甚至发布前，都不会有人想到，这么万众期待的模型发布，被传播最多的会是多张让人哭笑不得的错误图表:

?GPT5

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

OpenAI和科大訊飛，瞄准了同一件事

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式发布GPT-5模型网友：写作像诗人

GPT-5有望明天发布 OpenAI：免费无限使用

博士水平的GPT-5依然翻车 OpenAI奥特曼：AGI已失去意义

GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

薦因爲GPT-5，這群人決定在Reddit上起義。

减少幻觉、不再谄媚！OpenAI：即日起史上最强大的GPT-5将免费提供给用户

薦AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

薦GPT5發布，槽點竟多過亮點：AGI沒來，AI公司肉搏時代來了

今日大家都在搜的詞：

熱文

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

华为MatePad Air 12英寸2025发布：售价2799元起

AI日報：可靈2.1推出全新首尾幀功能；昆侖萬維上線AI音樂模型M

REDMI Note 15 Pro系列官宣下周发布

华为MatePad 11.5 S 2025发布：预装鸿蒙5 首发售价2099元起

苹果正式入驻小红书 iPhone 17系列下月发布

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

iPhone17Pro最新外觀曝光：蘋果調整天線布局

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智

REDMI Note 15 Pro系列官宣本月发布

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

华为MatePad 11.5 S官宣8月15日发布

周鸿祎与机器人PK球技：带球突破被机器人抢断

阿裏小號宣布暫緩停服：可繼續正常使用

站長商机