声明:本文来自于微信公众号 硅星人Pro,作者:Yoky,授权站長之家转载发布。
我們至今不知道讓奧特曼“癱倒在椅子上”的是什麽力量。
因爲人們等待許久的GPT-5發布,至少從大家第一時間對發布會的感受來看,居然是槽點,甚至笑料多過了亮點……
幾個月前,甚至發布前,都不會有人想到,這麽萬衆期待的模型發布,被傳播最多的會是多張讓人哭笑不得的錯誤圖表:
而這幾乎就是發布會給人們感受的一個縮影。
大量工作在爭奪用戶注意力上,不少不錯的細節提升,但沒有大的驚喜,甚至一度有些好笑,“AGI”還早,肉搏時代開啓了。
GPT5来了,模型没有到AGI时刻,甚至连“aha moment”也没有。
正如发布前的剧透,GPT-5采用了“All in one”策略,将推理、编码、语音、研究等能力整合进单一模型,根据用户需求自动调取相应能力。在各个垂直领域,GPT-5都刷新了基准测试成绩,其中编程能力的进化最为显著,无论你是专业的开发者,还是小白尝试vibe Coding,它都在模型能力上做了优化。
API方面,他首次考慮到了廣大用戶的錢包,開啓了一輪大降價。企業用戶可以通過自己的預算來調低中高檔位,分别为GPT-5标准版、GPT-5-mini版、GPT-5-nano版。其中GPT-5-mini 的价格低于谷歌的 Gemini2.5Flash,而 GPT-5Standard 的价格仅为 Claude4Opus 的十二分之一。
新模型的案例演示、再次被刷新的Benchmark、被打下来的API价格,几乎构成了这场发布会的全部。但不同的是,在最后三分一,OpenAI加入了一些并不那么炫酷的企业案例分享,展示了他们如何通过模型帮助企业构建自己的应用,同时增加了一个专门服务于企业的模型 GPT-5-chat:面向客服场景,延迟 <200ms。
而這些,才是GPT-5發布的真正意圖:他們想要的已經不是技術Demo的掌聲,而是企業客戶的真金白銀。GPT-5不是代際跨越的炸裂模型,而是OpenAI准備投入到商業肉搏的底牌。
结合Sam Altman此前在X上关于SaaS的预判,一旦企业能够基于GPT-5自主构建应用,传统SaaS模式确实面临冲击。
但這也證明了一個更深層的現實:整個AI行業都已從技術炫技轉向商業落地的關鍵階段,連OpenAI也不例外。
一個模型,多種智能
发布的开始,Sam Altman就代表OpenAI ,认为这不是一次简单的升级,而是一次智能的「次元跳跃」。
官方宣稱它引入了一個全新的「智能路由」系統,能秒級判斷你的問題難度,自動調用合適的「大腦」來回答。普通問題用「高效大腦」快速響應,複雜問題則自動切換到「深度思考大腦」。這種快思考和慢思考的結合,在今年更早的時候,已經有部分模型産品通過Autothink已經實現。
GPT-5首次把 GPT 系列与 o 系列推理模型融合,形成单一多模态架构。上下文窗口扩展至1M tokens,输出可达10万 tokens,支持 MCP(模型上下文协议)与并行工具调用。四个变体全部面向代码场景优化:
? gpt-5:旗舰,长链推理 + 全模态;
? gpt-5-mini:成本↓60%,保留90% 编程性能;
? gpt-5-nano:端侧离线32K,延迟 <40ms;
? gpt-5-chat:企业级对话,CI/CD 集成插件化。
针对不同的场景,GPT-5都做了单项优化,睙徵写作中的语感优化、语音对话功能多语种灵活切换能力,GPT-5也在新的 ARC-AGI-2上进行了测试。除 Grok4(思考)外,它的表现优于所有主要模型。
但最可圈可點的,是在整個Coding能力上再次提高了一個水准。代碼能力覆蓋了兩種場景,一種是低提示詞的非專業用戶場景,
在发布会上,OpenAI 的后期训练负责人 Yann Dubois 使用 GPT-5现场演示,要求它生成一个用于学习法语、并带有互动游戏的网站。在短短几秒钟内,GPT-5就编写了数百行代码,并直接展示了网站的前端界面。他在 Zoom 上分享屏幕并进行了简单的点击操作,一个看起来非常酷炫的网站便生成了。
在 Canvas 中,GPT-5可以快速一次性完成前端应用程序,以保证没有免费又好用的编码模型的用户,能够实现真正的Vibe Coding。
在专业编程场景,GPT-5支持一键上传整个前后端仓库,秒级生成可视化“代码地图”,分层展示模块依赖、性能瓶颈及安全漏洞,并给出优先级列表;针对遗留代码,它能自动剔除无用依赖、统一命名风格、补全类型注解,同时生成 Git 回滚脚本,确保重构零风险。
同时模型原生支持 Python、Typescript、Rust、Go、Solidity 等20余种语言混合项目,可智能识别跨语言调用链,自动生成 FFI 绑定、序列化代码及对应的 Docker 多阶段构建文件,无需人工干预即可打通开发与部署全链路。
當然,盡管OpenAI一直在強調“GPT-5是世界上最好的编程模型”,但在 OpenAI 的展示中,却出现了Benchmark图的坐标轴“作弊”的行为,不仅有52.8>69.1这样的弱智错误,也实际上夸大了 GPT-5的能力提升。
抛開一些“小插曲”,GPT-5的確把“寫代碼”升級爲“交付軟件”,從單文件補全到跨語言、跨框架、端到端的工程代理。開發者獲得的不僅是更快的自動補全,而是一鍵可部署、可測試、可維護的工程團隊。
为了尽可能的保证模型的可用性,OpenAI花了不少时间用来降低模型幻觉。模型安全研究负责人 Alex Beutel 透露,OpenAI 为评估 GPT-5的潜在风险,累计投入逾五千小时进行深度测试,核心目标之一是杜绝模型向用户“撒谎”。
尽管相比 o3推理模型,GPT-5的幻觉有所收敛,但“言之凿凿的假话”仍是大型语言模型难以根除的顽疾;尤其在模型扮演智能体、执行多步骤任务时,这一隐患会被进一步放大。 不过,OpenAI 强调,GPT-5在连贯完成复杂流程方面更值得信赖。Beutel 指出,过去曾出现模型宣称已达成目标却实际未行动的情况,如今团队正着力堵住此类漏洞。
整體來說,GPT-5在模型、産品、場景進行了綜合的優化提升,它可能不是某一個領域絕對的尖子生,但卻是全能的ACE。
用低價突圍商業化
“卷價格”常常被形容是中國大模型廠商們的做法,而這次OpenAI告訴大家,你們錯了,我卷起來更狠。
面向个人用户,OpenAI采取了免费先用、分级限速的策略。从今天起,所有 ChatGPT 账号都能直接体验 GPT-5,无需排队。免费层每天有一定额度,用完即自动降级到 GPT-5-mini 继续对话。Plus 会员额度翻倍,Pro 会员则可调用“GPT-5Pro”这一高推理档位。换句话说,OpenAI 把7亿 C 端用户当成了「默认入口」,但真正的算盘并不在这里。
面向企业客户则出现了明显的低价抢市场。根据官网消息,标准版 GPT-5:输入1.25美元 / 百万 token,输出10美元 / 百万 token,比 GPT-4时代普遍低30–50%。mini 与 nano 再砍一刀,分别低至0.3美元和0.05美元 / 百万 token,几乎逼近自托管成本。
企业套餐还附带零保留、私有端点、并发翻倍,整体算下来,同等算力支出可节省40% 以上。
显然,OpenAI 这次把火力瞄准了 B 端:用超低 API 价格把企业从自研或竞争对手那里直接“挖”过来,C 端免费只是流量入口和口碑放大器。
顯然,新的價格讓這些“苦o3久矣”的開發者們十分滿意,當GPT-5標准版僅爲Claude4Opus十二分之一價格時,那些靠“性價比”立足的平替廠商將面臨生存危機。
參考國內上一輪的模型“價格戰”,基礎模型市場將迎來殘酷的優勝劣汰。中小模型廠商要麽在垂直領域找到差異化定位,要麽被迫退出競爭。
當然,推理成本的大幅下降直接降低了AI應用的准入門檻。當調用成本不再是制約因素,更多企業和開發者將嘗試將AI能力集成到産品中。軟件的邊際成本持續降低,將催生新一輪應用創新浪潮,從工具類應用到消費級産品都將受益。
從技術突破到價格屠夫,從能力炫技到場景落地,OpenAI這次發布的核心邏輯異常清晰:用成本優勢和産品整合來重塑整個AI生態的遊戲規則。
當GPT-5以白菜價提供接近人類專家水平的能力時,它實際上是在向整個行業宣戰——不僅要搶奪競對的市場份額,更要讓傳統軟件服務商感受到降維打擊的壓力。這種策略轉變標志著AI行業從“技術驅動”正式邁入“商業驅動”階段。
GPT-5不是技术的终点,而是商业肉搏战更进一步的信号。接下来,像是meta离谱高价抢夺人才,OpenAI发布会的“图表错误”,Anthropic断供二选一之类的事情,会睙崦人惊叹的模型大跃升和各种“Aha moment ”更多的出现在你面前。
(舉報)