網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

AI編程終于“開箱即用”了？Qwen3-Coder或許是那個質變節點

2025-07-25 11:05 · 稿源：矽星人Pro

声明：本文来自于微信公众号矽星人Pro，作者：Yoky，授权站長之家转载发布。

7月23日，阿裏通義團隊正式發布Qwen3-Coder-480B-A35B-Instruct，這可能是AI編程领域的一个分水岭时刻。该模型采用480B总参数、35B激活的MoE架构，原生支持256K上下文，可扩展至1M token，在Agentic Coding、Browser-Use、Tool-Use三大类基准中多项评测的开源SOTA，性能直接对标Claude Sonnet-4。

不同于以往需要复杂配置的代码模型，Qwen3-Coder真正做到了“一条命令接管整个代码仓库”。同步开源的CLI工具Qwen Code，让模型能像“初级程序员”一样工作——从理解需求到拆解任务，从编写代码到跑测试修bug，整个过程无需人工逐行干预。这种Agentic Coding方式把大模型当做一个能在仓库里自主行动的Agent，既能理解自然语言需求，又能调用Git、浏览器、终端等工具。

更關鍵的是價格優勢極其明顯。每百萬Tokens最低输入和输出价格分别为4元和16元，平均价格为Claude4的1/3。同时，阿里云百炼还推出了低至5折的限时优惠，128K-1M长上下文价格享受五折优惠。加上完全开源免费商用的政策，让原本高昂的AI編程服务真正平民化。

很多人可能还没意识到AI Coding的真正价值——它不只是写代码的工具，而是AI Agent与物理世界自由交互的关键底层技术。从这个角度看，Qwen3-Coder的发布或许标志着AI編程真正从“辅助工具”向“自主Agent”的跃迁，而开源+超低价的组合，可能会让这种能力快速普及，改变整个软件开发的游戏规则。

我們已第一時間完成內測，對其發布的技術細節進行解讀。

实测Agentic Coding

在實測階段，我們並沒有選擇已經被測試過多輪的貪吃蛇、彈球遊戲，而是選擇了規則更複雜、交互也更多的圍棋對戰遊戲，我們的Prompt是:制作一個圍棋對戰小遊戲，有時間計時，遵守圍棋遊戲的規則（如吃子、禁著點）。

在第一次運行時，結果不僅滿足了圍棋的最基本規則，也准確遵守了吃子、禁著點等規則（棋子被提走後，當前位置禁止再下子）的規則，，這展現了模型在理解和實現基礎遊戲邏輯方面的能力。

但是，這個圍棋對戰遊戲還是太過于簡單，例如缺少輸贏判機制，缺少倒計時等等。遊戲的完整性和用戶體驗方面仍有很大提升空間，這些功能對于一個完整的圍棋遊戲來說是必不可少的。

因此，我們又追問了一遍:制作一個圍棋對戰小遊戲，有時間計時，遵守圍棋遊戲的規則（如吃子、禁著點），還包括局勢分析和判斷輸贏。

Qwen3-coder給出了更複雜的也更成熟的遊戲頁面，甚至在沒有提示的前提下，給出了認輸的按鈕。但有一個問題是圍棋的深層次規則，除了我們在Prompt中提到的規則，一些高級规则睙徵“打劫”，Qwen3-coder没有完全写出来。

接下来，我们又尝试让模型来制作一个网页，Prompt是:生成一页纯 HTML+CSS+SVG 的梦幻黄色网页:背景从 #FFF59D 到 #FFEB3B 径向渐变;60颗白色粒子6秒漂移;5个光晕气泡循环淡入淡出;中央 ‘Dreamy Lemon’ 手写字带发光;点开柠檬会炸开，所有元素保持柠檬黄+Tiffany蓝主題，代码可直接运行。

結果如上，模型確實按照指令實現了所有的技術要求:徑向漸變背景、粒子動畫、氣泡效果、發光文字、交互功能等等。然而，對于“夢幻”這個概念的理解似乎出現了偏差，可能將其解讀爲需要添加模糊效果或其他視覺濾鏡，導致整體視覺效果適得其反，整個頁面都模糊不清，

我們也測試了官方發布的物理運動場景，只不過我們選擇了非常複雜的“三體運動”，難度上很爲難模型，我們通過Cline調用Qwen3-Coder來測試它的Agent能力。

Prompt:做一个实时的三体运动，黑色全屏 ;3个彩色小球（红、绿、蓝）只受彼此万有引力作用，彼此吸引、环绕、抛射，必须真实运动;实时计算牛顿万有引力 F = G·m?m?/r?，速度矢量随时间累积;保留彩虹渐变轨迹(800点 FIFO)，可开关;左上角提供:重力常数滑杆、速度倍率滑杆、轨迹复选框、重置按钮;零依赖、复制即用、双击即可在浏览器看到3球持续运动。

https://weibo.com/tv/show/1034:5191880476917785?from=old_pc_videoshow

這次，我們吸取了教訓，盡可能地完善了prompt來控制模型，我們發現Qwen3-Coder在完成編程後，調用了Chrome浏覽器工具，在後台自行演示了一遍，並核對我提出的所有要求，在逐個檢測完畢後，才進入到最終演示階段。

當然，實際物理中的三體運動肯定比演示更加複雜，這也意味著，雖然模型能夠理解並生成複雜的需求列表，但在將這些需求轉化爲可工作的代碼時，特別是涉及複雜數學計算和實時動畫的部分，還要通過多工具協同來完成。

如何讓代碼能力“長”在模型裏?

Qwen团队采用了一种全新的训练思路:他们没有把Agent能力当作后期的“插件”，而是在训练过程中就深度集成。通过Agent RL训练，模型学会了真正的多轮交互、工具调用、错误处理等能力，这些能力是“长”在模型里的，而不是外挂的。

在預訓練階段，團隊用了7.5萬億token的數據，其中70%是代碼。這不只是簡單的數據堆積，而是像給學生准備更豐富教材的策略，既保證編程能力，又不丟掉通用的語言和數學能力。

更關鍵的是上下文能力的提升。模型原生支持256K上下文長度，最多可擴展到1M，這讓模型能同時查看整個項目的代碼，而不只是看片段。同時，他們用之前的Qwen2.5-Coder來“批改作業”，把低質量的代碼數據重新清洗和改寫，確保訓練數據質量。這種做法體現了從理論學習向實戰准備的轉變。

傳統代碼模型主要關注benchmark表現，但Qwen團隊在後訓練階段加入了執行驅動的強化學習。他們針對“難寫、易驗證”的真實任務（單測、腳本、小工具）自動批量生成測試用例，把執行成功率當作獎勵信號，讓模型在百萬量級代碼片段裏反複試錯、自我糾錯。

這種方法的核心差異在于:不只是讓模型寫代碼，更重要的是讓代碼能真正運行成功。通過自動生成大量測試用例，模型可以立即知道自己寫的代碼對不對，然後不斷改進。模型的目標從“跑分”轉向了“可用”。

更進一步，真正的Agent能力是在不斷實測中産生的。團隊在SWE-Bench這類需要多輪改代碼、跑測試、用Git提交的環境裏做強化學習，這已經接近真實的軟件開發流程。

技术突破在于环境的工业化扩展。他们用阿里云构建了能同时运行2万个独立编程环境的系统，就像同时开2万个虚拟机让模型练习编程。每个环境都能提供即时反馈，模型像实习程序员一样不断接收CI反馈、再改再跑，最终在SWE-Bench Verified拿下开源第一。

在真实场景中训练出来的Qwen3-Coder，解决了AI編程工具终于突破了普及的最大瓶颈:调试能力。此前的AI編程助手普遍存在一个致命问题:代码生成后如果出现bug，开发者仍需要手动排查和修复，这对编程经验要求極高，讓普通用戶望而卻步。而Qwen3-Coder具備自我測試和調試能力，真正做到了“寫完即可用”，這意味著即使是編程新手也能借助AI完成複雜的開發任務。

更重要的是成本優勢帶來的市場重塑。開發過程中往往需要多輪叠代調試，以往使用Claude4這類頂級模型成本高昂，許多中小團隊和個人開發者只能望而興歎。Qwen3-Coder在保持相同性能水准的前提下，成本僅爲三分之一，加上完全開源免費商用，徹底消除了成本門檻。這種性能與價格的完美平衡，正在讓其快速成爲開發者的首選模型。

Qwen3-Coder的核心優勢不僅在于編程能力本身，更在于其強大的Agent特性。該模型能夠自主調用各種工具、理解複雜需求、進行多輪交互，這種能力遠超傳統的代碼補全工具。

然而，当前市场对AI Coding重视程度远远不够。实际上，编程能力是AI Agent的核心基础，是AI与物理世界自由交互最关键的底层技术。当AI能够理解需求、编写代码、调用工具、处理异常时，它就具备了在现实世界中自主行动的能力。从这个维度看，AI Coding的价值被严重低估了。

綜合各方面來看，Qwen3-Coder可以說是目前全球範圍內，最具性價比的編程模型。不僅在技術性能上對標頂級闭源模型，在成本控制上更是实现了数量级的优势，加上完全开源的策略，正在重新定义AI編程工具的行业标准。

當編程的門檻被AI徹底降低時，我們看到的是整個軟件開發生態正在走向民主化。

（舉報）

相關推薦

關鍵詞：

AI 大模型选型指导：一文实测 Kimi?K2?Turbo?Preview 与 Qwen3?Coder?Flash

本文對比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash兩款AI大模型在開發者選型中的表現。K2-Turbo采用MoE架構，激活參數32B，支持128K上下文，在代碼調試和自動化流程方面表現突出；Qwen3-Coder爲480B參數的MoE模型，原生支持256K上下文，擅長大規模代碼庫理解和API集成。二者在中級任務表現接近，但K2在複雜可視化任務更優，Qwen3在多輪Agent調用更穩定。建議根據需求選擇：注重調試自動化選K2，需要長上下文支持選Qwen3。推薦使用AIbase模型廣場進行高效選型對比。

?AI大模型選型 ?編碼能力對比 ?性能評測
薦AI日報：B站測試AI視頻工具花生AI；騰訊發布多模態模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

【AI日报】主要内容： 1. B站测试"花生AI"视频工具，3分钟可成片，同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0，实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI，苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision，支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐，仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新：恢复GPT-4o默认模式，为GPT-5引入多模式选择，优化交互体验

?AI視頻創作 ?花生AI ?B站AI工具
薦AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

AI日報欄目聚焦人工智能領域最新動態：1)阿裏發布Qwen3-4B輕量級模型，手機端可運行；2)小紅書開源多模態大模型dots.vlm1，在圖表推理方面表現突出；3)MiniMax推出語音生成模型Speech2.5，多語種表現提升；4)Midjourney推出HD視頻模式，提升專業影像質量；5)Cursor1.4版本增強異步任務處理能力；6)谷歌否認AI搜索影響網站流量，但數據顯示用戶行爲改變；7)MiniCPM-V4.0開源發布，號稱"手機上的GPT-4V"；8)AMD與高通宣布支持OpenAI的gpt-oss系列模型；9)騰訊開源WeKnora文檔智能解析工具；11)疑似GPT-5信息在GitHub泄露；12)FlowSpeech實現書面語轉口語的TTS技術突破。

?AI模型 ?移動端AI ?阿裏通義千問
薦AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

?AI ?遊戲視頻生成 ?騰訊混元
百川開源最新醫療大模型，中國力量領跑醫療AI賽道

专注医疗后，百川智能交出第一份答卷! 8月11日，百川智能发布第二款开源医疗增强推理大模型Baichuan-M2，其以32B的参数量，在OpenAI的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。

?百川智能 ?醫療大模型 ?開源模型
薦AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V，这是该公司在通向通用人工智能（AGI）道路上的又一重要探
薦AI日报：火山引擎发布豆包3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4

【AI日报】栏目聚焦人工智能领域最新动态：1)火山引擎发布豆包系列AI模型升级，包括图像编辑3.0、同声传译2.0等；2)通义千问开源Qwen3-30B模型，支持多语言处理；3)OpenAI推出ChatGPT Study学习助手；4)中国发布HYPIR图像复原大模型；5)谷歌NotebookLM新增视频概览功能；6)谷歌Imagen4图像生成模型升级，性能媲美GPT-4o；7)昆仑万维开源多模态模型Skywork UniPic；8)理想汽车发布首搭VLA大模型的i8纯电SUV；9)谷歌在英国推出AI搜索模式；10)OWL团队开源多智能体协作工具；11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

?人工智能 ?圖像編輯 ?同聲傳譯
薦AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

本文汇总了AI领域最新动态：1)阿里开源文生图模型Qwen-Image，中文文本渲染领先；2)ChatGPT周活用户达7亿，OpenAI年收入120亿美元；3)Anthropic测试Claude Opus 4.1，推理能力升级；4)智谱推出开发工具Zread.ai提升代码理解效率；5)xAI发布Grok Imagine4支持文生视频及NSFW内容；6)Character.AI推出首个AI原生社交功能；7)阿里与南开合作视频压缩技术LLaVA-Scissor；8)北京团队突破人形机器人3D视觉系统?

?人工智能 ?文生圖模型 ?阿裏通義千問
GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式發布GPT-5，與Claude4Opus和Gemini2.5Pro進行對比測試。GPT-5在編程能力(SWE-bench測試74.9%)和數學推理(AIME2025測試94.6%)表現突出；Claude4Opus編程優異(72.5%)但數學較弱(33.9%)；Gemini2.5Pro擅長長文本處理(100萬token窗口)和多模態應用。價格方面，GPT-5和Gemini2.5Pro定價相近($1.25-$10)，Claude4Opus較高($15-$75)。建議根據需求選擇：GPT-5適合綜合應用，Claude4Opus適合專業編程，Gemini2.5Pro適合長文檔?

?GPT-5發布 ?大語言模型 ?性能對比
从管理工具向“增长伙伴”蜕变 Agent重构CRM价值体系

銷售易在騰訊雲城市峰會上發布中國首款AI+CRM産品NeoAgent，標志著CRM系統從流程化工具向智能化夥伴轉型。該産品通過智能錄入、場景賦能和自然交互三大功能，實現從被動執行到主動輔助的跨越。NeoAgent依托語音識別、對話解析等技術，能自動提取客戶需求等關鍵信息並結構化存儲，大幅降低操作成本。同時打破傳統CRM菜單層級限制，通過語音或文字指令快速獲取數據，響應速度提升80%以上。産品深度整合企業銷售方法論與客戶數據，爲具體場景提供精准建議，並通過"湖倉一體"數據平台確保信息實時更新。其每月叠代機制緊密依賴業務場景，已成功應用于客戶畫像、渠道管理等場景，形成"試用-反饋-叠代-轉化"閉環。

?CRM系統 ?智能化轉型 ?AI科技

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

AI編程終于“開箱即用”了？Qwen3-Coder或許是那個質變節點

AI 大模型选型指导：一文实测 Kimi?K2?Turbo?Preview 与 Qwen3?Coder?Flash

薦AI日報：B站測試AI視頻工具花生AI；騰訊發布多模態模型Large-Vision；昆仑万维开源Skywork UniPic 2.0

薦AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

薦AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

百川開源最新醫療大模型，中國力量領跑醫療AI賽道

薦AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

薦AI日报：火山引擎发布豆包3.0；通义开源Qwen3非思考模型；谷歌偷偷升级Imagen 4

薦AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashengLM-7B；智谱Zread.ai搭载 GLM-4.5

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

从管理工具向“增长伙伴”蜕变 Agent重构CRM价值体系

今日大家都在搜的詞：

熱文

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-

华为MatePad 11.5 S官宣8月15日发布

阿裏小號宣布暫緩停服：可繼續正常使用

华为MatePad Air新款官宣8月15日发布

AI日報：B站測試AI視頻工具花生AI；騰訊發布多模態模型Large-V

婚禮時間有變！李國慶透露有新版實名制請柬：從未對外出售門票

華爲平板電腦教育優惠上線：至高便宜200元

荣耀Magic V Flip2 定档 8 月 21 日外观配置亮点抢先看

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

iPhone17Pro最新外觀曝光：蘋果調整天線布局

AI日報：昆侖萬維發布SkyReels-A3模型；百度搜索PC端全面上線A

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日報：騰訊混元開源Hunyuan-GameCraft；最強圖像編輯器nano-

REDMI Note 15 Pro系列官宣本月发布

京东养车50亿补贴更名震骨价号称补贴不「唬」

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

REDMI Turbo 5已备案：首发天玑8500处理器

站長商机