快科技6月17日消息,月之暗面推出了針對軟件工程任務的全新開源代碼大模型Kimi-Dev-72B。
该模型在SWE-bench Verified編程基准測試中取得了全球最高開源模型水平,以僅72B的參數量,超越了剛發布不就、參數量達671B的新版DeepSeek-R1。
該模型通過大規模強化學習進行優化,能夠自主修補Docker中的真實存儲庫,並且只有當整個測試套件通過時才會獲得獎勵,從而確保了解決方案的正確性和穩健性。
Kimi-Dev-72B的设计理念和技术细节包括BugFixer和TestWriter的组合、中期训练、強化學習和测试时自我博弈。
其中,BugFixer和TestWriter的互補設計奠定了模型的基礎,使其在修複錯誤和編寫測試方面表現出色。
中期訓練則通過約1500億個高質量的真實數據,增強了模型對實際Bug修複和單元測試的理解。
強化學習阶段则专注于提升其代码编辑能力,使其在文件本地化和代码编辑方面表现出色。
目前,Kimi-Dev-72B已在Hugging Face和GitHub上提供下载和部署,包括模型权重、源代码等。
(舉報)