網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

字節跳動豆包團隊開源MoE架構優化技術：可將大模型訓練效率提升1.7倍

2025-03-11 07:28 · 稿源：快科技

快科技3月10日消息，據報道，字節跳動旗下豆包大模型團隊近日宣布了一項關于混合專家（MoE）架構的重要技術突破，並決定將這一成果開源，與全球AI社區共享。

這一技術通過一系列創新方法，成功將大模型的訓練效率提升了約1.7倍，同時顯著降低了訓練成本，降幅高達40%。這一突破爲大規模模型訓練提供了更高效、更經濟的解決方案。

该技术已在字節跳動的万卡集群训练中得到实际应用。内部数据显示，自采用该技术以来，已累计节省了数百万GPU小时的训练算力。这不仅验证了技术的实际效果，也进一步凸显了字節跳動在AI技术研发领域的领先地位。

對于此次開源的決定，豆包大模型團隊希望通過分享這一技術，推動整個AI社區在模型訓練效率方面的共同進步。開源不僅有助于加速行業技術發展，還能爲更多研究者和開發者提供寶貴的資源，進一步推動人工智能技術的創新與應用。

開源地址：https://github.com/bytedance/flux

（舉報）

相關推薦

關鍵詞：

聚焦大模型訓練效率提升北大依托昇腾突破细粒度混合并行技术

北京大學崔斌教授團隊在鵬城實驗室支持下，研發了面向大模型的高效分布式訓練框架。該框架通過統一訓練接口、細粒度模型切分與並行策略搜索算法，解決了訓練任務多樣性和負載不均問題，實現訓練效率提升15%。同時利用昇騰計算資源管理能力，優化硬件通信效率，通過計算通信重疊技術提升流水線效率。研究成果已在NeurIPS等頂會發表3篇論文，展現了國産算力在分布式計算領域的潛力，爲AI産業自主化突破提供支撐。

?人工智能 ?大模型訓練 ?分布式計算
马斯克称正在训练新FSD模型：约十倍参数最快下月底发布

馬斯克今日在X上發文表示，特斯拉正在訓練新的十倍參數FSD模型，如果一切順利則可能會在下個月底准備好面向公衆發布。

?特斯拉 ?FSD ?完全自動駕駛
百川開源最新醫療大模型，中國力量領跑醫療AI賽道

专注医疗后，百川智能交出第一份答卷! 8月11日，百川智能发布第二款开源医疗增强推理大模型Baichuan-M2，其以32B的参数量，在OpenAI的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。
産教融合新實踐：360三大訓練營閉環賦能高校人才培養全鏈條

8月7日，第十三届互联网安全大会ISC.AI2025开幕，360集团推出为期两个月的AI训练营，包含专业营、学生营和师资营三大课程体系。作为360在教育领域的核心实践，本次训练营依托360在数字安全和AI领域的技术积累，以"产学研用"深稛嶷合为理念，打造从师资赋能到学生培养的全链条解决方案。专业营整合360技术资源转化为教学资源，助力高校实战课程升级；学生营吸引全国30所高校800余名学子参与，通过定制化学习路径培养AI安全人才；师资营为72名高校教师提供系统培训，破解高校"金师"培养痛点。360通过"技术筑基、生态共生"理念，构建了覆盖教学资源到就业支持的一体化服务体系，为高校人才培养与产业需求无缝对接提供核心支撑。
AI大模型對比完全指南:如何選擇最適合你的大模型?

文章探討了當前AI大模型市場衆多選擇帶來的選擇困難問題。面對GPT-4、Claude、文心一言等各具特色的模型，普通用戶和企業難以科學評估和選擇。文章提出了一套完整的評估體系，包括基礎能力、技術性能、應用場景和商業考量四個維度，並建議采用標准化測試和實際場景驗證相結合的方法。同時介紹了2025年主流AI模型的特點：GPT-4o在多模態交互領先，Claude3在編程和邏輯分析突出，Gemini2.5擅長長文本處理，國産DeepSeek則以高性價比見長。最後強調選擇AI模型應基于具體需求，而非簡單追求性能排名，建議通過專業對比平台和實際測試來驗證。

?AI大模型對比 ?模型選擇方法論 ?市場分析
华为发布AI推理技术UCM：降低HBM依赖计划9月正式开源

在2025金融AI推理应用落地与发展论坛上，华为重磅发布了其AI推理创新技术UCM（推理记忆数据管理器）。这项技术被业内视为有望重塑国内AI推理格局的关键突破。 UCM技术的核心在于其先进的KV Cache系统，通过融合多种缓存加速算法工具与精细的分级管理策略，高效处理推理过程中产生的大量记忆数据。这带来了多重显著优势：有效扩大上下文窗口，确保推理过程的高吞吐量与
字節跳動回应筹备“豆包汽车”：纯属谣言

字節跳動被传计划与旗下火山引擎合作开展"豆包汽车"业务，聚焦智能座舱和智驾两大板块，对标华为鸿蒙智行方案。但火山引擎迅速辟谣，称"豆包汽车"纯属谣言。字節跳動在AI领域布局广泛，推出豆包AI助手、扣子开发平台等多款产品，持续深耕AI技术。虽然短期内不会涉足汽车业务，但其在AI领域的创新突破值得期待。

?字節跳動 ?豆包汽車 ?火山引擎
AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

本文探討了如何從衆多AI大模型中選擇最適合自身需求的模型。文章提出應從四個核心維度進行評估：1)核心能力對比，包括通用任務表現和特定領域專長；2)成本與效率，考量API調用成本和響應速度；3)本地化與數據安全，滿足合規要求；4)生態與社區支持，關注開發者活躍度和文檔完善度。爲解決模型對比難題，推薦使用專業平台如AIbase模型廣場，可一站式對比主流模型的多維參數和評測數據。通過系統化評估，開發者能更高效地選擇契合業務需求的AI模型。

?人工智能 ?AI大模型 ?模型選型
實戰指南:AI大模型使用費用預測怎麽做?AIbase大模型費用計算器幫你告別成本“黑箱”

本文探討了如何預測AI大模型使用費用，並介紹了AIbase費用計算工具的價值。隨著ChatGPT等大模型的普及，企業面臨高昂API費用、複雜Token計費模式等問題。文章提出四個關鍵步驟：1)量化使用規模，包括調用量、Token消耗等；2)深入解讀定價模型，注意輸入/輸出Token價差、上下文窗口等隱藏成本；3)構建預測模型，推薦使用AIbase等專業工具進行多模型成本對比；4)持續監控優化。AI

?AI大模型 ?費用預測 ?成本控制
薦AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的熱點内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V，这是该公司在通向通用人工智能（AGI）道路上的又一重要探

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

字節跳動豆包團隊開源MoE架構優化技術：可將大模型訓練效率提升1.7倍

聚焦大模型訓練效率提升北大依托昇腾突破细粒度混合并行技术

马斯克称正在训练新FSD模型：约十倍参数最快下月底发布

百川開源最新醫療大模型，中國力量領跑醫療AI賽道

産教融合新實踐：360三大訓練營閉環賦能高校人才培養全鏈條

AI大模型對比完全指南:如何選擇最適合你的大模型?

华为发布AI推理技术UCM：降低HBM依赖计划9月正式开源

字節跳動回应筹备“豆包汽车”：纯属谣言

AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

實戰指南:AI大模型使用費用預測怎麽做?AIbase大模型費用計算器幫你告別成本“黑箱”

薦AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智能核心技術；360智腦推出Light-IF系列模型

今日大家都在搜的詞：

熱文

iPhone17Pro最新外觀曝光：蘋果調整天線布局

AI日報：智譜視覺推理模型GLM-4.5V開源；達摩院開源三項具身智

REDMI Note 15 Pro系列官宣本月发布

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

特斯拉Model 3长续航后轮驱动版上线：售价26.95万起 830公里续

周鸿祎与机器人PK球技：带球突破被机器人抢断

苹果OLED版MacBook Pro或将延至2027年发布

阿裏小號宣布暫緩停服：可繼續正常使用

华为MatePad 11.5 S官宣8月15日发布

AI日報：昆侖萬維發布SkyReels-A3模型；百度搜索PC端全面上線A