站長之家(ChinaZ.com) 5月29日 消息:近日,在2024智能經濟論壇上,百度集團執行副總裁、百度智能雲事業群總裁沈抖深入解析了文心系列主力大模型免費策略的背後邏輯。
沈抖指出,文心大模型之所以能实行免费政策,主要得益于百度智能雲强大的技术实力,特别是其业界领先的AI异构算力管理平台和“一云多芯”架构。这一策略旨在鼓励产业界摆脱对价格的过度关注,转而聚焦于场景创新和应用落地。成本的大幅降低,将激发产业界更广泛的创新尝试,从而加速AI技术的实际应用。
一周前,百度智能雲宣布ERNIE Speed和ERNIE Lite两款主力模型全面免费,这两款模型在文案创作、聊天对话、知识问答、内容续写等场景中有着極高的調用量。沈抖在論壇上詳細闡述了這一決策背後的技術支撐。
首先,百度百舸·AI異構計算平台通過統一、高效的管理不同地點、規模、集群的智能算力,結合芯片性能優化、自動芯片選型、潮汐混部等技術,實現了智能算力效能的大幅提升。萬卡集群上的模型有效訓練時長占比超過98.8%,幫助企業將資源成本降低一半,每年爲企業客戶節約的智算成本可達50億元以上。
其次,“一雲多芯”架構的引入,使得百舸平台能夠兼容國內外主流AI芯片,支持不同廠商芯片的混合使用。這不僅降低了企業的芯片依賴風險,還提升了供應鏈的性價比、安全性和彈性。在多芯混合訓練任務中,百舸平台能夠將單芯片利用率、芯片間通信效率、集群整體效能發揮到極致,性能損失極低。
此外,千帆ModelBuilder提供的模型路由能力也是文心大模型實現免費策略的關鍵。這一能力能夠針對任務類型自動分配合適的模型進行處理,使小參數模型在特定場景中達到與大參數模型相近的效果。以小度AI助手爲例,通過模型路由能力,成本降低了99%,模型響應速度提升了200%。
目前,文心大模型已經擁有中國最大的产业落地规模,日均调用量超过2亿,每天处理的文本相当于74万本《新华字典》。千帆平台累计服务了10.5万家企业用户,帮助他们精调了1.75万个大模型,并开发了32万个AI原生应用。这一系列的成就,充分证明了百度智能雲在AI领域的技术实力和产业影响力。
(舉報)