2025年8月5日,全球權威AI性能評測組織公布最新MLPerf? Storage v2.0基准测试结果,華爲OceanStor A系列存储联合济南超級計算技術研究院(簡稱“JNIST”)斬獲佳績,在本次測試中獲得多項全球排名第一,再度登頂單存儲設備、每U存儲設備及單客戶端性能榜首。
MLPerf? Storage作为全球AI存储性能评测领域的權威標杆,以嚴格的標准化測試流程和跨廠商可比性著稱,本次測試共有26家業界主流的廠商參與,其中包括DDN、IBM、焱融、HPE、UBIX、Nutanix等專業存儲廠商,充分體現了該榜單在全球科技領域的廣泛認可度與影響力。
面向Training场景,MLPerf? Storage涵盖了3D U-Net等负载用例,聚焦考核GPU利用率及横向扩展能力,同时强调存储与网络协同优化,以此验证存储系统对大规模AI集群算力的支撑能力。
此外,本次測試新增了Checkpointing場景,是首個測試大模型訓練檢查點性能的行業標准,其聚焦存儲頻繁保存訓練狀態時的穩定性表現,可覆蓋大規模集群斷點續訓、模型存檔等實際應用場景,爲集群存儲的選型決策提供了關鍵參考依據。
Training場景中,華爲以698GiB/s性能刷新全球記錄
在该测试中,3D U-Net是对存储带宽要求最高的训练用例。测试结果显示,在保持GPU利用率90%以上的条件下,華爲OceanStor A系列存储以絕對性能優勢,獲得了單存儲設備、每U存儲設備及單客戶端三項指標全球第一,其中:
● 单台8U双节点架构的OceanStor A800,可支撑255张H100GPU训练数据吞吐需求,持续提供698GiB/s的稳定带宽。
MLPerf? Storage v2.0测试:3D U-Net单存储设备性能排名第一
● 单台2U双节点架构的OceanStor A600,可支撑76张H100GPU训练场景的吞吐需求,每U带宽稳定达108GiB/s,单客户端带宽达104GiB/s。
Checkpointing場景中,OceanStorA系列存儲性能領先第二名6.7倍
在新增的 Checkpointing工作负载测试中,结果显示:
● 在Llama3_8b模型训练场景下(单台8卡训练服务器8并发场景),華爲OceanStor A系统存储单客户端支持40.2GiB/s读带宽与20.5GiB/s写带宽,排名第一。
● 在Llama3_70b模型训练场景下(单台8卡训练服务器8并发场景),華爲OceanStor A系统存储单客户端68.8GiB/s读带宽与62.4GiB/s写带宽,领先第二名6.7倍,排名第一。
華爲OceanStorA系列存儲持續創新,加速大模型應用落地
面对未来更强劲的GPU卡,華爲OceanStor A系列存储性能可随客户端与存储节点数量线性增长,提供百TB级稳定集群带宽,为大规模训练提供更强的数据访问能力。同时,華爲OceanStor A系列存储更在多维度展开技术创新:
華爲數據存儲不僅在性能上持續深耕並保持領先優勢,更在多維度展開技術創新。圍繞大模型訓練與推理場景,華爲數據存儲實現訓推全流程的全面加速,具體包括:
? 高扩展性:集群支持EB级容量横向扩展;每个引擎可支持多GPU、DPU或NPU纵向扩展,最大支持擴容至4096張算力卡;
? 数据韧性:以架构创新实现99.999%高可靠性,通过内置防勒索引擎,实现侦测准确率提升至99.99%;
? 全新数据范式:构建PB级KV Cache全局共享资源池,在保证推理精度的同时首token时延(TTFT)降低90%,推理吞吐10倍提升,大幅提升客户推理体验;内置RAG知识库,支持标量、向量、张量、图等多模式检索,大幅度降低AI大模型使用门槛;
? 数据编织:基于存储元数据管理及检索能力,实现全局数据可视、可管,可实现10倍的数据流动效率提升;
? 绿色节能:通过存储介质应用创新和整机硬件创新,将推出128TB大容量SSD盘,密度高达1PB/U,能耗低至0.7Watt/TB。
展望前路,華爲OceanStor A系列存储将持续深耕,推出面向HPC、AI大模型训/推等场景领先的产品与解决方案,与客户共赢全面智能化的未来。
(推廣)