7月16日至18日,2025年RISC-V中国峰会在上海成功举办。作为RISC-V特定领域计算革新者,跃昉科技受邀出席峰会高性能计算分论坛,公司首席运营官(COO)袁博浒发表题为《RISC-V+DSA:重塑芯算格局的必然选择》的主題演讲,深入探讨了RISC-V架构与特定领域加速架构(DSA)结合的技术路径及其在高性能计算领域的应用前景。
RISC-V+DSA:釋放硬件潛能新範式
袁博浒在演講中指出,隨著AI和高性能計算需求的爆發式增長,傳統芯片架構面臨算力堆砌、能耗攀升等挑戰。RISC-V架構的開放性與靈活性,結合DSA的專用化設計,能夠更高效地釋放硬件性能。
他進一步解釋,DSA通過針對特定計算任務優化指令集和硬件資源分配,顯著提升了計算能效。例如,在AI推理場景中,通過定制化指令集和緩存機制優化,可減少數據搬運開銷,使計算效率提升數倍。這種“軟硬協同”的設計理念,讓芯片無需依賴更高算力即可實現更優的AI性能表現。
在工藝演進趨緩的背景下,DSA的價值更爲凸顯。袁博浒強調:"未來需要通過DSA的專業領域架構提升能耗比,同時從工藝角度拆解不同檢查線,實現應用場景下的專業資源整合。"這種架構級優化能夠在現有工藝水平下,通過軟硬協同設計釋放更大計算潛力。
DSA架構的技術實現路徑
袁博浒詳細闡述了DSA架構從算法到芯片的完整技術路徑,這一路徑可分爲三個關鍵層次:指令集擴展設計、Chiplet設計和芯片設計。
在指令集層面,優化的核心在于針對特定計算模式進行深度定制。以Energon算法爲例,通過RISC-V擴展指令集對矩陣乘法(MatMul)、SoftMax等操作進行硬件級加速,可實現高達10000倍的能效提升和1000倍的運算速度增益。這種優化不僅提升了計算效率,更釋放了硬件的潛在能力。
Chiplet設計層面則聚焦于芯片內部執行效率的提升。袁博浒提到,通過優化單發射/多發射機制、改進緩存訪問策略以及減少數據搬運開銷,芯片能在相同工藝條件下顯著提升性能。此外,軟件共享內存機制的引入進一步增強了多核協同效率,爲複雜計算任務提供了更高效的執行環境。
在芯片设计方面,DSA架构强调针对不同计算负载设计专用加速引擎。袁博浒特别指出,“我们需要构建针对某一种计算所需要的对象对应的计算引擎。” 这一理念推动了从计算对象的扩展能力出发,构建可扩展的计算单元组合和高效的内存子系统,从而实现对特定工作负载的極致優化。
産業化的關鍵挑戰與解決方案
盡管DSA架構在技術上展現出顯著優勢,但其産業化仍面臨諸多挑戰。袁博浒從跨廠商協作、基礎設施建設和軟件生態三個維度剖析了這些問題,並提出了相應的解決方案。
跨廠商協作標准是DSA産業化首要解決的問題。袁博浒認爲,“做這樣的事情肯定只靠一個廠家很難做到”,因此需要建立統一的IP接口規範和互聯標准,確保不同廠商的DSA模塊能夠無縫協作。同時,多工藝節點支持也至關重要,這能保證架構在12nm、16nm、28nm等不同工藝下均能高效運行。
基礎設施建設方面,袁博浒提出了集中式數據交換架構和可靠互連機制等解決方案。這些技術不僅能優化多核間數據傳輸效率,還能提升系統穩定性。此外,完善的仿真工具鏈也是加速芯片設計驗證的關鍵。
软件生态建设同样不容忽视。袁博浒强调,“我们需要构建一个开放的生态,让各家可以贡献自己的加速架构设计。” 这一目标需要高性能模拟器和开放软件栈的支持,以降低开发者门槛,加速应用落地。跃昉科技已开发出支持RVA23完整指令集的高性能模拟器,为早期软件开发提供了有力保障。
袁博浒最後提出,在RISC-V+DSA生態建設方面,躍昉科技正在積極行動,作爲核心發起單位成立了全球首個基于RISC-V的DSA産業創新合作組織——RDSA産業聯盟,已經吸引了國內外50余家合作夥伴加入,共同探索異構計算互聯、協議層優化等關鍵技術,共同推進産業生態建設。
躍昉科技的DSA+RISC-V技術路線,爲芯片産業提供了新的發展思路。通過算法-指令集-硬件的深度優化,DSA架構能在能效、性能上實現突破,而開放生態的構建將進一步加速産業化落地。未來,這一技術路徑有望在AI、高性能計算等領域發揮更大價值,推動芯片産業邁向新高度。
(推廣)