網站賺不到錢？立刻加入參與變現
字體超市--好字體用得起，買得起！
共建未成年人“清朗”網絡空間承諾書

英偉達发布Nemotron-4 15B： 8 万亿训练数据，性能超LLaMA-2

2024-03-07 08:48 · 稿源：站長之家

**劃重點:**
1. ? Nemotron-415B擁有150億參數，基于8萬億文本標注數據預訓練，在多領域測試中超越同類大小的開源模型，尤其在代碼語言准確率上表現出色。
2. ?采用标准Transformer架构，结合自注意力、全局注意力和多头注意力等机制，以及旋转位置编码技术，提升模型表达和泛化能力。
3. ? 利用384个DGX H100节点，每节点搭载8个NVIDIA Hopper架构的H10080GB SXM5GPU，采用8路张量并行和数据并行的组合，以及分布式优化器进行分片。

站長之家（ChinaZ.com）3月7日消息:英偉達最新推出的大型語言模型Nemotron-415B，以其卓越性能和創新架構引起廣泛關注。該模型擁有150億參數，基于龐大的8萬億文本標注數據進行了預訓練。

在多領域測試中，Nemotron-415B在7個領域中的4個表現優異，超越了同類大小的開源模型。特別值得注意的是，在代碼語言方面，Nemotron-415B展現出更高的准確率，尤其在資源稀缺的編程語言上超過了Starcoder和Mistral7B等模型。

該模型采用了標准的Transformer架構，包括多頭自注意力機制和前饋神經網絡。其獨特之處在于，Nemotron-415B結合了自注意力和全局注意力機制，以更好地理解輸入序列內部的依賴關系和輸入序列與輸出序列之間的對應關系。多頭注意力的引入進一步提高了模型的表達能力和泛化能力。

在训练过程中，研究人员充分利用了384个DGX H100节点，每个节点搭载8个基于NVIDIA Hopper架构的H10080GB SXM5GPU。通过8路张量并行和数据并行的组合，以及分布式优化器进行分片，成功完成了Nemotron-415B的训练。

Nemotron-415B在英語、數學推理、多語言分類和代碼等多個測試任務中表現出色，不僅在性能上超越了LLaMA-234B和Mistral7B，在廣泛的代碼語言中也取得了更高的准確率。這一成就爲大型語言模型的發展和應用提供了嶄新的視角。

技術報告https://arxiv.org/abs/2402.16819

（舉報）

相關推薦

關鍵詞：

联发科辟谣被英偉達收购：不实消息不是真的

此前，NVIDIA官方公开了与联发科共同开发的GB10超级芯片的详细信息，这一合作成果随即引发了市场的广泛猜测。有观点认为，鉴于双方在芯片技术上的深度整合，NVIDIA可能会进一步采取行动，通过收购联发科来强化自身在芯片领域的地位。据了解，GB10芯片是联发科与NVIDIA技术合作的结晶。其中，联发科负责CPU与内存的设计工作，而NVIDIA则贡献了其GPU技术的最新成果。通过这?

?NVIDIA ?聯發科 ?芯片技術
苹果破天荒史诗升级！iPhone 17标准版首次支持Pro Motion：120Hz高刷

iPhone 17系列终于在万众期待中亮相，首先介绍的就是屏幕，采用更窄边框的6.3英寸屏幕。大家盼望多年的重磅升级终于来了标准版首次支持高刷。

?iPhone ?17 ?高刷屏幕
英偉達正研发新型AI芯片，微美全息（WIMI.US）携算力方案加入全球科技争霸赛

马斯克终止Dojo超级计算机项目，耗资超十亿美元后转向斥资数十亿购买英偉達AI芯片。特斯拉计划到2025年底将H100芯片数量从3.5万增至8.5万块。英偉達凭借强大训练芯片性能占据市场主导，并正为中国市场开发基于Blackwell架构的新型AI芯片B30A和RTX6000D。全球AI推理芯片市场正经历爆发式增长，预计2023至2030年复合增长率超35%。微美全息等科技公司加大AI算力投入，推动边缘计算与A

?Dojo超級計算機 ?英偉達AI芯片 ?FSD神經網絡
英偉達机器人底层技术突破，微美全息（WIMI.US）多维布局助推产业生态爆发

英偉達发布机器人AI芯片，黄仁勋称AI下一波浪潮将是机器人。上海发布AI+制造方案，推动3000家企业智能化。人形机器人市场前景广阔，预计2030年产量达23万台。微美全息等企业积极布局，在工业与家庭场景加速落地。机器人技术从"炫技"走向实用，正重塑产业结构和生活方式。

?英偉達 ?機器人 ?AI
小米召回116887輛SU7電動汽車：將OTA升級消除安全隱患

小米汽車因部分SU7標准版電動車型在L2高速領航輔助駕駛功能開啓時，存在極端場景下識別、預警或處置能力不足的安全隱患，決定自9月19日起召回2024年2月6日至2025年8月30日期間生産的116,887輛相關車輛。公司將通過OTA遠程免費升級軟件消除隱患，無需車主到店，體現對消費者安全的高度重視。

?小米汽車召回 ?SU7標准版 ?電動汽車召回
HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败，如今AI时代带来消费原子化、决策流线化和主体去人化三大变革，使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易，重构互联网经济逻辑，让HTTP 402从理想变为AI经济的支付基石。

?HTTP402 ?微支付 ?Roy
AI員工正在賦能千行百業，企業在選擇AI員工時，應該重點對比這4項重要能力！

国务院发布《关于深入实施“人工智能+”行动的意见》，明确AI与实体经济、社会各领域深稛嶷合成为国家战略。文章指出企业应重点考察AI员工的业务适配性、执行能力、系统对接能力和持续进化能力，选择能深度理解行业逻辑、完成真实任务、无缝对接现有系统并持续学习的AI工具，以提升效率、解放人力，把握智能化转型机遇。

?人工智能+ ?AI技術 ?智能終端
为生命科学全球化赋能：法大大 Nota Sign 发布业内首个 GxP 合规电子签方案

法大大Nota Sign发布业内首个符合GxP标准的电子签方案，满足FDA 21CFR Part11等国际法规，为生命科学企业提供安全可靠的电子签署服务。该方案覆盖研发、临床、生产禑岖流程，解决传统纸质签署效率低、易出错的问题，助力企业提升合规性与运营效率，加速全球化进程。

?全球化 ?醫藥合規 ?電子簽方案
VTN平台：向TRUTH原則致敬，攜手消費者重識健康真相

在信息過載的大健康消費市場，VTN平台以“TRUTH原則”爲核心，通過全面、實際、有用、信任與和諧五個維度，爲消費者構建科學健康認知體系。平台甄選全球優質健康品牌，依托前沿科技與深度服務，提供個性化健康方案，致力于推動健康消費從交易型向價值型躍遷，實現個體與社會的健康和諧。

?健康消費 ?TRUTH原則 ?VTN平台
王腾因泄密被小米辞退最后一次站台主讲的是REDMI Note 15系列

8日深夜，小米集团职业道德委员会一封《关于对中国区员工王腾违规违纪行为处理的通报》引发业内与网友熱议。邮件显示，辞退原因是泄露公司机密信息，且存在利益冲突等严重违规违纪行为。当晚，王腾本人也发布微博对此事进行了回应，他表示很惭愧跟大家说声抱歉，承认过去犯了一些错误，愿意接受该有的代价。王腾最后一次公开亮相是在今年8月21日的REDMI Note15?

?小米集團 ?王騰違規 ?泄露機密

今日大家都在搜的詞：

熱文

3 天
7天

站長商机

美女1级情感片下载二级1片欧美1级片 1级片网站 a1级片免费看1级片看1级片国产1级片三级1片三1级片

英偉達发布Nemotron-4 15B： 8 万亿训练数据，性能超LLaMA-2

联发科辟谣被英偉達收购：不实消息不是真的

苹果破天荒史诗升级！iPhone 17标准版首次支持Pro Motion：120Hz高刷

英偉達正研发新型AI芯片，微美全息（WIMI.US）携算力方案加入全球科技争霸赛

英偉達机器人底层技术突破，微美全息（WIMI.US）多维布局助推产业生态爆发

小米召回116887輛SU7電動汽車：將OTA升級消除安全隱患

HTTP 402与微支付：一段沉睡三十年的代码，在AI时代觉醒

AI員工正在賦能千行百業，企業在選擇AI員工時，應該重點對比這4項重要能力！

为生命科学全球化赋能：法大大 Nota Sign 发布业内首个 GxP 合规电子签方案

VTN平台：向TRUTH原則致敬，攜手消費者重識健康真相

王腾因泄密被小米辞退最后一次站台主讲的是REDMI Note 15系列

今日大家都在搜的詞：

熱文

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

AI日報：阿裏雲開源通義DeepResearch；誇克推醫師考試大模型；

盧偉冰：9月19日將直播在線解答小米17系列17個問題

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

小米召回116887輛SU7電動汽車：將OTA升級消除安全隱患

蘋果承諾修複iPhone17拍照黑色方塊、白色曲線等問題

苹果 iPhone 17/Pro 系列今日发售多维度升级

鴻蒙智行秋季發布會定檔9月23日：尚界H5、新問界M7來了

雷軍回應小米召回11.7萬輛SU7：將爲用戶帶來更多期待功能

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米17 Pro系列外观公布：搭载“妙享背屏”

小米16改名小米17 本月发布：现已上架开启预约

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

小米手机官博头像上熱搜：泄密17 Pro系列或配备背屏

小米17官宣本月发布卢伟冰称有信心直面iPhone17

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

尚界H5小订突破10万台预售16.98万起

理想i6定檔9月26日上市：官方定義新形態五座SUV

站長商机