国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達(dá)發(fā)力智能體!開源模型Nemotron 3 Super參數(shù)1200億,吞吐量提升五倍

0
分享至

英偉達(dá)正在自主智能體基礎(chǔ)設(shè)施競爭中發(fā)力,標(biāo)志著這家芯片巨頭在人工智能(AI)競賽中從硬件供應(yīng)商向模型層深度延伸的戰(zhàn)略轉(zhuǎn)變。

美東時間11日周三,英偉達(dá)宣布推出新一代開源大語言模型Nemotron 3 Super,專為企業(yè)級多智能體系統(tǒng)設(shè)計,憑借全新的混合專家(MoE)架構(gòu),將推理吞吐量提升至上一代模型的五倍以上。該模型的總參數(shù)量達(dá)1200億,推理時僅激活120億參數(shù),原生支持100萬token上下文窗口。

英偉達(dá)表示,Nemotron 3 Super在效率與開放性方面已登頂Artificial Analysis榜首,同等規(guī)模模型中準(zhǔn)確率領(lǐng)先,并驅(qū)動英偉達(dá)AI-Q研究智能體在DeepResearch Bench及DeepResearch Bench II兩大排行榜中位列第一。


英偉達(dá)披露了Nemotron 3 Super的首批合作伙伴。AI搜索公司Perplexity成為首家接入該模型執(zhí)行智能體任務(wù)的合作方,為用戶提供搜索及Computer產(chǎn)品中的多智能體編排服務(wù)。Palantir、西門子、Cadence、達(dá)索系統(tǒng)及Amdocs等企業(yè)軟件巨頭也已宣布將部署該模型,用于電信、網(wǎng)絡(luò)安全、半導(dǎo)體設(shè)計及制造等領(lǐng)域的工作流自動化。

Nemotron 3 Super模型現(xiàn)已通過英偉達(dá)旗下build.nvidia.com、Hugging Face及OpenRouter等渠道向開發(fā)者開放。

兩大瓶頸催生新架構(gòu)

英偉達(dá)在博客中指出,企業(yè)從聊天機器人邁向多智能體應(yīng)用時,面臨兩項核心約束。

其一為"上下文爆炸":多智能體工作流每次交互均需重新傳輸完整歷史記錄(含工具輸出和中間推理步驟),生成的token數(shù)量最高可達(dá)標(biāo)準(zhǔn)對話的15倍。隨著任務(wù)延伸,這一海量上下文不僅推高成本,還會導(dǎo)致"目標(biāo)漂移"——智能體逐漸偏離原始目標(biāo)。

其二為"思考稅":復(fù)雜智能體須在每一步驟進(jìn)行推理,若每個子任務(wù)均調(diào)用大型模型,多智能體應(yīng)用將因成本高昂、響應(yīng)遲緩而難以落地。

Nemotron 3 Super通過100萬token原生上下文窗口直接回應(yīng)上下文爆炸問題,確保智能體在超長任務(wù)中保持狀態(tài)連貫,防止目標(biāo)漂移。而混合架構(gòu)設(shè)計則針對性化解思考稅。

三重架構(gòu)創(chuàng)新支撐五倍提速

英偉達(dá)博客披露,Nemotron 3 Super的性能躍升來自三項架構(gòu)層面的核心創(chuàng)新。

  • 混合Mamba-Transformer骨干網(wǎng)絡(luò):模型交錯部署Mamba-2層與Transformer注意力層。Mamba層處理大部分序列任務(wù),以線性時間復(fù)雜度提供4倍內(nèi)存與計算效率提升,使百萬token上下文窗口具備實際可行性;Transformer層則在關(guān)鍵深度插入,保障精確的關(guān)聯(lián)召回能力。
  • 潛在專家混合模型(latent MoE):在路由決策前,將token嵌入壓縮至低秩潛空間,專家計算在該較小維度內(nèi)完成后再投影回全維度。英偉達(dá)表示,這一設(shè)計使模型以相同推理成本激活4倍數(shù)量的專家,實現(xiàn)更細(xì)粒度的專業(yè)化路由——例如針對Python語法與SQL邏輯分別激活不同專家。
  • 多token預(yù)測(MTP):模型在單次前向傳播中同步預(yù)測多個未來token,而非逐token生成。英偉達(dá)稱,這一設(shè)計在訓(xùn)練階段強化了模型對長程邏輯依賴的內(nèi)化,在推理階段則內(nèi)置推測解碼能力,對代碼和工具調(diào)用等結(jié)構(gòu)化生成任務(wù)實現(xiàn)最高3倍的速度提升,且無需額外草稿模型。

在英偉達(dá)Blackwell平臺上,該模型以NVFP4精度運行,相比英偉達(dá)Hopper平臺的FP8,推理速度最高提升至4倍,且據(jù)英偉達(dá)稱精度無損失。

開放權(quán)重疊加多層生態(tài)布局

與當(dāng)前主流前沿模型普遍采用API-only訪問方式不同,英偉達(dá)選擇以寬松許可協(xié)議開放Nemotron 3 Super的權(quán)重、數(shù)據(jù)集與訓(xùn)練方案,開發(fā)者可在工作站、數(shù)據(jù)中心或云端自由部署與定制。

英偉達(dá)同步公開了完整的訓(xùn)練與評估方案,涵蓋預(yù)訓(xùn)練至對齊的全流程,并發(fā)布超過10萬億token的預(yù)訓(xùn)練及后訓(xùn)練數(shù)據(jù)集、21個強化學(xué)習(xí)訓(xùn)練環(huán)境以及評估方案。預(yù)訓(xùn)練階段,模型在25萬億token上以NVFP4原生精度訓(xùn)練,從首次梯度更新起即在4位浮點運算約束下學(xué)習(xí)準(zhǔn)確性,而非事后量化。

在生態(tài)層面,英偉達(dá)已與谷歌云Vertex AI、甲骨文云基礎(chǔ)設(shè)施、戴爾技術(shù)、HPE等主流云服務(wù)商及硬件廠商達(dá)成合作,亞馬遜AWS Bedrock及微軟Azure的接入亦在籌備中。CodeRabbit、Factory、Greptile等軟件開發(fā)智能體公司,以及生命科學(xué)機構(gòu)Edison Scientific和Lila Sciences,也已宣布將該模型整合至其智能體工作流。

"Super+Nano"組合部署

英偉達(dá)在博客中還闡述了Nemotron 3系列的協(xié)同部署邏輯。去年12月推出的Nemotron 3模型Nano版本適合處理智能體工作流中針對性的單步任務(wù),Nemotron 3 Super則專為需要深度規(guī)劃與推理的復(fù)雜多步驟任務(wù)而設(shè)計。

以軟件開發(fā)場景為例,英偉達(dá)建議:簡單的合并請求可由Nano處理,涉及對代碼庫深度理解的復(fù)雜編碼任務(wù)交由Super承擔(dān),而專家級任務(wù)則可進(jìn)一步調(diào)用第三方專有模型。這一分層架構(gòu)旨在幫助企業(yè)在成本與能力之間尋求最優(yōu)平衡。

在具體應(yīng)用場景上,英偉達(dá)博客舉例稱,軟件開發(fā)智能體可將整個代碼庫一次性加載至上下文,實現(xiàn)端到端代碼生成與調(diào)試;金融分析場景下可將數(shù)千頁報告載入內(nèi)存,省去跨長對話的重復(fù)推理;網(wǎng)絡(luò)安全中的自主安全編排場景則可受益于高精度工具調(diào)用,避免在高風(fēng)險環(huán)境中出現(xiàn)執(zhí)行錯誤。

硬件護(hù)城河的模型層延伸

英偉達(dá)此次開放模型策略背后是一套清晰的商業(yè)邏輯。此前,英偉達(dá)主要通過向OpenAI、谷歌等模型提供商出售GPU積累AI領(lǐng)域主導(dǎo)地位。如今,若Nemotron成為企業(yè)智能體AI的主流基礎(chǔ)模型,大規(guī)模運行該模型所需的GPU基礎(chǔ)設(shè)施仍將倚重英偉達(dá)——在模型層推進(jìn)開放的同時,鞏固硬件層的需求鎖定。

目前,Nemotron 3 Super已通過英偉達(dá)NIM微服務(wù)打包交付,支持從本地到云端的靈活部署。性能數(shù)據(jù)能否在生產(chǎn)級工作負(fù)載下得到驗證,以及企業(yè)客戶如何在開放靈活性與競爭對手專有模型能力之間做出取舍,將是檢驗這一戰(zhàn)略成效的關(guān)鍵變量。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
伊朗女足已乘飛機回國!登機時痛哭,至少1人拒離開+2人最終留守

伊朗女足已乘飛機回國!登機時痛哭,至少1人拒離開+2人最終留守

二瘋說球
2026-03-11 08:11:58
萬萬沒有想到!美國真正的危機,才剛剛開始!

萬萬沒有想到!美國真正的危機,才剛剛開始!

米筐投資
2026-03-12 07:05:02
5-2!歐冠5隊晉級在望:巴黎+皇馬大勝,黑馬或攜手4豪門進(jìn)8強

5-2!歐冠5隊晉級在望:巴黎+皇馬大勝,黑馬或攜手4豪門進(jìn)8強

體育知多少
2026-03-12 07:30:11
胡歌亮相《生命樹》座談會獲封大使,楊紫缺席,預(yù)測橫掃各大獎項

胡歌亮相《生命樹》座談會獲封大使,楊紫缺席,預(yù)測橫掃各大獎項

露珠聊影視
2026-03-11 23:04:33
重慶市中心正在悄悄“搬家”?這3個新中心正在強勢崛起!

重慶市中心正在悄悄“搬家”?這3個新中心正在強勢崛起!

原廣工業(yè)
2026-03-11 09:18:39
毛主席:晚年重用了這3個人物,從此徹底改寫了中國未來命運

毛主席:晚年重用了這3個人物,從此徹底改寫了中國未來命運

優(yōu)趣紀(jì)史記
2026-03-10 11:15:34
人到晚年才明白:女婿是客,外孫是緣,別把自己當(dāng)回事

人到晚年才明白:女婿是客,外孫是緣,別把自己當(dāng)回事

大熊歡樂坊
2026-02-17 13:50:16
廢了,已經(jīng)無球可踢了,還在換女友,何小珂公布新戀情,令人唏噓

廢了,已經(jīng)無球可踢了,還在換女友,何小珂公布新戀情,令人唏噓

體壇風(fēng)之子
2026-03-12 04:30:05
中國籃球又出丑聞!26歲明星球員桃色實錘,郭士強做的太對了

中國籃球又出丑聞!26歲明星球員桃色實錘,郭士強做的太對了

李橑在北漂
2026-03-11 19:48:45
美國為何不愿平視中國?牢A揭秘:在西方眼里,我們不能算“人”

美國為何不愿平視中國?牢A揭秘:在西方眼里,我們不能算“人”

史智文道
2026-02-15 17:31:46
阿根廷求中國復(fù)工!停工兩年代價慘重,美方的餅再大也填不飽肚子

阿根廷求中國復(fù)工!停工兩年代價慘重,美方的餅再大也填不飽肚子

阿芒娛樂說
2026-03-11 19:18:21
江浙滬家長對子女的上班執(zhí)念有多大?網(wǎng)友:付費上班具象化了!

江浙滬家長對子女的上班執(zhí)念有多大?網(wǎng)友:付費上班具象化了!

另子維愛讀史
2026-03-11 19:38:15
油價調(diào)整:注意,預(yù)計上調(diào)1100元/噸,油價飆升!

油價調(diào)整:注意,預(yù)計上調(diào)1100元/噸,油價飆升!

金投網(wǎng)
2026-03-11 10:54:03
美貿(mào)易代表:特朗普改主意了,除中國之外,其他國家一個都跑不掉

美貿(mào)易代表:特朗普改主意了,除中國之外,其他國家一個都跑不掉

原來仙女不講理
2026-03-11 22:55:55
“養(yǎng)龍蝦”的第一批受害者出現(xiàn)了!亂刪郵件、隱私泄露,有嚴(yán)重安全風(fēng)險!有商家推出代卸載OpenClaw服務(wù):上門卸載299元,遠(yuǎn)程卸載199元

“養(yǎng)龍蝦”的第一批受害者出現(xiàn)了!亂刪郵件、隱私泄露,有嚴(yán)重安全風(fēng)險!有商家推出代卸載OpenClaw服務(wù):上門卸載299元,遠(yuǎn)程卸載199元

中國能源網(wǎng)
2026-03-11 10:56:11
曝王曼昱將暫退世界大賽!國乒教練組難辭其咎,一細(xì)節(jié)早有跡可循

曝王曼昱將暫退世界大賽!國乒教練組難辭其咎,一細(xì)節(jié)早有跡可循

十點街球體育
2026-03-11 20:29:44
電視劇盛典紅毯,成明星現(xiàn)形鏡,白敬亭面相變了,肖戰(zhàn)太驚艷

電視劇盛典紅毯,成明星現(xiàn)形鏡,白敬亭面相變了,肖戰(zhàn)太驚艷

八卦南風(fēng)
2026-03-09 18:07:30
加拿大帶頭“不陪玩”,美以陷入孤立?解放軍三句話點破戰(zhàn)爭真相

加拿大帶頭“不陪玩”,美以陷入孤立?解放軍三句話點破戰(zhàn)爭真相

夢想的現(xiàn)實
2026-03-12 08:14:14
曼城0-3!輸球不可怕,可怕的是瓜迪奧拉一席話,看不到希望!

曼城0-3!輸球不可怕,可怕的是瓜迪奧拉一席話,看不到希望!

李帕在北漂
2026-03-12 07:43:39
伊朗發(fā)起第40波打擊

伊朗發(fā)起第40波打擊

財聯(lián)社
2026-03-12 05:05:03
2026-03-12 08:52:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
142826文章數(shù) 2652843關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門口"裝蝦"

頭條要聞

牛彈琴:伊朗開出停戰(zhàn)三大條件 這是讓美國"投降"啊

頭條要聞

牛彈琴:伊朗開出停戰(zhàn)三大條件 這是讓美國"投降"啊

體育要聞

郭艾倫重傷,CBA下半賽季還能期待些什么

娛樂要聞

蔡少芬曬全家福照,兩女兒成最大亮點

財經(jīng)要聞

美國真正的危機,才剛剛開始!

汽車要聞

蓮花糾偏, 馮擎峰的“收”與“守”

態(tài)度原創(chuàng)

藝術(shù)
教育
親子
旅游
公開課

藝術(shù)要聞

字寫得像個“獨行俠”?教你治愈連貫性缺失!

教育要聞

農(nóng)村養(yǎng)豬要放音樂,神曲在對你的孩子做同樣的事

親子要聞

產(chǎn)后性生活不和諧?別慌,用對心技巧,寶媽也能重獲性福與爽感

旅游要聞

視窗|春拂西湖游興濃

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版