国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

英偉達(dá)發(fā)力智能體!開源模型Nemotron 3 Super參數(shù)1200億,吞吐量提升五倍

0
分享至

英偉達(dá)正在自主智能體基礎(chǔ)設(shè)施競(jìng)爭(zhēng)中發(fā)力,標(biāo)志著這家芯片巨頭在人工智能(AI)競(jìng)賽中從硬件供應(yīng)商向模型層深度延伸的戰(zhàn)略轉(zhuǎn)變。

美東時(shí)間11日周三,英偉達(dá)宣布推出新一代開源大語(yǔ)言模型Nemotron 3 Super,專為企業(yè)級(jí)多智能體系統(tǒng)設(shè)計(jì),憑借全新的混合專家(MoE)架構(gòu),將推理吞吐量提升至上一代模型的五倍以上。該模型的總參數(shù)量達(dá)1200億,推理時(shí)僅激活120億參數(shù),原生支持100萬token上下文窗口。

英偉達(dá)表示,Nemotron 3 Super在效率與開放性方面已登頂Artificial Analysis榜首,同等規(guī)模模型中準(zhǔn)確率領(lǐng)先,并驅(qū)動(dòng)英偉達(dá)AI-Q研究智能體在DeepResearch Bench及DeepResearch Bench II兩大排行榜中位列第一。


英偉達(dá)披露了Nemotron 3 Super的首批合作伙伴。AI搜索公司Perplexity成為首家接入該模型執(zhí)行智能體任務(wù)的合作方,為用戶提供搜索及Computer產(chǎn)品中的多智能體編排服務(wù)。Palantir、西門子、Cadence、達(dá)索系統(tǒng)及Amdocs等企業(yè)軟件巨頭也已宣布將部署該模型,用于電信、網(wǎng)絡(luò)安全、半導(dǎo)體設(shè)計(jì)及制造等領(lǐng)域的工作流自動(dòng)化。

Nemotron 3 Super模型現(xiàn)已通過英偉達(dá)旗下build.nvidia.com、Hugging Face及OpenRouter等渠道向開發(fā)者開放。

兩大瓶頸催生新架構(gòu)

英偉達(dá)在博客中指出,企業(yè)從聊天機(jī)器人邁向多智能體應(yīng)用時(shí),面臨兩項(xiàng)核心約束。

其一為"上下文爆炸":多智能體工作流每次交互均需重新傳輸完整歷史記錄(含工具輸出和中間推理步驟),生成的token數(shù)量最高可達(dá)標(biāo)準(zhǔn)對(duì)話的15倍。隨著任務(wù)延伸,這一海量上下文不僅推高成本,還會(huì)導(dǎo)致"目標(biāo)漂移"——智能體逐漸偏離原始目標(biāo)。

其二為"思考稅":復(fù)雜智能體須在每一步驟進(jìn)行推理,若每個(gè)子任務(wù)均調(diào)用大型模型,多智能體應(yīng)用將因成本高昂、響應(yīng)遲緩而難以落地。

Nemotron 3 Super通過100萬token原生上下文窗口直接回應(yīng)上下文爆炸問題,確保智能體在超長(zhǎng)任務(wù)中保持狀態(tài)連貫,防止目標(biāo)漂移。而混合架構(gòu)設(shè)計(jì)則針對(duì)性化解思考稅。

三重架構(gòu)創(chuàng)新支撐五倍提速

英偉達(dá)博客披露,Nemotron 3 Super的性能躍升來自三項(xiàng)架構(gòu)層面的核心創(chuàng)新。

  • 混合Mamba-Transformer骨干網(wǎng)絡(luò):模型交錯(cuò)部署Mamba-2層與Transformer注意力層。Mamba層處理大部分序列任務(wù),以線性時(shí)間復(fù)雜度提供4倍內(nèi)存與計(jì)算效率提升,使百萬token上下文窗口具備實(shí)際可行性;Transformer層則在關(guān)鍵深度插入,保障精確的關(guān)聯(lián)召回能力。
  • 潛在專家混合模型(latent MoE):在路由決策前,將token嵌入壓縮至低秩潛空間,專家計(jì)算在該較小維度內(nèi)完成后再投影回全維度。英偉達(dá)表示,這一設(shè)計(jì)使模型以相同推理成本激活4倍數(shù)量的專家,實(shí)現(xiàn)更細(xì)粒度的專業(yè)化路由——例如針對(duì)Python語(yǔ)法與SQL邏輯分別激活不同專家。
  • 多token預(yù)測(cè)(MTP):模型在單次前向傳播中同步預(yù)測(cè)多個(gè)未來token,而非逐token生成。英偉達(dá)稱,這一設(shè)計(jì)在訓(xùn)練階段強(qiáng)化了模型對(duì)長(zhǎng)程邏輯依賴的內(nèi)化,在推理階段則內(nèi)置推測(cè)解碼能力,對(duì)代碼和工具調(diào)用等結(jié)構(gòu)化生成任務(wù)實(shí)現(xiàn)最高3倍的速度提升,且無需額外草稿模型。

在英偉達(dá)Blackwell平臺(tái)上,該模型以NVFP4精度運(yùn)行,相比英偉達(dá)Hopper平臺(tái)的FP8,推理速度最高提升至4倍,且據(jù)英偉達(dá)稱精度無損失。

開放權(quán)重疊加多層生態(tài)布局

與當(dāng)前主流前沿模型普遍采用API-only訪問方式不同,英偉達(dá)選擇以寬松許可協(xié)議開放Nemotron 3 Super的權(quán)重、數(shù)據(jù)集與訓(xùn)練方案,開發(fā)者可在工作站、數(shù)據(jù)中心或云端自由部署與定制。

英偉達(dá)同步公開了完整的訓(xùn)練與評(píng)估方案,涵蓋預(yù)訓(xùn)練至對(duì)齊的全流程,并發(fā)布超過10萬億token的預(yù)訓(xùn)練及后訓(xùn)練數(shù)據(jù)集、21個(gè)強(qiáng)化學(xué)習(xí)訓(xùn)練環(huán)境以及評(píng)估方案。預(yù)訓(xùn)練階段,模型在25萬億token上以NVFP4原生精度訓(xùn)練,從首次梯度更新起即在4位浮點(diǎn)運(yùn)算約束下學(xué)習(xí)準(zhǔn)確性,而非事后量化。

在生態(tài)層面,英偉達(dá)已與谷歌云Vertex AI、甲骨文云基礎(chǔ)設(shè)施、戴爾技術(shù)、HPE等主流云服務(wù)商及硬件廠商達(dá)成合作,亞馬遜AWS Bedrock及微軟Azure的接入亦在籌備中。CodeRabbit、Factory、Greptile等軟件開發(fā)智能體公司,以及生命科學(xué)機(jī)構(gòu)Edison Scientific和Lila Sciences,也已宣布將該模型整合至其智能體工作流。

"Super+Nano"組合部署

英偉達(dá)在博客中還闡述了Nemotron 3系列的協(xié)同部署邏輯。去年12月推出的Nemotron 3模型Nano版本適合處理智能體工作流中針對(duì)性的單步任務(wù),Nemotron 3 Super則專為需要深度規(guī)劃與推理的復(fù)雜多步驟任務(wù)而設(shè)計(jì)。

以軟件開發(fā)場(chǎng)景為例,英偉達(dá)建議:簡(jiǎn)單的合并請(qǐng)求可由Nano處理,涉及對(duì)代碼庫(kù)深度理解的復(fù)雜編碼任務(wù)交由Super承擔(dān),而專家級(jí)任務(wù)則可進(jìn)一步調(diào)用第三方專有模型。這一分層架構(gòu)旨在幫助企業(yè)在成本與能力之間尋求最優(yōu)平衡。

在具體應(yīng)用場(chǎng)景上,英偉達(dá)博客舉例稱,軟件開發(fā)智能體可將整個(gè)代碼庫(kù)一次性加載至上下文,實(shí)現(xiàn)端到端代碼生成與調(diào)試;金融分析場(chǎng)景下可將數(shù)千頁(yè)報(bào)告載入內(nèi)存,省去跨長(zhǎng)對(duì)話的重復(fù)推理;網(wǎng)絡(luò)安全中的自主安全編排場(chǎng)景則可受益于高精度工具調(diào)用,避免在高風(fēng)險(xiǎn)環(huán)境中出現(xiàn)執(zhí)行錯(cuò)誤。

硬件護(hù)城河的模型層延伸

英偉達(dá)此次開放模型策略背后是一套清晰的商業(yè)邏輯。此前,英偉達(dá)主要通過向OpenAI、谷歌等模型提供商出售GPU積累AI領(lǐng)域主導(dǎo)地位。如今,若Nemotron成為企業(yè)智能體AI的主流基礎(chǔ)模型,大規(guī)模運(yùn)行該模型所需的GPU基礎(chǔ)設(shè)施仍將倚重英偉達(dá)——在模型層推進(jìn)開放的同時(shí),鞏固硬件層的需求鎖定。

目前,Nemotron 3 Super已通過英偉達(dá)NIM微服務(wù)打包交付,支持從本地到云端的靈活部署。性能數(shù)據(jù)能否在生產(chǎn)級(jí)工作負(fù)載下得到驗(yàn)證,以及企業(yè)客戶如何在開放靈活性與競(jìng)爭(zhēng)對(duì)手專有模型能力之間做出取舍,將是檢驗(yàn)這一戰(zhàn)略成效的關(guān)鍵變量。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人民銳評(píng):要充分認(rèn)知違禁境外劇的危害

人民銳評(píng):要充分認(rèn)知違禁境外劇的危害

人民資訊
2026-03-11 11:27:06
各大 AI 哭暈了。。。字節(jié)來收割「龍蝦」用戶了。。。真一鍵收割 。!快狠準(zhǔn)。。。

各大 AI 哭暈了。。。字節(jié)來收割「龍蝦」用戶了。。。真一鍵收割 。!快狠準(zhǔn)。。。

純潔的微笑
2026-03-11 19:27:49
揚(yáng)州一女子車禍被打,樣貌曝光,人無賴嘴也惡毒,網(wǎng)友:打的好

揚(yáng)州一女子車禍被打,樣貌曝光,人無賴嘴也惡毒,網(wǎng)友:打的好

奇思妙想草葉君
2026-03-11 18:56:30
泰國(guó)海軍:一艘懸掛泰國(guó)國(guó)旗的貨船在霍爾木茲海峽遭炮火襲擊,船艙嚴(yán)重受損,現(xiàn)場(chǎng)畫面曝光

泰國(guó)海軍:一艘懸掛泰國(guó)國(guó)旗的貨船在霍爾木茲海峽遭炮火襲擊,船艙嚴(yán)重受損,現(xiàn)場(chǎng)畫面曝光

大風(fēng)新聞
2026-03-11 19:30:03
中方表態(tài)!任何情況下都不允許!

中方表態(tài)!任何情況下都不允許!

看看新聞Knews
2026-03-11 16:06:02
丟人!爆冷輸新疆,廣東揪3戰(zhàn)犯:MVP0得分,三分王6中0葬送全局

丟人!爆冷輸新疆,廣東揪3戰(zhàn)犯:MVP0得分,三分王6中0葬送全局

后仰大風(fēng)車
2026-03-11 22:11:19
字母哥談阿德巴約83分:以后沒人會(huì)記得罰球多少,重要的是他拿到了

字母哥談阿德巴約83分:以后沒人會(huì)記得罰球多少,重要的是他拿到了

懂球帝
2026-03-11 13:37:05
她果然沒離,畢竟400億資產(chǎn)的男人也不多啊!

她果然沒離,畢竟400億資產(chǎn)的男人也不多!

BenSir本色說
2026-03-11 22:06:22
一男子高速開啟智駕后呼呼大睡了一百多公里:致多車連環(huán)追尾

一男子高速開啟智駕后呼呼大睡了一百多公里:致多車連環(huán)追尾

快科技
2026-03-11 11:29:07
實(shí)在陰險(xiǎn)!美以開啟"化學(xué)戰(zhàn)"制造強(qiáng)酸性黑雨,囂張喊話"敲打"中國(guó)

實(shí)在陰險(xiǎn)!美以開啟"化學(xué)戰(zhàn)"制造強(qiáng)酸性黑雨,囂張喊話"敲打"中國(guó)

派大星紀(jì)錄片
2026-03-11 14:40:57
以防長(zhǎng)說對(duì)伊軍事行動(dòng)“沒有時(shí)間限制”

以防長(zhǎng)說對(duì)伊軍事行動(dòng)“沒有時(shí)間限制”

新華社
2026-03-11 20:18:03
百度的新段子看樂了:李彥宏吐槽豆包不一定比我們好,但它不給我看廣告

百度的新段子看樂了:李彥宏吐槽豆包不一定比我們好,但它不給我看廣告

爆角追蹤
2026-03-11 19:04:48
《海賊王》第二季口碑爆棚:爛番茄新鮮度100%開分

《海賊王》第二季口碑爆棚:爛番茄新鮮度100%開分

3DM游戲
2026-03-11 13:22:07
登機(jī)前決定不回國(guó) 伊朗女足又有2人獲簽證 留澳7人摘頭巾激動(dòng)擁抱

登機(jī)前決定不回國(guó) 伊朗女足又有2人獲簽證 留澳7人摘頭巾激動(dòng)擁抱

我愛英超
2026-03-11 09:11:36
蔡少芬全家福照,兩個(gè)女兒成了最大的亮點(diǎn),已是亭亭玉立美麗動(dòng)人

蔡少芬全家福照,兩個(gè)女兒成了最大的亮點(diǎn),已是亭亭玉立美麗動(dòng)人

科學(xué)發(fā)掘
2026-03-11 20:01:01
看哭了!大量伊朗人正在“逆行”回國(guó) 土伊邊境兩小時(shí)就有4波人返回伊朗

看哭了!大量伊朗人正在“逆行”回國(guó) 土伊邊境兩小時(shí)就有4波人返回伊朗

閃電新聞
2026-03-11 14:25:52
天塌了,山姆的三文魚原來不能生吃!很多人被包裝誤導(dǎo)

天塌了,山姆的三文魚原來不能生吃!很多人被包裝誤導(dǎo)

新民周刊
2026-03-11 19:48:20
美國(guó)、德國(guó)、英國(guó)、法國(guó)、意大利、加拿大、日本,發(fā)表聯(lián)合聲明

美國(guó)、德國(guó)、英國(guó)、法國(guó)、意大利、加拿大、日本,發(fā)表聯(lián)合聲明

環(huán)球時(shí)報(bào)國(guó)際
2026-03-11 21:19:59
收藏!國(guó)家衛(wèi)健委主任給出的5個(gè)“防癌處方”,尤其最后一條關(guān)乎全家

收藏!國(guó)家衛(wèi)健委主任給出的5個(gè)“防癌處方”,尤其最后一條關(guān)乎全家

人民日?qǐng)?bào)健康客戶端
2026-03-10 21:42:01
徹底凌亂了!韓國(guó):我準(zhǔn)備讓你拉走薩德,但真沒準(zhǔn)備這么多!

徹底凌亂了!韓國(guó):我準(zhǔn)備讓你拉走薩德,但真沒準(zhǔn)備這么多!

阿龍聊軍事
2026-03-11 17:29:25
2026-03-12 03:59:00
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
142820文章數(shù) 2652838關(guān)注度
往期回顧 全部

科技要聞

騰訊"養(yǎng)蝦"暴漲后,百度急得在門口"裝蝦"

頭條要聞

特朗普再次威脅將切斷與西班牙貿(mào)易往來:非常糟糕

頭條要聞

特朗普再次威脅將切斷與西班牙貿(mào)易往來:非常糟糕

體育要聞

郭艾倫重傷,CBA下半賽季還能期待些什么

娛樂要聞

蔡少芬曬全家福照,兩女兒成最大亮點(diǎn)

財(cái)經(jīng)要聞

喚醒10萬億存量資金 公積金改革大潮來了

汽車要聞

蓮花糾偏, 馮擎峰的“收”與“守”

態(tài)度原創(chuàng)

時(shí)尚
本地
手機(jī)
數(shù)碼
游戲

衣服不用買太多!初春多穿短大衣和針織衫,簡(jiǎn)單舒適又顯高

本地新聞

這檔韓國(guó)玄學(xué)綜藝,讓多少人看得頭皮發(fā)麻

手機(jī)要聞

第一臺(tái)龍蝦手機(jī)來了:小米「養(yǎng)蝦」,意在何處?

數(shù)碼要聞

OpenClaw裝進(jìn)平板!聯(lián)想AI平板宣布首發(fā)端側(cè)一鍵部署:四大優(yōu)勢(shì)公布

《生化9》MOD讓瘋狂難度更難 被喪尸咬了會(huì)感染

無障礙瀏覽 進(jìn)入關(guān)懷版