国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI 的「精算時代」正式開啟,英偉達(dá)打響第一槍

0
分享至

在 AI 領(lǐng)域,小型模型正迎來屬于它們的高光時刻。從 MIT 子公司 Liquid AI 發(fā)布的可裝入智能手表的新 AI 視覺模型,到能在谷歌智能手機(jī)上運(yùn)行的模型,小型化、高效化已成為顯著趨勢。而如今,英偉達(dá)也強(qiáng)勢加入這一浪潮,帶來了全新的小語言模型(SLM)——Nemotron - Nano - 9B - v2。這款模型不僅在選定基準(zhǔn)測試中達(dá)到同類最高性能,更具備讓用戶自由開啟和關(guān)閉 AI “推理” 的獨(dú)特能力,為 AI 應(yīng)用開辟了新的想象空間。

“小” 模型從邊緣玩具到生產(chǎn)主力

過去三個月,AI 圈的 “迷你軍團(tuán)” 接連亮劍,掀起了一場無聲的革命。MIT 子公司 Liquid AI 推出的視覺模型,小巧到能輕松裝入智能手表,讓可穿戴設(shè)備的智能體驗邁入新臺階;谷歌則將 Gemini-Nano 成功塞進(jìn) Pixel 8 手機(jī),讓移動端 AI 能力實(shí)現(xiàn)質(zhì)的飛躍;而今,英偉達(dá)帶著 90 億參數(shù)的 Nemotron-Nano-9B-v2 登場,將其部署在單張 A10 GPU 上,再次刷新了人們對小型模型的認(rèn)知。

這絕非一場 “小而美” 的技術(shù)炫技,而是一次對成本、效率與可控性的精準(zhǔn)平衡實(shí)驗。正如英偉達(dá) AI 模型后訓(xùn)練主管 Oleksii Kuchiaev 在 X 上直言:“120 億參數(shù)精簡到 90 億,就是專門為了適配 A10—— 那可是企業(yè)部署中最常見的顯卡?!?/p>

一句話:參數(shù)大小不再是衡量模型優(yōu)劣的 KPI,投資回報率(ROI)才是硬道理。

把思維鏈條做成可計費(fèi)功能

傳統(tǒng)大模型的 “黑盒思維” 一直是企業(yè)使用的痛點(diǎn) —— 一旦觸發(fā)長時間推理,token 賬單就如同脫韁野馬般失控。而 Nemotron-Nano-9B-v2 給出的解法簡單直接且高效:

在 prompt 中加入/think,模型便會啟用內(nèi)部思維鏈,像人類思考一樣逐步推導(dǎo);加入/no_think,則會直接輸出答案,省去中間環(huán)節(jié);系統(tǒng)級的max_think_tokens功能,如同 AWS 的 CPU credit 機(jī)制,能為思維鏈設(shè)定預(yù)算,精準(zhǔn)控制成本。

現(xiàn)場實(shí)測(官方報告)數(shù)據(jù)更能說明問題:

一句話:把「推理」從默認(rèn)能力變成可選項,企業(yè)第一次可以像買云硬盤一樣,按思考深度付費(fèi)。

Transformer 的「省油」補(bǔ)丁

為何 9B 模型能在長上下文里打平 70B?
答案藏在Mamba-Transformer 混合架構(gòu)里:

用 Mamba 狀態(tài)空間層替換 70% 的注意力層,顯存占用 ↓ 40%;

序列長度與顯存呈線性關(guān)系,而非平方爆炸;

128k token 實(shí)測吞吐量比同尺寸純 Transformer高 2.3×。

一句話:Mamba 不是取代 Transformer,而是把它改造成省油的混動引擎。

商業(yè)核彈:寬松許可證 + 零門檻商用

英偉達(dá)此次在許可協(xié)議上的舉措堪稱 “商業(yè)核彈”,做到了 “三不要”:

不要錢:無版稅、無收入分成,企業(yè)無需為使用模型支付額外費(fèi)用;不要談判:直接下載即可商用,省去了繁瑣的合作洽談流程;不要法務(wù)焦慮:僅要求遵守可信 AI 護(hù)欄和出口合規(guī),降低了企業(yè)的法律風(fēng)險。

對比 OpenAI 的分級許可、Anthropic 的使用上限,Nemotron-Nano-9B-v2 幾乎成了 “開源界的 AWS EC2”—— 拿來就能上線賺錢,極大地降低了企業(yè)的使用門檻。

場景切片:誰最先受益?

一句話:任何邊緣/私有化場景,都多了一張「足夠聰明又付得起」的牌

AI 的「精算時代」正式開幕

過去四年,我們見證了 scaling law 的魔法:參數(shù) × 算力 = 性能。而今天,Nemotron-Nano-9B-v2 用 90 億參數(shù)告訴我們:架構(gòu) × 控制 × 許可證 = 可持續(xù)的 AI 經(jīng)濟(jì)。

當(dāng) Liquid AI 把模型塞進(jìn)手表,當(dāng)英偉達(dá)把推理做成開關(guān),“小” 不再是技術(shù)上的妥協(xié),而是經(jīng)過精打細(xì)算后的最優(yōu)解。

下一次融資路演,創(chuàng)業(yè)者們或許不會再說 “我們比 GPT-4 更強(qiáng)”,而是會自信地宣稱:“我們用 1/10 的算力,做出了 90% 的效果,并且還能賺錢。” 這標(biāo)志著,AI 的 “精算時代” 已正式拉開帷幕。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
誰把“腐敗”帶到了香港金融圈?

誰把“腐敗”帶到了香港金融圈?

融通天下
2026-03-12 20:38:36
一個被我們忽視了20年的碳水,正在悄悄救人的脂肪肝

一個被我們忽視了20年的碳水,正在悄悄救人的脂肪肝

富貴說
2026-03-10 23:38:35
顛覆達(dá)爾文!谷歌科學(xué)家實(shí)驗證明:智能根本不是進(jìn)化出來的,它一開始就在

顛覆達(dá)爾文!谷歌科學(xué)家實(shí)驗證明:智能根本不是進(jìn)化出來的,它一開始就在

報人劉亞東
2026-03-11 12:25:28
中國船員實(shí)拍伊朗導(dǎo)彈轟炸阿聯(lián)酋儲油設(shè)施,6枚愛國者皆攔截失敗

中國船員實(shí)拍伊朗導(dǎo)彈轟炸阿聯(lián)酋儲油設(shè)施,6枚愛國者皆攔截失敗

不掉線電波
2026-03-12 09:27:43
伊朗新領(lǐng)袖遭襲受傷,特朗普斬首行動失???伊朗抓捕121名內(nèi)鬼!

伊朗新領(lǐng)袖遭襲受傷,特朗普斬首行動失敗?伊朗抓捕121名內(nèi)鬼!

軍機(jī)Talk
2026-03-11 14:50:31
終于平賬了!一深圳業(yè)主2017年花210萬買70平米房子,如今賣210萬

終于平賬了!一深圳業(yè)主2017年花210萬買70平米房子,如今賣210萬

火山詩話
2026-03-11 13:29:00
蒙曼感嘆:這輩子也結(jié)不了婚!有兩個原因:一是歲數(shù),二是長相

蒙曼感嘆:這輩子也結(jié)不了婚!有兩個原因:一是歲數(shù),二是長相

離離言幾許
2026-03-12 19:08:20
實(shí)錘!美媒給出美軍“戰(zhàn)斧”襲擊伊朗小學(xué)證據(jù)

實(shí)錘!美媒給出美軍“戰(zhàn)斧”襲擊伊朗小學(xué)證據(jù)

新華社
2026-03-09 15:34:17
伊朗:當(dāng)年的口號有多響亮,今天的諷刺就有多刺眼

伊朗:當(dāng)年的口號有多響亮,今天的諷刺就有多刺眼

廖保平
2026-03-12 09:30:17
鄭薇淘汰的人,被宮魯鳴重用當(dāng)隊長,半場0分,球迷:又菜又裝!

鄭薇淘汰的人,被宮魯鳴重用當(dāng)隊長,半場0分,球迷:又菜又裝!

我就是一個說球的
2026-03-12 22:18:36
追覓宣布發(fā)射200萬顆衛(wèi)星!

追覓宣布發(fā)射200萬顆衛(wèi)星!

中國半導(dǎo)體論壇
2026-03-11 22:00:09
巴拿馬媒體痛批巴政府:得罪中國有什么好處?報應(yīng)已徹底到來!

巴拿馬媒體痛批巴政府:得罪中國有什么好處?報應(yīng)已徹底到來!

影像溫度
2026-03-12 20:01:45
嘴硬如鐵,腿軟如紙!伊朗新領(lǐng)袖首份聲明,連臉都不敢露

嘴硬如鐵,腿軟如紙!伊朗新領(lǐng)袖首份聲明,連臉都不敢露

老馬拉車莫少裝
2026-03-12 21:39:10
法院600萬元拍掛一輛布加迪威航跑車,強(qiáng)調(diào)不得上路行駛引熱議,該車曾上京牌,全球限量僅8臺

法院600萬元拍掛一輛布加迪威航跑車,強(qiáng)調(diào)不得上路行駛引熱議,該車曾上京牌,全球限量僅8臺

極目新聞
2026-03-12 17:32:24
抖音盛典成“祛魅現(xiàn)場”!網(wǎng)紅集體見光死,網(wǎng)友:名字和臉對不上

抖音盛典成“祛魅現(xiàn)場”!網(wǎng)紅集體見光死,網(wǎng)友:名字和臉對不上

子芫伴你成長
2026-03-11 22:52:28
中國至朝鮮國際旅客列車抵達(dá)平壤

中國至朝鮮國際旅客列車抵達(dá)平壤

新華社
2026-03-12 17:09:04
誰在掏空銀行?惠州博羅農(nóng)商行與空殼公司勾結(jié),騙貸1.3億成爛賬

誰在掏空銀行?惠州博羅農(nóng)商行與空殼公司勾結(jié),騙貸1.3億成爛賬

微評社
2026-03-12 00:40:52
“全球第一律所”大暴雷!還有“主任”卷9億跑路

“全球第一律所”大暴雷!還有“主任”卷9億跑路

大貓財經(jīng)Pro
2026-03-12 17:50:38
高市早苗宣布:不管國際油價怎么變,日本油價將鎖定在170日元左右

高市早苗宣布:不管國際油價怎么變,日本油價將鎖定在170日元左右

風(fēng)向觀察
2026-03-12 16:00:02
OpenClaw創(chuàng)始人表達(dá)對騰訊抄襲不滿:大量抓取龍蝦數(shù)據(jù)卻不提供支持,服務(wù)器成本飆升

OpenClaw創(chuàng)始人表達(dá)對騰訊抄襲不滿:大量抓取龍蝦數(shù)據(jù)卻不提供支持,服務(wù)器成本飆升

回旋鏢
2026-03-12 14:56:05
2026-03-13 02:28:49
山自 incentive-icons
山自
寫點(diǎn)有趣的。關(guān)注自動駕駛和AI商業(yè)變革。
120文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

當(dāng)養(yǎng)蝦人開始卸載,大廠的戰(zhàn)爭才真正開始

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭

頭條要聞

伊朗:特朗普幾條推文結(jié)束不了戰(zhàn)爭

體育要聞

建議將“出球型門將”納入反詐app

娛樂要聞

貝克漢姆全家給27歲大布送生日祝福

財經(jīng)要聞

盧鋒:從特朗普團(tuán)隊群演看時代變局

汽車要聞

大眾2025財報:轉(zhuǎn)型雖有陣痛 "大象"已然起跑

態(tài)度原創(chuàng)

游戲
藝術(shù)
教育
公開課
軍事航空

《Apex英雄》“高達(dá)”聯(lián)動訪談:尊敬原著,貼合游戲"/> 主站 商城 論壇 自運(yùn)營 登錄 注冊 《Apex英雄》“高達(dá)”聯(lián)動訪談:尊敬原著,貼合游戲 ...

藝術(shù)要聞

深圳能源大廈,“看得我強(qiáng)迫癥都要犯了”

教育要聞

“跟伺候精神病一樣”,男孩家長因接送孩子破防:后悔沒生女兒

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普自行宣布對伊朗戰(zhàn)爭勝利

無障礙瀏覽 進(jìn)入關(guān)懷版