国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達正在封裝世界

0
分享至


出品|虎嗅科技組

作者|陳伊凡

編輯|苗正卿

頭圖|視覺中國

剛結(jié)束的GTC上,英偉達傳遞出的一個關(guān)鍵信號是,其在不斷深化芯片提供商向AI基礎(chǔ)設(shè)施系統(tǒng)提供商的角色轉(zhuǎn)變。

英偉達正在封裝AI算力層面的基礎(chǔ)設(shè)施?!表f豪創(chuàng)芯創(chuàng)始合伙人王智表示,程序編寫的方式從與硬件高度耦合的機器語言到匯編語言、到接近自然語言的高級程序語言、再到Windows的GUI、進一步出現(xiàn)面向?qū)ο蟮木幊?.....直到用Python這樣主要引用“庫”的“膠水語言”,軟件世界經(jīng)歷了一個不斷將邏輯和功能高度抽象化和封裝的過程,而英偉達正在AI算力基礎(chǔ)設(shè)施世界展示同樣的故事

王智解釋,這種高度封裝的好處是,客戶規(guī)避了對復(fù)雜系統(tǒng)中基礎(chǔ)組件的“手搓”式采購和測試,而是可以搭積木,以樂高的方式搭建。英偉達在將這種封裝不斷擴散。

二十年前,英偉達的殺手锏是CUDA。它不只是一套編程框架,而是一個讓開發(fā)者只管寫算法、不用操心底層硬件的抽象層。CUDA的護城河不是代碼,是二十年來積累的數(shù)億裝機量、數(shù)十萬開源項目、以及所有在這套生態(tài)里長大的工程師。

但CUDA只是封裝的第一層,這篇文章要回答的三個問題:

英偉達的token分層定價,意味著什么?

收購Groq、發(fā)布專用CPU。英偉達在建立一個比CUDA更大的帝國,這個帝國長什么樣?

當這個帝國的邊界不斷擴張,創(chuàng)業(yè)公司還有沒有活路?窗口在哪里?

Token分層定價:封裝的結(jié)果

token正在變成大宗商品。

這是黃仁勛在演講中拋出的核心觀點。

封裝的終點,是讓復(fù)雜的東西消失在視野之外。當芯片、系統(tǒng)、調(diào)度軟件被一層層封裝起來,用戶感知不到GPU,感知不到算力,感知到的只剩一個單位:token。token是封裝完成之后,唯一暴露在外的接口。它變成大宗商品,是封裝的必然結(jié)果,不是偶然。

黃仁勛在演講中明確說了這句話:“Tokens are the new commodity”(Token是新的大宗商品)。大宗商品成熟之后會自然分層。他不是在描述現(xiàn)狀,他是在預(yù)判一個市場結(jié)構(gòu),然后把英偉達的硬件產(chǎn)品線,精確地鋪在這個結(jié)構(gòu)的每一層上。

GTC 2026上,英偉達推出了五層Token定價體系:免費層、中級層、高級層、高速層和超高速層,對應(yīng)不同的token量。

這正如當年電信行業(yè)基本沒干成的理想,也就是對數(shù)據(jù)流量進行差異化定價。背后是一個更深層的趨勢:算力需求的精細化。越是嚴肅的場景,對幻覺的容忍度越低;量化交易這種場景,需要的是微秒級的反應(yīng);自動駕駛和某些具身智能場景需要毫秒級以內(nèi)的反饋速度,還得更快。不同場景的指標要求完全不同。

早期的AI應(yīng)用是無差異的,一臺GPU、一套推理框架,所有請求排隊處理。但當AI真正進入工商業(yè)場景,這種大水漫灌式的供給就開始失效。一家醫(yī)院的影像輔助診斷要的是準確率,一筆高頻交易要的是微秒級延遲,一個工廠流水線上的實時質(zhì)檢要的是穩(wěn)定吞吐。

算力精細化的本質(zhì),是讓不同質(zhì)量的算力服務(wù)找到真正需要它的場景。

但這只是表面的邏輯。更深層的,是需求側(cè)的一場根本性變化。從原來的人機交互,變?yōu)锳gent-to-Agent交互,Agent把token需求從線性變成了指數(shù),人用token是對話,使用量很有限;機器用token是工作流,單位時間消耗量是人的倍數(shù)。

這種變化已經(jīng)可以在數(shù)據(jù)里看到。今年春節(jié)前后,國內(nèi)大模型的流量出現(xiàn)了異常暴漲。那是國外很多公司在在降本——它們的Agent大量調(diào)用AI接口,而國內(nèi)模型更便宜(因為中國的電便宜),于是悄悄切換了,變相助力了中國模型和token的出海。

英偉達在建立一個比CUDA更大的帝國

封裝意味著綁定。從GPU到系統(tǒng),從系統(tǒng)到token經(jīng)濟規(guī)則,英偉達每封裝一層,外部的替代成本就高一個量級,這也是英偉達為何要把封裝不斷加深的原因——你會越來越討厭他,但你會越來越離不開他。

過去幾年,這套封裝在訓練側(cè)的護城河是CUDA。但在推理側(cè),CUDA的優(yōu)勢從來沒有那么明顯。

原因在于訓練和推理的計算邏輯根本不同。GPU是并行計算的機器,擅長同時處理成千上萬個相同的操作,這正是訓練神經(jīng)網(wǎng)絡(luò)所需要的。CUDA是駕馭GPU的語言,二十年的生態(tài)積累讓它無可替代。但推理不是這樣工作的:推理要的不是并行的暴力計算,而是低延時、快響應(yīng)、靈活的任務(wù)調(diào)度。GPU做推理,就像用一輛大卡車去跑快遞,力氣有余,靈活不足。

過去兩年,很多人盯著這個裂縫,覺得推理側(cè)是繞開CUDA、挑戰(zhàn)英偉達的窗口。

CPU同理,GPU負責算,CPU負責管。GPU是工廠的流水線,負責大規(guī)模并行運算;CPU是工廠的調(diào)度室,負責決定任務(wù)的順序、工具的調(diào)用、數(shù)據(jù)的流向。在AI推理場景里,一個Agent接到任務(wù)后,要決定先調(diào)用哪個工具、再調(diào)用哪個模型、結(jié)果怎么傳遞——這些控制流的工作,恰恰是CPU的主場。

英偉達之前也并非沒有CPU,只是沒有那么強。

但這一次,黃仁勛明確提出,今年是英偉達的推理年。過去幾年,隨著模型深入現(xiàn)實世界,推理的需求開始爆發(fā)。推理硬件已被提升到核心地位。

英偉達的首席科學家Bill Dally在一次對話中提到,訓練更吃內(nèi)存容量,而推理則考驗計算、內(nèi)存帶寬、容量和通信之間的資源配比。他表示,推理內(nèi)部也存在差異。比如預(yù)填充(Prefill)階段更像訓練:一次性處理大量數(shù)據(jù),屬于密集計算型,受通信能耗主導。而到了解碼(Decode)階段,為了優(yōu)化延遲,你通常在做極瘦矩陣運算,這會變成極端的帶寬受限和延遲受限。

Bill Dally提出了一個預(yù)判,未來至少會分化出三類硬件:一類針對訓練和預(yù)填充,一類針對解碼,而解碼類硬件內(nèi)部甚至還會進一步細分。

英偉達宣布了和芯片廠商Groq的整合。訓練是計算密集型,HBM(高帶寬內(nèi)存)是最優(yōu)解;推理是存儲密集型,需要的是低延時、大容量的快速存儲。Groq的LPU正是為此而生:基于SRAM,片上集成,速度遠快于DRAM,極低延時。

同時英偉達發(fā)布了新的CPU,這款CPU專門為算力中心優(yōu)化設(shè)計,放到其他場景反而不合適,跟英特爾打的不是同一場仗。但顯然,英偉達,正在構(gòu)筑一個比CUDA更大的帝國。

王智說,英偉達正在成為算力時代的蘋果,芯片自己做,操作系統(tǒng)自己做,硬件自己做,應(yīng)用自己控制。只不過耦合比蘋果更復(fù)雜。

創(chuàng)業(yè)公司的機會還有嗎

所有人都在問同一個問題:英偉達的帝國在擴大,推理市場也被它納入版圖,創(chuàng)業(yè)公司還有活路嗎?

關(guān)鍵在于,英偉達不會做所有的事,它的強項是系統(tǒng)級、規(guī)模化的交付,是面向數(shù)據(jù)中心的整體解決方案。而邊緣場景和中等定制化場景的特點恰恰相反:和特定場景高度綁定,需要定制化能力。一個工廠的質(zhì)檢攝像頭、一輛自動駕駛汽車的車載芯片、一個手術(shù)機器人的感知模塊——這些邊緣側(cè)場景對計算的需求是高度定制化和異構(gòu)的。

這里就是可重構(gòu)計算的機會所在。可重構(gòu)計算解決的是一個根本矛盾:通用芯片效率低,專用芯片太死板。如果我們拿流水線的工人做類比,普通芯片就像流水線工人,招進來只會擰螺絲,讓他去焊接?不會,得重新招人。CPU像萬能工人,什么都能干,但什么都干得不夠快??芍貥?gòu)芯片呢,它像一個可以反復(fù)“回爐培訓”的工人,今天把他訓練成焊接工,明天把他重新訓練成噴漆工,后天再訓練成質(zhì)檢員。人沒換,但技能跟著任務(wù)走,每次都能以"專業(yè)工人"的效率干活。AI時代的問題是,任務(wù)今天是這個模型、明天是那個模型,總不能每換一個任務(wù)就重新招一批專業(yè)工人。

可重構(gòu)計算也是中國半導體領(lǐng)域少數(shù)幾個與國際差距相對較小的方向之一。

王智最近在看一些可重構(gòu)計算的公司,成本更低,部署更快,適合中等程度的定制場景。

那么推理是否還有機會?王智認為,推理領(lǐng)域?qū)儆谀壳皣鴥?nèi)剛上市(岸)的頭部算力芯片公司的機會。推理側(cè)的需求剛剛開始爆發(fā),場景綁定的特性也給了差異化的可能。但他同時說,這也是很大的挑戰(zhàn),抓不住,就很難走到下一個階段。

判斷一個公司是否抓住了機會,他給了一個具體標準:是不是足夠快地認清推理才是重點,而不是繼續(xù)把資源押在為了上市而做的、跟隨英偉達的訓練芯片路線上。

這個標準比看起來更苛刻。許多已經(jīng)上市或臨近上市的國內(nèi)芯片公司,此前的商業(yè)邏輯是:做一款"夠用"的訓練芯片,講一個替代英偉達的故事,完成上市。而新的邏輯需要他們放棄路徑依賴,基于中國豐富的應(yīng)用場景重新建立產(chǎn)品定義和客戶關(guān)系

總之,領(lǐng)先者的優(yōu)勢越來越明顯,錢、技術(shù)團隊、客戶綁定……剩下的機會不多了。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4844267.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
Manus的兩名聯(lián)合創(chuàng)始人被告知不要離開中國

Manus的兩名聯(lián)合創(chuàng)始人被告知不要離開中國

新浪財經(jīng)
2026-03-26 13:50:59
卡塔爾正式宣布暫停跟中國的合同,而且短時間內(nèi)不會恢復(fù)

卡塔爾正式宣布暫停跟中國的合同,而且短時間內(nèi)不會恢復(fù)

南權(quán)先生
2026-03-25 15:19:55
懟得漂亮!伊朗外長:既然我們連領(lǐng)導層都沒有了,還有什么好談的

懟得漂亮!伊朗外長:既然我們連領(lǐng)導層都沒有了,還有什么好談的

南風不及你溫柔
2026-03-26 14:07:38
聯(lián)大通過決議,宣布“最嚴重反人類罪”

聯(lián)大通過決議,宣布“最嚴重反人類罪”

澎湃新聞
2026-03-26 11:03:06
高速統(tǒng)一限速3月26日正式落地!五檔限速+清理非標不會再亂扣分!

高速統(tǒng)一限速3月26日正式落地!五檔限速+清理非標不會再亂扣分!

沙雕小琳琳
2026-03-26 09:41:30
日本東京商業(yè)區(qū)發(fā)生持刀傷人事件2人死亡

日本東京商業(yè)區(qū)發(fā)生持刀傷人事件2人死亡

新華社
2026-03-26 21:10:15
四川某設(shè)計院爆大瓜!

四川某設(shè)計院爆大瓜!

黯泉
2026-03-26 18:36:06
心酸!湖南某鄉(xiāng)鎮(zhèn)一位小學教師哭訴年收入73150元,評論區(qū)炸鍋了

心酸!湖南某鄉(xiāng)鎮(zhèn)一位小學教師哭訴年收入73150元,評論區(qū)炸鍋了

火山詩話
2026-03-26 09:24:48
張雪峰前女友哭紅眼,喊話不要給張雪峰潑臟水,曝兩人分手原因

張雪峰前女友哭紅眼,喊話不要給張雪峰潑臟水,曝兩人分手原因

180視角
2026-03-26 14:51:03
引而不發(fā)才是王道,封鎖霍爾木茲海峽,伊朗打完了最后一張牌……

引而不發(fā)才是王道,封鎖霍爾木茲海峽,伊朗打完了最后一張牌……

家傳編輯部
2026-03-26 10:34:27
全球貨幣支付排名:美元跌至49.25%,歐元漲到22.82%,人民幣呢

全球貨幣支付排名:美元跌至49.25%,歐元漲到22.82%,人民幣呢

張嘴說財經(jīng)
2026-03-26 20:56:17
瘋狂!狂轟59+10+5,場均31.8分+歷史得分王,竟然打不了NBA

瘋狂!狂轟59+10+5,場均31.8分+歷史得分王,竟然打不了NBA

球童無忌
2026-03-26 11:10:26
以牙還牙!歐盟凍結(jié)對匈牙利160億援助,投降俄軍助烏軍消滅150人

以牙還牙!歐盟凍結(jié)對匈牙利160億援助,投降俄軍助烏軍消滅150人

史政先鋒
2026-03-26 20:22:48
網(wǎng)友曝張雪峰搶救細節(jié):倒地30分鐘才被發(fā)現(xiàn),用ECMO全力搶救無效

網(wǎng)友曝張雪峰搶救細節(jié):倒地30分鐘才被發(fā)現(xiàn),用ECMO全力搶救無效

半窗疏影
2026-03-26 20:17:36
曼城115項指控迎大結(jié)局?專家預(yù)測扣分在40到60分之間

曼城115項指控迎大結(jié)局?專家預(yù)測扣分在40到60分之間

樂道足球
2026-03-26 19:55:49
突發(fā),雷軍辭職董事長!

突發(fā),雷軍辭職董事長!

品牌頭版
2026-03-26 14:46:17
原來她是張雪峰母親,一生操勞全力托舉兒子,卻中年喪夫晚年喪子

原來她是張雪峰母親,一生操勞全力托舉兒子,卻中年喪夫晚年喪子

以茶帶書
2026-03-26 13:38:50
多地將舉辦“紀念張國榮”演唱會,行情火爆?張國榮摯友:請停止所有非法行為

多地將舉辦“紀念張國榮”演唱會,行情火爆?張國榮摯友:請停止所有非法行為

上觀新聞
2026-03-26 15:06:07
去世還不到48小時,張雪峰過往爭議被扒,出軌傳聞早已真相大白

去世還不到48小時,張雪峰過往爭議被扒,出軌傳聞早已真相大白

蘭亭墨未干
2026-03-26 22:47:38
全線跳水!剛剛,伊朗發(fā)動攻擊

全線跳水!剛剛,伊朗發(fā)動攻擊

中國基金報
2026-03-26 16:15:26
2026-03-27 03:31:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
25983文章數(shù) 687624關(guān)注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
本地
時尚
游戲
公開課

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補償方案出爐!

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復(fù)仇了一萬遍

400萬人愛過的女孩,被黃謠網(wǎng)暴180天后

PS1大IP游戲藏私貨!成人手繪與盜版馬里奧ROM塞滿

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版