国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛親自“定義”英偉達(dá):將“電子”轉(zhuǎn)為“Token”的轉(zhuǎn)換器

0
分享至

英偉達(dá)CEO黃仁勛用一句話定義了自己的公司:輸入是電子,輸出是Token,中間是英偉達(dá)。

4月15日,英偉達(dá)CEO黃仁勛接受播客主持人Dwarkesh Patel的深度訪談,內(nèi)容涵蓋英偉達(dá)的供應(yīng)鏈護(hù)城河、TPU競(jìng)爭(zhēng)威脅,以及英偉達(dá)為何不自己做云服務(wù)等問(wèn)題。

英偉達(dá):“電子Token”轉(zhuǎn)換器

訪談開篇,主持人提出了一個(gè)尖銳問(wèn)題:英偉達(dá)本質(zhì)上只是寫軟件,芯片由臺(tái)積電制造,內(nèi)存由SK 海力士、美光、三星提供,封裝由臺(tái)灣ODM廠商完成——如果軟件被商品化,英偉達(dá)會(huì)不會(huì)也被商品化?

黃仁勛給出了他對(duì)英偉達(dá)最精煉的定義:

最終,需要有某個(gè)東西把電子轉(zhuǎn)化成Token。把電子轉(zhuǎn)化成Token,并且讓這些Token隨時(shí)間變得更有價(jià)值,這件事很難被完全商品化。

他進(jìn)一步說(shuō):“輸入是電子,輸出是Token,中間是英偉達(dá)。我們的工作是盡可能高效地完成這一轉(zhuǎn)化?!?/strong>

在供應(yīng)鏈層面,外界關(guān)注的焦點(diǎn)是英偉達(dá)的采購(gòu)承諾規(guī)?!钚仑?cái)報(bào)顯示接近1000億美元,行業(yè)分析機(jī)構(gòu)SemiAnalysis預(yù)測(cè)這一數(shù)字未來(lái)可能達(dá)到2500億美元。黃仁勛解釋了這背后的邏輯:

如果未來(lái)幾年是萬(wàn)億美元規(guī)模,我們的供應(yīng)鏈能支撐它。

他說(shuō),這種能力并非單純來(lái)自合同,而來(lái)自對(duì)上游CEO的持續(xù)“告知、激勵(lì)和對(duì)齊”——讓他們看清AI產(chǎn)業(yè)的規(guī)模和方向,然后愿意為英偉達(dá)的需求進(jìn)行投資。CoWoS封裝是典型案例:兩年前是全行業(yè)最緊缺的瓶頸,英偉達(dá)“連續(xù)幾個(gè)翻倍”地?cái)U(kuò)產(chǎn)之后,現(xiàn)在已基本不再是話題。

他判斷,供應(yīng)鏈上的任何瓶頸都不會(huì)持續(xù)超過(guò)兩三年:“EUV機(jī)器、邏輯產(chǎn)能、封裝——這些東西都不難復(fù)制,只需要需求信號(hào)?!彼J(rèn)為真正的長(zhǎng)期制約在下游:能源政策。“你不能在沒(méi)有電力的情況下建立一個(gè)工業(yè),這才是需要時(shí)間的事情?!?/p>


TPU競(jìng)爭(zhēng):沒(méi)有一家敢來(lái)跑基準(zhǔn)測(cè)試

云巨頭(Hyperscalers)貢獻(xiàn)了英偉達(dá)約60%的收入,但谷歌、亞馬遜、甚至OpenAI等大客戶都在加碼自研TPU或其他ASIC芯片,這直接質(zhì)疑英偉達(dá)的競(jìng)爭(zhēng)地位。

黃仁勛的回應(yīng)分兩層。

第一層是定性區(qū)分:英偉達(dá)做的是“加速計(jì)算”,而不是專用張量處理單元。加速計(jì)算覆蓋分子動(dòng)力學(xué)、流體力學(xué)、數(shù)據(jù)處理、量子計(jì)算等幾乎所有科學(xué)計(jì)算領(lǐng)域,遠(yuǎn)比AI更寬。

我們是唯一一家加速所有類型應(yīng)用的公司。

第二層,黃仁勛稱,球沒(méi)有任何一個(gè)平臺(tái)的性能和總擁有成本能優(yōu)于英偉達(dá),谷歌TPU、亞馬遜Trainium都無(wú)法與之匹敵,我并不認(rèn)可Trainium所宣稱的40%成本優(yōu)勢(shì)。英偉達(dá)毛利率能達(dá)到70%,而ASIC芯片毛利率約為65%,企業(yè)替換產(chǎn)品并不能實(shí)現(xiàn)顯著的成本節(jié)省。

英偉達(dá)的計(jì)算棧是全球最佳性價(jià)比,沒(méi)有例外。沒(méi)有一家公司能向我證明,今天世界上有任何平臺(tái)的AI數(shù)據(jù)中心的總擁有成本(TCO)比我們更好。沒(méi)有。Dylan的InferenceMAX擺在那里供所有人用,TPU不來(lái),Trainium不來(lái)。

對(duì)于Anthropic大量使用TPU的問(wèn)題,黃仁勛直接回應(yīng):

Anthropic是一個(gè)特例,不是趨勢(shì)。沒(méi)有Anthropic,TPU的增長(zhǎng)從哪里來(lái)?是100%來(lái)自Anthropic。沒(méi)有Anthropic,Trainium的增長(zhǎng)從哪里來(lái)?也是100%來(lái)自Anthropic。

他也坦承,早年未能及時(shí)向Anthropic進(jìn)行戰(zhàn)略投資是自己的判斷失誤:

當(dāng)時(shí)谷歌和亞馬遜AWS投入了大量資金,Anthropic因此使用了他們的算力。我當(dāng)時(shí)沒(méi)有深刻意識(shí)到,風(fēng)投根本不可能給一家AI實(shí)驗(yàn)室投50億、100億美元。這是我的失誤。但我不會(huì)再犯同樣的錯(cuò)誤。

目前,黃仁勛已分別對(duì)OpenAI和Anthropic進(jìn)行了大規(guī)模投資,據(jù)報(bào)道金額分別高達(dá)300億和100億美元。

為什么不自己做云?“盡可能少做”是哲學(xué)

手握巨額現(xiàn)金流,英偉達(dá)近期頻頻向CoreWeave等初創(chuàng)云服務(wù)商提供資金和算力支持。市場(chǎng)猜測(cè),英偉達(dá)是否會(huì)越過(guò)客戶,親自下場(chǎng)做超大規(guī)模云服務(wù)商,收取算力租用費(fèi)?

黃仁勛的回答涉及公司哲學(xué):

我們應(yīng)該做盡可能必要的事,做盡可能少的事。我們做的這些事,如果我們不做,我真的相信它們就不會(huì)發(fā)生。但云服務(wù)?如果我不做,有人會(huì)來(lái)做的。

他舉了CoreWeave、Nscale、Nebius等“新云”作為例子——這些公司若沒(méi)有英偉達(dá)的早期投資和支持,根本不會(huì)存在。但英偉達(dá)的介入是“讓生態(tài)繁榮”,而不是轉(zhuǎn)行做金融租賃或云計(jì)算運(yùn)營(yíng)。

他對(duì)于“不挑贏家”也有明確表態(tài):“當(dāng)我投資其中一家,我會(huì)投資所有家?!崩碛墒牵河ミ_(dá)自己當(dāng)年在60家3D圖形公司中幾乎是被公認(rèn)“最不可能活下來(lái)”的一家,“我有足夠的謙遜來(lái)認(rèn)識(shí)到這一點(diǎn)”。

堅(jiān)守賣鏟人定位,GPU分配絕不搞“價(jià)高者得”

在供需極度失衡的背景下,英偉達(dá)如何分配緊俏的GPU?黃仁勛明確否認(rèn)了“價(jià)高者得”的市場(chǎng)傳聞。

我們絕不會(huì)那樣做,這是糟糕的商業(yè)行為。你定好價(jià)格,然后人們決定是否購(gòu)買。

黃仁勛解釋了英偉達(dá)的分配邏輯:優(yōu)先考察客戶的排產(chǎn)預(yù)測(cè)和采購(gòu)訂單(PO),其次看客戶數(shù)據(jù)中心的就緒程度,最終遵循先到先得的原則?!拔腋M蔀樾袠I(yè)可靠的基石。如果你下達(dá)了1000億美元的AI工廠訂單,沒(méi)問(wèn)題,全世界只有我們能給你這種確定性承諾。”

不會(huì)放棄全球第二大市場(chǎng)

針對(duì)當(dāng)前的芯片出口管制,黃仁勛從商業(yè)與技術(shù)標(biāo)準(zhǔn)的角度表達(dá)了務(wù)實(shí)的看法。

他指出,算力只是AI產(chǎn)業(yè)的底層輸入,當(dāng)受到約束時(shí),競(jìng)爭(zhēng)對(duì)手可以通過(guò)堆疊更多能源、使用更多上一代芯片,以及優(yōu)化算法來(lái)彌補(bǔ)硬件代差。

他表示,首先要認(rèn)識(shí)到:中國(guó)并不缺芯片。他們擁有全球頂尖的計(jì)算機(jī)科學(xué)家,眾所周知,這些AI實(shí)驗(yàn)室里的AI研究人員有相當(dāng)大比例是中國(guó)人。他們擁有全球約50%的AI研究人員。

他們是競(jìng)爭(zhēng)對(duì)手,我們希望美國(guó)勝出,但我認(rèn)為進(jìn)行對(duì)話和研究交流可能是最安全的做法。放棄整個(gè)市場(chǎng)不會(huì)讓美國(guó)長(zhǎng)期在技術(shù)競(jìng)賽中在芯片層、計(jì)算堆棧中獲勝。這是一個(gè)事實(shí)。
CUDA生態(tài)系統(tǒng)與飛輪效應(yīng)

英偉達(dá)的核心競(jìng)爭(zhēng)壁壘就是成熟的開發(fā)者生態(tài),GPU全球裝機(jī)量達(dá)到數(shù)億級(jí)別,應(yīng)用場(chǎng)景實(shí)現(xiàn)全面覆蓋。

行業(yè)發(fā)展飛輪效應(yīng)清晰,依靠最大的裝機(jī)量、可編程的架構(gòu)、豐富的生態(tài)體系以及全球海量的AI公司,形成強(qiáng)勁發(fā)展動(dòng)力。再加上性價(jià)比、能效、客戶基數(shù)均處于全球領(lǐng)先地位,進(jìn)一步推動(dòng)發(fā)展飛輪持續(xù)運(yùn)轉(zhuǎn)。

架構(gòu)優(yōu)勢(shì)(對(duì)比ASIC/TPU)

黃仁勛表示,傳統(tǒng)摩爾定律每年性能增長(zhǎng)約25%,想要實(shí)現(xiàn)10到100倍的性能飛躍,必須依靠算法與計(jì)算架構(gòu)的雙重革新。Blackwell架構(gòu)的能效相比Hopper架構(gòu)提升50倍,這一成果絕非單純依靠晶體管進(jìn)步就能實(shí)現(xiàn),架構(gòu)優(yōu)化與計(jì)算機(jī)科學(xué)創(chuàng)新才是核心關(guān)鍵。該架構(gòu)支持全流程可編程以及全棧協(xié)同設(shè)計(jì),依托NVLink、Spectrum-X技術(shù)實(shí)現(xiàn),沒(méi)有CUDA生態(tài)根本無(wú)法完成。
對(duì)于產(chǎn)品路線圖與發(fā)布節(jié)奏。黃仁勛透露,英偉達(dá)產(chǎn)品會(huì)保持年度穩(wěn)定迭代,從Vera Rubin到Vera Rubin Ultra,再到Feynman,每年都會(huì)推出穩(wěn)定升級(jí)的新品。同時(shí)我們是全球唯一一家,能夠承接從1000萬(wàn)美元到1000億美元任意規(guī)模AI算力訂單的企業(yè)。


訪談文字實(shí)錄(略有刪減)

章節(jié)目錄
  • (00:00:00) 英偉達(dá)最大的護(hù)城河,是否在于對(duì)稀缺供應(yīng)鏈的掌控?
  • (00:16:25) TPU能否打破英偉達(dá)對(duì)AI算力的壟斷?
  • (00:41:06) 英偉達(dá)為何不轉(zhuǎn)型為超大規(guī)模云服務(wù)商?
  • (01:35:06) 英偉達(dá)為何不同時(shí)開發(fā)多種不同的芯片架構(gòu)?
00:00:00——英偉達(dá)最大的護(hù)城河,是否在于對(duì)稀缺供應(yīng)鏈的掌控?
Dwarkesh Patel
我們看到許多軟件公司的估值大幅下跌,因?yàn)槿藗冾A(yù)期AI將使軟件商品化。有一種可能過(guò)于簡(jiǎn)單的看法是:英偉達(dá)把GDS2文件發(fā)給臺(tái)積電,臺(tái)積電制造邏輯芯片和交換機(jī),再與SK海力士、美光和三星生產(chǎn)的HBM一起封裝,然后發(fā)往臺(tái)灣的ODM廠商組裝成機(jī)架。英偉達(dá)本質(zhì)上是在做軟件,而制造由他人完成。如果軟件被商品化,英偉達(dá)是否也會(huì)被商品化?

Jensen Huang
歸根結(jié)底,總需要有某種東西把電子轉(zhuǎn)化為Token。將電子轉(zhuǎn)化為Token,并持續(xù)提升Token的價(jià)值,這件事很難被徹底商品化。這個(gè)轉(zhuǎn)化過(guò)程本身就是一段了不起的旅程——讓這個(gè)Token變得有價(jià)值,就像讓一個(gè)分子比另一個(gè)分子更珍貴,讓一個(gè)Token比另一個(gè)Token更珍貴。其中涉及的藝術(shù)性、工程智慧、科學(xué)原理和創(chuàng)新發(fā)明,我們正在實(shí)時(shí)見(jiàn)證這一切的發(fā)生。這個(gè)轉(zhuǎn)化過(guò)程、這套制造體系、所有的科學(xué)積累,遠(yuǎn)未被深刻理解,這段旅程也遠(yuǎn)未結(jié)束。我不認(rèn)為商品化會(huì)發(fā)生。
我們當(dāng)然會(huì)持續(xù)提升效率。你描述問(wèn)題的框架,正是我理解這家公司的方式:輸入是電子,輸出是Token,英偉達(dá)在中間。我們的職責(zé)是:在實(shí)現(xiàn)這種轉(zhuǎn)化的過(guò)程中,做一切必要的事,同時(shí)盡可能少做。所謂"盡可能少做",就是凡是我不需要親自完成的,我都找合作伙伴來(lái)做,納入我的生態(tài)系統(tǒng)。

如果你今天審視英偉達(dá),我們可能擁有全球最大的合作伙伴生態(tài)系統(tǒng),上游有供應(yīng)鏈,下游有所有計(jì)算機(jī)公司、應(yīng)用開發(fā)者和模型創(chuàng)造者。AI是一塊五層蛋糕,我們?cè)谡麄€(gè)五層都擁有生態(tài)系統(tǒng)。我們盡可能少做,但我們必須親自完成的那部分,恰恰是極其困難的事,我不認(rèn)為那會(huì)被商品化。
事實(shí)上,我也不認(rèn)為企業(yè)軟件公司或工具制造商會(huì)被商品化。如今大多數(shù)軟件公司都是工具制造商,也有一些是工作流程編碼系統(tǒng)。但就工具制造商而言,Excel是工具,PowerPoint是工具,Cadence做工具,Synopsys做工具——我看到的前景與很多人恰恰相反。我認(rèn)為AI智能體的數(shù)量將會(huì)指數(shù)級(jí)增長(zhǎng),工具使用者的數(shù)量也將指數(shù)級(jí)增長(zhǎng),各類工具的實(shí)例數(shù)量極有可能會(huì)急速飆升。
Synopsys Design Compiler的實(shí)例數(shù)量很可能會(huì)急劇增加,使用平面規(guī)劃器、布局工具和設(shè)計(jì)規(guī)則檢查器的智能體數(shù)量也會(huì)如此。如今我們受限于工程師的數(shù)量,但將來(lái),這些工程師將得到大批智能體的支持。我們將以前所未有的方式探索設(shè)計(jì)空間,而我們使用的,正是今天這些工具。
我認(rèn)為工具使用的爆發(fā)將推動(dòng)軟件公司的價(jià)值飆升。之所以尚未發(fā)生,是因?yàn)橹悄荏w使用工具的能力還不夠強(qiáng)。未來(lái),要么這些公司自己打造智能體,要么智能體本身足夠強(qiáng)大,能夠運(yùn)用這些工具。我認(rèn)為兩種情況都會(huì)發(fā)生。
Dwarkesh Patel
根據(jù)你們最新的財(cái)務(wù)文件,英偉達(dá)在晶圓廠、內(nèi)存和封裝方面的采購(gòu)承諾接近1000億美元。SemiAnalysis報(bào)道稱,這類采購(gòu)承諾總額將達(dá)到2500億美元。有一種解讀認(rèn)為,英偉達(dá)真正的護(hù)城河,在于你們鎖定了未來(lái)多年所需的稀缺元器件供應(yīng)。競(jìng)爭(zhēng)對(duì)手或許能做出一款加速芯片,但他們能拿到所需的內(nèi)存來(lái)制造嗎?能拿到邏輯芯片來(lái)制造嗎?這真的是英偉達(dá)未來(lái)幾年最大的護(hù)城河嗎?
Jensen Huang
這是我們能做、而他人難以復(fù)制的事情之一。我們?cè)谏嫌巫龀隽司薮蟪兄Z,有些是你提到的顯性承諾,有些則是隱性的。舉個(gè)例子,上游的許多投資,是由我們的供應(yīng)鏈合作伙伴主動(dòng)做出的,因?yàn)槲以鴮?duì)那些CEO們說(shuō):"讓我告訴你這個(gè)行業(yè)將會(huì)有多大,讓我解釋為什么,讓我和你一起推演,讓我展示給你我所看到的未來(lái)。"
正是通過(guò)這個(gè)告知、激勵(lì)、與各行業(yè)上游CEO達(dá)成共識(shí)的過(guò)程,他們?cè)敢庾龀鐾顿Y。為什么他們?cè)敢鉃槲叶皇菫閯e人投資?因?yàn)樗麄冎溃矣心芰ο麄兊漠a(chǎn)能,并通過(guò)我的下游渠道銷售出去。英偉達(dá)的下游供應(yīng)鏈規(guī)模和下游需求體量如此龐大,所以他們才愿意在上游持續(xù)投入。
看看GTC,人們驚嘆于它的規(guī)模和與會(huì)者的構(gòu)成——整個(gè)AI宇宙匯聚一堂,因?yàn)樗麄儽舜硕夹枰?jiàn)到對(duì)方。我把他們聚在一起,讓下游看到上游,上游看到下游,所有人共同見(jiàn)證AI的進(jìn)步。更重要的是,他們都能親眼看到那些AI原生公司、那些正在構(gòu)建的AI初創(chuàng)企業(yè),以及所有令人振奮的發(fā)展,親身印證我所描述的一切。我花了大量時(shí)間,直接或間接地讓我們的供應(yīng)鏈、合作伙伴和生態(tài)系統(tǒng),了解我們面前的機(jī)遇。
有人說(shuō),在大多數(shù)科技發(fā)布會(huì)上,都是一個(gè)接一個(gè)的公告,但我們的發(fā)布會(huì)總有一部分有些"折磨人",因?yàn)樗袷窃趥魇谥R(shí)。事實(shí)上,這正是我的用意。我需要確保整個(gè)供應(yīng)鏈的上下游,以及整個(gè)生態(tài)系統(tǒng),都理解即將到來(lái)的是什么,為什么會(huì)來(lái),什么時(shí)候會(huì)來(lái),規(guī)模會(huì)有多大,并且能夠像我一樣系統(tǒng)地進(jìn)行推演。
關(guān)于你描述的護(hù)城河,我們之所以能夠?yàn)槲磥?lái)做好準(zhǔn)備,是因?yàn)椋?strong>如果未來(lái)幾年的規(guī)模達(dá)到萬(wàn)億美元,我們有供應(yīng)鏈來(lái)支撐它。
沒(méi)有我們的影響力和業(yè)務(wù)的高速運(yùn)轉(zhuǎn)——就像現(xiàn)金流帶來(lái)供應(yīng)鏈流動(dòng)和業(yè)務(wù)周轉(zhuǎn)——沒(méi)有人會(huì)為一個(gè)業(yè)務(wù)周轉(zhuǎn)率低的架構(gòu)專門建設(shè)供應(yīng)鏈。我們能夠維持這種規(guī)模,恰恰是因?yàn)槲覀兊南掠涡枨笕绱送ⅲ麄兛吹搅诉@一切,聽(tīng)到了這一切,一切都?xì)v歷在目。這才使我們得以在如此規(guī)模上做成今天能做的事。
Dwarkesh Patel
我想更具體地了解,上游供應(yīng)鏈能否跟上。多年來(lái),你們的營(yíng)收一直在逐年翻倍,每年向全球提供的算力也在以翻倍以上的速度增長(zhǎng)。
Jensen Huang
而且在如今這個(gè)規(guī)模上繼續(xù)翻倍,是真的了不起。
Dwarkesh Patel
正是如此。但再看邏輯芯片這一環(huán)——你們是臺(tái)積電N3節(jié)點(diǎn)最大的客戶,也是N2節(jié)點(diǎn)最大客戶之一。根據(jù)SemiAnalysis的數(shù)據(jù),AI今年將占N3產(chǎn)能的60%,明年將達(dá)到86%。你已經(jīng)是多數(shù),還怎么翻倍?又如何年復(fù)一年地持續(xù)下去?我們是否已經(jīng)進(jìn)入了一個(gè)AI算力增長(zhǎng)必須因上游瓶頸而放緩的階段?你有沒(méi)有破局之法?歸根結(jié)底,我們?cè)鯓硬拍苊磕晷陆▋杀兜木A廠?
Jensen Huang
在某種程度上,瞬時(shí)需求始終大于全球的供給能力。在任何時(shí)刻,我們都可能受限于某一環(huán)節(jié)的產(chǎn)能——水暖工短缺就是個(gè)真實(shí)案例。
Dwarkesh Patel
水暖工要被邀請(qǐng)參加明年的GTC了。
Jensen Huang
其實(shí)這是個(gè)好主意。但瞬時(shí)需求大于總供給,本身是個(gè)好現(xiàn)象。你希望身處一個(gè)供不應(yīng)求的行業(yè),反過(guò)來(lái)才糟糕。如果某個(gè)特定元器件的缺口過(guò)大,整個(gè)行業(yè)就會(huì)蜂擁而至,集中攻克。舉個(gè)例子,注意現(xiàn)在幾乎沒(méi)人再談CoWoS了。
原因就在于過(guò)去兩年我們已經(jīng)全力以赴、連續(xù)翻倍地?cái)U(kuò)產(chǎn)。如今CoWoS的供給已經(jīng)相當(dāng)充裕。臺(tái)積電現(xiàn)在明白,CoWoS的供給必須與邏輯芯片和內(nèi)存的需求同步擴(kuò)張,并以相同的節(jié)奏規(guī)?;疌oWoS及未來(lái)的封裝技術(shù)。這是一大進(jìn)步——過(guò)去很長(zhǎng)一段時(shí)間,CoWoS和HBM內(nèi)存都是相當(dāng)小眾的專業(yè)品,但如今它們已經(jīng)是主流計(jì)算技術(shù),整個(gè)行業(yè)都意識(shí)到了這一點(diǎn)。
當(dāng)然,我們現(xiàn)在也能對(duì)更廣泛的供應(yīng)鏈?zhǔn)┘痈蟮挠绊?。AI革命之初,我今天所說(shuō)的這些話,五年前我就已經(jīng)在說(shuō)了。一些人相信了并付諸行動(dòng),比如Sanjay和美光團(tuán)隊(duì)。我至今清楚地記得那次會(huì)議,當(dāng)時(shí)我明確說(shuō)明了即將發(fā)生什么、為什么會(huì)發(fā)生,以及對(duì)今日的預(yù)判。他們真的All-in了,我們?cè)贚PDDR和HBM內(nèi)存領(lǐng)域開展了深度合作,他們?yōu)榇舜罅ν顿Y,這對(duì)美光來(lái)說(shuō)顯然是一段非凡的旅程。有些人來(lái)得稍晚,但現(xiàn)在他們都到位了。
每一個(gè)瓶頸都會(huì)受到高度關(guān)注,而我們現(xiàn)在已經(jīng)提前數(shù)年預(yù)判下一個(gè)瓶頸。比如,過(guò)去幾年我們?cè)贚umentum、Coherent以及硅光子生態(tài)系統(tǒng)上的投資,從根本上重塑了供應(yīng)鏈。我們圍繞臺(tái)積電構(gòu)建了一整套供應(yīng)鏈,與他們合作推進(jìn)COUPE項(xiàng)目,發(fā)明了一系列新技術(shù),并將這些專利授權(quán)給整個(gè)供應(yīng)鏈,以保持其開放性。
我們通過(guò)發(fā)明新技術(shù)、新工藝、雙面探針測(cè)試等新型測(cè)試設(shè)備,以及投資企業(yè)、幫助其擴(kuò)大產(chǎn)能等方式,主動(dòng)塑造生態(tài)系統(tǒng),確保供應(yīng)鏈隨時(shí)準(zhǔn)備好支撐所需的規(guī)模。
Dwarkesh Patel
有些瓶頸似乎比其他的更容易解決。擴(kuò)大CoWoS產(chǎn)能,對(duì)比擴(kuò)大——
Jensen Huang
我直接說(shuō)最難的那個(gè)。
Dwarkesh Patel
是什么?
Jensen Huang
水暖工,還有電工。這也是我對(duì)"末日論者"渲染工作終結(jié)、大規(guī)模失業(yè)的說(shuō)法感到擔(dān)憂的原因之一。如果我們把人嚇退出軟件工程這個(gè)行業(yè),我們就會(huì)面臨軟件工程師短缺的問(wèn)題。十年前也有過(guò)類似的預(yù)言——有些末日論者告訴大家,無(wú)論如何都不要去做放射科醫(yī)生。你或許還能在網(wǎng)上找到這些視頻,聲稱放射科會(huì)是第一個(gè)消亡的職業(yè),世界將不再需要放射科醫(yī)生。現(xiàn)在我們短缺的是什么?恰恰是放射科醫(yī)生。
Dwarkesh Patel
回到剛才關(guān)于哪些東西可以擴(kuò)展、哪些不能的話題——邏輯芯片的產(chǎn)量,究竟如何實(shí)現(xiàn)每年翻倍?歸根結(jié)底,內(nèi)存和邏輯芯片的產(chǎn)能都受限于EUV光刻機(jī)。我們?cè)鯓硬拍苊磕険碛袃杀兜腅UV機(jī)器?
Jensen Huang
這些都不是短期內(nèi)無(wú)法快速擴(kuò)展的問(wèn)題。在兩三年內(nèi)完全可以實(shí)現(xiàn),關(guān)鍵是要有明確的需求信號(hào)。一旦你能造出一臺(tái),就能造出十臺(tái),造出十臺(tái)就能造出一百萬(wàn)臺(tái)。這些東西并不難復(fù)制。
Dwarkesh Patel
你會(huì)深入到供應(yīng)鏈的哪個(gè)層級(jí)去溝通?比如,你會(huì)直接去找ASML說(shuō):"如果三年后英偉達(dá)要做到年?duì)I收兩萬(wàn)億美元,我們需要更多的EUV光刻機(jī)"嗎?
Jensen Huang
有些情況需要我親自去溝通,有些可以間接推動(dòng),還有些……如果我能說(shuō)服臺(tái)積電,ASML自然也會(huì)被說(shuō)服。我們需要著眼于關(guān)鍵的瓶頸節(jié)點(diǎn)——而如果臺(tái)積電已經(jīng)信服,幾年內(nèi)就會(huì)有充足的EUV機(jī)器。
我的核心觀點(diǎn)是,任何一個(gè)瓶頸的持續(xù)時(shí)間都不會(huì)超過(guò)兩三年。與此同時(shí),我們持續(xù)將計(jì)算效率提升10倍、20倍,從Hopper到Blackwell甚至提升了30到50倍。我們通過(guò)CUDA的高度靈活性持續(xù)推出新算法,開發(fā)各種新技術(shù),在擴(kuò)大產(chǎn)能的同時(shí)不斷驅(qū)動(dòng)效率提升。這些問(wèn)題我都不擔(dān)心。真正令我憂慮的是我們下游的問(wèn)題——能源政策阻礙了能源的發(fā)展,而沒(méi)有能源,什么產(chǎn)業(yè)都建不起來(lái)。
我們希望重新工業(yè)化美國(guó),希望帶回芯片制造、計(jì)算機(jī)制造和封裝產(chǎn)業(yè),希望構(gòu)建新興產(chǎn)業(yè),比如電動(dòng)汽車、機(jī)器人和AI工廠。而這一切都離不開能源,能源基礎(chǔ)設(shè)施的建設(shè)需要很長(zhǎng)時(shí)間。相比之下,擴(kuò)大芯片產(chǎn)能是一個(gè)兩到三年的問(wèn)題,擴(kuò)大CoWoS產(chǎn)能也是兩到三年的問(wèn)題。
Dwarkesh Patel
有意思。我感覺(jué)有些嘉賓告訴我的恰好相反,但在這個(gè)問(wèn)題上,我自己沒(méi)有足夠的專業(yè)知識(shí)來(lái)判斷誰(shuí)對(duì)。
Jensen Huang
好在這次你在和行家聊。
00:16:25——TPU能否打破英偉達(dá)對(duì)AI算力的壟斷?
Dwarkesh Patel
說(shuō)得對(duì)。我想談?wù)勀愕母?jìng)爭(zhēng)對(duì)手???strong>全球排名前三的模型,Claude和Gemini這兩個(gè),可以說(shuō)都是在TPU上訓(xùn)練的。這對(duì)英偉達(dá)的未來(lái)意味著什么?
Jensen Huang
我們做的是截然不同的東西。英偉達(dá)做的是加速計(jì)算,而不是張量處理器。加速計(jì)算的應(yīng)用范圍極為廣泛:分子動(dòng)力學(xué)、量子色動(dòng)力學(xué)、數(shù)據(jù)處理、數(shù)據(jù)框架、結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、流體動(dòng)力學(xué)、粒子物理——此外,我們也將它用于AI。
加速計(jì)算的多樣性要豐富得多。雖然AI是當(dāng)下最熱門的話題,影響力也顯而易見(jiàn),但計(jì)算的外延遠(yuǎn)比AI寬廣。英偉達(dá)從根本上重新定義了計(jì)算范式,從通用計(jì)算轉(zhuǎn)向加速計(jì)算。我們的市場(chǎng)覆蓋范圍,遠(yuǎn)超任何TPU或ASIC所能企及的邊界。
從我們的定位來(lái)看,英偉達(dá)是唯一一家能夠加速各類應(yīng)用的公司,我們擁有龐大的生態(tài)系統(tǒng),各類框架和算法都能在英偉達(dá)上運(yùn)行。
因?yàn)槲覀兊挠?jì)算平臺(tái)本就設(shè)計(jì)為可供他人運(yùn)營(yíng),任何運(yùn)營(yíng)商都可以直接購(gòu)買我們的系統(tǒng)。而那些自研系統(tǒng),則大多只能自己運(yùn)營(yíng),因?yàn)樗鼈儚奈幢辉O(shè)計(jì)成足夠靈活、可供第三方運(yùn)營(yíng)的形態(tài)。正因?yàn)槿魏稳硕伎梢赃\(yùn)營(yíng)我們的系統(tǒng),我們得以進(jìn)駐每一朵云——包括谷歌、亞馬遜、微軟Azure和OCI。
如果你想以出租方式運(yùn)營(yíng),就需要跨越眾多行業(yè)擁有龐大的客戶生態(tài)作為消化方。如果你想自己運(yùn)營(yíng),我們完全有能力幫你實(shí)現(xiàn),就像我們?yōu)轳R斯克的xAI所做的一樣。而且,因?yàn)槲覀兡軌蛑С秩魏喂尽⑷魏涡袠I(yè)的運(yùn)營(yíng)者,你可以用它為禮來(lái)這樣的藥企建造一臺(tái)超級(jí)計(jì)算機(jī),用于科學(xué)研究和藥物發(fā)現(xiàn),幫助他們自主運(yùn)營(yíng),并將其應(yīng)用于整個(gè)藥物研發(fā)和生命科學(xué)領(lǐng)域——而這些,恰好都是我們能夠加速的領(lǐng)域。
有大量TPU根本無(wú)法處理的應(yīng)用場(chǎng)景,我們都可以覆蓋。英偉達(dá)在CUDA上構(gòu)建出了出色的張量處理能力,同時(shí)也涵蓋了數(shù)據(jù)處理、計(jì)算和AI的完整生命周期。我們的市場(chǎng)機(jī)遇更大,覆蓋范圍也更廣。正因?yàn)槲覀冎С质澜缟蠋缀跛袘?yīng)用,英偉達(dá)的系統(tǒng)可以部署在任何地方,并且都能找到用戶,這是一種完全不同的競(jìng)爭(zhēng)格局。
Dwarkesh Patel
這是一個(gè)比較長(zhǎng)的問(wèn)題。你們營(yíng)收驚人,但你們一個(gè)季度賺600億美元,不是靠制藥或量子計(jì)算,而是因?yàn)锳I是一項(xiàng)前所未有、以前所未有的速度增長(zhǎng)的技術(shù)。
問(wèn)題在于,什么才是真正最有利于AI本身的?我自己沒(méi)有深入研究過(guò),但我的AI研究員朋友們說(shuō):"當(dāng)我用TPU的時(shí)候,它是一個(gè)巨大的脈動(dòng)陣列,非常適合做矩陣乘法;而GPU非常靈活,特別適合有大量分支或不規(guī)則內(nèi)存訪問(wèn)的情形。"
但AI到底是什么?就是一遍又一遍、非常規(guī)律地做矩陣乘法。你不需要為線程調(diào)度器或線程與內(nèi)存庫(kù)之間的切換犧牲任何芯片面積。而TPU恰恰就是針對(duì)這一需求——當(dāng)前算力需求增長(zhǎng)最快的那部分——高度優(yōu)化的。我很好奇你對(duì)此有何看法。
Jensen Huang
矩陣乘法是AI的重要組成部分,但不是全部。如果你想開發(fā)新的注意力機(jī)制、以不同方式進(jìn)行解耦,或者發(fā)明全新的架構(gòu)——比如混合SSM——你就需要一個(gè)通用可編程的架構(gòu)。如果你想創(chuàng)建一個(gè)融合擴(kuò)散模型和自回歸技術(shù)的模型,你也需要一個(gè)通用可編程的架構(gòu)。我們可以運(yùn)行你能想到的任何算法,這正是核心優(yōu)勢(shì)——它讓新算法的發(fā)明變得更加容易,因?yàn)樗且粋€(gè)可編程系統(tǒng)。
正是這種發(fā)明新算法的能力,推動(dòng)著AI如此迅速地向前演進(jìn)。TPU和所有其他東西一樣,受到摩爾定律的約束,而摩爾定律每年帶來(lái)的提升大約只有25%。想要實(shí)現(xiàn)10倍乃至100倍的飛躍,唯一的途徑是每年從根本上改變算法及其計(jì)算方式。
這就是英偉達(dá)的根本優(yōu)勢(shì)所在。我們之所以能讓Blackwell比Hopper提升50倍,正源于此——當(dāng)我最初宣布Blackwell的能效將比Hopper提升35倍時(shí),沒(méi)有人相信。后來(lái)Dylan寫了一篇文章,說(shuō)我保守估計(jì)了,實(shí)際上是50倍。單靠摩爾定律是不可能做到這一點(diǎn)的。我們解決這個(gè)問(wèn)題的方式,是通過(guò)新的模型架構(gòu),比如MoE——它在一套計(jì)算系統(tǒng)中實(shí)現(xiàn)了并行化、解耦和分布式部署。如果沒(méi)有CUDA的可編程性來(lái)做到這一點(diǎn),我甚至不知道該從哪里下手。
Dwarkesh Patel
這觸及了一個(gè)關(guān)于英偉達(dá)客戶群的有趣問(wèn)題。你們60%的營(yíng)收來(lái)自五大超大規(guī)模云服務(wù)商。在早期不同的客戶群體中——比如做實(shí)驗(yàn)的教授——他們需要CUDA,無(wú)法使用其他加速器,只能在CUDA上運(yùn)行PyTorch,依賴全套優(yōu)化。
但這些超大規(guī)模云服務(wù)商有資源自己寫內(nèi)核。事實(shí)上,為了在自家特定架構(gòu)上榨出最后5%的性能,他們也不得不這樣做。Anthropic和谷歌主要運(yùn)行自家加速器和TPU、Trainium。就算是使用GPU的OpenAI,也有Triton——因?yàn)樗麄冃枰约旱膬?nèi)核。他們直接寫到CUDA C++層面,不用cuBLAS和NCCL,而是構(gòu)建了一套可編譯到其他加速器的自有技術(shù)棧。
如果你大部分的主要客戶都能、并且確實(shí)在為自己的CUDA替代方案,CUDA究竟在多大程度上還是讓前沿AI在英偉達(dá)上發(fā)生的真正動(dòng)因?
Jensen Huang
CUDA是一個(gè)內(nèi)容極為豐富的生態(tài)系統(tǒng)。如果你想要在任何計(jì)算機(jī)上率先構(gòu)建,優(yōu)先基于CUDA來(lái)開發(fā),是極為明智的選擇。因?yàn)樯鷳B(tài)系統(tǒng)如此豐富,我們支持所有框架。如果你想創(chuàng)建自定義內(nèi)核——我們對(duì)Triton的貢獻(xiàn)也是巨大的,Triton的后端蘊(yùn)含著大量英偉達(dá)的技術(shù)。
我們很樂(lè)意幫助每一個(gè)框架發(fā)揮到極致。框架的種類繁多:Triton、vLLM、SGLang等等。如今還有一批新的強(qiáng)化學(xué)習(xí)框架涌現(xiàn),比如verl和NeMo RL,后訓(xùn)練和強(qiáng)化學(xué)習(xí)整個(gè)領(lǐng)域正在爆炸式發(fā)展。所以,如果你想在某個(gè)架構(gòu)上構(gòu)建,首選CUDA是最明智的,因?yàn)槟阒肋@個(gè)生態(tài)系統(tǒng)足夠成熟。
你知道,一旦出現(xiàn)問(wèn)題,更可能是你自己的代碼,而不是底層那座代碼山。在構(gòu)建這些系統(tǒng)時(shí),當(dāng)某個(gè)地方無(wú)法運(yùn)行,到底是你的問(wèn)題,還是計(jì)算機(jī)的問(wèn)題?你希望問(wèn)題永遠(yuǎn)在你這邊,希望能信任這臺(tái)計(jì)算機(jī)。當(dāng)然,我們自己也還有很多bug,但我們的系統(tǒng)經(jīng)過(guò)了充分的驗(yàn)證,至少可以作為可靠的基礎(chǔ)。這是第一點(diǎn):生態(tài)系統(tǒng)的豐富性、架構(gòu)的可編程性,以及整體的能力深度。
第二點(diǎn)是,對(duì)于任何開發(fā)者來(lái)說(shuō),最重要的事情是安裝基礎(chǔ)。你希望自己寫的軟件能在盡可能多的計(jì)算機(jī)上運(yùn)行,因?yàn)槟悴恢皇窃跒樽约洪_發(fā),而是在為自己的集群,或者作為框架開發(fā)者,為其他所有人的集群開發(fā)。英偉達(dá)的CUDA生態(tài)系統(tǒng),是我們真正的核心財(cái)富。
如今,我們大約有數(shù)億張GPU分布在世界各地,每一朵云都有。從A10、A100、H100、H200,到L系列、P系列,各種型號(hào)、各種規(guī)格都有。如果你是一家機(jī)器人公司,你希望這套CUDA技術(shù)棧能直接運(yùn)行在機(jī)器人本身上。我們已經(jīng)無(wú)處不在。龐大的安裝基礎(chǔ)意味著,一旦你開發(fā)了某個(gè)軟件或模型,它就能在任何地方發(fā)揮價(jià)值,這本身就是極其寶貴的。
最后,我們存在于每一朵云中,這使我們真正做到了獨(dú)一無(wú)二。如果你是一家AI公司或開發(fā)者,你不一定清楚自己將來(lái)會(huì)與哪家云服務(wù)商深度合作,或在哪里運(yùn)行。我們到處都能跑,包括本地部署。生態(tài)系統(tǒng)的豐富性、安裝基礎(chǔ)的廣泛性,以及部署地點(diǎn)的多樣性,共同鑄就了CUDA無(wú)可替代的價(jià)值。
Dwarkesh Patel
這很有道理。我想追問(wèn)的是,這些優(yōu)勢(shì)對(duì)你的主要客戶來(lái)說(shuō)是否真的舉足輕重。在大多數(shù)情形下,真正有能力自己搭建整套軟件棧的人——比如那些超大規(guī)模云服務(wù)商——恰恰貢獻(xiàn)了你們大部分的營(yíng)收。
尤其是進(jìn)入一個(gè)AI越來(lái)越擅長(zhǎng)處理"強(qiáng)驗(yàn)證閉環(huán)"任務(wù)的世界——比如通過(guò)強(qiáng)化學(xué)習(xí)來(lái)優(yōu)化內(nèi)核性能,因?yàn)槟憧梢詫?duì)結(jié)果進(jìn)行驗(yàn)證——那么,如何在規(guī)?;那疤嵯拢瑸樽⒁饬C(jī)制或MLP寫一個(gè)在各種配置下都最高效的內(nèi)核,這是一個(gè)非??沈?yàn)證的反饋閉環(huán)。
超大規(guī)模云服務(wù)商都能自己寫這些內(nèi)核。英偉達(dá)在性價(jià)比上依然很強(qiáng),所以他們可能仍然傾向于選擇英偉達(dá)。但問(wèn)題在于,這是否會(huì)變成一場(chǎng)單純拼規(guī)格的競(jìng)爭(zhēng)——誰(shuí)在同樣的價(jià)格下能提供更好的算力和內(nèi)存帶寬?歷史上英偉達(dá)之所以能夠擁有整個(gè)AI產(chǎn)業(yè)中最高的70%以上的毛利率——橫跨硬件和軟件——正是憑借CUDA的護(hù)城河。那么,當(dāng)你的大多數(shù)主要客戶都有能力自建替代方案時(shí),你能守住這樣的利潤(rùn)率嗎?
Jensen Huang
我們派駐到各個(gè)AI實(shí)驗(yàn)室的工程師數(shù)量之多,令人咋舌——他們就在那里,與實(shí)驗(yàn)室團(tuán)隊(duì)并肩工作,持續(xù)優(yōu)化技術(shù)棧。原因很簡(jiǎn)單:沒(méi)有人比我們更了解自己的架構(gòu)。這些架構(gòu)并非像CPU那樣的通用平臺(tái)。CPU有點(diǎn)像一輛凱迪拉克,舒適、穩(wěn)健,永遠(yuǎn)不會(huì)太快,大多數(shù)人開起來(lái)都輕松自如,有巡航控制,一切都很簡(jiǎn)單。但在很多層面上,英偉達(dá)的GPU和加速器更像F1賽車——以時(shí)速160公里駕駛它或許誰(shuí)都能做到,但要真正把它推到極限,需要相當(dāng)深厚的專業(yè)功底。我們大量運(yùn)用AI來(lái)打造我們的內(nèi)核。
我相當(dāng)確信,我們?cè)谙喈?dāng)長(zhǎng)的時(shí)間內(nèi)仍然是不可或缺的。我們的專業(yè)能力能幫助AI實(shí)驗(yàn)室合作伙伴輕松從技術(shù)棧中榨出額外的2倍性能。我們經(jīng)常見(jiàn)到這種情況:當(dāng)我們完成技術(shù)棧或特定內(nèi)核的優(yōu)化之后,他們的模型加速了3倍、2倍或50%。這是一個(gè)巨大的數(shù)字,尤其當(dāng)你考量到他們龐大的硬件規(guī)模——那些Hopper和Blackwell的集群——性能提升兩倍,就等于營(yíng)收翻倍,直接轉(zhuǎn)化為收入增長(zhǎng)。
英偉達(dá)的計(jì)算技術(shù)棧在全球范圍內(nèi)擁有最佳的總擁有成本(TCO)性價(jià)比,沒(méi)有例外。沒(méi)有任何一個(gè)平臺(tái)能向我證明,今天全球存在比我們更優(yōu)的性能/TCO比。沒(méi)有一家。事實(shí)上,相關(guān)基準(zhǔn)測(cè)試公開擺在那里:Dylan的InferenceMAX就在那,所有人都可以用,但沒(méi)有一家——TPU不來(lái),Trainium也不來(lái)。
我一直鼓勵(lì)他們使用InferenceMAX,來(lái)展示他們出色的推理成本。但這很難,沒(méi)有人愿意出現(xiàn)。MLPerf也是如此。我非常歡迎Trainium來(lái)證明他們一直宣稱的那40%,我也很想看看TPU在成本優(yōu)勢(shì)上的實(shí)際表現(xiàn)。這在我看來(lái)毫無(wú)道理,從第一性原理出發(fā)根本說(shuō)不通。
所以,我認(rèn)為我們之所以如此成功,根本原因就在于我們的TCO是極其出色的。其次,你說(shuō)60%的客戶是前五大云服務(wù)商,但其中大部分業(yè)務(wù)是面向外部客戶的。比如,英偉達(dá)在AWS上的大部分,是為外部客戶服務(wù)的,而非AWS自用。英偉達(dá)在Azure上的客戶,顯然都是外部客戶。在OCI上的客戶,也都是外部客戶,并非自用。他們之所以偏愛(ài)我們,是因?yàn)槲覀兊母采w范圍極其廣泛,能夠?yàn)樗麄儙?lái)全球最優(yōu)質(zhì)的客戶群。這些公司都建立在英偉達(dá)之上,而原因正是我們無(wú)可比擬的覆蓋面與靈活性。
所以,我認(rèn)為這個(gè)飛輪的運(yùn)轉(zhuǎn)邏輯,是:安裝基礎(chǔ)、架構(gòu)的可編程性、生態(tài)系統(tǒng)的豐富性,以及全球AI公司的數(shù)量。如今有數(shù)以萬(wàn)計(jì)的AI公司,如果你是其中一家,你會(huì)選擇哪種架構(gòu)?你會(huì)選擇全球最普及的那個(gè)——我們是最普及的;你會(huì)選擇安裝基礎(chǔ)最大的那個(gè)——我們擁有最大的安裝基礎(chǔ);你會(huì)選擇生態(tài)系統(tǒng)最豐富的那個(gè)。
這就是飛輪。我們的每美元算力性價(jià)比極高,客戶能以最低的成本生產(chǎn)Token;我們的每瓦算力性能全球最強(qiáng)——如果我們的合作伙伴建造一座1吉瓦的數(shù)據(jù)中心,這1吉瓦必須要產(chǎn)生最大的營(yíng)收和Token數(shù)量。你希望它產(chǎn)出盡可能多的Token,讓這座數(shù)據(jù)中心的收益最大化——我們擁有全球每瓦Token產(chǎn)出最高的架構(gòu)。最后,如果你的目標(biāo)是出租基礎(chǔ)設(shè)施,我們?cè)谌驌碛凶疃嗟目蛻?,這就是飛輪得以運(yùn)轉(zhuǎn)的原因。
Dwarkesh Patel
有意思。問(wèn)題歸根結(jié)底是:實(shí)際的市場(chǎng)格局是怎樣的?即便有其他公司存在,也可以存在一個(gè)數(shù)以萬(wàn)計(jì)的AI公司大致均等地分配算力的世界。但即使通過(guò)這五大超大規(guī)模云服務(wù)商,真正使用那些算力的,也是Anthropic、OpenAI以及這些大型基礎(chǔ)模型實(shí)驗(yàn)室——它們本身就有資源和能力,讓不同的加速器跑通自己的模型。
Jensen Huang
不,我認(rèn)為你的前提是錯(cuò)誤的。
Dwarkesh Patel
也許吧。但讓我換個(gè)角度問(wèn)你。
Jensen Huang
回頭記得讓我來(lái)糾正你的前提。
Dwarkesh Patel
好的。讓我先換一個(gè)問(wèn)題。
Jensen Huang
但一定要記得讓我回來(lái)糾正,因?yàn)檫@對(duì)AI太重要了,對(duì)科學(xué)的未來(lái)太重要了,對(duì)這個(gè)行業(yè)的未來(lái)太重要了。這個(gè)前提……
Dwarkesh Patel
讓我先把問(wèn)題說(shuō)完,然后我們一起來(lái)討論。
Jensen Huang
好。
Dwarkesh Patel
如果你所說(shuō)的這些關(guān)于價(jià)格、性能、每瓦性能等等都是事實(shí),你認(rèn)為為什么Anthropic就在幾天前宣布了一項(xiàng)與Broadcom和谷歌合作、涉及多吉瓦規(guī)模、大量使用TPU的計(jì)算協(xié)議?對(duì)谷歌來(lái)說(shuō),TPU顯然是主流算力。所以當(dāng)我審視這些大型AI公司時(shí),它們的相當(dāng)大一部分算力……曾經(jīng)全是英偉達(dá),但現(xiàn)在已經(jīng)不是了。如果這些優(yōu)勢(shì)都是真實(shí)存在的,那我很想知道,為什么它們會(huì)選擇其他加速器?
Jensen Huang
Anthropic是個(gè)特殊案例,不代表趨勢(shì)。如果沒(méi)有Anthropic,TPU的增長(zhǎng)從何而來(lái)?那100%是Anthropic帶動(dòng)的。如果沒(méi)有Anthropic,Trainium的增長(zhǎng)從何而來(lái)?也是100%來(lái)自Anthropic。我認(rèn)為這一點(diǎn)大家都相當(dāng)清楚。這并不說(shuō)明ASIC機(jī)會(huì)遍地開花,只是恰好有Anthropic這樣一家公司存在。
Dwarkesh Patel
但OpenAI和AMD有合作,他們也在自研Titan加速芯片。
Jensen Huang
是的,但我想大家都承認(rèn),他們?nèi)匀灰杂ミ_(dá)為主。未來(lái)我們還會(huì)一起做很多工作。別人嘗試其他方案,我并不介意。如果他們不去嘗試,又怎么知道我們有多好?有時(shí)候需要對(duì)比才能體會(huì)到。我們必須持續(xù)贏得現(xiàn)有的地位。
總會(huì)有很多宏大的聲明,但看看有多少ASIC項(xiàng)目已經(jīng)被取消。僅僅是打算造一塊ASIC,你還得造出比英偉達(dá)更好的東西。造出比英偉達(dá)更好的東西,并不那么容易,說(shuō)實(shí)話,并不容易。英偉達(dá)必然是某個(gè)地方存在明顯短板,才能被超越。憑借我們的規(guī)模和速度,我們是全世界唯一一家每年都在持續(xù)突破、每年都有重大飛躍的公司。
Dwarkesh Patel
我想他們的邏輯是:"它不需要更好,只要?jiǎng)e比英偉達(dá)差70%就行",因?yàn)樗麄冊(cè)诮o你付70%的利潤(rùn)率。
Jensen Huang
別忘了,ASIC的利潤(rùn)率也相當(dāng)高。英偉達(dá)的毛利率比如說(shuō)是70%,ASIC的毛利率大概是65%,你真正省下來(lái)多少?
Dwarkesh Patel
你是說(shuō)像Broadcom這樣的公司嗎?
Jensen Huang
是啊。你總得付給誰(shuí)。據(jù)我所知,ASIC的利潤(rùn)率極為可觀,他們自己也心知肚明,對(duì)自己出色的ASIC利潤(rùn)率相當(dāng)引以為豪。
說(shuō)到你問(wèn)的"為什么",很久以前,我們?cè)谪?cái)務(wù)上就是沒(méi)有能力這樣做。當(dāng)時(shí),我也沒(méi)有深刻意識(shí)到,打造一家像OpenAI和Anthropic這樣的基礎(chǔ)AI實(shí)驗(yàn)室有多艱難,以及它們需要供應(yīng)商本身做出巨額投資。我們當(dāng)時(shí)根本沒(méi)有能力向Anthropic投入數(shù)十億美元,支持他們使用我們的算力。但谷歌和AWS做到了。他們從一開始就大力投資,換來(lái)的是Anthropic使用他們的算力。我們當(dāng)時(shí)真的沒(méi)有那個(gè)能力。
我說(shuō)自己的失誤,在于沒(méi)有深刻認(rèn)識(shí)到:他們其實(shí)別無(wú)選擇,風(fēng)險(xiǎn)投資根本不可能向一家AI實(shí)驗(yàn)室投入五十億甚至一百億美元,指望它成為另一個(gè)Anthropic。這是我的疏漏。但即使當(dāng)時(shí)我看清楚了,以英偉達(dá)彼時(shí)的規(guī)模,也未必能做到。不過(guò)這個(gè)錯(cuò)誤我不會(huì)再犯了。
我很高興能夠投資OpenAI,很高興幫助他們擴(kuò)大規(guī)模,我也認(rèn)為這是必須做的事。后來(lái)當(dāng)Anthropic向我們走來(lái)的時(shí)候,我也很高興成為他們的投資人,幫助他們擴(kuò)大規(guī)模。只是在那時(shí),我們確實(shí)沒(méi)有能力這樣做。如果可以把一切倒回去——如果當(dāng)年英偉達(dá)就像今天這么大——我會(huì)毫不猶豫地去做。
00:41:06——英偉達(dá)為何不轉(zhuǎn)型為超大規(guī)模云服務(wù)商?
Dwarkesh Patel
這其實(shí)相當(dāng)耐人尋味。多年來(lái),英偉達(dá)一直是AI領(lǐng)域賺錢最多的公司,現(xiàn)在你們開始把這些錢投出去。據(jù)報(bào)道,你們?cè)贠penAI投入了高達(dá)300億美元,在Anthropic投入了100億美元。但如今它們的估值已經(jīng)大幅攀升,而且相信還會(huì)繼續(xù)上漲。
這么多年來(lái),如果你們一直在為它們提供算力,也清楚地看到行業(yè)走向,而它們的估值在幾年前——或者就在一年前——還只有今天的十分之一,而你們又握有大量現(xiàn)金,那么完全可以有另一種選擇:要么英偉達(dá)自己成為一家基礎(chǔ)模型實(shí)驗(yàn)室,要么以現(xiàn)在更低的估值更早做出這些投資。你們完全有這個(gè)財(cái)力。所以我很想知道,為什么沒(méi)有早點(diǎn)這樣做?
Jensen Huang
我們?cè)谀軌蜃龅臅r(shí)候就做了。在條件允許的那一刻,我們就行動(dòng)了;如果能更早,我會(huì)更早。在Anthropic需要我們出手的時(shí)候,我們?cè)谪?cái)務(wù)上和認(rèn)知上都沒(méi)有準(zhǔn)備好。
Dwarkesh Patel
怎么說(shuō)?是資金問(wèn)題嗎?
Jensen Huang
是投資規(guī)模的問(wèn)題。當(dāng)時(shí)我們從未在公司外部做過(guò)這個(gè)量級(jí)的投資,也沒(méi)有意識(shí)到這樣做是必要的。我一直以為他們可以去找風(fēng)險(xiǎn)投資,就像所有公司那樣。但他們想做的事,根本不是通過(guò)VC能夠完成的。OpenAI想做的事,VC也做不到。這一點(diǎn)我現(xiàn)在明白了,但當(dāng)時(shí)不知道。
這正是他們的高明之處,也是他們的智慧所在。他們當(dāng)時(shí)就意識(shí)到必須走這條路。我為此感到高興。即使因?yàn)槲覀兊娜毕?,Anthropic不得不轉(zhuǎn)向其他方,我仍然為這件事感到慶幸。Anthropic的存在對(duì)這個(gè)世界是一件好事,我真心希望它存在。
Dwarkesh Patel
不過(guò)你們現(xiàn)在仍在大量賺錢,而且季度利潤(rùn)還在持續(xù)增長(zhǎng)。
Jensen Huang
即便如此,還是可以有遺憾的。
Dwarkesh Patel
那問(wèn)題仍然存在。好,現(xiàn)在我們來(lái)到了今天這個(gè)節(jié)點(diǎn),手握越來(lái)越多的現(xiàn)金,英偉達(dá)接下來(lái)應(yīng)該怎么用這些錢?有一種選擇是:如今已經(jīng)形成了一個(gè)專門將資本支出(CapEx)轉(zhuǎn)化為運(yùn)營(yíng)支出(OpEx)的中間商生態(tài)系統(tǒng),這些新型云服務(wù)商可以為AI實(shí)驗(yàn)室提供算力出租服務(wù)。因?yàn)樾酒瑑r(jià)格昂貴,但在整個(gè)生命周期內(nèi)盈利豐厚,而AI模型不斷進(jìn)步,使得它們生產(chǎn)的Token價(jià)值持續(xù)提升。這些芯片部署成本高,但英偉達(dá)有錢來(lái)承擔(dān)這筆CapEx。據(jù)報(bào)道,你們還在為CoreWeave提供高達(dá)63億美元的背書,并已投資20億美元。
英偉達(dá)為什么不自己做云服務(wù)?為什么不自己成為超大規(guī)模云服務(wù)商,直接出租這些算力?你們有足夠的現(xiàn)金。
Jensen Huang
這是公司的經(jīng)營(yíng)哲學(xué),我認(rèn)為它是正確的:做一切必要的事,盡可能少做。這意味著,我們?cè)跇?gòu)建計(jì)算平臺(tái)這件事上所付出的努力,如果不是我們來(lái)做,我真誠(chéng)地相信,沒(méi)有人會(huì)去做。如果我們不承擔(dān)我們承擔(dān)的風(fēng)險(xiǎn)——如果我們沒(méi)有以那樣的方式構(gòu)建NVLink,沒(méi)有構(gòu)建整個(gè)技術(shù)棧,沒(méi)有打造那個(gè)生態(tài)系統(tǒng),沒(méi)有在二十年里持續(xù)耕耘CUDA并在大部分時(shí)間里處于虧損——如果我們當(dāng)初沒(méi)有這樣做,沒(méi)有人會(huì)這樣做。
如果我們沒(méi)有創(chuàng)建所有CUDA-X領(lǐng)域?qū)S脦?kù)——十五年前我們就開始推進(jìn)領(lǐng)域?qū)S脦?kù)的建設(shè),因?yàn)槲覀円庾R(shí)到如果不這樣做,無(wú)論是光線追蹤、圖像生成,還是早期的AI模型,還是數(shù)據(jù)處理、結(jié)構(gòu)化數(shù)據(jù)處理、向量數(shù)據(jù)處理,這些庫(kù)如果不是我們來(lái)做,沒(méi)有人會(huì)做。我對(duì)此深信不疑。我們?yōu)橛?jì)算光刻創(chuàng)建了cuLitho這個(gè)庫(kù),如果不是我們,也不會(huì)有人做。所以,如果我們沒(méi)有做這些工作,加速計(jì)算就不會(huì)取得今天的進(jìn)展。
這些事,我們應(yīng)該做。我們應(yīng)該全力以赴,傾公司之力去做。但是,世界上有很多云服務(wù)。即使我們不做,也會(huì)有人站出來(lái)做。所以,遵循"做必要的事、盡可能少做"這一哲學(xué),我用這個(gè)視角審視我做的每一件事。
具體到云服務(wù)商,如果不是我們支持CoreWeave的存在,這些新型AI云就不會(huì)存在。如果不是我們幫助CoreWeave起步,它們就不會(huì)有今天。如果不是我們支持Nscale,它們不會(huì)走到今天。如果不是我們支持Nebius,它們也不會(huì)有今天的成就?,F(xiàn)在它們都做得非常出色。
這是一個(gè)我們應(yīng)該投入的商業(yè)模式嗎?我們做必要的事,盡可能少做。我們投資生態(tài)系統(tǒng),是因?yàn)槲蚁M鷳B(tài)系統(tǒng)繁榮,希望這個(gè)架構(gòu)和AI能夠連接盡可能多的行業(yè)和國(guó)家,讓整個(gè)星球都能建立在AI之上,建立在美國(guó)技術(shù)棧之上。這正是我們追求的愿景。
我提到的另一件事是,有這么多出色的基礎(chǔ)模型公司,我們盡力投資所有的公司。這是我們做事的另一個(gè)方式:不挑贏家。我們需要支持所有人。這既是我們樂(lè)于做的,也是我們業(yè)務(wù)上的迫切需要。但我們也刻意不去挑贏家。所以每當(dāng)我投資其中一家,我也會(huì)投資其他所有家。
Dwarkesh Patel
為什么你特別刻意地不去挑贏家?
Jensen Huang
第一,這不是我們的職責(zé)。第二,英偉達(dá)剛成立時(shí),市場(chǎng)上有60家3D圖形公司,我們是唯一一家存活下來(lái)的。如果當(dāng)時(shí)有人要從這60家里預(yù)測(cè)誰(shuí)能最終勝出,英偉達(dá)大概會(huì)排在最不可能的那一梯隊(duì)。
這是在你出生之前的事了,但英偉達(dá)當(dāng)年的圖形架構(gòu)方向是"恰好走錯(cuò)了"——不是稍微偏了點(diǎn),而是完全走錯(cuò)了方向。我們從扎實(shí)的第一性原理出發(fā)來(lái)推演,但最終走到了一個(gè)錯(cuò)誤的答案,開發(fā)出了一個(gè)開發(fā)者幾乎無(wú)法支持的架構(gòu),看起來(lái)毫無(wú)未來(lái)可言。當(dāng)時(shí)每個(gè)人都會(huì)把我們排除在外。但你看,我們?cè)谶@里。
這份經(jīng)歷讓我有足夠的謙遜去認(rèn)識(shí)到:不要挑贏家。要么放手讓他們各自證明自己,要么把所有人都扶持起來(lái)。
Dwarkesh Patel
有一件事我沒(méi)明白。你說(shuō),"我們支持這些新型云服務(wù)商,并不只是為了扶持他們而扶持他們。"但緊接著你又列舉了一批新型云服務(wù)商,說(shuō)如果沒(méi)有英偉達(dá),它們就不會(huì)存在。這兩句話怎么能并立?
Jensen Huang
首先,他們自己要有存在的意愿,要主動(dòng)來(lái)尋求我們的幫助。當(dāng)他們有意愿存在、有商業(yè)計(jì)劃、有專業(yè)能力和熱情,也具備必要的實(shí)力,但在起步階段需要一些投資才能落地時(shí),我們會(huì)在那里。但我們的目標(biāo)是,他們的飛輪越快自轉(zhuǎn)越好。
你的問(wèn)題是,我們是否想做融資業(yè)務(wù)?答案是不。有專門做融資的機(jī)構(gòu),我們寧愿與所有這些機(jī)構(gòu)合作,而不是自己成為一個(gè)融資方。我們的目標(biāo)是專注于我們所做的事,保持商業(yè)模式的簡(jiǎn)潔,支持我們的生態(tài)系統(tǒng)。
當(dāng)OpenAI這樣的公司在IPO之前需要三百億美元規(guī)模的融資,而我們深信他們,深信他們已經(jīng)是一家非凡的公司、將來(lái)也必然是一家卓越的公司,世界需要他們存在,我也需要他們存在,他們有強(qiáng)勁的發(fā)展勢(shì)頭,那就讓我們支持他們,幫助他們擴(kuò)大規(guī)模。這樣的投資我們會(huì)做,因?yàn)樗麄冃枰覀儭5覀儾⒉皇桥ψ霰M可能多的事——我們是做盡可能少的事。
Dwarkesh Patel
這也許是個(gè)顯而易見(jiàn)的問(wèn)題,但我們已經(jīng)在這種GPU短缺的狀態(tài)下生活了好多年,隨著模型不斷進(jìn)步,這種短缺還在加劇。
Jensen Huang
我們確實(shí)面臨GPU短缺。
Dwarkesh Patel
是的。英偉達(dá)以非單純競(jìng)價(jià)方式來(lái)分配稀缺的配額,而是會(huì)說(shuō):"我們希望確保這些新型云服務(wù)商存活下去,給CoreWeave一些,給Crusoe一些,給Lambda一些。"這對(duì)英偉達(dá)有什么好處?首先,你是否認(rèn)同我這個(gè)"分散市場(chǎng)"的描述?
Jensen Huang
不。不,你的前提是錯(cuò)的。我們對(duì)這些事情相當(dāng)用心。首先,如果你不下采購(gòu)訂單,說(shuō)再多也沒(méi)用。在我們收到采購(gòu)訂單之前,我們能做什么?所以,第一件事是我們與各方努力完成預(yù)測(cè),因?yàn)檫@些東西需要很長(zhǎng)時(shí)間來(lái)制造,數(shù)據(jù)中心的建設(shè)也需要很長(zhǎng)時(shí)間。我們通過(guò)預(yù)測(cè)來(lái)對(duì)齊供需關(guān)系,這是第一要?jiǎng)?wù)。
第二,我們努力與盡可能多的合作伙伴完成預(yù)測(cè),但歸根結(jié)底,你還是必須下訂單。也許因?yàn)槟撤N原因,你沒(méi)有及時(shí)下單,我能怎么辦?到了某個(gè)節(jié)點(diǎn),就要先來(lái)先得。但除此之外,如果你因?yàn)閿?shù)據(jù)中心沒(méi)有準(zhǔn)備好,或者某些組件還沒(méi)到位,暫時(shí)無(wú)法搭建數(shù)據(jù)中心,我們可能會(huì)決定先服務(wù)另一個(gè)客戶,這是為了最大化我們自己工廠的產(chǎn)出,我們可能會(huì)做一些這樣的調(diào)整。
除此之外,排序原則就是先來(lái)先得,你必須下采購(gòu)訂單。當(dāng)然,網(wǎng)上有各種傳言,比如那篇關(guān)于Larry Ellison和埃隆·馬斯克與我共進(jìn)晚餐、向我"乞討"GPU的文章。這從來(lái)都沒(méi)有發(fā)生過(guò)。我們確實(shí)一起吃了晚飯,那是一頓很愉快的晚餐,但他們從始至終沒(méi)有"乞討"過(guò)GPU,他們只是下了訂單而已。一旦他們下了訂單,我們就會(huì)盡力滿足產(chǎn)能。我們沒(méi)有那么復(fù)雜。
Dwarkesh Patel
好的。聽(tīng)起來(lái),流程上有一個(gè)隊(duì)列,根據(jù)你的數(shù)據(jù)中心是否準(zhǔn)備就緒,以及你何時(shí)下了采購(gòu)訂單,來(lái)決定供貨時(shí)間。但這聽(tīng)起來(lái)并不是價(jià)高者得。有什么原因不這樣做嗎?
Jensen Huang
我們從來(lái)不這樣做。
Dwarkesh Patel
好的。
Jensen Huang
從來(lái)不。
Dwarkesh Patel
為什么不直接價(jià)高者得?
Jensen Huang
因?yàn)檫@是不好的商業(yè)行為。你定好價(jià)格,客戶決定買不買。我知道芯片行業(yè)有人在需求旺盛時(shí)漲價(jià),但我們從來(lái)不這樣做,這從來(lái)就不是我們的做法。你可以信賴我們。我更希望成為行業(yè)的基石,一個(gè)可以依賴的存在。你不需要猜測(cè)。我給你報(bào)了一個(gè)價(jià),就是這個(gè)價(jià),就算需求沖到天上也好,隨它去。
Dwarkesh Patel
另一面,這也是你們與臺(tái)積電保持良好關(guān)系的原因,對(duì)吧?
Jensen Huang
是的,英偉達(dá)與臺(tái)積電的合作已經(jīng)差不多三十年了。英偉達(dá)和臺(tái)積電之間并沒(méi)有正式的法律合同,有時(shí)我占了便宜,有時(shí)我吃了虧,但總體而言,這段關(guān)系非常出色,我可以完全信任他們,完全依賴他們。
英偉達(dá)有一件事你可以確定:今年,Vera Rubin會(huì)非常出色;明年,Vera Rubin Ultra會(huì)來(lái)臨;后年,F(xiàn)eynman會(huì)到來(lái);再下一年,我還沒(méi)公布名字。你可以每年都指望我們。全球你去找另一個(gè)ASIC團(tuán)隊(duì),任何一個(gè),你能說(shuō)"我可以把我的全部身家都押在你身上,相信你每年都會(huì)出現(xiàn),每年的Token成本都會(huì)下降一個(gè)數(shù)量級(jí),我可以像信賴時(shí)鐘一樣信賴你"——我剛才說(shuō)的是臺(tái)積電,歷史上沒(méi)有哪家晶圓廠能讓你這么說(shuō),但今天你可以這樣說(shuō)英偉達(dá)。
如果你想購(gòu)買價(jià)值10億美元的AI算力工廠,沒(méi)問(wèn)題;1億美元,沒(méi)問(wèn)題;1000萬(wàn)美元或一個(gè)機(jī)架,沒(méi)問(wèn)題;一張顯卡,也沒(méi)問(wèn)題;想下一筆1000億美元的AI算力工廠訂單,沒(méi)問(wèn)題。今天全球只有我們一家公司可以這么說(shuō)。
我對(duì)臺(tái)積電也一樣:買一臺(tái),買十億臺(tái),沒(méi)問(wèn)題,只需要走正常的計(jì)劃流程。英偉達(dá)作為全球AI產(chǎn)業(yè)基石的地位,是用數(shù)十年的巨大承諾和奉獻(xiàn)換來(lái)的。我們公司的穩(wěn)定性和一致性,是極其重要的。
關(guān)于中國(guó)競(jìng)爭(zhēng)Dwarkesh Patel
好,我想聊聊中國(guó)這個(gè)話題。
Jensen Huang
首先,Mythos是在相當(dāng)普通的算力規(guī)模上訓(xùn)練出來(lái)的,由一家非凡的公司完成。它所使用的算力規(guī)模和類型,在中國(guó)是完全可以獲得的。所以,首先要認(rèn)識(shí)到:中國(guó)并不缺芯片。
他們生產(chǎn)全球約60%的主流芯片,甚至可能更多,這對(duì)他們來(lái)說(shuō)是個(gè)龐大的產(chǎn)業(yè)。他們擁有全球頂尖的計(jì)算機(jī)科學(xué)家,眾所周知,這些AI實(shí)驗(yàn)室里的AI研究人員有相當(dāng)大比例是中國(guó)人。他們擁有全球約50%的AI研究人員。所以問(wèn)題是:考慮到他們已經(jīng)擁有的這些資產(chǎn)——充裕的能源、大量的芯片、大多數(shù)AI研究人員——如果你擔(dān)憂他們,創(chuàng)造一個(gè)安全世界的最佳方式是什么?
他們是競(jìng)爭(zhēng)對(duì)手,我們希望美國(guó)勝出,但但我認(rèn)為進(jìn)行對(duì)話和研究交流可能是最安全的做法。
當(dāng)然我們希望美國(guó)擁有盡可能多的計(jì)算資源。我們受到能源的限制,但我們有很多人在努力解決這個(gè)問(wèn)題。我們不能讓能源成為我們國(guó)家的瓶頸。但我們還希望確保世界上所有的AI開發(fā)者都在美國(guó)技術(shù)棧上進(jìn)行開發(fā),并將AI的進(jìn)步——尤其是開源的——提供給美國(guó)生態(tài)系統(tǒng)。創(chuàng)建兩個(gè)生態(tài)系統(tǒng)將是極其愚蠢的:一個(gè)開源生態(tài)系統(tǒng),它只能在一個(gè)外國(guó)技術(shù)棧上運(yùn)行;以及一個(gè)封閉的生態(tài)系統(tǒng),它在美國(guó)技術(shù)棧上運(yùn)行。我認(rèn)為這對(duì)美國(guó)來(lái)說(shuō)將是一個(gè)可怕的結(jié)局。
認(rèn)為英偉達(dá)是一家美國(guó)公司嗎?好的。第一,為什么我們不制定一個(gè)更平衡的法規(guī),讓英偉達(dá)可以在全球獲勝,而不是放棄世界?你為什么要讓美國(guó)放棄世界?
芯片行業(yè)是美國(guó)生態(tài)系統(tǒng)的一部分。它是美國(guó)技術(shù)領(lǐng)先地位的一部分。它是AI生態(tài)系統(tǒng)的一部分。它是AI領(lǐng)先地位的一部分。為什么你的政策、你的哲學(xué)會(huì)導(dǎo)致美國(guó)放棄世界市場(chǎng)的巨大一部分?
首先,解決這個(gè)問(wèn)題的方法是與研究人員對(duì)話,與中國(guó)對(duì)話,與所有國(guó)家對(duì)話,確保人們不會(huì)那樣使用技術(shù)。這是必須進(jìn)行的對(duì)話。好的。第一點(diǎn)。
第二點(diǎn),我們還需要確保美國(guó)領(lǐng)先,確保Vera Rubin、Blackwell在美國(guó)豐富、大量地可用。顯然,我們的結(jié)果會(huì)顯示這一點(diǎn)。豐富,大量的。我們擁有的計(jì)算資源很棒。我們這里有很棒的AI研究人員。很棒。我們應(yīng)該保持領(lǐng)先。
然而,我們也必須認(rèn)識(shí)到,AI不僅僅是一個(gè)模型。AI是一個(gè)五層蛋糕。AI產(chǎn)業(yè)在每一層都很重要,包括芯片層。放棄整個(gè)市場(chǎng)不會(huì)讓美國(guó)長(zhǎng)期在技術(shù)競(jìng)賽中在芯片層、計(jì)算堆棧中獲勝。這是一個(gè)事實(shí)。
為了美國(guó)技術(shù)產(chǎn)業(yè)放棄那個(gè)市場(chǎng),是對(duì)我們國(guó)家的傷害。
01:35:06 – 英偉達(dá)為什么不制造多種不同的芯片架構(gòu)?Dwarkesh Patel
我們之前討論了臺(tái)積電、內(nèi)存等方面的瓶頸。
所以,如果我們處在一個(gè)你已經(jīng)是N3節(jié)點(diǎn)主要客戶的世界里——在某個(gè)時(shí)候你會(huì)用到N2,并且你會(huì)是N2的主要客戶——你是否認(rèn)為你可以回到N7節(jié)點(diǎn),一個(gè)更舊工藝節(jié)點(diǎn)的閑置產(chǎn)能,然后說(shuō),“嘿,對(duì)AI的需求如此巨大,而我們擴(kuò)展前沿節(jié)點(diǎn)的能力無(wú)法滿足它,所以我們將制造一個(gè)Hopper或Ampere,但使用我們今天所知道的關(guān)于數(shù)值運(yùn)算的所有知識(shí)以及你描述的所有其他改進(jìn)”?你認(rèn)為在2030年之前這種情況會(huì)發(fā)生嗎?
Jensen Huang
沒(méi)有必要。原因在于,每一代架構(gòu)不僅僅是晶體管尺寸的問(wèn)題。你在做大量的工程、封裝和堆疊工作,以及數(shù)值運(yùn)算和系統(tǒng)架構(gòu)。
當(dāng)你產(chǎn)能耗盡時(shí),輕松回到另一個(gè)節(jié)點(diǎn)……那是一種沒(méi)人能負(fù)擔(dān)得起的研發(fā)水平。我們能夠承擔(dān)向前推進(jìn)的成本。我認(rèn)為我們承擔(dān)不起回頭。現(xiàn)在,如果世界只是說(shuō)……如果在那一刻,讓我們做個(gè)思想實(shí)驗(yàn),在那一刻我們被告知,“聽(tīng)著,我們?cè)僖膊粫?huì)有更多的產(chǎn)能了。”我會(huì)回去用7納米嗎?毫不猶豫地,我當(dāng)然會(huì)。
Dwarkesh Patel
我交談過(guò)的人有一個(gè)問(wèn)題,為什么英偉達(dá)不同時(shí)運(yùn)行多個(gè)完全不同架構(gòu)的芯片項(xiàng)目?你可以做一個(gè)Cerebras風(fēng)格的晶圓級(jí)芯片。你可以做一個(gè)Dojo風(fēng)格的大封裝。你可以做一個(gè)沒(méi)有CUDA的。你有資源和工程人才可以并行做所有這些。那么,鑒于誰(shuí)知道AI和架構(gòu)可能會(huì)走向何方,為什么要把所有雞蛋放在一個(gè)籃子里呢?
Jensen Huang
哦,我們可以。只是我們沒(méi)有更好的主意。我們可以做所有那些事情。只是它們不是更好的。我們?cè)谀M器中模擬了所有,證明它們更差。所以我們不會(huì)去做。我們正在做的正是我們想要做的項(xiàng)目。如果工作負(fù)載發(fā)生巨大變化——我指的不是算法,我實(shí)際上指的是工作負(fù)載,這取決于市場(chǎng)的形態(tài)——我們可能會(huì)決定增加其他加速器。
例如,最近我們?cè)黾恿薌roq,我們計(jì)劃將Groq整合到我們的CUDA生態(tài)系統(tǒng)中。我們現(xiàn)在正在這樣做,因?yàn)門oken的價(jià)值已經(jīng)變得如此之高,以至于你可以有不同的Token定價(jià)。在過(guò)去,僅僅幾年前,Token要么免費(fèi),要么幾乎不貴。但現(xiàn)在你可以有不同的客戶,這些客戶想要不同的答案。因?yàn)榭蛻糍嵙撕芏噱X——例如,我們的軟件工程師——如果我能給他們響應(yīng)更快的Token,讓他們比今天更高效,我愿意為此付費(fèi)。
但那個(gè)市場(chǎng)最近才出現(xiàn)。所以我認(rèn)為我們現(xiàn)在有能力根據(jù)響應(yīng)時(shí)間,為同一個(gè)模型提供不同的細(xì)分市場(chǎng)。這就是為什么我們決定擴(kuò)展帕累托前沿,創(chuàng)建一個(gè)響應(yīng)時(shí)間更快的推理細(xì)分市場(chǎng),即使它的吞吐量較低。直到現(xiàn)在,更高的吞吐量總是更好。我們認(rèn)為可能存在一個(gè)世界,其中可能有非常高ASP(平均售價(jià))的Token,即使工廠的吞吐量較低,ASP也能彌補(bǔ)這一點(diǎn)。
這就是我們這樣做的原因。但除此之外,從架構(gòu)的角度來(lái)看,如果我有更多的錢,我會(huì)把更多的錢投入到英偉達(dá)的架構(gòu)背后。
Dwarkesh Patel
我認(rèn)為這種極致優(yōu)質(zhì)的Token和推理市場(chǎng)的分解是一個(gè)非常有趣的想法。
Jensen Huang
它的細(xì)分。
Dwarkesh Patel
是的。好了,最后一個(gè)問(wèn)題。假設(shè)深度學(xué)習(xí)革命沒(méi)有發(fā)生。英偉達(dá)會(huì)在做什么?顯然是游戲,但考慮到——
Jensen Huang
加速計(jì)算,和我們一直在做的一樣。我們公司的前提是摩爾定律將……通用計(jì)算對(duì)很多事情有好處,但對(duì)很多計(jì)算來(lái)說(shuō)并不理想。
所以我們結(jié)合了一種稱為GPU、CUDA的架構(gòu)和一個(gè)CPU,這樣我們就可以加速CPU的工作負(fù)載。不同的內(nèi)核代碼或算法可以被卸載到我們的GPU上。因此,你可以將應(yīng)用程序加速100倍、200倍。你可以在哪里使用它?顯然是工程、科學(xué)、物理、數(shù)據(jù)處理、計(jì)算機(jī)圖形、圖像生成,各種各樣的東西。即使今天沒(méi)有AI,英偉達(dá)也會(huì)非常非常大。
原因相當(dāng)根本,那就是通用計(jì)算繼續(xù)擴(kuò)展的能力基本上已經(jīng)走到了盡頭。而唯一的方法……不是唯一的方法,但實(shí)現(xiàn)這一目標(biāo)的方法是通過(guò)特定領(lǐng)域的加速。我們開始的領(lǐng)域之一是計(jì)算機(jī)圖形,但還有許多其他領(lǐng)域。有各種各樣的。粒子物理和流體、結(jié)構(gòu)化數(shù)據(jù)處理,所有不同類型受益于CUDA的算法。
我們的使命確實(shí)是向世界提供加速計(jì)算,并推進(jìn)通用計(jì)算無(wú)法完成的應(yīng)用類型,并將其能力擴(kuò)展到有助于突破某些科學(xué)領(lǐng)域的水平。一些早期的應(yīng)用是分子動(dòng)力學(xué)、用于能源發(fā)現(xiàn)的地震處理、當(dāng)然還有圖像處理,所有這些通用計(jì)算效率低下的領(lǐng)域。
如果沒(méi)有AI,我會(huì)非常難過(guò)。但是,由于我們?cè)谟?jì)算方面取得的進(jìn)步,我們使深度學(xué)習(xí)民 主化了。我們使任何地方、任何研究人員、任何科學(xué)家、任何學(xué)生都能夠使用PC或GeForce擴(kuò)展卡進(jìn)行出色的科學(xué)研究成為可能。這個(gè)根本承諾沒(méi)有改變,一點(diǎn)也沒(méi)有。
如果你看GTC大會(huì),有整個(gè)開頭部分。那里面沒(méi)有AI。那一整部分關(guān)于計(jì)算光刻、量子化學(xué)工作、數(shù)據(jù)處理工作,所有這些東西都與AI無(wú)關(guān)。它仍然非常重要。我知道AI非常有趣且令人興奮,但有很多人正在做很多非常重要的非AI相關(guān)工作,而張量并不是你計(jì)算的唯一方式。我們想幫助所有人。
Dwarkesh Patel
Jensen,非常感謝。
Jensen Huang
不客氣。我很享受。
Dwarkesh Patel
我也是。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被噴用中國(guó)貨!韓國(guó)Naver宣布:全面棄用阿里Qwen編碼器

被噴用中國(guó)貨!韓國(guó)Naver宣布:全面棄用阿里Qwen編碼器

快科技
2026-04-18 10:23:13
婆家拆遷擺30桌慶祝,讓我離婚,我簽字離婚??ǎY(jié)賬時(shí)婆家傻眼

婆家拆遷擺30桌慶祝,讓我離婚,我簽字離婚???,結(jié)賬時(shí)婆家傻眼

云端小院
2026-04-19 07:35:27
局勢(shì)生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國(guó)接管

局勢(shì)生變,全球接到消息,美軍全部撤離,所有軍事基地被敘國(guó)接管

丹妮觀
2026-04-19 06:02:44
別再尬演“萬(wàn)人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰(shuí)?

別再尬演“萬(wàn)人迷”!滿臉褶子疙瘩、鼻孔朝天,這皮囊能迷倒誰(shuí)?

雨月海星
2026-04-18 05:25:40
湖人重大利好:名記曝東契奇或首輪中段復(fù)出 康復(fù)時(shí)間早于里夫斯

湖人重大利好:名記曝東契奇或首輪中段復(fù)出 康復(fù)時(shí)間早于里夫斯

醉臥浮生
2026-04-19 06:34:54
鹵菜店使用“四姐”二字被索賠50萬(wàn)元,店主:大家都叫我四姐,為什么告我侵權(quán)

鹵菜店使用“四姐”二字被索賠50萬(wàn)元,店主:大家都叫我四姐,為什么告我侵權(quán)

環(huán)球網(wǎng)資訊
2026-04-11 21:50:22
華為回歸,小米“撤退”

華為回歸,小米“撤退”

鈦媒體APP
2026-04-16 19:17:33
投訴公交車私自縮短運(yùn)營(yíng)時(shí)間,怎么工作丟了?

投訴公交車私自縮短運(yùn)營(yíng)時(shí)間,怎么工作丟了?

新民周刊
2026-04-18 15:35:30
浪姐史上翻車最大最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的

浪姐史上翻車最大最快的人出現(xiàn)了,網(wǎng)友:人不紅果然是有原因的

許三歲
2026-04-12 07:34:18
北京一35歲程序員辭職擺攤賣肉蛋堡月入5萬(wàn),當(dāng)事人:?jiǎn)蝺r(jià)5元,日均銷量超1000個(gè),食材來(lái)自胖東來(lái)、山姆

北京一35歲程序員辭職擺攤賣肉蛋堡月入5萬(wàn),當(dāng)事人:?jiǎn)蝺r(jià)5元,日均銷量超1000個(gè),食材來(lái)自胖東來(lái)、山姆

大象新聞
2026-04-09 23:45:01
哈登和米切爾在首輪G1的表現(xiàn),讓騎士隊(duì)球迷對(duì)NBA總決賽充滿期待

哈登和米切爾在首輪G1的表現(xiàn),讓騎士隊(duì)球迷對(duì)NBA總決賽充滿期待

好火子
2026-04-19 05:45:26
驚天內(nèi)幕!中國(guó)專家揭露美國(guó)攻打伊朗的真正目的,竟然是這個(gè)!

驚天內(nèi)幕!中國(guó)專家揭露美國(guó)攻打伊朗的真正目的,竟然是這個(gè)!

橙色書卷
2026-04-18 22:56:03
回國(guó)之后才敢說(shuō):真實(shí)的越南,部分中國(guó)人去了簡(jiǎn)直就是一個(gè)小白鼠

回國(guó)之后才敢說(shuō):真實(shí)的越南,部分中國(guó)人去了簡(jiǎn)直就是一個(gè)小白鼠

番外行
2026-03-22 00:05:09
都市極簡(jiǎn)風(fēng)穿搭解析:白色連體褲的線條美學(xué)與視覺(jué)張力

都市極簡(jiǎn)風(fēng)穿搭解析:白色連體褲的線條美學(xué)與視覺(jué)張力

只要高興就好
2026-04-18 18:40:10
吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

吃相太難看!莫氏雞煲爆火后,惡心一幕出現(xiàn),終走上呆呆妹的老路

以茶帶書
2026-04-15 17:30:12
30國(guó)幫手已到,日艦艇進(jìn)臺(tái)海!賭中方不會(huì)動(dòng)手?中國(guó)軍隊(duì)依法處置

30國(guó)幫手已到,日艦艇進(jìn)臺(tái)海!賭中方不會(huì)動(dòng)手?中國(guó)軍隊(duì)依法處置

說(shuō)歷史的老牢
2026-04-19 06:17:08
慘了!伊朗使用星鏈的用戶將面臨死刑,軍方啟用電子干擾星鏈

慘了!伊朗使用星鏈的用戶將面臨死刑,軍方啟用電子干擾星鏈

深度報(bào)
2026-04-16 22:38:25
隨著深圳青年人3-1,蘇州東吳1-0,中甲最新積分榜出爐:榜首易主

隨著深圳青年人3-1,蘇州東吳1-0,中甲最新積分榜出爐:榜首易主

凌空倒鉤
2026-04-18 22:07:46
中國(guó)—瑞士經(jīng)貿(mào)聯(lián)委會(huì)第27次會(huì)議在瑞士伯爾尼召開

中國(guó)—瑞士經(jīng)貿(mào)聯(lián)委會(huì)第27次會(huì)議在瑞士伯爾尼召開

界面新聞
2026-04-18 15:24:57
橘子海樂(lè)隊(duì)喊話華為:下架道歉賠償

橘子海樂(lè)隊(duì)喊話華為:下架道歉賠償

ZAKER新聞
2026-04-17 17:12:59
2026-04-19 08:12:49
華爾街見(jiàn)聞官方 incentive-icons
華爾街見(jiàn)聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
144794文章數(shù) 2653299關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

頭條要聞

媒體:特朗普對(duì)伊朗發(fā)動(dòng)攻擊 美國(guó)遭遇四大挫敗

頭條要聞

媒體:特朗普對(duì)伊朗發(fā)動(dòng)攻擊 美國(guó)遭遇四大挫敗

體育要聞

時(shí)隔25年重返英超!沒(méi)有人再嘲笑他了

娛樂(lè)要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

數(shù)碼
親子
教育
藝術(shù)
時(shí)尚

數(shù)碼要聞

華為版的科技春晚來(lái)了!Pura 90/Pura X Max下周發(fā):陣容豪華

親子要聞

老公終于夢(mèng)想成真了!幫忙給寶寶起小名唄

教育要聞

父母永遠(yuǎn)不看孩子的臉色

藝術(shù)要聞

夜色下的歐洲

選對(duì)發(fā)型,真的能少走很多變美彎路

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版