国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

黃仁勛萬字訪談:放棄中國(guó)市場(chǎng),美國(guó)將輸?shù)鬉I技術(shù)棧競(jìng)爭(zhēng)

0
分享至


芯東西(公眾號(hào):aichip001)
編譯 高遠(yuǎn)矚
編輯 漠影

芯東西4月16日?qǐng)?bào)道,4月15日,頂尖的AI播客主持人Dwarkesh Patel與英偉達(dá)創(chuàng)始人兼CEO黃仁勛進(jìn)行了一場(chǎng)近兩小時(shí)的深度對(duì)話。黃仁勛系統(tǒng)拆解了英偉達(dá)面臨的五大關(guān)鍵問題:是否依賴稀缺供應(yīng)鏈構(gòu)建護(hù)城河、TPU等ASIC芯片能否打破其壟斷、為何不自己做超大規(guī)模云廠商、是否應(yīng)向中國(guó)出售AI芯片,以及公司為何不采用多種不同芯片架構(gòu)。內(nèi)容同時(shí)涉及競(jìng)爭(zhēng)壁壘、AI算力市場(chǎng)格局、公司戰(zhàn)略邊界及中美芯片政策等核心維度。

黃仁勛在訪談中明確闡述了英偉達(dá)的原則是“做必要的事,同時(shí)盡可能少做”。他強(qiáng)調(diào),英偉達(dá)只投入那些“如果我不做,就沒人會(huì)做”的事情,例如CUDA生態(tài)、加速計(jì)算和特定領(lǐng)域計(jì)算庫(kù)(如cuLitho),而不會(huì)輕易進(jìn)入云服務(wù)領(lǐng)域與客戶競(jìng)爭(zhēng),因?yàn)椤笆澜缟嫌泻芏嘣品?wù)商,如果我不做,別人會(huì)做”。

對(duì)于公司的未來,他展現(xiàn)出極強(qiáng)的自信與長(zhǎng)期主義承諾:“你可以信賴英偉達(dá)的一件事是,今年的Vera Rubin會(huì)令人難以置信,明年的Vera Rubin Ultra會(huì)來,后年Feynman會(huì)來。每一年你都可以信賴我們?!彼J(rèn)為,英偉達(dá)正成為世界AI工業(yè)的基石,這種穩(wěn)定性和一致性是任何ASIC團(tuán)隊(duì)都無法提供的。

在談及中國(guó)AI芯片出口與競(jìng)爭(zhēng)時(shí),黃仁勛明確反對(duì)將AI芯片出口管制極端化,直言“將AI比作濃縮鈾是一個(gè)糟糕的、不合邏輯的類比”,并批評(píng)“那種失敗者的心態(tài),對(duì)我來說毫無意義”。他談到,中國(guó)擁有全球50%的AI研究人員,是開源軟件和開放模型的最大貢獻(xiàn)者之一;華為剛剛度過了公司歷史上最好的一年,已出貨數(shù)百萬顆AI芯片,而且中國(guó)有大量閑置的數(shù)據(jù)中心和充足的能源,即使使用7nm工藝,也能通過數(shù)量堆疊和算法創(chuàng)新彌補(bǔ)制程差距。

他認(rèn)為,放棄中國(guó)市場(chǎng)不會(huì)阻止中國(guó)AI發(fā)展,反而會(huì)迫使中國(guó)建立獨(dú)立于美國(guó)技術(shù)棧的完整生態(tài)系統(tǒng),重蹈美國(guó)電信行業(yè)被政策排擠出世界市場(chǎng)的覆轍,并提醒:“AI是一個(gè)五層的技術(shù)蛋糕。我們?cè)谒形鍖佣疾渴鹆松鷳B(tài)系統(tǒng)。放棄芯片層,就等于讓美國(guó)輸?shù)粽麄€(gè)技術(shù)棧的競(jìng)爭(zhēng)?!?/p>

以下是這篇播客的核心內(nèi)容:

1、下游需求即護(hù)城河: 英偉達(dá)能鎖定上游產(chǎn)能,根本原因是巨大的下游需求讓供應(yīng)鏈愿意投資。

2、真正瓶頸是能源和“水管工”: 任何供應(yīng)鏈瓶頸都不會(huì)超過兩三年,CoWoS、EUV都能快速擴(kuò)產(chǎn),真正瓶頸是能源和“水管工”。

3、可編程架構(gòu)才是關(guān)鍵: AI不僅是矩陣乘法,新算法需要可編程架構(gòu),專用TPU無法打破英偉達(dá)的壟斷。

4、CUDA的“飛輪效應(yīng)”: 數(shù)億GPU的安裝基礎(chǔ)、覆蓋所有云平臺(tái)、支持無數(shù)框架,這是任何ASIC無法比擬的護(hù)城河。

5、性價(jià)比世界第一: 英偉達(dá)每瓦token數(shù)和每美元性能都是全球最高,黃仁勛歡迎對(duì)手用MLPerf、InferenceMAX來證明。

6、Anthropic是特例: 轉(zhuǎn)投TPU是因?yàn)楫?dāng)時(shí)英偉達(dá)無力進(jìn)行數(shù)十億美元的投資,而非技術(shù)劣勢(shì)。

7、不做云,只投資: 英偉達(dá)不自己做超大規(guī)模云廠商,而是投資CoreWeave等neocloud,避免與客戶競(jìng)爭(zhēng)。

8、先到先得,從不漲價(jià): GPU分配不是價(jià)高者得,而是先下采購(gòu)訂單先得;英偉達(dá)保持價(jià)格穩(wěn)定,做行業(yè)基石。

9、DeepSeek是“可怕的結(jié)果”: DeepSeek若在華為芯片上首發(fā),意味著AI模型可能在美國(guó)技術(shù)棧之外運(yùn)行得最好,對(duì)美國(guó)是重大損失。

10、放棄市場(chǎng)會(huì)催生對(duì)手: 放棄中國(guó)這個(gè)全球第二大科技市場(chǎng),只會(huì)推動(dòng)中國(guó)建立獨(dú)立于美國(guó)的技術(shù)棧。

以下是播客內(nèi)容的完整編譯:

一、英偉達(dá)的核心工作難以被商品化:將電子轉(zhuǎn)化為token

主持人:我們看到很多軟件公司的估值暴跌,因?yàn)槿藗冋J(rèn)為有了AI之后,軟件就會(huì)變得像普通商品一樣,不再稀缺。有人會(huì)天真地想:英偉達(dá)把GDS2文件發(fā)給臺(tái)積電。臺(tái)積電制造邏輯芯片die,制造開關(guān),然后用SK海力士、美光和三星生產(chǎn)的HBM封裝起來。然后把它送到臺(tái)灣的ODM那里,他們組裝機(jī)架。英偉達(dá)本質(zhì)上是在做軟件,由別人來制造。如果軟件變得像普通商品一樣不再稀缺,那英偉達(dá)也會(huì)變得不再稀缺嗎?

黃仁勛:歸根結(jié)底,總得有人把電子轉(zhuǎn)化為token。把電子轉(zhuǎn)化為token,并隨著時(shí)間的推移讓這些token更有價(jià)值——這個(gè)過程很難完全商品化。從電子到token的轉(zhuǎn)化是一段令人難以置信的旅程。讓一個(gè)token比另一個(gè)token更有價(jià)值,就像讓一個(gè)分子比另一個(gè)分子更有價(jià)值一樣。其中涉及的藝術(shù)、工程、科學(xué)和發(fā)明,顯然我們正在實(shí)時(shí)目睹這一切。這種轉(zhuǎn)化、制造以及其中的所有科學(xué),遠(yuǎn)未被深刻理解,這段旅程也遠(yuǎn)未結(jié)束。

你描述問題的方式,其實(shí)就是我對(duì)我們公司的思維模型。輸入是電子,輸出是token,中間是英偉達(dá)。我們的工作是:做必要的事情,同時(shí)盡可能少做,以實(shí)現(xiàn)這種轉(zhuǎn)化,達(dá)到驚人的能力。我所說的“盡可能少做”是指,凡是我無需親力親為的,我就與人合作,讓它成為我生態(tài)系統(tǒng)的一部分。

看看今天的英偉達(dá),我們可能擁有最大的合作伙伴生態(tài)系統(tǒng),包括上游和下游的供應(yīng)鏈、所有的計(jì)算機(jī)公司、應(yīng)用開發(fā)者以及模型構(gòu)建者。AI就像一塊五層的蛋糕,我們?cè)谌课鍖佣加猩鷳B(tài)系統(tǒng)。我們?cè)噲D盡可能少做,但我們必須做的那部分,事實(shí)證明,極其困難,我不認(rèn)為那部分會(huì)變得像普通商品一樣不再稀缺。

事實(shí)上,我也不認(rèn)為企業(yè)軟件公司、工具制造商……今天的大多數(shù)軟件公司都是工具制造商。有些不是,有些是工作流編碼系統(tǒng)。但對(duì)很多公司來說,它們是工具制造商。例如,Excel、PowerPoint是工具,Cadence、Synopsys制造工具。我看到的與大家看到的恰恰相反。我認(rèn)為Agent的數(shù)量將呈指數(shù)級(jí)增長(zhǎng),工具用戶的數(shù)量也將呈指數(shù)級(jí)增長(zhǎng),所有這些工具的實(shí)例數(shù)量很可能會(huì)飆升。

Synopsys Design Compiler的實(shí)例數(shù)量很可能會(huì)飆升,同時(shí)使用floor planners、我們的布局工具和設(shè)計(jì)規(guī)則檢查器的Agent數(shù)量也會(huì)飆升。今天,我們受限于工程師的數(shù)量。明天,這些工程師將得到一群Agent的支持。我們將以前所未有的方式探索設(shè)計(jì)空間,我們將使用我們今天使用的工具。

我認(rèn)為工具的使用將導(dǎo)致軟件公司業(yè)績(jī)飆升,之所以還沒發(fā)生,是因?yàn)锳gent使用工具的能力還不夠好。這些公司要么自己構(gòu)建Agent,要么Agent會(huì)變得足夠好,才能夠使用這些工具,我認(rèn)為兩者會(huì)同時(shí)發(fā)生。

二、英偉達(dá)如何構(gòu)建供應(yīng)鏈護(hù)城河:上游大額采購(gòu)承諾和生態(tài)協(xié)同

主持人:我記得在你們最新的財(cái)報(bào)文件中,你們與代工廠、內(nèi)存和封裝供應(yīng)商有近1000億美元的采購(gòu)承諾。SemiAnalysis報(bào)道說,你們這類采購(gòu)承諾將達(dá)到2500億美元。一種解讀是,英偉達(dá)的護(hù)城河在于你們鎖定了未來多年的稀缺組件。別人可能有加速器,但他們真的能拿到制造它所需的內(nèi)存嗎?真的能拿到制造它所需的邏輯芯片嗎?這是否是英偉達(dá)未來幾年的主要護(hù)城河?

黃仁勛:這是我們可以做到、而別人很難做到的事情之一。我們?cè)谏嫌巫龀隽司薮蟮某兄Z,其中一些是顯性的,就是你提到的這些承諾。有些是隱性的,例如,上游的很多投資是由我們的供應(yīng)鏈做出的,因?yàn)槲覍?duì)那些CEO們說:“讓我告訴你們這個(gè)行業(yè)會(huì)有多大,讓我解釋為什么,讓我和你們一起推理,讓我展示我所看到的。”

通過這個(gè)告知、啟發(fā)并與上游不同行業(yè)CEO們對(duì)齊的過程,他們?cè)敢膺M(jìn)行投資。他們?yōu)槭裁丛敢鉃槲叶皇菫閯e人投資?原因在于,他們知道我有能力購(gòu)買他們的產(chǎn)品,并通過我的下游銷售出去。事實(shí)是,英偉達(dá)的下游供應(yīng)鏈和下游需求如此之大,他們?cè)敢庠谏嫌芜M(jìn)行投資。

你看看GTC大會(huì),人們對(duì)其規(guī)模和參會(huì)人數(shù)感到驚嘆。那是全方位的,整個(gè)AI宇宙匯聚一堂。他們聚在一起是因?yàn)樾枰ハ嗔私猓野阉麄兙奂饋?,讓下游看到上游,上游看到下游,所有人都能看到AI的進(jìn)步。非常重要的是,他們都能見到AI原住民、所有正在建設(shè)的AI初創(chuàng)公司以及所有正在發(fā)生的奇妙事情,這樣他們就能親眼看到我告訴他們的一切。我花大量時(shí)間,直接或間接地,告知我們的供應(yīng)鏈、合作伙伴和生態(tài)系統(tǒng),我們面前的機(jī)會(huì)。

一些人總是說:“在大多數(shù)主題演講中,都是一個(gè)接一個(gè)的公告?!倍覀兊闹黝}演講,總有一部分有點(diǎn)“折磨人”,因?yàn)樗鼛缀跸袷窃谧鼋逃J聦?shí)上,這正是我的想法,我需要確保整個(gè)供應(yīng)鏈、上下游、生態(tài)系統(tǒng),理解即將發(fā)生什么、為什么會(huì)發(fā)生、何時(shí)發(fā)生、規(guī)模會(huì)有多大,并能像我一樣系統(tǒng)地推理。

關(guān)于你描述的護(hù)城河,我們能夠?yàn)槲磥矶ㄔO(shè)。如果未來幾年我們的規(guī)模達(dá)到萬億美元級(jí)別,我們有供應(yīng)鏈來支撐。沒有我們的影響力,沒有我們業(yè)務(wù)的速度……就像有現(xiàn)金流一樣,還有供應(yīng)鏈流、有周轉(zhuǎn)。如果一個(gè)架構(gòu)的業(yè)務(wù)周轉(zhuǎn)率低,沒人會(huì)為其建立供應(yīng)鏈。我們維持規(guī)模的能力,完全是因?yàn)槲覀兊南掠涡枨笕绱司薮?。他們看到了,聽說了,看到了這一切的到來,這使我們能夠以現(xiàn)有的規(guī)模做我們能做的事情。

三、AI行業(yè)的瞬時(shí)需求大于總供應(yīng),但每個(gè)瓶頸兩三年內(nèi)都能解決

主持人:我想更具體地了解上游能否跟得上,你們每年向全球提供的FLOPs數(shù)量,已經(jīng)是原來的三倍以上。

黃仁勛:在這種規(guī)模下還能翻倍,確實(shí)令人難以置信。

主持人:確實(shí),但再看看邏輯芯片。你們是臺(tái)積電N3節(jié)點(diǎn)的最大客戶,也是N2節(jié)點(diǎn)最大的客戶之一,今年整個(gè)AI將占N3產(chǎn)能的60%,根據(jù)SemiAnalysis的數(shù)據(jù),明年將達(dá)到86%。如果你已經(jīng)是最大頭,你怎么翻倍?你如何年復(fù)一年地做到這一點(diǎn)?我們現(xiàn)在是否處于一個(gè)因?yàn)樯嫌蜗拗贫坏貌环啪廇I計(jì)算增長(zhǎng)率的階段?你覺得有辦法繞過這個(gè)限制嗎?我們最終如何年復(fù)一年地建設(shè)兩倍多的晶圓廠?

黃仁勛:在某種程度上,瞬時(shí)需求大于世界上游和下游的總供應(yīng)。在任何時(shí)刻,我們甚至可能受限于水管工的數(shù)量,這確實(shí)發(fā)生過。

主持人:水管工也應(yīng)該被邀請(qǐng)參加明年的GTC。

黃仁勛:好主意,但這是個(gè)好現(xiàn)象。你希望一個(gè)行業(yè)的瞬時(shí)需求大于該行業(yè)的總供應(yīng),反之顯然不太好。如果差距太大,某個(gè)特定組件供應(yīng)差得太遠(yuǎn),整個(gè)行業(yè)會(huì)蜂擁而上解決它。例如,人們現(xiàn)在不太談?wù)揅oWoS了。

原因是,我們花了兩年時(shí)間拼命攻克它。我們翻倍、翻倍、再翻倍,翻了好幾番,現(xiàn)在我認(rèn)為我們的狀況相當(dāng)不錯(cuò)。臺(tái)積電現(xiàn)在明白,CoWoS的供應(yīng)必須與邏輯和內(nèi)存需求的其余部分保持同步,他們正在以與擴(kuò)展邏輯相同的水平來擴(kuò)展CoWoS和未來的封裝技術(shù)。這太棒了,因?yàn)樵诤荛L(zhǎng)一段時(shí)間里,CoWoS和HBM內(nèi)存都相當(dāng)特殊,但它們不再是特殊技術(shù)了,人們現(xiàn)在意識(shí)到它們是主流的計(jì)算技術(shù)。

當(dāng)然,我們現(xiàn)在更有能力影響更廣泛范圍的供應(yīng)鏈。在AI革命之初,我現(xiàn)在說的這些話,五年前我就說了。有些人相信并投入了,例如,Sanjay和美光團(tuán)隊(duì)。我仍然清楚地記得那次會(huì)議,我清楚地說明了將要發(fā)生什么,為什么會(huì)發(fā)生,以及今天的預(yù)測(cè)。他們真的加大了投入,我們?cè)贚PDDR和HBM內(nèi)存方面與他們合作,他們確實(shí)投入了。這對(duì)公司來說顯然是非常好的,有些人來得晚一些,但現(xiàn)在他們都來了。

每一個(gè)瓶頸都會(huì)得到大量關(guān)注,我們現(xiàn)在提前數(shù)年預(yù)判瓶頸。例如,過去幾年我們對(duì)Lumentum、Coherent以及硅光子生態(tài)系統(tǒng)的投資,真的重塑了供應(yīng)鏈,我們?cè)谂_(tái)積電周圍建立了完整的供應(yīng)鏈。我們與他們合作COUPE,發(fā)明了大量技術(shù),并將這些專利授權(quán)給供應(yīng)鏈,以保持其良好和開放。

我們正在通過發(fā)明新技術(shù)、新工作流程、雙面探測(cè)等新型測(cè)試設(shè)備,以及通過投資公司、幫助它們擴(kuò)大產(chǎn)能,來為供應(yīng)鏈做好準(zhǔn)備。你可以看到,我們正在努力塑造生態(tài)系統(tǒng),以便供應(yīng)鏈準(zhǔn)備好支持這樣的規(guī)模。

主持人:有些瓶頸好解決,有些就沒那么容易,像擴(kuò)展CoWoS跟擴(kuò)展。

黃仁勛:我選了最難的一個(gè)——水管工,一些末日論者總在描述“崗位消失”,水管工和電工的短缺引起了我的擔(dān)憂。如果我們勸阻人們成為軟件工程師,我們就會(huì)耗盡軟件工程師。同樣的預(yù)言十年前就發(fā)生過,末日論者當(dāng)時(shí)告訴人們:“無論如何,別當(dāng)放射科醫(yī)生?!蹦憧赡苓€在網(wǎng)上看到過一些視頻,說放射科將是第一個(gè)消失的職業(yè),世界不再需要更多的放射科醫(yī)生,但我們現(xiàn)在很缺放射科醫(yī)生。

四、芯片產(chǎn)能瓶頸可在兩三年內(nèi)解決,真正的限制是能源政策

主持人:回到關(guān)于某些東西可以規(guī)模化,而另一些則不能……你如何每年實(shí)際制造出兩倍數(shù)量的邏輯芯片?歸根結(jié)底,內(nèi)存和邏輯都受限于EUV。你如何年復(fù)一年地獲得兩倍數(shù)量的EUV機(jī)器?

黃仁勛:這些都不是不可能快速規(guī)?;?,所有這些在兩三年內(nèi)都容易做到。你只需要一個(gè)需求信號(hào),一旦你能造出一個(gè),你就能造出十個(gè);一旦你能造出十個(gè),你就能造出一百萬個(gè),這些東西復(fù)制起來并不難。

主持人:你會(huì)深入到供應(yīng)鏈的哪一層?你會(huì)去找ASML說:“如果我展望三年后,英偉達(dá)要達(dá)到每年兩萬億美元的收入,我們需要多得多的EUV機(jī)器”嗎?

黃仁勛:有些我需要直接去談,有些是間接的。如果我能說服臺(tái)積電,ASML自然就會(huì)被說服。我們必須考慮關(guān)鍵的瓶頸點(diǎn),但如果臺(tái)積電被說服了,幾年內(nèi)你就會(huì)有大量的EUV機(jī)器。

我的觀點(diǎn)是,沒有任何一個(gè)瓶頸會(huì)持續(xù)超過兩三年,沒有。與此同時(shí),我們正在將計(jì)算效率提高10倍、20倍,從Hopper到Blackwell甚至提高30到50倍。因?yàn)镃UDA非常靈活,我們不斷推出新算法,我們開發(fā)各種新技術(shù),在增加容量的同時(shí)提高效率,這些都不讓我擔(dān)心。我擔(dān)心的是我們下游的東西,那些阻礙能源供應(yīng)的能源政策……沒有能源,你就無法創(chuàng)建工業(yè),沒有能源,你就無法創(chuàng)建一個(gè)全新的制造業(yè)。

我們想在美國(guó)再工業(yè)化,我們希望將芯片制造、計(jì)算機(jī)制造和封裝帶回美國(guó),我們希望制造電動(dòng)汽車和機(jī)器人等新東西。我們希望建AI工廠。沒有能源,你無法建造任何這些東西,而這些事情需要很長(zhǎng)時(shí)間。更多的芯片產(chǎn)能,是兩三年能解決的問題,更多的CoWoS產(chǎn)能,也是兩三年能解決的問題。

五、英偉達(dá)構(gòu)建的是多樣化的加速計(jì)算平臺(tái),而不僅是AI張量處理單元

主持人:我想問問關(guān)于你們競(jìng)爭(zhēng)對(duì)手的情況??纯碩PU,可以說世界上排名前三的模型中有兩個(gè),Claude和Gemini,是在TPU上訓(xùn)練的。這對(duì)英偉達(dá)的未來意味著什么?

黃仁勛:我們構(gòu)建的東西非常不同,英偉達(dá)構(gòu)建的是加速計(jì)算,而不僅僅是張量處理單元。加速計(jì)算用于各種領(lǐng)域:分子動(dòng)力學(xué)、量子色動(dòng)力學(xué)、數(shù)據(jù)處理、數(shù)據(jù)幀、結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),它還用于流體動(dòng)力學(xué)和粒子物理。此外,我們也把它用于AI。

加速計(jì)算要多樣化得多,盡管AI是當(dāng)下的熱門話題,顯然非常重要且有影響力,但計(jì)算遠(yuǎn)不止于此。英偉達(dá)重新發(fā)明了計(jì)算的方式,從通用計(jì)算轉(zhuǎn)向加速計(jì)算,我們的市場(chǎng)覆蓋范圍遠(yuǎn)遠(yuǎn)超過任何TPU或ASIC可能達(dá)到的范圍??纯次覀兊奈恢?,我們是唯一一家加速各種應(yīng)用程序的公司,我們擁有龐大的生態(tài)系統(tǒng)。所以,各種框架和算法都在英偉達(dá)上運(yùn)行。

因?yàn)槲覀兊挠?jì)算機(jī)設(shè)計(jì)成可供他人操作,任何操作員都可以購(gòu)買我們的系統(tǒng)。而對(duì)于大多數(shù)自建系統(tǒng),你必須自己當(dāng)操作員,因?yàn)樗鼈兊脑O(shè)計(jì)靈活性不足以讓其他人操作。因?yàn)槿魏稳硕伎梢圆僮魑覀兊南到y(tǒng),我們存在于每一個(gè)云平臺(tái)中,包括Google、Amazon、Azure和OCI。

如果你想運(yùn)營(yíng)它以供出租,你最好擁有一個(gè)龐大的、來自各行各業(yè)的客戶生態(tài)系統(tǒng)來作為承購(gòu)方。如果你想為自己運(yùn)營(yíng),我們顯然有能力幫助你自己運(yùn)營(yíng),就像我們?yōu)閤AI的Elon做的那樣。而且,因?yàn)槲覀兡茏屓魏喂尽⑷魏涡袠I(yè)的操作員都能使用,你可以用它來為L(zhǎng)illy公司建造用于科學(xué)研究和藥物發(fā)現(xiàn)的超級(jí)計(jì)算機(jī)。我們可以幫助他們運(yùn)營(yíng)自己的超級(jí)計(jì)算機(jī),并將其用于我們加速的整個(gè)藥物發(fā)現(xiàn)和生物科學(xué)領(lǐng)域。

有一大堆應(yīng)用是我們能夠處理而TPU無法處理的,英偉達(dá)構(gòu)建的CUDA也是一個(gè)出色的張量處理單元,但它也處理數(shù)據(jù)處理的每一個(gè)生命周期、計(jì)算、AI等等。我們的市場(chǎng)機(jī)會(huì)大得多,我們的覆蓋范圍也廣得多。因?yàn)槲覀儸F(xiàn)在支持世界上每一個(gè)應(yīng)用,你可以在任何地方構(gòu)建英偉達(dá)系統(tǒng),并且知道會(huì)有客戶使用它。這是一個(gè)非常不同的情況。

六、英偉達(dá)實(shí)現(xiàn)代際性能飛躍的根本原因:可編程架構(gòu)和算法創(chuàng)新

主持人:你們一季度收入600億美元,但這并不來自于制藥和量子計(jì)算,而是因?yàn)锳I是一項(xiàng)前所未有的技術(shù),并且以前所未有的速度增長(zhǎng)。那么問題來了,對(duì)于AI本身來說,什么是最好的?我不了解細(xì)節(jié),但我與我的AI研究員朋友交流時(shí),他們說:“你看,當(dāng)我使用TPU時(shí),它是一個(gè)巨大的脈動(dòng)陣列,非常適合做矩陣乘法,而GPU非常靈活,當(dāng)有很多分支或非規(guī)則內(nèi)存訪問時(shí),它很棒?!?/strong>

但AI是什么呢?它就是一次又一次、非??深A(yù)測(cè)的矩陣乘法。你不需要為warp調(diào)度器或線程與內(nèi)存庫(kù)之間的切換犧牲任何die面積。而TPU真正優(yōu)化的,正是當(dāng)前即將到來的收入增長(zhǎng)和計(jì)算用例中的絕大部分,我想知道你對(duì)此有何回應(yīng)。

黃仁勛:矩陣乘法是AI的重要組成部分,但不是唯一的部分。如果你想提出一種新的注意力機(jī)制,以不同的方式解耦,或者發(fā)明一種全新的架構(gòu)——比如混合SSM——你需要一個(gè)普遍可編程的架構(gòu)。如果你想創(chuàng)建一個(gè)融合了擴(kuò)散模型和自回歸技術(shù)的模型,你需要一個(gè)普遍可編程的架構(gòu),我們運(yùn)行你能想象到的一切,這就是優(yōu)勢(shì)所在。它允許更容易地發(fā)明新算法,因?yàn)樗且粋€(gè)可編程系統(tǒng)。

發(fā)明新算法的能力才是AI進(jìn)步如此之快的真正原因。TPU和其他任何東西一樣,都受到摩爾定律的影響,我們知道摩爾定律每年大約提升25%。真正實(shí)現(xiàn)10倍或100倍飛躍的唯一方法是,每年從根本上改變算法及其計(jì)算方式。

這就是英偉達(dá)的根本優(yōu)勢(shì),我們之所以能讓Blackwell比Hopper快50倍……我第一次宣布Blackwell能效將比Hopper高35倍時(shí),沒人相信。后來Dylan寫了篇文章說我“藏著掖著”,實(shí)際上是50倍,僅靠摩爾定律你無法合理做到這一點(diǎn)。我們解決這個(gè)問題的方法是采用新模型,比如MoE,這些模型被并行化、解耦,并分布在一個(gè)計(jì)算系統(tǒng)中。如果沒有能力真正深入并用CUDA提出新的kernel,這真的很難做到。

這是可編程架構(gòu)與英偉達(dá)是一家極端協(xié)同設(shè)計(jì)公司這兩個(gè)事實(shí)的結(jié)合。我們甚至可以將部分計(jì)算卸載到fabric本身,比如NVLink,或者卸載到網(wǎng)絡(luò),比如Spectrum-X。我們可以同時(shí)影響處理器、系統(tǒng)、fabric、庫(kù)和算法的變革。沒有CUDA來做這件事,我甚至不知道從何開始。

七、CUDA的寶貴價(jià)值:生態(tài)系統(tǒng)、安裝基礎(chǔ)和普遍存在性

主持人:這引出了一個(gè)關(guān)于英偉達(dá)客戶群的有趣問題。你們60%的收入來自五大超大規(guī)模云廠商。在另一個(gè)時(shí)代,面對(duì)不同的客戶——比如說運(yùn)行實(shí)驗(yàn)的教授——他們需要CUDA。他們不能使用別的加速器。他們只需要用帶CUDA的PyTorch,一切就都優(yōu)化好了。

但這些超大規(guī)模云廠商有資源編寫自己的kernel。事實(shí)上,為了獲得針對(duì)他們特定架構(gòu)所需的那最后5%性能,他們必須這樣做。Anthropic和Google主要運(yùn)行它們自己的加速器,或者使用TPU和Trainium。但即使是使用GPU的OpenAI,也有Triton,因?yàn)樗麄冃枰约旱膋ernel。深入到CUDA C++,他們沒有使用cuBLAS和NCCL,而是有自己的軟件棧,這個(gè)軟件棧也可以編譯到其他加速器上。如果你大多數(shù)客戶能夠并且確實(shí)在制作CUDA的替代品,那么CUDA在多大程度上真的是前沿AI發(fā)生在英偉達(dá)上的原因呢?

黃仁勛:CUDA是一個(gè)豐富的生態(tài)系統(tǒng),如果你想在任何計(jì)算機(jī)上優(yōu)先構(gòu)建,首先基于CUDA構(gòu)建是極其明智的。因?yàn)樯鷳B(tài)系統(tǒng)如此豐富,我們支持每一個(gè)框架。如果你想創(chuàng)建自定義kernel……例如,我們?yōu)門riton做出了巨大貢獻(xiàn),所以Triton的后端包含了大量的英偉達(dá)技術(shù)。

我們樂于幫助每一個(gè)框架變得盡可能好,框架非常多。有Triton、vLLM、SGLang等等?,F(xiàn)在又涌現(xiàn)出一大批新的強(qiáng)化學(xué)習(xí)框架,比如verl和NeMo RL。隨著后訓(xùn)練和強(qiáng)化學(xué)習(xí)的發(fā)展,整個(gè)領(lǐng)域正在爆炸式增長(zhǎng)。所以,如果你想基于某個(gè)架構(gòu)構(gòu)建,基于CUDA構(gòu)建是最有意義的,因?yàn)槟阒郎鷳B(tài)系統(tǒng)很強(qiáng)大。

如果出了問題,問題更可能出在你的代碼里,而不是下面那堆積如山的代碼中,別忘了構(gòu)建這些系統(tǒng)時(shí)你要處理多少代碼。當(dāng)某些東西不工作時(shí),是你錯(cuò)了還是計(jì)算機(jī)錯(cuò)了?你希望總是你自己錯(cuò)了,并且能夠信任計(jì)算機(jī)。顯然,我們自己還有很多bug,但我們的系統(tǒng)經(jīng)過了如此充分的檢驗(yàn),你至少可以在這個(gè)基礎(chǔ)上構(gòu)建。這是第一點(diǎn):生態(tài)系統(tǒng)的豐富性、可編程性和能力。

第二點(diǎn)是,如果你是一個(gè)開發(fā)者,無論你在構(gòu)建什么,你最想要的是一個(gè)安裝基礎(chǔ),你希望自己寫的軟件能在大量其他計(jì)算機(jī)上運(yùn)行,你不是只為自己構(gòu)建軟件。你是為你的集群或所有人的集群構(gòu)建,因?yàn)槟闶且粋€(gè)框架構(gòu)建者,英偉達(dá)的CUDA生態(tài)系統(tǒng)最終是它最寶貴的財(cái)富。

我們現(xiàn)在有數(shù)億個(gè)GPU在使用中,每個(gè)云平臺(tái)都有。這可以追溯到A10、A100、H100、H200、L系列、P系列,各種尺寸和形狀的都有。如果你是一家機(jī)器人公司,你希望那個(gè)CUDA棧能真正在機(jī)器人內(nèi)部運(yùn)行,我們幾乎無處不在。這個(gè)安裝基礎(chǔ)意味著,一旦你開發(fā)了軟件或模型,它將在任何地方都有用,這價(jià)值連城。

最后,我們存在于每一個(gè)云平臺(tái)中,這使我們真正獨(dú)一無二。如果你是一家AI公司或開發(fā)者,你不完全確定你會(huì)與哪個(gè)云服務(wù)商合作,或者你想在哪里運(yùn)行它。我們無處不在,包括如果你愿意,也可以在你本地運(yùn)行。生態(tài)系統(tǒng)豐富性、安裝基礎(chǔ)廣泛性以及我們所在位置的通用性,這些結(jié)合在一起,使得CUDA價(jià)值連城。

八、英偉達(dá)的每瓦性能和每美元性能均為世界最高,形成了客戶依賴的飛輪

主持人:這些優(yōu)勢(shì)對(duì)你的主要客戶來說是否真的很重要?對(duì)于很多人來說,這些優(yōu)勢(shì)可能很重要。但那種能夠自己構(gòu)建軟件棧的人,占據(jù)了你們收入的大部分。特別是,如果我們進(jìn)入一個(gè)AI在那些具有嚴(yán)格驗(yàn)證循環(huán)(你可以進(jìn)行強(qiáng)化學(xué)習(xí))的事情上變得特別擅長(zhǎng)的世界……關(guān)于如何最有效地編寫執(zhí)行attention或MLP的kernel以進(jìn)行擴(kuò)展的問題,這是一個(gè)非??沈?yàn)證的反饋循環(huán)。

所有超大規(guī)模云廠商都能為自己編寫這些自定義kernel嗎?英偉達(dá)仍然有很好的性價(jià)比,所以他們可能還是更愿意用英偉達(dá)。但問題是,這是否就變成了一個(gè)簡(jiǎn)單的問題:誰能在給定成本下提供最好的規(guī)格、最好的FLOPs和內(nèi)存帶寬。而歷史上,由于CUDA這個(gè)護(hù)城河,英偉達(dá)在AI硬件和軟件方面一直擁有、并且現(xiàn)在仍然擁有最高的利潤(rùn)率,超過70%。問題在于,如果你的大多數(shù)客戶實(shí)際上能夠負(fù)擔(dān)得起構(gòu)建替代品,而不是被CUDA護(hù)城河困住,你還能維持這些利潤(rùn)率嗎?

黃仁勛:我們分配給這些AI實(shí)驗(yàn)室的工程師數(shù)量是驚人的,我們與他們一起工作,優(yōu)化他們的軟件棧。原因在于,沒有人比我們更了解我們的架構(gòu)。這些架構(gòu)不像CPU那樣通用,CPU有點(diǎn)像凱迪拉克,不錯(cuò)的巡航車,從來不會(huì)開太快,每個(gè)人都能開得挺好,有巡航控制,一切都很簡(jiǎn)單。但在很多方面,英偉達(dá)的GPU、加速器,就像F1賽車。我想象每個(gè)人都能以100英里的時(shí)速駕駛它,但要想把它推向極限,需要相當(dāng)多的專業(yè)知識(shí),我們使用大量AI來創(chuàng)建我們擁有的kernel。

我很確定在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),我們?nèi)匀粫?huì)被需要。我們的專業(yè)知識(shí)常常能幫助我們的AI實(shí)驗(yàn)室合作伙伴輕松地將其軟件棧性能再提升2倍。我們優(yōu)化完他們的軟件?;蚰硞€(gè)特定kernel后,他們的模型速度提升了3倍、2倍、50%,這并不罕見。這是一個(gè)巨大的數(shù)字,尤其是考慮到他們擁有的集群規(guī)模,所有那些Hoppers和Blackwells。當(dāng)你將其提升一倍時(shí),這直接轉(zhuǎn)化為收入。

英偉達(dá)的計(jì)算棧是世界上性價(jià)比最高的,毫無疑問。沒有人能向我證明,當(dāng)今世界上有任何單一平臺(tái)擁有更好的性能-總體擁有成本比,一家都沒有。事實(shí)上,現(xiàn)有的基準(zhǔn)測(cè)試已經(jīng)證明了這一點(diǎn)。Dylan的InferenceMAX就擺在那里,任何人都可以使用,但沒有一個(gè)……TPU不來,Trainium也不來。

我鼓勵(lì)他們使用InferenceMAX來展示他們令人難以置信的推理成本,這真的很難,沒人愿意站出來。MLPerf也是。我歡迎Trainium來展示他們一直聲稱的40%優(yōu)勢(shì)。我很樂意聽到他們展示TPU的成本優(yōu)勢(shì),在我看來,這毫無意義,從基本原理上講,這毫無意義。

所以我認(rèn)為我們?nèi)绱顺晒Φ脑蚝芎?jiǎn)單,因?yàn)槲覀兊目傮w擁有成本如此之好。其次,你說我們60%的客戶是前五大云廠商,但大部分業(yè)務(wù)是外部的。例如,AWS上的大部分英偉達(dá)算力是供外部客戶使用的,而不是內(nèi)部使用。Azure上的大部分客戶,顯然都是外部客戶。OCI上的所有客戶都是外部客戶,不是內(nèi)部使用。他們青睞我們的原因是因?yàn)槲覀兊母采w范圍如此之廣,我們可以為他們帶來世界上所有偉大的客戶。這些客戶都構(gòu)建在英偉達(dá)之上,而所有這些公司之所以構(gòu)建在英偉達(dá)之上,是因?yàn)槲覀兊母采w范圍和通用性如此之廣。

所以我認(rèn)為這個(gè)飛輪確實(shí)是:安裝基礎(chǔ)、我們架構(gòu)的可編程性、生態(tài)系統(tǒng)的豐富性,以及世界上有這么多AI公司?,F(xiàn)在有數(shù)萬家了。如果你是那些AI初創(chuàng)公司之一,你會(huì)選擇哪種架構(gòu)?你會(huì)選擇最充裕的架構(gòu),我們是世界上最充裕的。你會(huì)選擇安裝基礎(chǔ)最大的,我們是最大的安裝基礎(chǔ),你會(huì)選擇擁有豐富生態(tài)系統(tǒng)的。

這就是飛輪,這就是為什么結(jié)合了以下幾點(diǎn):第一,我們的每美元性能如此出色,以至于他們擁有成本最低的token。第二,我們的每瓦性能是世界上最高的。所以,如果我們的合作伙伴中有一家建造了一個(gè)吉瓦級(jí)的數(shù)據(jù)中心,那個(gè)吉瓦級(jí)數(shù)據(jù)中心最好能產(chǎn)生最多的收入和token數(shù)量,這直接轉(zhuǎn)化為收入。你希望它產(chǎn)生盡可能多的token,最大化該數(shù)據(jù)中心的收入,我們是世界上每瓦token數(shù)最高的架構(gòu)。最后,如果你的目標(biāo)是出租基礎(chǔ)設(shè)施,我們擁有世界上最多的客戶,這就是飛輪運(yùn)作的原因。

九、Anthropic使用TPU是特殊案例,源于英偉達(dá)當(dāng)時(shí)缺乏投資能力

主持人:有意思,我想問題歸結(jié)為,實(shí)際的市場(chǎng)結(jié)構(gòu)是怎樣的?因?yàn)榧词褂衅渌尽赡艽嬖谝粋€(gè)世界,有數(shù)萬家AI公司大致平等地分享算力。但即使通過這五大超大規(guī)模云廠商,真正在亞馬遜上使用算力的是Anthropic、OpenAI以及那些大型基礎(chǔ)模型實(shí)驗(yàn)室,他們自己能夠負(fù)擔(dān)并且有能力讓不同的加速器工作起來。

黃仁勛:不,我認(rèn)為你的前提是錯(cuò)的,我務(wù)必要糾正,因?yàn)檫@對(duì)AI來說太重要了。這對(duì)科學(xué)的未來太重要了。對(duì)這個(gè)行業(yè)的未來太重要了。

主持人:讓我把問題說完,然后我們可以一起討論。如果你說的關(guān)于價(jià)格、性能、每瓦性能等等這些都是真的,那你認(rèn)為,為什么像Anthropic這樣的公司,就在幾天前宣布與博通和谷歌達(dá)成一項(xiàng)multi-gigawatt(數(shù)吉瓦級(jí))的TPU交易,并且他們的大部分算力將來自TPU?

顯然對(duì)谷歌來說,TPU占其大部分算力。所以,如果我看這些大型AI公司,似乎他們的很多算力……曾經(jīng)一度全是英偉達(dá),現(xiàn)在不是了。所以我很好奇,如果這些在紙面上都是真的,為什么他們轉(zhuǎn)而使用其他加速器?

黃仁勛:Anthropic是一個(gè)特例,不是趨勢(shì)。沒有Anthropic,TPU的增長(zhǎng)從何而來?百分之百是Anthropic。沒有Anthropic,Trainium的增長(zhǎng)從何而來?百分之百是Anthropic,我認(rèn)為這是眾所周知、廣為人知的。并不是說ASIC的機(jī)會(huì)很多,只有一個(gè)Anthropic。

主持人:但OpenAI與AMD的交易……他們正在構(gòu)建自己的Titan加速器。

黃仁勛:是的,但我認(rèn)為我們都承認(rèn),他們絕大部分算力還是來自英偉達(dá)。我們?nèi)詫⒁黄鹱龊芏喙ぷ?,我不介意別人使用其他東西并嘗試。如果他們不嘗試這些東西,怎么會(huì)知道我們的有多好呢?有時(shí)候你需要被提醒一下,我們必須不斷贏得我們目前的地位。

總是有夸大的說法,看看有多少ASIC項(xiàng)目被取消了。僅僅因?yàn)槟愦蛩憬ㄔ煲粋€(gè)ASIC……你仍然需要建造比英偉達(dá)更好的東西。建造比英偉達(dá)更好的東西并不容易,事實(shí)上,這不合理。英偉達(dá)肯定在某些方面有缺失,嚴(yán)重缺失。因?yàn)閼{借我們的規(guī)模、我們的速度,我們是世界上唯一一家每年都在推出新產(chǎn)品的公司。每年都有巨大飛躍。

主持人:我想他們的邏輯是:“它不需要更好。它只需要不比70%差太多,”因?yàn)樗麄兏督o你70%的利潤(rùn)率。

黃仁勛:不,別忘了,即使是ASIC,利潤(rùn)率也相當(dāng)高。比方說英偉達(dá)的利潤(rùn)率是70%,但ASIC的利潤(rùn)率是65%,你真正能省下多少?

主持人:你是說來自博通之類的公司?

黃仁勛:是的,當(dāng)然。你得付錢給某人。據(jù)我所知,ASIC的利潤(rùn)率非常高,他們也相信這一點(diǎn),他們?yōu)樽约毫钊穗y以置信的ASIC利潤(rùn)率感到相當(dāng)自豪。

所以,你問為什么。很久以前,我們沒有能力去做(投資)。當(dāng)時(shí),我沒有深刻內(nèi)化建立一個(gè)像OpenAI和Anthropic這樣的基礎(chǔ)AI實(shí)驗(yàn)室有多么困難,以及他們需要來自供應(yīng)商本身的大量投資。我們當(dāng)時(shí)沒有能力向Anthropic進(jìn)行數(shù)十億美元的投資,以便他們使用我們的算力。但谷歌和AWS有,他們一開始就投入了巨額投資,作為回報(bào),Anthropic使用他們的算力,我們當(dāng)時(shí)沒有能力做到這一點(diǎn)。

我想說的是,我的錯(cuò)誤在于我沒有深刻內(nèi)化他們真的別無選擇,風(fēng)險(xiǎn)投資家絕不會(huì)向一個(gè)AI實(shí)驗(yàn)室投入50到100億美元,期望它能成為Anthropic,這是我的失誤。但即使我當(dāng)時(shí)明白了,我也不認(rèn)為我們當(dāng)時(shí)有能力做到,但我不會(huì)再犯同樣的錯(cuò)誤了。

我很高興投資OpenAI,也很高興幫助他們擴(kuò)展,我相信這樣做是必要的。然后,當(dāng)Anthropic來找我們時(shí),我也很高興成為投資者,很高興幫助他們擴(kuò)展,我們當(dāng)時(shí)就是做不到。如果我能讓時(shí)光倒流——如果英偉達(dá)當(dāng)時(shí)能像現(xiàn)在這么強(qiáng)大——我會(huì)非常樂意這樣做。

十、英偉達(dá)遵循“做必要之事、盡可能少做”的原則,通過投資支持云生態(tài)而非自營(yíng)

主持人:多年來,英偉達(dá)一直是AI領(lǐng)域賺錢的公司,賺得盆滿缽滿。現(xiàn)在你在進(jìn)行投資,據(jù)報(bào)道,你已經(jīng)向OpenAI投資了高達(dá)300億美元,向Anthropic投資了100億美元,現(xiàn)在他們的估值還在漲,我相信會(huì)繼續(xù)漲。

所以,如果這么多年來,你一直在給他們提供算力,你看到了它的發(fā)展方向,而一兩年前——或者在某些情況下甚至一年前——他們的價(jià)值只有現(xiàn)在的十分之一,你手頭又有這么多現(xiàn)金……那么,存在著一個(gè)世界,要么英偉達(dá)自己成為一個(gè)基礎(chǔ)模型實(shí)驗(yàn)室,進(jìn)行大規(guī)模投資來實(shí)現(xiàn)這一點(diǎn),要么以現(xiàn)在的估值更早地做成你現(xiàn)在做的這些交易,而且你當(dāng)時(shí)有現(xiàn)金做這些。所以我很好奇,為什么不早點(diǎn)做呢?

黃仁勛:我們一有能力就做了,如果我能,我會(huì)更早做。在Anthropic需要我們做的時(shí)候,我們就是沒能力做,當(dāng)時(shí)我們還沒有這種意識(shí)。

主持人:怎么會(huì)?是現(xiàn)金問題嗎?

黃仁勛:是的,投資規(guī)模的問題。當(dāng)時(shí)我們從未在公司外部進(jìn)行過投資,更沒有那么大額的,我們沒意識(shí)到我們需要這樣做。我一直以為他們可以去找風(fēng)險(xiǎn)投資家融資,看在上帝的份上,所有公司不都這樣嗎?但他們?cè)噲D做的事情,通過風(fēng)險(xiǎn)投資是做不到的。OpenAI想做的事情,通過風(fēng)險(xiǎn)投資是做不到的,我現(xiàn)在認(rèn)識(shí)到這點(diǎn)了,我當(dāng)時(shí)不知道。

但這就是他們的天才之處,這就是他們聰明的地方,他們當(dāng)時(shí)就意識(shí)到必須做那樣的事情,我很高興他們做了。盡管我們導(dǎo)致Anthropic不得不去找別人,我仍然很高興事情發(fā)生了,Anthropic的存在對(duì)世界是件好事。我為此感到高興。

主持人:我想你仍然在賺很多錢,而且每個(gè)季度賺的錢都多得多。

黃仁勛:有點(diǎn)遺憾還是可以的。

主持人:所以問題仍然存在,好吧,你一直在賺這么多錢,英偉達(dá)應(yīng)該用這些錢做什么呢?有一個(gè)答案是,圍繞如何將這些實(shí)驗(yàn)室的資本支出轉(zhuǎn)換為運(yùn)營(yíng)支出以便他們能租用算力,已經(jīng)出現(xiàn)了一個(gè)完整的中介生態(tài)系統(tǒng)。因?yàn)樾酒浅0嘿F,但AI模型在不斷進(jìn)步,所以它們?cè)谏芷趦?nèi)能創(chuàng)造很多價(jià)值。它們產(chǎn)生的token價(jià)值在增加,但前期設(shè)置成本很高,英偉達(dá)有錢做資本支出。事實(shí)上,據(jù)報(bào)道,你們正在支持CoreWeave,金額高達(dá)63億美元,并且已經(jīng)投資了20億美元。

為什么英偉達(dá)不自己成為一家云服務(wù)商?為什么不自己成為一家超大規(guī)模云廠商,把這些算力租出去?你們有這么多現(xiàn)金來做這件事。

黃仁勛:這是我們公司的理念,我認(rèn)為這是明智的。我們應(yīng)該做必要的事情,同時(shí)盡可能少做。這意味著,在我們構(gòu)建計(jì)算平臺(tái)的工作中,如果我們不做,我真心相信就沒人會(huì)做了。如果我們不承擔(dān)我們所承擔(dān)的風(fēng)險(xiǎn)——如果我們不像那樣構(gòu)建NVLink,如果我們不構(gòu)建整個(gè)軟件棧,如果我們不像那樣創(chuàng)建生態(tài)系統(tǒng),如果我們不致力于CUDA20年并且在大部分時(shí)間里虧損——如果我們不做,別人也不會(huì)做。

如果我們不創(chuàng)建所有的CUDA-X庫(kù),讓它們都針對(duì)特定領(lǐng)域……十五年前,我們進(jìn)軍特定領(lǐng)域庫(kù),因?yàn)槲覀円庾R(shí)到,如果我們不創(chuàng)建這些特定領(lǐng)域庫(kù),無論是用于光線追蹤、圖像生成還是AI的早期工作,這些模型,如果我們不創(chuàng)建它們,用于數(shù)據(jù)處理、結(jié)構(gòu)化數(shù)據(jù)處理或向量數(shù)據(jù)處理,如果我們不創(chuàng)建它們,沒人會(huì)做。我對(duì)此完全確定。我們創(chuàng)建了一個(gè)名為cuLitho的計(jì)算光刻庫(kù)。如果我們不創(chuàng)建,沒人會(huì)做。所以,如果我們不做我們所做的事情,加速計(jì)算就不會(huì)像現(xiàn)在這樣進(jìn)步。

所以我們應(yīng)該做那些事,我們應(yīng)該將我們公司、我們所有的力量、全心全意地投入到那些事情上。然而,世界上有很多云服務(wù)商。如果我不做,別人會(huì)做。所以,遵循這個(gè)“做必要的事,但盡可能少做”——盡可能少做——這個(gè)理念今天仍存在于我們公司。我所做的每一件事,都帶著這個(gè)視角。

就云服務(wù)而言,如果我們不支持CoreWeave的存在,這些neocloud、這些AI云就不會(huì)存在。如果我們不幫助CoreWeave存在,它們就不會(huì)存在。如果我們不支持Nscale,他們就不會(huì)有今天的成就,如果我們不支持Nebius,他們也不會(huì)有今天的成就,現(xiàn)在他們做得非常好。

這是一個(gè)商業(yè)模式嗎?我們應(yīng)該做必要的事,盡可能少做。所以我們投資于我們的生態(tài)系統(tǒng),因?yàn)槲蚁M覀兊纳鷳B(tài)系統(tǒng)蓬勃發(fā)展。我希望這種架構(gòu)和AI能夠連接盡可能多的行業(yè)、盡可能多的國(guó)家,并使得地球能夠建立在AI之上,建立在美國(guó)技術(shù)棧之上。這個(gè)愿景正是我們正在追求的。

現(xiàn)在,你提到的其中一件事……有很多偉大的、了不起的基礎(chǔ)模型公司,我們?cè)噲D投資于所有公司。這是我們要做的另一件事。我們不挑選贏家。我們需要支持每個(gè)人。這是我們樂于做的事情的一部分。這對(duì)我們的業(yè)務(wù)至關(guān)重要。但我們也刻意不去挑選贏家。所以當(dāng)我投資其中一家時(shí),我會(huì)投資所有。

主持人:你們?yōu)槭裁纯桃獠惶暨x贏家?

黃仁勛:第一點(diǎn),因?yàn)檫@不是我們的工作。第二點(diǎn),英偉達(dá)剛起步時(shí),有60家3D圖形公司,我們是唯一幸存下來的。如果你從這60家圖形公司里猜哪家能成功,英偉達(dá)最有可能被排在“不會(huì)成功”的名單首位。

這遠(yuǎn)在你之前,但英偉達(dá)的圖形架構(gòu)是完全錯(cuò)誤的。不是有點(diǎn)錯(cuò)。我們創(chuàng)建了一個(gè)完全錯(cuò)誤的架構(gòu),開發(fā)者不可能支持它。它永遠(yuǎn)不會(huì)成功。我們基于良好的第一原理推理,但最終得到了錯(cuò)誤的解決方案。所有人都會(huì)把我們排除在外。而我們今天在這里。

所以我有足夠的謙遜認(rèn)識(shí)到這一點(diǎn):不要挑選贏家。要么讓它們自己照顧自己,要么照顧所有。

十一、英偉達(dá)的GPU分配遵循采購(gòu)訂單順序,從不價(jià)高者得

主持人:有一點(diǎn)我不明白,你說:“你看,我們并不是僅僅因?yàn)樗鼈兪莕eocloud就優(yōu)先考慮它們,想扶持它們?!钡阋擦信e了一堆neocloud,并說沒有英偉達(dá)它們就不會(huì)存在。這兩者如何兼容?

黃仁勛:首先,他們需要有存在的意愿,并且來尋求我們的幫助。當(dāng)他們想存在,并且有商業(yè)計(jì)劃、專業(yè)知識(shí)和熱情……他們顯然必須自己有一些能力。但是,如果歸根結(jié)底,他們需要一些投資來啟動(dòng),我們會(huì)支持他們。

你的問題是:“我們想不想做融資業(yè)務(wù)?”答案是不想。有人在做融資業(yè)務(wù),我們寧愿與所有從事融資業(yè)務(wù)的人合作,而不是自己成為融資方。我們的目標(biāo)是專注于我們所做的,保持我們的商業(yè)模式盡可能簡(jiǎn)單,并支持我們的生態(tài)系統(tǒng)。

當(dāng)像OpenAI這樣的公司需要300億美元規(guī)模的投資,因?yàn)樗€在IPO之前,而我們深信他們,我深信他們會(huì)成為……嗯,他們已經(jīng)是一家非凡的公司了,他們會(huì)成為一家令人難以置信的公司,世界需要他們存在,世界希望他們存在,我希望他們存在,他們順風(fēng)順?biāo)屛覀冎С炙麄?,讓他們發(fā)展。我們會(huì)做這些投資,因?yàn)樗麄冃枰覀冞@樣做。但我們不是想做得盡可能多,我們是想做得盡可能少。

主持人:這可能是一個(gè)顯而易見的問題,但我們已經(jīng)生活在GPU短缺的情況下很多年了,而且因?yàn)槟P驮絹碓胶?,這種情況還在加劇。

黃仁勛:我們的GPU是短缺的。

主持人:是的,眾所周知,英偉達(dá)分配稀缺的配額,不僅僅是基于最高出價(jià)者,而是基于:“嘿,我們希望確保這些neocloud存在。我們給CoreWeave一些,給Crusoe一些,給Lambda一些。”這對(duì)英偉達(dá)有什么好處?首先,你同意這種“碎片化市場(chǎng)”的描述嗎?

黃仁勛:不,你的前提是錯(cuò)誤的。我們對(duì)這些事情足夠用心,我們對(duì)這些事情非常用心。首先,如果你不下采購(gòu)訂單,再多的口頭溝通也沒用。在我們拿到采購(gòu)訂單之前,我們能做什么?所以第一件事,我們非常努力地與每個(gè)人合作,完成預(yù)測(cè),因?yàn)檫@些系統(tǒng)需要很長(zhǎng)時(shí)間來構(gòu)建,數(shù)據(jù)中心也需要很長(zhǎng)時(shí)間來構(gòu)建。我們通過預(yù)測(cè)等方式使供需對(duì)齊。明白嗎?這是第一要?jiǎng)?wù)。

第二,我們?cè)噲D與盡可能多的人進(jìn)行預(yù)測(cè),但最終,你還是得下訂單。也許,無論出于什么原因,你沒有下訂單。我能怎么辦?在某個(gè)節(jié)點(diǎn),先到先得。但除此之外,如果你還沒準(zhǔn)備好,因?yàn)槟愕臄?shù)據(jù)中心還沒準(zhǔn)備好,或者某些組件還沒準(zhǔn)備好讓你能夠建立數(shù)據(jù)中心,我們可能會(huì)決定先服務(wù)其他客戶,這只是為了最大化我們自身工廠的吞吐量。我們可能會(huì)在那里做一些調(diào)整。

除此之外,優(yōu)先級(jí)是先到先得,你必須下采購(gòu)訂單。如果你不下……當(dāng)然,關(guān)于這一點(diǎn)有一些故事。例如,這一切都始于一篇關(guān)于Larry和Elon與我共進(jìn)晚餐時(shí)懇求GPU的文章,那從未發(fā)生過,我們確實(shí)共進(jìn)了晚餐,那是一頓美好的晚餐,他們從未懇求GPU,他們只需要下訂單就行,一旦他們下了訂單,我們會(huì)盡力把產(chǎn)能分配給他們,我們并不復(fù)雜。

主持人:好的,所以聽起來有一個(gè)隊(duì)列,然后根據(jù)你的數(shù)據(jù)中心是否準(zhǔn)備好以及你何時(shí)下采購(gòu)訂單,你在特定時(shí)間拿到貨。但這聽起來仍然不是最高出價(jià)者就能拿到,有什么理由不這樣做?

黃仁勛:我們從不那樣做。

主持人:為什么不直接給出價(jià)最高的人?

黃仁勛:因?yàn)槟鞘遣缓玫纳虡I(yè)實(shí)踐,你設(shè)定你的價(jià)格,然后人們決定買或不買。我知道芯片行業(yè)的其他公司會(huì)在需求高時(shí)改變價(jià)格,但我們就是不這么做,這從來不是我們的做法。你可以信賴我們,我寧愿成為一個(gè)可靠的人,成為行業(yè)的基石,你不需要猜疑。如果我給你報(bào)了價(jià),那就是報(bào)價(jià),如果需求飆升,那就隨它去。

主持人:另一方面,這就是你們與臺(tái)積電保持富有成效關(guān)系的原因,對(duì)吧?

黃仁勛:是的,英偉達(dá)和他們做生意,我想快30年了。英偉達(dá)和臺(tái)積電沒有法律合同,總是有一些粗略的公平。有時(shí)候我對(duì),有時(shí)候我錯(cuò),有時(shí)候我得到更好的交易,有時(shí)候我得到更差的,但總的來說,這種關(guān)系是不可思議的,我可以完全信任他們。

你可以信賴英偉達(dá)的一件事是,今年的Vera Rubin會(huì)令人難以置信,明年的Vera Rubin Ultra會(huì)來,后年,F(xiàn)eynman會(huì)來,再后一年,我還沒介紹名字,每一年你都可以信賴我們。你得去世界上找另一個(gè)ASIC團(tuán)隊(duì)——隨便選一個(gè)你的ASIC團(tuán)隊(duì)——看看你能不能對(duì)他們說:“我可以把我的全部家當(dāng)、我的整個(gè)生意押在你們每年都會(huì)為我服務(wù)上,你們的token成本每年會(huì)下降一個(gè)數(shù)量級(jí),我可以像信賴時(shí)鐘一樣信賴你?!?/p>

我剛才對(duì)臺(tái)積電說了類似的話,對(duì)于歷史上任何其他代工廠,你都不可能說出這樣的話。但今天你可以對(duì)英偉達(dá)這么說,你可以每年都信賴我們。如果你想購(gòu)買價(jià)值10億美元的AI工廠算力,沒問題。如果你想購(gòu)買1億美元,沒問題。你想購(gòu)買1000萬美元,或者只是一個(gè)機(jī)架,沒問題?;蛘咧皇且粔K顯卡,沒問題。如果你想下價(jià)值1000億美元的AI工廠訂單,沒問題。今天,我們是世界上唯一一家你能說出這樣的話的公司。

我對(duì)臺(tái)積電也能這么說,我想買一個(gè),或者買十億個(gè),都沒問題。我們只需要經(jīng)過規(guī)劃流程,以及所有成熟公司會(huì)做的事情。所以,我認(rèn)為英偉達(dá)成為世界AI工業(yè)基石的能力,這是我們花了幾十年才達(dá)到的位置。巨大的承諾,巨大的奉獻(xiàn),我們公司的穩(wěn)定性和一致性非常重要。

十二、向中國(guó)銷售芯片有助于保持美國(guó)技術(shù)棧的全球主導(dǎo)地位,出口管制適得其反

主持人:好的,我想問問關(guān)于中國(guó)的問題。實(shí)際上,關(guān)于向中國(guó)出售芯片是好是壞,我不知道自己怎么想,但我喜歡對(duì)嘉賓唱反調(diào)。所以當(dāng)Dario來的時(shí)候(他支持出口管制),我問他,為什么不能美國(guó)和中國(guó)都在數(shù)據(jù)中心里擁有一批天才呢?但因?yàn)槟阏驹趯?duì)立面,我會(huì)用相反的方式來問你。

一種思考方式是,Anthropic實(shí)際上幾天前宣布了Mythos Preview。這個(gè)模型Mythos,他們甚至不會(huì)公開發(fā)布,因?yàn)樗麄冋f它具有如此強(qiáng)的網(wǎng)絡(luò)攻擊能力,以至于世界還沒有準(zhǔn)備好,直到我們確保這些零日漏洞被修補(bǔ)好。但他們說它發(fā)現(xiàn)了所有主流操作系統(tǒng)、所有瀏覽器中的數(shù)千個(gè)高危漏洞。它在OpenBSD中發(fā)現(xiàn)了一個(gè)漏洞,這個(gè)操作系統(tǒng)是專門為沒有零日漏洞而設(shè)計(jì)的。它發(fā)現(xiàn)了一個(gè)存在了27年的漏洞。

所以,如果中國(guó)公司、中國(guó)實(shí)驗(yàn)室和中國(guó)政府能夠獲得AI芯片,來訓(xùn)練像Claude Mythos這樣具有網(wǎng)絡(luò)攻擊能力的模型,并用更多的算力運(yùn)行數(shù)百萬個(gè)它的實(shí)例,那么問題來了,這是否對(duì)美國(guó)公司、美國(guó)的國(guó)家安全構(gòu)成威脅?

黃仁勛:首先,Mythos是在相當(dāng)普通的算力水平上訓(xùn)練的,而且算力規(guī)模也相當(dāng)普通,是由一家非凡的公司訓(xùn)練的。訓(xùn)練它所使用的算力規(guī)模和類型在中國(guó)是大量存在的,所以你首先得認(rèn)識(shí)到,中國(guó)是有芯片的。

他們制造了全球60%的主流芯片,也許更多,這對(duì)他們來說是一個(gè)非常大的產(chǎn)業(yè),他們擁有一些世界上最偉大的計(jì)算機(jī)科學(xué)家。如你所知,所有這些AI實(shí)驗(yàn)室中的大多數(shù)AI研究人員都是中國(guó)人,他們擁有全球50%的AI研究人員。那么問題是,考慮到他們已經(jīng)擁有的所有資產(chǎn)——他們擁有充足的能源,他們有很多芯片,他們擁有大多數(shù)AI研究人員——如果你擔(dān)心他們,創(chuàng)造一個(gè)安全世界的最佳方式是什么?

將他們視為受害者,把他們變成敵人,很可能不是最佳答案,他們是競(jìng)爭(zhēng)對(duì)手,我們希望美國(guó)贏。但我認(rèn)為,進(jìn)行對(duì)話和研究方面的對(duì)話可能是最安全的做法。由于我們目前視中國(guó)為對(duì)手的態(tài)度,這個(gè)領(lǐng)域是明顯缺失的。我們的AI研究人員和他們的AI研究人員進(jìn)行交流至關(guān)重要,我們必須嘗試就“不將AI用于什么”達(dá)成一致。

關(guān)于在軟件中尋找漏洞,當(dāng)然,這正是AI應(yīng)該做的。它會(huì)在很多軟件中找到漏洞嗎?當(dāng)然。有非常非常多的漏洞,AI軟件本身也有很多漏洞。這正是AI應(yīng)該做的,我很高興AI已經(jīng)達(dá)到了這樣一個(gè)水平,可以幫助我們提高如此多的生產(chǎn)力。

有一點(diǎn)被低估了,那就是圍繞網(wǎng)絡(luò)安全、AI網(wǎng)絡(luò)安全、AI安全、AI隱私和AI安全的生態(tài)系統(tǒng)的豐富性。有一整個(gè)AI初創(chuàng)公司的生態(tài)系統(tǒng)正在努力為我們創(chuàng)造這個(gè)未來,你擁有一個(gè)令人難以置信的AI Agent,周圍有成千上萬的AI Agent在保護(hù)它、確保它的安全,這個(gè)未來肯定會(huì)到來。

讓一個(gè)AI Agent到處亂跑而沒人看管的想法,有點(diǎn)瘋狂。我們很清楚,這個(gè)生態(tài)系統(tǒng)需要蓬勃發(fā)展。事實(shí)證明,這個(gè)生態(tài)系統(tǒng)需要開源,這個(gè)生態(tài)系統(tǒng)需要開放模型,他們需要開放的軟件棧,以便所有這些AI研究人員和所有這些偉大的計(jì)算機(jī)科學(xué)家能夠構(gòu)建同樣強(qiáng)大的AI系統(tǒng),并確保AI的安全。所以,我們需要確保做的一件事是保持開源生態(tài)系統(tǒng)的活力。這一點(diǎn)不容忽視。其中很大一部分來自中國(guó),我們不應(yīng)該扼殺它。

關(guān)于中國(guó),當(dāng)然我們希望美國(guó)擁有盡可能多的算力。我們受限于能源,但我們有很多人在努力解決這個(gè)問題,我們絕不能讓能源成為我們國(guó)家的瓶頸。但我們同樣希望的是,確保世界上所有的AI開發(fā)者都在美國(guó)技術(shù)棧上進(jìn)行開發(fā),并將AI的進(jìn)步(特別是開源的進(jìn)步)貢獻(xiàn)給美國(guó)生態(tài)系統(tǒng)。如果創(chuàng)造兩個(gè)生態(tài)系統(tǒng):一個(gè)是只運(yùn)行在外國(guó)技術(shù)棧上的開源生態(tài)系統(tǒng),另一個(gè)是運(yùn)行在美國(guó)技術(shù)棧上的封閉生態(tài)系統(tǒng),那將是非常愚蠢的,我認(rèn)為這對(duì)美國(guó)來說將是一個(gè)可怕的結(jié)果。

十三、中國(guó)擁有充足的能源、芯片產(chǎn)能和AI研究人員,出口管制反而加速其自主生態(tài)

主持人:回到黑客攻擊所需的FLOPs差異上的擔(dān)憂是:是的,他們有算力,但有一些估計(jì)認(rèn)為,由于他們停留在7nm——他們沒有EUV因?yàn)樾酒圃斐隹诠苤啤麄儗?shí)際能生產(chǎn)的FLOPs數(shù)量,只有美國(guó)的十分之一。

那么,他們最終能否訓(xùn)練出像Mythos這樣的模型?能,但問題是,因?yàn)槲覀冇懈嗟腇LOPs,美國(guó)的實(shí)驗(yàn)室能夠首先達(dá)到這些能力水平。因?yàn)锳nthropic先達(dá)到了,他們說,“好吧,我們會(huì)把它保留一個(gè)月,同時(shí)我們會(huì)讓所有這些美國(guó)公司使用它。他們會(huì)修補(bǔ)所有漏洞,然后我們?cè)侔l(fā)布?!?/strong>

此外,即使他們訓(xùn)練出這樣的模型,大規(guī)模部署它的能力……如果你有一個(gè)網(wǎng)絡(luò)黑客,擁有100萬個(gè)實(shí)例比擁有1000個(gè)實(shí)例危險(xiǎn)得多。所以推理算力真的很重要。事實(shí)上,他們有這么多如此優(yōu)秀的AI研究人員,這才是可怕的地方,因?yàn)槭鞘裁醋屵@些工程師研究人員更有效率?是算力。

如果你和美國(guó)任何一個(gè)AI實(shí)驗(yàn)室交談,他們會(huì)說限制他們的是算力。有DeepSeek創(chuàng)始人或通義千問領(lǐng)導(dǎo)層的引述,他們說他們受限制的是算力。那么問題是,讓美國(guó)公司因?yàn)閾碛懈嗨懔Χ冗_(dá)到Mythos級(jí)別的能力,讓我們的社會(huì)為此做好準(zhǔn)備,在中國(guó)達(dá)到之前(因?yàn)樗麄兯懔^少),這樣做不是更好嗎?

黃仁勛:我們應(yīng)該總是第一,我們應(yīng)該總是擁有更多。但為了讓你描述的結(jié)果成立,你必須把它推向極端,他們必須沒有算力,如果他們有一些算力,問題是多少是需要的?

他們?cè)谥袊?guó)的算力總量是巨大的,你說的是世界第二大計(jì)算市場(chǎng)。如果他們想?yún)R聚他們的算力,他們有大量的算力可以匯聚。

主持人:但這是真的嗎?有人做估算,說“中芯國(guó)際在工藝節(jié)點(diǎn)上實(shí)際上是落后的。”

黃仁勛:他們擁有的能量是驚人的,對(duì)不對(duì)?AI是一個(gè)并行計(jì)算問題,不是嗎?為什么他們不能因?yàn)槟茉磶缀跏敲赓M(fèi)的,就把4倍、10倍的芯片放在一起?他們有那么多能源,他們有完全空置、已通電的數(shù)據(jù)中心。你知道他們有鬼城,他們也有鬼數(shù)據(jù)中心,他們有如此多的基礎(chǔ)設(shè)施容量,如果他們想,他們只需把更多的芯片組合起來,即使是7nm的。

他們制造芯片的能力是世界上最大的之一,半導(dǎo)體行業(yè)知道他們?cè)趬艛嘀髁餍酒?。他們產(chǎn)能過剩,產(chǎn)能太多,所以,認(rèn)為中國(guó)將無法擁有AI芯片的想法完全是胡說八道。

當(dāng)然,如果你問我,如果全世界根本沒有算力,美國(guó)會(huì)不會(huì)更領(lǐng)先?但這不是一個(gè)結(jié)果,這不是一個(gè)真實(shí)的場(chǎng)景,他們已經(jīng)擁有大量的算力。你所擔(dān)心的那個(gè)門檻,他們已經(jīng)達(dá)到了,甚至超過了。

所以我認(rèn)為你誤解了,AI是一個(gè)五層蛋糕,最底層是能源。當(dāng)你擁有充足的能源時(shí),它可以彌補(bǔ)芯片的不足。如果你擁有充足的芯片,它可以彌補(bǔ)能源的不足。例如,美國(guó)能源稀缺,這就是為什么英偉達(dá)必須不斷推進(jìn)我們的架構(gòu),進(jìn)行這種極端協(xié)同設(shè)計(jì),以便用我們運(yùn)出的少量芯片——因?yàn)槟茉捶浅S邢蕖覀兊拿客咄掏铝扛叩秒x譜。

但是,如果你的瓦特?cái)?shù)量完全充足,是免費(fèi)的,你還會(huì)在乎每瓦性能嗎?你會(huì)有很多。你可以用舊芯片來做。所以7nm芯片本質(zhì)上就是Hopper,Hopper的能力……我得告訴你,今天的模型大部分是在Hopper、Hopper這一代上訓(xùn)練的,所以7nm芯片完全夠用,能源的充足是他們的優(yōu)勢(shì)。

主持人:但問題在于他們是否能實(shí)際制造出足夠的芯片。

黃仁勛:但他們能,證據(jù)是什么?華為剛剛經(jīng)歷了公司歷史上最好的一年。

主持人:他們運(yùn)出了多少芯片?

黃仁勛:很多,數(shù)百萬,數(shù)百萬比Anthropic擁有的多得多。

主持人:?jiǎn)栴}在于中芯國(guó)際能生產(chǎn)多少邏輯芯片,以及能生產(chǎn)多少內(nèi)存。

黃仁勛:我告訴你實(shí)際情況。他們有充足的邏輯芯片,也有充足的HBM2內(nèi)存。

主持人:對(duì)。但如你所知,訓(xùn)練和推理這些模型的瓶頸通常是帶寬,所以如果你用的是HBM2……我不記得具體數(shù)字,但與你最新的產(chǎn)品相比,內(nèi)存帶寬可能存在幾乎一個(gè)數(shù)量級(jí)的差異,這影響巨大。

黃仁勛:華為是一家網(wǎng)絡(luò)公司。

主持人:但這并不能改變你需要EUV來制造最先進(jìn)HBM的事實(shí)。

黃仁勛:不對(duì),完全不對(duì)。他們可以把它們組合在一起,就像我們用NVL72做的那樣,他們已經(jīng)展示了硅光子技術(shù),可以將所有這些算力連接成一個(gè)巨大的超級(jí)計(jì)算機(jī),你的前提是錯(cuò)誤的。

事實(shí)是,他們的AI發(fā)展進(jìn)展順利,世界上最優(yōu)秀的AI研究人員,因?yàn)樗懔τ邢?,他們也提出了極其聰明的算法。記住,我剛才說摩爾定律每年大約進(jìn)步25%。然而,通過偉大的計(jì)算機(jī)科學(xué),我們?nèi)匀豢梢詫⑺惴ㄐ阅芴岣?0倍。我的意思是,偉大的計(jì)算機(jī)科學(xué)才是杠桿所在。

毫無疑問,MoE是一個(gè)偉大的發(fā)明,毫無疑問,所有令人難以置信的注意力機(jī)制都減少了計(jì)算量。我們必須承認(rèn),AI的大部分進(jìn)步來自算法進(jìn)步,而不僅僅是原始硬件。現(xiàn)在,如果大多數(shù)進(jìn)步來自算法、計(jì)算機(jī)科學(xué)和編程,那么告訴我,他們那支AI研究人員大軍難道不是他們的根本優(yōu)勢(shì)嗎?我們看到了,DeepSeek不是一個(gè)無足輕重的進(jìn)步,DeepSeek首先在華為上發(fā)布的那一天,對(duì)我們國(guó)家來說是一個(gè)可怕的結(jié)果。

主持人:為什么?因?yàn)楝F(xiàn)在你可以有一個(gè)像DeepSeek這樣的模型,如果它是開源的,可以在任何加速器上運(yùn)行,為什么未來這種情況會(huì)改變?

黃仁勛:假設(shè)它不會(huì)改變,假設(shè)它是為華為優(yōu)化的,是為他們的架構(gòu)優(yōu)化的,那將使我們的架構(gòu)處于劣勢(shì)。你描述了一個(gè)我認(rèn)為是好消息的情況。一家公司開發(fā)了軟件,開發(fā)了一個(gè)AI模型,并且它在美國(guó)技術(shù)棧上運(yùn)行得最好,我認(rèn)為那是好消息,你把它設(shè)定為壞消息的前提。我來告訴你壞消息:如果世界各地的AI模型都是在非美國(guó)硬件上開發(fā)并運(yùn)行得最好,那對(duì)我們來說才是壞消息。

主持人:我想我只是沒看到證據(jù)表明存在巨大的差異會(huì)阻止你切換加速器,美國(guó)的實(shí)驗(yàn)室正在所有云平臺(tái)上、所有不同的加速器上運(yùn)行他們的模型。

黃仁勛:我就是證據(jù),你拿一個(gè)為英偉達(dá)優(yōu)化的模型,然后嘗試在別的上面運(yùn)行。

主持人:但美國(guó)的實(shí)驗(yàn)室確實(shí)這么做。

黃仁勛:但它們運(yùn)行得并不更好,英偉達(dá)的成功就是完美的證據(jù),AI模型是在我們的技術(shù)棧上創(chuàng)建的,在我們的技術(shù)棧上運(yùn)行得最好,這難道不合邏輯嗎?

主持人:Anthropic的模型在GPU上運(yùn)行,也在Trainium上運(yùn)行,在TPU上運(yùn)行。

黃仁勛:需要做很多工作才能改變,但看看全球南方,看看中東,開箱即用,如果所有的AI模型都在別人的技術(shù)棧上運(yùn)行得最好,你此刻必須是在主張一個(gè)荒謬的說法,說這對(duì)美國(guó)是好事。

主持人:假設(shè)中國(guó)公司先達(dá)到下一個(gè)Mythos,他們首先在美國(guó)軟件中發(fā)現(xiàn)所有安全漏洞,但他們可以在英偉達(dá)硬件上做到這一點(diǎn),并將其輸出到全球南方,他們?cè)谟ミ_(dá)硬件上做,那怎么是好事?

黃仁勛:那不是好事,所以我們不要讓這種事發(fā)生。

主持人:你為什么認(rèn)為它是完全可以替代的,如果你不向他們運(yùn)送算力,它就會(huì)被華為完全替代?他們是落后的,對(duì)吧?他們的芯片比你的差。

黃仁勛:現(xiàn)在就有證據(jù),他們的芯片產(chǎn)業(yè)巨大。

主持人:你可以直接比較H200和華為910C之間的FLOPs、帶寬或內(nèi)存,大概是二分之一到三分之一。

黃仁勛:他們用更多數(shù)量,他們用兩倍的數(shù)量。

主持人:你的論點(diǎn)似乎是,他們有這么多隨時(shí)可用的能源,對(duì)吧?他們需要芯片來填充它。

黃仁勛:而且他們擅長(zhǎng)制造。

主持人:我相信最終他們將能夠超越所有人進(jìn)行制造,但在這關(guān)鍵的幾年里。

黃仁勛:你說的關(guān)鍵幾年是什么?

主持人:未來幾年,我們將擁有能夠進(jìn)行所有網(wǎng)絡(luò)攻擊的模型。

黃仁勛:既然如此,如果未來幾年是關(guān)鍵,那么我們必須確保在這關(guān)鍵的幾年里,世界上所有的AI模型都建立在美國(guó)技術(shù)棧上。

主持人:如果它們建立在美國(guó)技術(shù)棧上,那怎么能阻止它們,如果它們擁有更先進(jìn)的能力,發(fā)動(dòng)相當(dāng)于Mythos的網(wǎng)絡(luò)攻擊呢?

黃仁勛:無論哪種方式都無法保證。

主持人:但如果你早點(diǎn)擁有它,我們可以做好準(zhǔn)備。

黃仁勛:為什么讓AI行業(yè)的一層失去整個(gè)市場(chǎng),以便另一層受益?有五層,每一層都必須成功。最需要成功的一層實(shí)際上是AI應(yīng)用層,你為什么如此執(zhí)著于那個(gè)AI模型?那一家公司?出于什么原因?

主持人:因?yàn)檫@些模型使得這些極其強(qiáng)大的攻擊能力成為可能,并且你需要算力來運(yùn)行它們。

黃仁勛:是能源、芯片和AI研究人員的生態(tài)系統(tǒng)使之成為可能。

主持人:好吧,退一步說,中國(guó)必須能夠建立足夠的7nm產(chǎn)能,記住,他們?nèi)匀煌A粼?nm,而你將推進(jìn)到3nm,然后是2nm或1.6nm,通過Feynman。所以當(dāng)你在1.6nm時(shí),他們?nèi)詫⒃?nm,他們必須生產(chǎn)足夠的芯片來彌補(bǔ)差距。他們有如此多的能源,你給他們的芯片越多,他們擁有的算力就越多。所以問題歸結(jié)為,最終他們獲得了更多的算力,算力是訓(xùn)練和推理的輸入——

黃仁勛:我只是覺得你在說絕對(duì)的話,我認(rèn)為美國(guó)應(yīng)該領(lǐng)先,美國(guó)的算力是世界其他地區(qū)總和的100倍。

英偉達(dá)制造最先進(jìn)的技術(shù),我們確保美國(guó)實(shí)驗(yàn)室最先聽到消息,并有最先購(gòu)買的機(jī)會(huì),如果他們錢不夠,我們甚至投資他們。美國(guó)應(yīng)該領(lǐng)先,我們想做一切可能的事來確保美國(guó)領(lǐng)先,我們正在竭盡所能做到這一點(diǎn)。

主持人:但如果他們受限于算力,向中國(guó)運(yùn)送芯片怎么能讓美國(guó)保持領(lǐng)先?

黃仁勛:不,我們有給美國(guó)的Vera Rubin,現(xiàn)在,我算不算在美國(guó)?你認(rèn)為我是美國(guó)的一部分嗎?

主持人:是的。

黃仁勛:你認(rèn)為英偉達(dá)是一家美國(guó)公司嗎?第一,為什么我們不想出一個(gè)更平衡的法規(guī),讓英偉達(dá)能夠在全球獲勝,而不是放棄全球市場(chǎng)?你為什么想讓美國(guó)放棄全球市場(chǎng)?

芯片產(chǎn)業(yè)是美國(guó)生態(tài)系統(tǒng)的一部分,它是美國(guó)技術(shù)領(lǐng)先地位的一部分,它是AI生態(tài)系統(tǒng)的一部分,它是AI領(lǐng)先地位的一部分,為什么你的政策、你的理念會(huì)導(dǎo)致美國(guó)放棄世界市場(chǎng)的巨大份額?

主持人:我想這里的主張是……Dario有一句引言,他說這就像波音吹噓我們向朝鮮出售核彈,但導(dǎo)彈外殼是波音制造的。這在某種程度上是在支持美國(guó)的技術(shù)棧,本質(zhì)上,你在給他們這種能力。

黃仁勛:將AI與你剛才提到的任何東西相比,都是瘋狂的。

主持人:但AI類似于濃縮鈾,對(duì)吧?它可以有正面用途,也可以有負(fù)面用途,我們?nèi)匀徊幌氚褲饪s鈾送到其他國(guó)家。

黃仁勛:誰在發(fā)送濃縮鈾?

主持人:這個(gè)類比是,濃縮鈾就像算力。

黃仁勛:這是一個(gè)糟糕的類比。這是一個(gè)不合邏輯的類比。

主持人:但如果這些算力可以運(yùn)行一個(gè)能夠?qū)γ绹?guó)所有軟件進(jìn)行零日漏洞利用的模型,那怎么不是一種武器?

黃仁勛:首先,解決這個(gè)問題的方法是,與研究人員對(duì)話,與中國(guó)對(duì)話,與所有國(guó)家對(duì)話,確保人們不以那種方式使用技術(shù)。

第二點(diǎn),我們還需要確保美國(guó)領(lǐng)先,Vera Rubin、Blackwell在美國(guó)大量供應(yīng),堆積如山。顯然,我們的結(jié)果會(huì)證明這一點(diǎn)。大量供應(yīng),巨量供應(yīng)。我們擁有的算力很棒。我們這里有很棒的AI研究人員,這很好,我們應(yīng)該保持領(lǐng)先。

然而,我們也必須認(rèn)識(shí)到,AI不僅僅是一個(gè)模型,AI是一個(gè)五層蛋糕,AI行業(yè)的每一層都很重要,我們希望美國(guó)在每一層都獲勝,包括芯片層。放棄整個(gè)市場(chǎng)不會(huì)讓美國(guó)長(zhǎng)期在技術(shù)競(jìng)賽中贏得芯片層、贏得計(jì)算棧,這是一個(gè)事實(shí)。

主持人:我想問題的關(guān)鍵在于,現(xiàn)在向他們出售芯片如何幫助我們?cè)陂L(zhǎng)期獲勝?特斯拉長(zhǎng)期以來向中國(guó)銷售極好的電動(dòng)汽車。iPhone在中國(guó)銷售,極好。它們并沒有導(dǎo)致他們被鎖定,中國(guó)仍然會(huì)制造他們自己的電動(dòng)車版本,并且他們正在主導(dǎo)市場(chǎng),他們的智能手機(jī)正在主導(dǎo)市場(chǎng)。

黃仁勛:我們今天開始對(duì)話時(shí),你承認(rèn)英偉達(dá)的地位非常不同。你用了“護(hù)城河”這樣的詞,對(duì)我們公司來說,最重要的事情是我們生態(tài)系統(tǒng)的豐富性,這關(guān)乎開發(fā)者,50%的AI開發(fā)者在中國(guó),美國(guó)不應(yīng)該放棄這一點(diǎn)。

主持人:但我們?cè)诿绹?guó)有很多英偉達(dá)開發(fā)者,這并不妨礙美國(guó)實(shí)驗(yàn)室未來也能夠使用其他加速器。事實(shí)上,他們現(xiàn)在也在使用其他加速器,這沒問題,很好。我不明白為什么在中國(guó)情況會(huì)不同,如果你向他們出售英偉達(dá)芯片,就像谷歌可以使用TPU和英偉達(dá)一樣。

黃仁勛:我們必須不斷創(chuàng)新,而且你可能知道,我們的份額在增長(zhǎng),而不是在減少。即使我們?cè)谥袊?guó)競(jìng)爭(zhēng),我們也會(huì)失去那個(gè)市場(chǎng)的這個(gè)前提……你不是在和一個(gè)醒來就是輸家的人說話,這種失敗者的態(tài)度,失敗者的前提,對(duì)我來說毫無意義。

我們不是汽車,我今天可以買這個(gè)品牌的車,明天用另一個(gè)品牌的車,很容易。計(jì)算不是這樣的,x86交易的存在是有原因的,ARM如此粘性是有原因的。這些生態(tài)系統(tǒng)難以替代,需要花費(fèi)大量的時(shí)間和精力,大多數(shù)人不想這樣做。所以我們的工作是繼續(xù)培育這個(gè)生態(tài)系統(tǒng),不斷推進(jìn)技術(shù),以便我們能夠在市場(chǎng)競(jìng)爭(zhēng)。

基于你描述的前提放棄一個(gè)市場(chǎng),我根本無法認(rèn)同,這毫無意義。因?yàn)槲也徽J(rèn)為美國(guó)是輸家,我們的行業(yè)不是輸家,那種失敗的主張,那種失敗者的心態(tài),對(duì)我來說毫無意義。

主持人:我的想法在于不是存在某個(gè)算力的關(guān)鍵閾值,而是任何邊際算力都是有幫助的,所以如果你有更多算力,你就可以訓(xùn)練更好的模型。

黃仁勛:而我只是想讓你承認(rèn),對(duì)美國(guó)技術(shù)產(chǎn)業(yè)來說,任何邊際銷售都是有益的。

主持人:如果運(yùn)行在這些芯片上的AI模型具備網(wǎng)絡(luò)攻擊能力,或者這些芯片正在訓(xùn)練具有網(wǎng)絡(luò)能力的模型并運(yùn)行更多這些模型的實(shí)例,它不是核武器,但它促成了一種武器。

黃仁勛:你使用的邏輯,你大可以對(duì)微處理器和DRAM說同樣的話,你大可以對(duì)電力說同樣的話。

主持人:但事實(shí)上,我們確實(shí)對(duì)制造最先進(jìn)DRAM的相關(guān)技術(shù)實(shí)行出口管制。我們對(duì)所有種類的芯片制造材料都有針對(duì)中國(guó)的出口管制。

黃仁勛:我們向中國(guó)出售大量的DRAM和CPU,我認(rèn)為這是正確的。

主持人:我想這又回到了根本問題:AI是否不同?如果你擁有那種能在軟件中找到零日漏洞的技術(shù),這是否是我們希望盡量減少中國(guó)率先達(dá)到、廣泛部署的能力?

黃仁勛:我們希望美國(guó)領(lǐng)先。我們可以控制這一點(diǎn)。

主持人:如果芯片已經(jīng)在那里,他們正在用它們訓(xùn)練那個(gè)模型,我們?nèi)绾慰刂疲?/strong>

黃仁勛:我們有大量的算力,我們有大量的AI研究人員,我們正在盡可能快地競(jìng)賽。

主持人:再說一次,我們擁有的核武器比任何人都多,但我們不想把濃縮鈾送到任何地方。

黃仁勛:我們不是濃縮鈾,我們是一個(gè)芯片,而且是一個(gè)他們自己能制造的芯片。

主持人:但他們向你購(gòu)買是有原因的。我們有中國(guó)公司創(chuàng)始人的引述,說他們受限于算力。

黃仁勛:因?yàn)槲覀兊男酒?,總體而言,我們的芯片更好,這是毫無疑問的。如果沒有我們的芯片……你能承認(rèn)華為度過了創(chuàng)紀(jì)錄的一年嗎?你能承認(rèn)一大批芯片公司已經(jīng)上市了嗎?你能承認(rèn)嗎?

你能否也承認(rèn),我們?cè)?jīng)在那個(gè)市場(chǎng)占有非常大的份額,而現(xiàn)在我們不再擁有那么大的份額?我們還可以承認(rèn),中國(guó)大約占世界科技產(chǎn)業(yè)的40%。為美國(guó)科技產(chǎn)業(yè)放棄那個(gè)市場(chǎng),是對(duì)我們國(guó)家的傷害,這是對(duì)我們國(guó)家安全的傷害,這是對(duì)我們技術(shù)領(lǐng)先地位的傷害,這一切只為了一個(gè)公司的利益,這對(duì)我來說毫無意義。

主持人:我想我有點(diǎn)困惑,感覺你在做兩種不同的陳述,一是,如果我們被允許競(jìng)爭(zhēng),我們將在與華為的競(jìng)爭(zhēng)中獲勝,因?yàn)槲覀兊男酒瑫?huì)好得多。二是,無論如何,沒有我們,他們也會(huì)做同樣的事情。這兩者怎么能同時(shí)為真呢?

黃仁勛:這顯然是真的,在沒有更好選擇的情況下,你會(huì)接受你唯一的選擇,這怎么不合邏輯了?這太合邏輯了。

主持人:他們想要英偉達(dá)芯片的原因是它們更好,更好意味著更多算力,更多算力意味著你可以訓(xùn)練更好的模型。

黃仁勛:不,只是更好。更好是因?yàn)樗菀拙幊蹋覀冇懈玫纳鷳B(tài)系統(tǒng),但無論更好是什么……當(dāng)然我們會(huì)給他們算力,那又怎樣?事實(shí)是,我們得到了好處。別忘了,我們得到了美國(guó)技術(shù)領(lǐng)先地位的好處。我們得到了開發(fā)者在美國(guó)技術(shù)棧上工作的好處。我們得到了好處,隨著那些AI模型擴(kuò)散到世界其他地方,美國(guó)技術(shù)棧因此成為最佳選擇,我們可以繼續(xù)推進(jìn)和擴(kuò)散美國(guó)技術(shù),我相信這是積極的,這是美國(guó)技術(shù)領(lǐng)先地位非常重要的一部分。

現(xiàn)在,你所倡導(dǎo)的政策導(dǎo)致了美國(guó)電信行業(yè)基本上被政策排擠出世界,以至于我們不再控制自己的電信,我不認(rèn)為那是明智的,這有點(diǎn)狹隘,并導(dǎo)致了意想不到的后果,我此刻正在向你描述的這些后果,你似乎很難理解。

主持人:好吧,似乎關(guān)鍵是有一個(gè)潛在的收益和一個(gè)潛在的成本。我們想弄清楚的是,收益是否值得成本,我想讓你承認(rèn)這個(gè)潛在的成本。算力是訓(xùn)練強(qiáng)大模型的輸入,強(qiáng)大的模型確實(shí)具有強(qiáng)大的攻擊能力,比如網(wǎng)絡(luò)攻擊。美國(guó)公司先達(dá)到Mythos級(jí)別的能力是件好事,然后他們現(xiàn)在會(huì)暫時(shí)保留這些能力,以便美國(guó)公司和美國(guó)政府能夠在那樣的能力被宣布之前,讓他們的軟件得到更好的保護(hù)。

如果中國(guó)擁有更多算力或更多匯聚的算力,如果他們能夠更早地制造出Mythos級(jí)別的模型并廣泛部署,那將是非常糟糕的。這之所以沒有發(fā)生,原因之一是我們有更多的算力,這要感謝像英偉達(dá)這樣的美國(guó)公司。這是將其運(yùn)送到中國(guó)的成本。那么,讓我們暫時(shí)把收益放在一邊。你承認(rèn)這是一個(gè)潛在的成本嗎?

黃仁勛:我也會(huì)告訴你,潛在的成本是,我們讓AI棧中最重要的層之一,芯片層,放棄了整個(gè)市場(chǎng)——世界第二大市場(chǎng)——以便他們能夠發(fā)展規(guī)模,發(fā)展自己的生態(tài)系統(tǒng),以便未來的AI模型以與美國(guó)技術(shù)棧截然不同的方式得到優(yōu)化。隨著AI擴(kuò)散到世界其他地方,他們的標(biāo)準(zhǔn)、他們的技術(shù)棧將變得比我們的優(yōu)越,因?yàn)樗麄兊哪P褪情_放的。

主持人:我想我只是足夠相信英偉達(dá)的內(nèi)核工程師和CUDA工程師,認(rèn)為他們可以優(yōu)化——

黃仁勛:AI不僅僅是內(nèi)核優(yōu)化,你知道的。

主持人:當(dāng)然,但你可以做很多事情,從蒸餾到一個(gè)非常適合你芯片的模型。

黃仁勛:我們會(huì)盡最大努力。

主持人:你們擁有完整的軟件生態(tài),即便中國(guó)暫時(shí)有更好的開源模型,行業(yè)也不會(huì)長(zhǎng)期鎖定在中國(guó)生態(tài)上。

黃仁勛:事實(shí)上中國(guó)是世界上開源軟件的最大貢獻(xiàn)者、中國(guó)是世界上開放模型的最大貢獻(xiàn)者,今天它建立在美國(guó)技術(shù)棧上,英偉達(dá)的技術(shù)棧上。

AI技術(shù)棧的所有五層都很重要,美國(guó)應(yīng)該去贏得全部五層。它們都很重要,當(dāng)然,最重要的一層是AI應(yīng)用層,那個(gè)擴(kuò)散到社會(huì)中、使用最多的層將從這場(chǎng)工業(yè)革命中受益最多。但我的觀點(diǎn)是,每一層都必須成功。

如果我們嚇唬這個(gè)國(guó)家,讓人民認(rèn)為AI是某種核彈,以至于每個(gè)人都討厭AI,每個(gè)人都害怕AI,我不知道你如何幫助美國(guó),你在幫倒忙。如果我們因?yàn)锳I會(huì)扼殺所有軟件工程工作而嚇跑所有人不去做軟件工程——結(jié)果我們沒有軟件工程師——我們?cè)趲兔绹?guó)的倒忙。

如果我們因?yàn)橛?jì)算機(jī)視覺完全免費(fèi),沒有AI會(huì)比放射科醫(yī)生做得更差,而嚇跑所有人不去做放射科,以至于沒人想當(dāng)放射科醫(yī)生,我們就是從根本上混淆了工作和任務(wù)的區(qū)別。放射科醫(yī)生的工作是患者護(hù)理,任務(wù)是讀片。如果我們?nèi)绱松羁痰卣`解這一點(diǎn),嚇跑所有人不去上放射科學(xué)校,我們就會(huì)沒有足夠的放射科醫(yī)生,也就沒有足夠好的醫(yī)療保健。

所以我在論證,當(dāng)你提出一個(gè)如此極端的前提時(shí),一切從零變成無窮大,我們最終以一種不真實(shí)的方式嚇到了人們。生活不是那樣的。我們希望美國(guó)是第一嗎?當(dāng)然,我們需要在那個(gè)技術(shù)棧的每一層都成為領(lǐng)導(dǎo)者嗎?當(dāng)然需要。今天你在談?wù)揗ythos,因?yàn)镸ythos很重要,當(dāng)然,那很棒。

但幾年后,我向你做出預(yù)測(cè),當(dāng)我們希望美國(guó)技術(shù)棧,希望美國(guó)技術(shù)擴(kuò)散到世界各地——到印度、到中東、到非洲、到東南亞——當(dāng)我們的國(guó)家希望出口,因?yàn)槲覀兿M隹谖覀兊募夹g(shù),我們希望出口我們的標(biāo)準(zhǔn)時(shí),在那一天,我希望你和我能再次進(jìn)行同樣的對(duì)話。我會(huì)準(zhǔn)確地告訴你今天對(duì)話的內(nèi)容,你的政策和你的想象如何毫無充分理由地導(dǎo)致美國(guó)放棄了世界第二大市場(chǎng)。

我們不應(yīng)該放棄它,如果我們輸了,那就輸了,但我們?yōu)槭裁匆艞??現(xiàn)在沒有人主張全有或全無,沒有人主張全有或全無,意味著我們隨時(shí)向中國(guó)運(yùn)送一切,沒有人主張那樣。我們應(yīng)該始終把最好的技術(shù)留在這里,我們應(yīng)該始終把最多的技術(shù)留在這里,并且最先得到。但我們也應(yīng)該努力在全球競(jìng)爭(zhēng)和取勝,這兩件事可以同時(shí)發(fā)生。這需要一些細(xì)微差別,一些成熟度,而不是絕對(duì)化。世界不是絕對(duì)化的。

主持人:好的,論點(diǎn)取決于這一點(diǎn)。他們構(gòu)建了針對(duì)他們幾年后能制造的最好芯片進(jìn)行優(yōu)化的模型,這些芯片被出口到世界各地,這就設(shè)定了標(biāo)準(zhǔn)。由于EUV出口管制,如我們所說,你將推進(jìn)到1.6nm。幾年后,他們?nèi)詫⑼A粼?nm。

從國(guó)內(nèi)來看,他們可能會(huì)傾向于,“我們有這么多能源,可以大規(guī)模制造。我們?nèi)詫⑹褂?nm。”但在出口方面,他們的7nm芯片必須與你們的1.6nm芯片競(jìng)爭(zhēng)。他們的模型必須對(duì)7nm進(jìn)行如此深入的優(yōu)化,以至于在他們的7nm上運(yùn)行他們的模型比在你們的1.6nm上運(yùn)行他們的模型更好。

黃仁勛:那我們看看事實(shí)好嗎?Blackwell的光刻技術(shù)比Hopper先進(jìn)50倍嗎?是50倍嗎?差遠(yuǎn)了,我一遍又一遍地說,摩爾定律已死,從Hopper到Blackwell,僅就晶體管本身而言,姑且說是75%,相差三年,75%,Blackwell是Hopper的50倍。

我的觀點(diǎn)是,架構(gòu)很重要,計(jì)算機(jī)科學(xué)很重要,半導(dǎo)體物理也很重要,但計(jì)算機(jī)科學(xué)很重要。AI的影響主要來自計(jì)算棧,這就是為什么CUDA如此有效,為什么CUDA如此受喜愛。它是一個(gè)生態(tài)系統(tǒng),一個(gè)計(jì)算架構(gòu),允許如此大的靈活性,以至于如果你想完全改變一個(gè)架構(gòu)——?jiǎng)?chuàng)造出像MoE這樣的東西,像擴(kuò)散模型這樣的東西,解耦的東西——你都可以做到,很容易做到。

所以,事實(shí)是,AI關(guān)乎上層的軟件棧,正如它關(guān)乎底層的架構(gòu)一樣。就我們擁有針對(duì)我們技術(shù)棧、我們生態(tài)系統(tǒng)進(jìn)行優(yōu)化的架構(gòu)和軟件棧而言,這顯然是有利的,因?yàn)槲覀兘裉扉_始對(duì)話時(shí)就談到了英偉達(dá)的生態(tài)系統(tǒng)有多么豐富。為什么人們總是喜歡首先為CUDA編程?他們確實(shí)如此,他們確實(shí)如此,中國(guó)的研究人員也是如此。

但是,如果我們被迫離開中國(guó),首先,這是一個(gè)政策錯(cuò)誤,顯然它會(huì)產(chǎn)生反作用,它對(duì)美國(guó)產(chǎn)生了不利影響,推動(dòng)并加速了他們的芯片產(chǎn)業(yè),它迫使他們所有的AI生態(tài)系統(tǒng)專注于他們內(nèi)部的架構(gòu)?,F(xiàn)在還不算太晚,但無論如何,這已經(jīng)發(fā)生了。

你將看到,在未來,他們顯然不會(huì)停留在7nm。他們擅長(zhǎng)制造。他們將從7nm繼續(xù)前進(jìn)。那么,5nm和7nm之間有10倍的差距嗎?答案是否定的,架構(gòu)很重要,網(wǎng)絡(luò)很重要。這就是為什么英偉達(dá)收購(gòu)了Mellanox。網(wǎng)絡(luò)很重要,能源很重要,所有這些都很重要,不像你試圖簡(jiǎn)化的那樣簡(jiǎn)單。

十四、英偉達(dá)不會(huì)輕易回到舊工藝節(jié)點(diǎn),但極端情況下會(huì)考慮

主持人:我們之前討論了臺(tái)積電、內(nèi)存等方面的瓶頸。那么,如果我們處于這樣一個(gè)世界,你已經(jīng)占據(jù)了N3節(jié)點(diǎn)的大部分產(chǎn)能——在某個(gè)時(shí)候你會(huì)進(jìn)入N2節(jié)點(diǎn),并成為那里的產(chǎn)能主力——你是否認(rèn)為你可以回到N7,利用較舊工藝節(jié)點(diǎn)的閑置產(chǎn)能,并說:“AI的需求如此之大,而我們擴(kuò)展前沿節(jié)點(diǎn)的能力無法滿足它,所以我們要制造一個(gè)Hopper或Ampere,但用上我們今天所知道的關(guān)于數(shù)值格式的一切以及你描述的所有其他改進(jìn)”?你認(rèn)為這種情況會(huì)在2030年之前發(fā)生嗎?

黃仁勛:沒有必要,原因是,每一代架構(gòu)不僅僅是晶體管尺寸,你做了大量的工程、封裝和堆疊,還有數(shù)值格式和系統(tǒng)架構(gòu)。

當(dāng)你產(chǎn)能耗盡時(shí),想輕易回到另一個(gè)節(jié)點(diǎn)……那種研發(fā)水平?jīng)]人負(fù)擔(dān)得起。我們能夠負(fù)擔(dān)得起向前邁進(jìn),我不認(rèn)為我們能負(fù)擔(dān)得起回頭,現(xiàn)在,如果世界只是說……如果有一天,我們做個(gè)思想實(shí)驗(yàn),那天我們意識(shí)到,“聽著,我們?cè)僖膊粫?huì)有更多產(chǎn)能了?!?我會(huì)回頭使用7nm嗎?毫不猶豫,我當(dāng)然會(huì)。

主持人:我交談過的一個(gè)人有一個(gè)問題:為什么英偉達(dá)不同時(shí)運(yùn)行多個(gè)不同架構(gòu)的芯片項(xiàng)目?你可以做類似Cerebras那樣的晶圓級(jí)集成,你可以做類似Dojo那樣的巨大封裝,你可以做一個(gè)沒有CUDA的。你有資源和工程人才并行做所有這些,那么,考慮到AI和架構(gòu)可能走向何方,為什么把所有的雞蛋放在一個(gè)籃子里?

黃仁勛:哦,我們可以。只是我們沒有更好的主意,我們可以做所有那些事情,只是它們不是更好的選擇。我們?cè)谀M器里模擬了所有,結(jié)果證明更差,所以我們不會(huì)做,我們正在做的正是我們想做的項(xiàng)目。如果工作負(fù)載發(fā)生巨大變化——我不是指算法,我指的是實(shí)際的工作負(fù)載,這取決于市場(chǎng)的形態(tài)——我們可能會(huì)決定增加其他加速器。

例如,最近我們?cè)黾恿薌roq,我們將把Groq整合到我們的CUDA生態(tài)系統(tǒng)中。我們現(xiàn)在這樣做,是因?yàn)閠oken的價(jià)值已經(jīng)變得如此之高,以至于可以對(duì)token進(jìn)行不同的定價(jià)。在過去,就在幾年前,token要么免費(fèi),要么幾乎不貴。但現(xiàn)在你可以有不同的客戶,這些客戶想要不同的答案,因?yàn)榭蛻糍嵙诉@么多錢——例如,我們的軟件工程師——如果我能給他們響應(yīng)更快的token,讓他們比現(xiàn)在更高效,我愿意為此付費(fèi)。

但這個(gè)市場(chǎng)只是最近才出現(xiàn),所以我認(rèn)為我們現(xiàn)在有能力根據(jù)響應(yīng)時(shí)間對(duì)同一個(gè)模型進(jìn)行不同的細(xì)分。這就是為什么我們決定擴(kuò)展帕累托前沿,創(chuàng)建一個(gè)響應(yīng)時(shí)間更快的推理細(xì)分市場(chǎng),即使其吞吐量較低。直到現(xiàn)在,更高的吞吐量總是更好的。我們認(rèn)為可能存在一個(gè)世界,其中有非常高ASP的token,即使工廠的吞吐量較低,ASP也能彌補(bǔ)。

這就是我們這樣做的原因,否則,從架構(gòu)的角度來看,如果我有更多的錢,我會(huì)把更多的錢投在英偉達(dá)的架構(gòu)后面。

主持人:我認(rèn)為這種極其昂貴的token以及推理市場(chǎng)的解耦想法非常有趣。

黃仁勛:它的細(xì)分市場(chǎng)。

十五、即使沒有深度學(xué)習(xí)革命,英偉達(dá)的加速計(jì)算使命依然能使其成為大公司

主持人:假設(shè)深度學(xué)習(xí)革命沒有發(fā)生,英偉達(dá)會(huì)做什么?

黃仁勛:加速計(jì)算,我們一直在做的事情。我們公司的前提是,摩爾定律將會(huì)……通用計(jì)算對(duì)很多事情有好處,但對(duì)很多計(jì)算來說并不理想。

所以我們結(jié)合了一種叫做GPU的架構(gòu),CUDA,和一個(gè)CPU,這樣我們可以加速CPU的工作負(fù)載。不同的代碼內(nèi)核或算法可以卸載到我們的GPU上。因此,你將一個(gè)應(yīng)用程序加速100倍、200倍。哪里可以用到?顯然是工程、科學(xué)和物理、數(shù)據(jù)處理、計(jì)算機(jī)圖形、圖像生成,各種領(lǐng)域。即使今天沒有AI,英偉達(dá)也會(huì)非常非常大。

原因很根本,那就是通用計(jì)算繼續(xù)擴(kuò)展的能力基本上已經(jīng)到頭了。而唯一的辦法……不是唯一的辦法,但辦法之一是通過特定領(lǐng)域的加速。我們開始的一個(gè)領(lǐng)域是計(jì)算機(jī)圖形,但還有許多其他領(lǐng)域,各種都有。粒子物理和流體、結(jié)構(gòu)化數(shù)據(jù)處理,所有不同類型、能從CUDA中受益的算法。

我們的使命確實(shí)是,將加速計(jì)算帶給世界,并推進(jìn)通用計(jì)算無法完成的各種應(yīng)用,并將其擴(kuò)展到能夠幫助突破某些科學(xué)領(lǐng)域的能力水平。早期的一些應(yīng)用是分子動(dòng)力學(xué)、能源勘探的地震處理、當(dāng)然還有圖像處理,所有這些通用計(jì)算效率太低而無法勝任的領(lǐng)域。

如果沒有AI,我會(huì)非常難過。但是,由于我們?cè)谟?jì)算方面取得的進(jìn)步,我們民主化了深度學(xué)習(xí)。我們讓任何地方的研究人員、科學(xué)家、學(xué)生都能使用一臺(tái)PC或一塊GeForce擴(kuò)展卡來做了不起的科學(xué),那個(gè)基本承諾沒有改變,一點(diǎn)都沒有。

如果你看GTC大會(huì),有整個(gè)開頭部分,沒有一個(gè)是關(guān)于AI的。整個(gè)部分,比如計(jì)算光刻,或者我們的量子化學(xué)工作,數(shù)據(jù)處理工作,所有這些東西都與AI無關(guān)。它們?nèi)匀环浅V匾N抑繟I非常有趣且令人興奮,但也有很多人正在做大量非常重要的、與AI無關(guān)的工作,張量并不是你計(jì)算的唯一方式,我們希望幫助每個(gè)人。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
長(zhǎng)安汽車朱華榮:將戰(zhàn)略性整合阿維塔和深藍(lán)汽車

長(zhǎng)安汽車朱華榮:將戰(zhàn)略性整合阿維塔和深藍(lán)汽車

IT之家
2026-04-21 16:29:26
上海3歲男童被虐致死案一審宣判:被告人被判死緩!男童媽媽:昨晚一直在回憶孩子被打畫面 必須要讓所有傷害他的人得到懲罰

上海3歲男童被虐致死案一審宣判:被告人被判死緩!男童媽媽:昨晚一直在回憶孩子被打畫面 必須要讓所有傷害他的人得到懲罰

閃電新聞
2026-04-21 11:09:03
朱珠四段感情經(jīng)歷,前任皆是大人物,37歲選擇嫁給普通人

朱珠四段感情經(jīng)歷,前任皆是大人物,37歲選擇嫁給普通人

孤城落日
2026-04-20 12:23:04
雷軍突然爆粗,人設(shè)崩塌大反轉(zhuǎn)!

雷軍突然爆粗,人設(shè)崩塌大反轉(zhuǎn)!

小蜜情感說
2026-04-21 12:06:45
紫檀博物館員工曝真相!遲重瑞陳麗華相處:對(duì)外遲總、對(duì)內(nèi)遲叔

紫檀博物館員工曝真相!遲重瑞陳麗華相處:對(duì)外遲總、對(duì)內(nèi)遲叔

匹夫來搞笑
2026-04-21 16:22:22
四川一車主因在臨時(shí)占道停車場(chǎng)累計(jì)停車2411次,拖欠停車費(fèi)13268元,長(zhǎng)期拒不繳納,被法院判決全額支付欠款,并承擔(dān)逾期利息

四川一車主因在臨時(shí)占道停車場(chǎng)累計(jì)停車2411次,拖欠停車費(fèi)13268元,長(zhǎng)期拒不繳納,被法院判決全額支付欠款,并承擔(dān)逾期利息

瀟湘晨報(bào)
2026-04-21 15:19:11
山東乳山銀灘“195平米復(fù)式房”1萬元起拍,已有多人競(jìng)價(jià),拍賣公司:產(chǎn)證面積97.94平米,另有贈(zèng)送面積,非法拍可隨時(shí)過戶

山東乳山銀灘“195平米復(fù)式房”1萬元起拍,已有多人競(jìng)價(jià),拍賣公司:產(chǎn)證面積97.94平米,另有贈(zèng)送面積,非法拍可隨時(shí)過戶

極目新聞
2026-04-19 14:06:31
中國(guó)駐日使館:村田脫崗遠(yuǎn)赴東京犯案,所屬部隊(duì)難道毫無察覺?

中國(guó)駐日使館:村田脫崗遠(yuǎn)赴東京犯案,所屬部隊(duì)難道毫無察覺?

南方都市報(bào)
2026-04-21 17:58:00
最新:我海軍剛通過橫當(dāng)水道,日本2架軍機(jī)從兩個(gè)方向飛了過來

最新:我海軍剛通過橫當(dāng)水道,日本2架軍機(jī)從兩個(gè)方向飛了過來

消失的電波
2026-04-21 17:21:58
19歲女孩挪用1700萬當(dāng)“榜一大姐”,賬號(hào)被扒出,是王俊凱鐵粉

19歲女孩挪用1700萬當(dāng)“榜一大姐”,賬號(hào)被扒出,是王俊凱鐵粉

180視角
2026-04-21 11:48:40
反轉(zhuǎn)來了,伊朗向印度油船開炮,事態(tài)急劇升級(jí),特朗普或登機(jī)離國(guó)

反轉(zhuǎn)來了,伊朗向印度油船開炮,事態(tài)急劇升級(jí),特朗普或登機(jī)離國(guó)

健身狂人
2026-04-21 04:32:56
存儲(chǔ)器漲價(jià),工信部將出手

存儲(chǔ)器漲價(jià),工信部將出手

小蜜情感說
2026-04-21 17:23:54
炸穿臺(tái)灣政壇!蔣友松強(qiáng)行遷走兩蔣懸棺,半世紀(jì)漂泊終要?dú)w鄉(xiāng)

炸穿臺(tái)灣政壇!蔣友松強(qiáng)行遷走兩蔣懸棺,半世紀(jì)漂泊終要?dú)w鄉(xiāng)

陳漎侃故事
2026-04-14 17:28:18
孫子只跟我睡不跟媽媽睡,我以為是幸福,后來才知道是禍!

孫子只跟我睡不跟媽媽睡,我以為是幸福,后來才知道是禍!

熱心市民小黃
2026-04-21 16:34:59
溫州未來十年格局已定,這四個(gè)地方將決定城市的上限

溫州未來十年格局已定,這四個(gè)地方將決定城市的上限

娛樂圈見解說
2026-04-21 16:40:40
執(zhí)掌蘋果15年后,庫(kù)克決定把蘋果交給一個(gè)純理工男

執(zhí)掌蘋果15年后,庫(kù)克決定把蘋果交給一個(gè)純理工男

差評(píng)XPIN
2026-04-21 15:19:43
男人只要不沉迷于色欲,就不會(huì)對(duì)女人精蟲上腦,從而對(duì)女人祛魅

男人只要不沉迷于色欲,就不會(huì)對(duì)女人精蟲上腦,從而對(duì)女人祛魅

加油丁小文
2026-04-18 13:30:08
郭德綱發(fā)文,德云社再變動(dòng),釋放3個(gè)強(qiáng)烈信號(hào),岳云鵬地位又變了

郭德綱發(fā)文,德云社再變動(dòng),釋放3個(gè)強(qiáng)烈信號(hào),岳云鵬地位又變了

阿纂看事
2026-04-20 16:35:53
晚年李銀橋坦露:毛主席對(duì)粟裕的評(píng)價(jià),我再不說以后都沒人知道

晚年李銀橋坦露:毛主席對(duì)粟裕的評(píng)價(jià),我再不說以后都沒人知道

浩渺青史
2026-04-21 17:01:57
汽柴油近6年最大下降,92,95汽油下跌超0.44元/升,今晚12時(shí)調(diào)價(jià)

汽柴油近6年最大下降,92,95汽油下跌超0.44元/升,今晚12時(shí)調(diào)價(jià)

豬友巴巴
2026-04-21 17:45:03
2026-04-21 18:40:49
芯東西 incentive-icons
芯東西
專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2287文章數(shù) 8153關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋果CEO

頭條要聞

男子買"隨用隨取"保險(xiǎn)后得知百歲才能取本金 法院判了

頭條要聞

男子買"隨用隨取"保險(xiǎn)后得知百歲才能取本金 法院判了

體育要聞

62歲,成為中國(guó)足壇最火的人

娛樂要聞

周潤(rùn)發(fā)時(shí)隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財(cái)經(jīng)要聞

現(xiàn)實(shí)是最大的荒誕:千億平臺(tái)的沖突始末

汽車要聞

全新坦克700正式上市 售價(jià)42.8萬-50.8萬元

態(tài)度原創(chuàng)

本地
房產(chǎn)
手機(jī)
數(shù)碼
軍事航空

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

房產(chǎn)要聞

年薪40-50萬!海南地產(chǎn)圈還在猛招人

手機(jī)要聞

一代經(jīng)典星宇橙成絕唱!iPhone 18 Pro四色新鮮出爐:紅色預(yù)定年度爆款

數(shù)碼要聞

浩鑫發(fā)布XPC Barebone DL40N迷你主機(jī):1.35L體積無風(fēng)扇設(shè)計(jì)

軍事要聞

特朗普公開對(duì)伊開戰(zhàn)真正原因

無障礙瀏覽 進(jìn)入關(guān)懷版