国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛最新采訪:談CUDA、TPU、華為和其他

0
分享至

在昨日一個采訪中,Vlogger Dwarkesh Patel向英偉達(dá)CEO Jensen Huang 詢問了關(guān)于 TPU 競爭、英偉達(dá)如何掌控日益緊張的先進(jìn)芯片供應(yīng)鏈、我們是否應(yīng)該向中國出售 AI 芯片、英偉達(dá)為什么不轉(zhuǎn)型為超大規(guī)模數(shù)據(jù)中心、其投資策略等等問題。

以下是我們總結(jié)的的三十個重要觀點:

1、所有產(chǎn)能問題都可以在兩三年內(nèi)輕松解決

2、CPU有點像凱迪拉克,它是一款舒適的巡航車,速度不會太快,每個人都能輕松駕馭;它配備了巡航控制,一切都很簡單。但在很多方面,英偉達(dá)的GPU和加速器就像F1賽車

3、跟Elon Musk吃過飯,但Musk沒有懇求黃仁勛優(yōu)先供貨GPU

4、GPU訂單遵循先來后到原則

5、不喜歡“價高者得”的經(jīng)營方式

6、后悔錯過Anthropic

7、不喜歡挑選贏家進(jìn)行支持,而是雨露均沾,讓他們自由發(fā)展

8、依然不看好ASIC,沒有任何一個ASIC公司有英偉達(dá)可靠

9、和臺積電沒有法律合同

10、今年的Vera Rubin將會非常出色;明年Vera Rubin Ultra將問世;后年,F(xiàn)eynman將橫空出世

11、中國生產(chǎn)了全球60%的主流芯片,甚至更多

12、中國擁有一些世界上最頂尖的計算機科學(xué)家

13、中國擁有全球50%的人工智能研究人員

14、中國不是敵人,他們只是對手

15、中國的計算能力非常龐大,中國是全球第二大計算市場。如果他們想整合計算資源,完全可以滿足需求。

16、中國擁有的能源量驚人,充足的能源是中國的優(yōu)勢

17、如果中國愿意,他們完全可以把更多的芯片集中起來

18、認(rèn)為中國無法制造人工智能芯片的說法完全是無稽之談

19、中國是全球最大的開源軟件貢獻(xiàn)國

20、中國也是全球最大的開放模型貢獻(xiàn)國

21、7nm芯片已經(jīng)足夠好了

22、建立兩個生態(tài)系統(tǒng)——一個只能運行在外國技術(shù)棧上的開源生態(tài)系統(tǒng),另一個是運行在美國技術(shù)棧上的封閉生態(tài)系統(tǒng)——的做法是極其愚蠢的

23、人工智能本質(zhì)上就是一個并行計算問題

24、MoE 是一項偉大的發(fā)明

25、DeepSeek 絕非無關(guān)緊要的進(jìn)步,如果 DeepSeek 先在華為平臺上發(fā)布,那對美國來說將是災(zāi)難性的

26、x86架構(gòu)的存在是有原因的。ARM架構(gòu)如此根深蒂固也是有原因的。這些生態(tài)系統(tǒng)難以替代。這需要耗費大量的時間和精力,而且大多數(shù)人都不愿意這樣做

27、英偉達(dá)在中國份額大幅下降

28、架構(gòu)至關(guān)重要,計算機科學(xué)至關(guān)重要。半導(dǎo)體物理固然重要,但計算機科學(xué)才是重中之重

29、即使人工智能今天尚未出現(xiàn),英偉達(dá)的規(guī)模也會非常龐大

30、如果沒有人工智能,我會非常難過

英偉達(dá)最大的護(hù)城河是其對稀缺供應(yīng)鏈的控制嗎?

Q:我們已經(jīng)看到許多軟件公司的估值暴跌,因為人們預(yù)期人工智能會使軟件商品化。有一種可能過于天真的想法是:你看,英偉達(dá)把GDS2文件發(fā)給臺積電。臺積電制造邏輯芯片,制造交換機芯片,然后將它們與SK海力士、美光和三星生產(chǎn)的HBM內(nèi)存封裝在一起。之后,臺積電將封裝好的芯片發(fā)給臺灣的ODM廠商,由他們組裝成機架。從本質(zhì)上講,英偉達(dá)制造的是其他人制造的軟件,如果軟件商品化了,英偉達(dá)也會商品化嗎?

黃仁勛:最終,總得有某種機制將電子轉(zhuǎn)化為tokens。將電子轉(zhuǎn)化為tokens,并隨著時間的推移提升這些tokens的價值,這很難完全商品化。從電子到tokens的轉(zhuǎn)化是一個不可思議的旅程。制造tokens就像讓一個分子比另一個分子更有價值,讓一個tokens比另一個更有價值。顯然,我們正在實時見證著tokens價值的提升,其中蘊含著大量的藝術(shù)、工程、科學(xué)和發(fā)明創(chuàng)造。這種轉(zhuǎn)化、制造以及所有相關(guān)的科學(xué)原理,我們遠(yuǎn)未被完全理解,這段旅程也遠(yuǎn)未結(jié)束。我懷疑它最終能否實現(xiàn)。

我們當(dāng)然會提高效率。你提出的問題正是我對我們公司的理解。輸入是電子,輸出是tokens。英偉達(dá)位于中間。我們的工作是在必要范圍內(nèi)盡可能少地干預(yù),從而以驚人的能力實現(xiàn)這種轉(zhuǎn)型。我所說的“盡可能少地干預(yù)”,是指任何我不需要親自完成的事情,我都會與其他合作伙伴一起,將其納入我的生態(tài)系統(tǒng)。

如果你看看今天的英偉達(dá),我們可能擁有規(guī)模最大的合作伙伴生態(tài)系統(tǒng),涵蓋供應(yīng)鏈的上下游,包括所有計算機公司、應(yīng)用開發(fā)商和模型構(gòu)建者。人工智能就像一個五層蛋糕,我們的生態(tài)系統(tǒng)遍布所有五個層面。我們盡量少做,但事實證明,我們必須做的那部分工作極其困難。我認(rèn)為這部分工作無法商品化。(We try to do as little as possible, but the part that we have to do, as it turns out, is insanely hard)

事實上,我也不認(rèn)為企業(yè)軟件公司、工具制造商……如今大多數(shù)軟件公司都是工具制造商。當(dāng)然,也有一些公司不是,它們開發(fā)的是工作流程編碼系統(tǒng)。但對很多公司來說,它們確實是工具制造商。例如,Excel 是工具,PowerPoint 是工具,Cadence開發(fā)工具,Synopsys也開發(fā)工具。實際上,我看到的恰恰與人們的看法相反。我認(rèn)為代理的數(shù)量和工具用戶的數(shù)量都將呈指數(shù)級增長。所有這些工具的實例數(shù)量很可能會激增。

Synopsys Design Compiler的實例數(shù)量很可能會激增,使用平面規(guī)劃器、布局工具和設(shè)計規(guī)則檢查器的代理數(shù)量也會隨之大幅增長。如今,我們受限于工程師的數(shù)量。未來,這些工程師將得到大量agent的支持。我們將以前所未有的方式探索設(shè)計空間,并繼續(xù)使用我們今天使用的工具。

我認(rèn)為工具的使用將推動軟件公司蓬勃發(fā)展。之所以目前還沒有出現(xiàn)這種情況,是因為agents還不擅長使用這些工具。要么這些公司會自行開發(fā)代理商,要么agents會變得足夠熟練,能夠使用這些工具。我認(rèn)為最終會是兩者的結(jié)合。

Q:在你們最新的文件中,你們與代工廠、內(nèi)存和封裝廠商簽訂了近1000億美元的采購承諾。SemiAnalysis報道稱,你們這類采購承諾的總額將達(dá)到2500億美元。一種解讀是,英偉達(dá)的護(hù)城河實際上在于你們鎖定了未來幾年這些稀缺組件的供應(yīng)。其他廠商或許擁有加速器,但他們真的能獲得所需的內(nèi)存嗎?他們真的能獲得所需的邏輯芯片嗎?這真的是英偉達(dá)未來幾年最大的護(hù)城河嗎?

黃仁勛:這是我們能做到而別人很難做到的事情之一。我們在上游投入了大量資源。有些是明確的,比如你提到的這些承諾。有些則是隱性的。例如,我們供應(yīng)鏈上的許多上游投資都是由他們進(jìn)行的,因為我曾對各位CEO說:“讓我告訴你們這個行業(yè)將會發(fā)展到多大的規(guī)模,讓我解釋一下原因,讓我和你們一起分析,讓我向你們展示我所看到的?!?/p>

通過與上游各行各業(yè)的CEO們溝通、啟發(fā)和協(xié)調(diào),他們才愿意進(jìn)行投資。為什么他們愿意為我而不是為其他人投資呢?原因在于,他們知道我有能力購買他們的產(chǎn)品,并通過我的下游渠道銷售。事實上,英偉達(dá)的下游供應(yīng)鏈和我們的下游需求都非常龐大,因此他們愿意進(jìn)行上游投資。(As a result of that process of informing, inspiring, and aligning with CEOs of all different industries upstream, they’re willing to make the investments. Why are they willing to make the investments for me and not someone else? The reason for that is because they know that I have the capacity to buy their supply and sell it through my downstream. The fact is that Nvidia’s downstream supply chain and our downstream demand is so large, they’re willing to make the investment upstream.)

如果你看看GTC大會,人們都會驚嘆于它的規(guī)模和參會人員之多。它涵蓋了人工智能領(lǐng)域的方方面面,可謂包羅萬象。他們齊聚一堂,是因為彼此需要交流。我把他們聚集在一起,是為了讓下游企業(yè)了解上游,上游企業(yè)了解下游,讓所有人都能了解人工智能的最新進(jìn)展。更重要的是,他們還能與人工智能領(lǐng)域的專家、正在蓬勃發(fā)展的人工智能初創(chuàng)公司以及所有令人驚嘆的成果見面,親眼見證我所講述的一切。我花費大量時間,直接或間接地向我們的供應(yīng)鏈、合作伙伴和生態(tài)系統(tǒng)傳達(dá)我們面前的機遇。

有些人總是說:“Jensen,大多數(shù)主題演講都是一個接一個的公告?!钡覀兊闹黝}演講總會有一部分內(nèi)容讓人感覺有點“折磨”,因為它幾乎像是在進(jìn)行教育。事實上,這正是我所關(guān)注的。我需要確保整個供應(yīng)鏈,從上到下,整個生態(tài)系統(tǒng),都了解即將發(fā)生的事情,它為什么會發(fā)生,何時發(fā)生,規(guī)模有多大,并且能夠像我一樣系統(tǒng)地思考和分析它。

關(guān)于您所描述的護(hù)城河,我們有能力為未來做好準(zhǔn)備。如果未來幾年我們的規(guī)模達(dá)到萬億美元,我們擁有相應(yīng)的供應(yīng)鏈。如果沒有我們的影響力,我們業(yè)務(wù)的發(fā)展速度……就像現(xiàn)金流、供應(yīng)鏈和客戶流失一樣,如果業(yè)務(wù)流失率很低,沒有人會為一個架構(gòu)構(gòu)建供應(yīng)鏈。我們之所以能夠維持如此龐大的規(guī)模,完全是因為下游需求巨大。他們看到了這一點,聽到了相關(guān)信息,預(yù)見到了這一切。這使我們能夠以如此大的規(guī)模去做我們能夠做的事情。

Q:我確實想更具體地了解上游能否跟上步伐。多年來,你們的收入每年都翻一番。你們提供給全球的flops數(shù)每年都增長三倍以上。

黃仁勛:現(xiàn)在以這種規(guī)模翻倍真的太不可思議了。

Q:沒錯。但你再看看邏輯。你是臺積電N3工藝節(jié)點的最大客戶,也是N2工藝節(jié)點的最大客戶之一。今年人工智能整體將占N3工藝節(jié)點的60%,根據(jù)SemiAnalysis的預(yù)測,明年將達(dá)到86%。如果你已經(jīng)占據(jù)了大部分市場份額,如何才能實現(xiàn)翻番?又該如何逐年實現(xiàn)這一目標(biāo)?我們現(xiàn)在是否正處于一個由于上游工藝的限制,人工智能計算增長速度不得不放緩的階段?你認(rèn)為有什么辦法可以解決這個問題?最終,我們?nèi)绾尾拍軐崿F(xiàn)每年兩倍的晶圓廠建設(shè)量?

黃仁勛:在某種程度上,瞬時需求大于全球上下游的供應(yīng)。在任何時刻,我們都可能面臨plumbers數(shù)量不足的限制,而這種情況實際上也時有發(fā)生。

Q:plumbers受邀參加明年的GTC大會。

黃仁勛:順便說一句,這主意不錯。但這只是個好條件。你想要的是一個瞬時需求大于行業(yè)總供給的行業(yè)。反之則顯然不好。如果我們之間的距離太遠(yuǎn),如果某個特定組件的供應(yīng)量太少,整個行業(yè)就會蜂擁而至。例如,你會發(fā)現(xiàn)現(xiàn)在人們很少再談?wù)揅oWoS了。

原因在于,過去兩年我們?nèi)σ愿?,實現(xiàn)了超負(fù)荷的產(chǎn)能擴張。我們連續(xù)數(shù)次加倍,每次都翻倍。現(xiàn)在我認(rèn)為我們形勢相當(dāng)不錯。臺積電現(xiàn)在也意識到,CoWoS的供應(yīng)必須跟上邏輯電路和存儲器的需求。他們正以與邏輯電路相同的速度擴展CoWoS和未來的封裝技術(shù)。這非常棒,因為長期以來,CoWoS和HBM存儲器都屬于小眾技術(shù)。但現(xiàn)在它們不再是小眾技術(shù)了。人們現(xiàn)在意識到它們已經(jīng)成為主流的計算技術(shù)。

當(dāng)然,我們現(xiàn)在更有能力影響供應(yīng)鏈的更大范圍。在人工智能革命之初,我五年前就說過現(xiàn)在我說的這些話。有些人相信它并進(jìn)行了投資,例如Sanjay和美光團(tuán)隊。我仍然清楚地記得那次會議,會上我清楚地闡述了將會發(fā)生什么、為什么會發(fā)生以及今天的預(yù)測。他們確實加倍投入。我們在LPDDR和HBM內(nèi)存領(lǐng)域與他們展開了合作,他們也確實投入了大量資金。這顯然對公司產(chǎn)生了巨大的影響。有些人加入得晚一些,但現(xiàn)在他們都在這里了。

這些瓶頸問題都受到了高度重視?,F(xiàn)在,我們正在提前數(shù)年預(yù)先解決這些瓶頸問題。例如,過去幾年我們對Lumentum 、Coherent以及硅光子生態(tài)系統(tǒng)的投資,真正重塑了供應(yīng)鏈。我們圍繞臺積電構(gòu)建了一條完整的供應(yīng)鏈。我們與他們合作開發(fā)了COUPE 項目,發(fā)明了大量技術(shù),并將這些專利授權(quán)給供應(yīng)鏈,以保持其開放性和高效性。

我們正在通過發(fā)明新技術(shù)、新工作流程、新型測試設(shè)備(例如雙面探針測試)來構(gòu)建供應(yīng)鏈,同時投資于相關(guān)企業(yè)并幫助它們擴大產(chǎn)能??梢钥闯?,我們正努力塑造整個生態(tài)系統(tǒng),使供應(yīng)鏈能夠支持規(guī)?;l(fā)展。

Q:似乎有些瓶頸比其他瓶頸更容易解決。例如,擴展 CoWoS 與其他擴展方式相比。

黃仁勛:順便說一句,我碰到的是難度最高的那一個。

Q:哪個?

黃仁勛:水管工和電工。這就是我對那些描述工作終結(jié)和職業(yè)消亡的末日論者感到擔(dān)憂的原因之一。如果我們勸阻人們成為軟件工程師,我們就會面臨軟件工程師短缺的問題。十年前也出現(xiàn)過同樣的預(yù)測。一些末日論者告誡人們:“無論如何,千萬別當(dāng)放射科醫(yī)生?!蹦憧赡苓€會在網(wǎng)上看到一些這樣的視頻,說放射科醫(yī)生將是第一個消失的職業(yè),世界將不再需要更多的放射科醫(yī)生。猜猜我們現(xiàn)在缺什么?放射科醫(yī)生。

Q:回到之前關(guān)于有些東西可以規(guī)?;a(chǎn),而有些東西卻不行這一點……你究竟如何才能每年生產(chǎn)兩倍的邏輯電路?歸根結(jié)底,存儲器和邏輯電路的瓶頸都在于極紫外光刻(EUV)。你如何才能逐年獲得兩倍的極紫外光刻設(shè)備?

黃仁勛:這些都不是無法快速擴展的。所有這些都可以在兩三年內(nèi)輕松實現(xiàn)。你只需要一個需求信號。一旦你能造出一個,你就能造出十個;一旦你能造出十個,你就能造出一百萬個。這些都不難復(fù)制。

Q:你會追溯到供應(yīng)鏈的哪個環(huán)節(jié)?你會去找ASML說:“嘿,如果我展望三年后,英偉達(dá)的年收入達(dá)到兩萬億美元,我們需要更多的EUV光刻機”嗎?

黃仁勛:有些我必須直接說服,有些需要間接,還有一些……如果我能說服臺積電,ASML也會被說服。我們必須考慮關(guān)鍵的瓶頸。但如果臺積電被說服了,幾年后你們就會有很多EUV光刻機可用了。

我的意思是,所有瓶頸都不會持續(xù)超過兩三年,一個都不會。與此同時,我們的計算效率提高了10倍、20倍,以Hopper到Blackwell為例,甚至提高了30倍到50倍。由于CUDA的靈活性,我們不斷開發(fā)新的算法。我們正在開發(fā)各種新技術(shù),以提高效率,同時提升產(chǎn)能。這些我都不擔(dān)心。真正讓我擔(dān)憂的是下游的問題。那些阻礙能源發(fā)展的能源政策……沒有能源,就無法建立任何產(chǎn)業(yè)。沒有能源,就無法建立一個全新的制造業(yè)。

我們希望重振美國工業(yè)。我們希望恢復(fù)芯片制造、計算機制造和封裝產(chǎn)業(yè)。我們希望研發(fā)電動汽車和機器人等新產(chǎn)品。我們希望建設(shè)人工智能工廠。所有這些都離不開能源,而且這些項目都需要很長時間。增加芯片產(chǎn)能,這需要兩到三年的時間。增加CoWoS產(chǎn)能,也需要兩到三年的時間。

Q:有意思。我感覺有時候客人會跟我說完全相反的話。這種情況下,我確實缺乏相關(guān)的專業(yè)知識來判斷。

黃仁勛:最妙的是,你是在和專家對話。

TPU 能否打破英偉達(dá)在 AI 計算領(lǐng)域的壟斷地位?

Q:我想問問你們的競爭對手。如果你看看TPU ,可以說全球排名前三的模型中,有兩款——Claude和Gemini——都是用TPU訓(xùn)練的。這對英偉達(dá)未來的發(fā)展意味著什么?

黃仁勛:我們打造的是截然不同的東西。英偉達(dá)打造的是加速計算,而不是張量處理單元。加速計算的應(yīng)用范圍非常廣泛:分子動力學(xué)、量子色動力學(xué)、數(shù)據(jù)處理、數(shù)據(jù)幀、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。它也用于流體動力學(xué)和粒子物理學(xué)。此外,我們還將其應(yīng)用于人工智能領(lǐng)域。

加速計算的范疇遠(yuǎn)比這廣泛得多。雖然人工智能是當(dāng)今的熱門話題,而且顯然非常重要且影響深遠(yuǎn),但計算的范疇遠(yuǎn)不止于此。英偉達(dá)徹底革新了計算方式,從通用計算轉(zhuǎn)向加速計算。我們的市場覆蓋范圍遠(yuǎn)遠(yuǎn)超過任何TPU或ASIC芯片所能企及的范圍。從我們的市場地位來看,我們是唯一一家能夠加速所有類型應(yīng)用程序的公司。我們擁有龐大的生態(tài)系統(tǒng)。因此,各種框架和算法都可以在英偉達(dá)平臺上運行。

因為我們的計算機設(shè)計之初就考慮到了由他人操作,所以任何具備操作能力的人都可以購買我們的系統(tǒng)。而大多數(shù)自建系統(tǒng)則需要用戶自行操作,因為它們的設(shè)計初衷并非為了方便他人操作。由于任何人都可以操作我們的系統(tǒng),因此我們的產(chǎn)品已部署在包括 Google、Amazon、Azure 和 OCI 在內(nèi)的所有云平臺上。

如果您想以租賃方式運營,最好擁有一個涵蓋多個行業(yè)的龐大客戶生態(tài)系統(tǒng),以便他們成為承購方。如果您想自行運營,我們當(dāng)然有能力幫助您,就像我們之前為埃隆·馬斯克提供的 xAI 服務(wù)一樣。而且,由于我們能夠賦能任何公司和任何行業(yè)的運營者,您可以利用這項技術(shù)為禮來公司構(gòu)建一臺用于科學(xué)研究和藥物研發(fā)的超級計算機。我們可以幫助他們運營自己的超級計算機,并將其用于我們所加速的各個藥物研發(fā)和生物科學(xué)領(lǐng)域。

我們能夠解決很多TPU無法解決的應(yīng)用問題。英偉達(dá)打造CUDA的目的不僅在于使其成為一個出色的張量處理單元,它還能處理數(shù)據(jù)處理、計算、人工智能等各個生命周期。我們的市場機會更大,覆蓋范圍也更廣。因為我們現(xiàn)在支持全球所有應(yīng)用,所以無論你在哪里構(gòu)建英偉達(dá)系統(tǒng),都無需擔(dān)心找不到客戶。這完全是兩碼事。

Q:這將是一個很長的問題。你們的營收非常驚人,但你們每季度600億美元的收入并非來自制藥和量子計算領(lǐng)域。你們之所以能做到這一點,是因為人工智能是一項前所未有的技術(shù),而且它正以前所未有的速度發(fā)展。

那么問題就變成了:哪種方案最適合人工智能?我不太了解細(xì)節(jié),但我跟我的人工智能研究朋友聊過,他們說:“你看,我用TPU的時候,它是一個大型的脈動陣列,非常適合做矩陣乘法,而GPU則非常靈活。當(dāng)你需要處理大量分支或不規(guī)則的內(nèi)存訪問時,它就非常棒?!?/p>

但人工智能究竟是什么?它不過是不斷重復(fù)進(jìn)行這些非??深A(yù)測的矩陣乘法運算。你無需為線程束調(diào)度器或線程與內(nèi)存庫之間的切換而犧牲任何芯片面積。而且,TPU 針對當(dāng)前計算領(lǐng)域收入增長和應(yīng)用場景的大量需求進(jìn)行了優(yōu)化。我想知道你對此有何看法。

黃仁勛:矩陣乘法是人工智能的重要組成部分,但并非全部。如果你想提出新的注意力機制、以不同的方式進(jìn)行分解,或者發(fā)明一種全新的架構(gòu)——例如混合SSM——你需要一個通用的可編程架構(gòu)。如果你想創(chuàng)建一個融合擴散和自回歸技術(shù)的模型,你同樣需要一個通用的可編程架構(gòu)。我們幾乎可以運行你所能想象的一切。這就是它的優(yōu)勢所在。由于它是一個可編程系統(tǒng),因此可以更輕松地發(fā)明新的算法。

人工智能之所以能如此快速發(fā)展,真正的原因在于其不斷發(fā)明新算法的能力。與其他任何事物一樣,TPU(技術(shù)處理單元)也受到摩爾定律的影響,而摩爾定律的年增長率約為25%。要想真正實現(xiàn)10倍甚至100倍的飛躍,唯一的辦法就是每年從根本上改變算法及其計算方式。

這就是英偉達(dá)的根本優(yōu)勢。我們之所以能讓 Blackwell 的能效比 Hopper 高出50倍,唯一的原因是……當(dāng)初我宣布 Blackwell 的能效將比 Hopper 高出35倍時,沒人相信。后來Dylan寫了篇文章說我故意隱瞞,但實際上能效是 Hopper 的50倍。單憑摩爾定律是無法實現(xiàn)這一點的。我們解決這個問題的方法是采用新的模型,例如MoE(模塊化執(zhí)行單元),這些模型可以并行化、解耦并分布在整個計算系統(tǒng)中。如果沒有能力真正深入研究并利用 CUDA 開發(fā)新的內(nèi)核,這一切都很難做到。

這得益于我們架構(gòu)的可編程性,以及英偉達(dá)作為一家極致的協(xié)同設(shè)計公司的優(yōu)勢。我們甚至可以將部分計算任務(wù)卸載到架構(gòu)本身(例如NVLink )或網(wǎng)絡(luò)(例如Spectrum-X)中。我們可以同時對處理器、系統(tǒng)、架構(gòu)、庫和算法進(jìn)行更改。如果沒有 CUDA,我真不知道該從何入手。

Q:這引出了一個關(guān)于英偉達(dá)客戶群的有趣問題。你們60%的收入都來自五大超大規(guī)模數(shù)據(jù)中心運營商。如果換個時代,面對不同的客戶群體——比如說進(jìn)行實驗的教授——他們需要CUDA。他們無法使用其他加速器。他們只需要用CUDA運行PyTorch ,并且所有功能都得到優(yōu)化。

但這些超大規(guī)模數(shù)據(jù)中心運營商擁有編寫自有內(nèi)核的資源。事實上,為了獲得其特定架構(gòu)所需的最后5% 的性能提升,他們必須這樣做。Anthropic 和 Google 大多運行著自己的加速器,或者使用 TPU 和Trainium 。即使是使用 GPU 的 OpenAI,也使用Triton ,因為他們需要自己的內(nèi)核。甚至在 CUDA C++ 方面,他們也沒有使用cuBLAS和NCCL ,而是擁有自己的技術(shù)棧,該技術(shù)棧還可以編譯到其他加速器上。如果你的大多數(shù)客戶能夠并且確實找到了 CUDA 的替代方案,那么 CUDA 在多大程度上真的能夠推動 Nvidia 平臺上的前沿 AI 應(yīng)用?

黃仁勛:CUDA 擁有豐富的生態(tài)系統(tǒng)。如果您想先在任何計算機上進(jìn)行構(gòu)建,那么首先基于 CUDA 進(jìn)行構(gòu)建是非常明智的選擇。正因為其生態(tài)系統(tǒng)如此豐富,我們才能支持所有框架。如果您想創(chuàng)建自定義內(nèi)核……例如,我們?yōu)?Triton 做出了巨大貢獻(xiàn)。因此,Triton 的后端使用了大量的 Nvidia 技術(shù)。

我們很高興能夠幫助每個框架發(fā)揮其最大潛力??蚣芊N類繁多,例如 Triton、vLLM 、SGLang等等?,F(xiàn)在又涌現(xiàn)出許多新的強化學(xué)習(xí)框架,例如verl和NeMo RL 。隨著訓(xùn)練后處理和強化學(xué)習(xí)的不斷發(fā)展,整個領(lǐng)域正經(jīng)歷著爆炸式增長。因此,如果您想基于某個架構(gòu)進(jìn)行開發(fā),那么基于 CUDA 無疑是最佳選擇,因為 CUDA 的生態(tài)系統(tǒng)非常完善。

你知道,如果出了問題,更有可能出在你的代碼里,而不是底層那堆積如山的代碼里。構(gòu)建這些系統(tǒng)時,別忘了你要處理的代碼量有多大。如果出了問題,是你的問題還是電腦的問題?你肯定希望問題總是出在你身上,并且能夠信任電腦。當(dāng)然,我們自己也存在很多 bug,但我們的系統(tǒng)已經(jīng)過充分測試,至少你可以在這個基礎(chǔ)上繼續(xù)開發(fā)。這就是第一點:生態(tài)系統(tǒng)的豐富性、可編程性和強大功能。

第二點是,如果你是一名開發(fā)者,無論開發(fā)什么軟件,你最看重的就是用戶基數(shù)。你希望你編寫的軟件能夠在大量的其他計算機上運行。你開發(fā)軟件并非僅僅為了自己,而是為了你的服務(wù)器群,或者其他所有人的服務(wù)器群,因為你是一名框架構(gòu)建者。英偉達(dá)的 CUDA 生態(tài)系統(tǒng)最終是其最大的財富。

現(xiàn)在市面上已經(jīng)有數(shù)億個GPU。每個云平臺都配備了GPU。從A10 、A100 、H100 、H200 ,到L系列、P系列等等,種類繁多,尺寸和形狀也各不相同。如果你是一家機器人公司,你肯定希望CUDA協(xié)議棧能夠直接在機器人上運行。我們的產(chǎn)品幾乎無處不在。龐大的用戶群意味著,一旦你開發(fā)出軟件或模型,它就能在任何地方使用。這簡直太有價值了。

最后,我們能夠覆蓋所有云平臺,這使我們真正獨樹一幟。如果您是一家人工智能公司或開發(fā)者,您可能并不確定應(yīng)該與哪家云服務(wù)提供商合作,或者在哪里運行。我們幾乎可以在任何地方運行,如果您愿意,我們也可以為您提供本地部署服務(wù)。豐富的生態(tài)系統(tǒng)、龐大的用戶群以及我們靈活的部署方式,共同造就了 CUDA 的無可比擬的價值。

Q:這很有道理。我好奇的是,這些優(yōu)勢對你的主要客戶來說是否重要。對很多人來說,這些優(yōu)勢可能很重要。能夠構(gòu)建自己軟件棧的那類人貢獻(xiàn)了你的大部分收入。尤其是在人工智能越來越擅長那些具有嚴(yán)格驗證循環(huán)、可以進(jìn)行強化學(xué)習(xí)的領(lǐng)域……如何編寫一個內(nèi)核,使其在規(guī)?;瘧?yīng)用中能夠最高效地處理注意力機制或多層感知器(MLP)?這是一個非常容易驗證的反饋循環(huán)。

所有超大規(guī)模數(shù)據(jù)中心運營商都能自行編寫這些定制內(nèi)核嗎?英偉達(dá)的性價比依然很高,所以他們可能仍然更傾向于使用英偉達(dá)的產(chǎn)品。但問題在于,最終會不會演變成誰能以最低的價格提供最佳的規(guī)格、浮點運算能力和內(nèi)存帶寬?歷史上,英偉達(dá)憑借CUDA的護(hù)城河,在人工智能領(lǐng)域(包括硬件和軟件)一直保持著最高的利潤率,高達(dá)70%。而問題是,如果大多數(shù)客戶能夠負(fù)擔(dān)得起自行構(gòu)建,而不是依賴CUDA的護(hù)城河,英偉達(dá)還能維持這樣的利潤率嗎?

黃仁勛:我們?yōu)檫@些人工智能實驗室配備了數(shù)量驚人的工程師,他們與這些實驗室合作,優(yōu)化他們的技術(shù)棧。原因在于,沒有人比我們更了解我們的架構(gòu)。這些架構(gòu)不像CPU那樣通用。CPU有點像凱迪拉克,它是一款舒適的巡航車,速度不會太快,每個人都能輕松駕馭。它配備了巡航控制,一切都很簡單。但在很多方面,英偉達(dá)的GPU和加速器就像F1賽車。我估計每個人都能以每小時一百英里的速度駕駛它,但要將其性能發(fā)揮到極致,則需要相當(dāng)豐富的專業(yè)知識。我們運用了大量的人工智能技術(shù)來創(chuàng)建我們的內(nèi)核。

我非??隙?,在相當(dāng)長的一段時間內(nèi),我們?nèi)匀粫恍枰?。我們的專業(yè)知識通常能幫助我們的人工智能實驗室合作伙伴輕松地將他們的技術(shù)棧性能提升兩倍。我們完成技術(shù)棧優(yōu)化或特定內(nèi)核優(yōu)化后,他們的模型速度提升三倍、兩倍甚至五成的情況并不少見。這是一個巨大的數(shù)字,尤其考慮到他們龐大的設(shè)備基數(shù),包括他們所有的 Hopper 和 Blackwell 等計算單元。性能提升一倍,收入也會翻倍。這直接轉(zhuǎn)化為實際收益。

英偉達(dá)的計算堆棧是全球性價比最高的,沒有之一。目前世界上沒有任何一個平臺能證明它的性能/總擁有成本比更高。沒有一家公司能做到。事實上,現(xiàn)有的基準(zhǔn)測試,比如Dylan的InferenceMAX ,人人都能用,但沒有任何一家公司能做到……TPU不會推出,Trainium也不會推出。

我鼓勵他們使用 InferenceMAX 來展示他們驚人的推理成本。這真的很難。沒人愿意來。MLPerf 。我倒是很想聽聽 Trainium 展示一下他們一直聲稱的40% 的成本優(yōu)勢。我很想聽聽他們?nèi)绾巫C明 TPU 的成本優(yōu)勢。在我看來,這完全說不通。一點道理都沒有。從根本上來說,這根本說不通。

所以我認(rèn)為我們?nèi)绱顺晒Φ脑蚝芎唵?,就是我們的總體擁有成本 (TCO) 非常低。其次,您提到我們60% 的客戶是前五大企業(yè),但其中大部分業(yè)務(wù)都是外部業(yè)務(wù)。例如,AWS 上的英偉達(dá)產(chǎn)品大部分是為外部客戶而非內(nèi)部用戶提供的。Azure 上的所有客戶也都是外部客戶。OCI 上的所有客戶也都是外部客戶,而非內(nèi)部用戶。他們之所以青睞我們,是因為我們的覆蓋范圍非常廣。我們可以為他們帶來全球所有優(yōu)秀的客戶。這些客戶都基于英偉達(dá)的產(chǎn)品。而所有這些公司之所以都基于英偉達(dá)的產(chǎn)品,正是因為我們覆蓋范圍廣、功能多樣。

所以我認(rèn)為真正的飛輪效應(yīng)在于用戶基數(shù)、我們架構(gòu)的可編程性、我們生態(tài)系統(tǒng)的豐富性,以及全球人工智能公司數(shù)量眾多這一事實?,F(xiàn)在有成千上萬家人工智能公司。如果你是其中一家人工智能初創(chuàng)公司,你會選擇哪種架構(gòu)?你會選擇最普及的架構(gòu)。而我們的架構(gòu)是全球最普及的。你會選擇用戶基數(shù)最大的架構(gòu)。而我們的用戶基數(shù)最大。你還會選擇擁有豐富生態(tài)系統(tǒng)的架構(gòu)。

這就是飛輪效應(yīng)。原因在于:首先,我們的每美元性能如此之高,以至于他們的tokens成本最低。其次,我們的每瓦性能是全球最高的。因此,如果我們的合作伙伴建造了一個1吉瓦的數(shù)據(jù)中心,那么這個1吉瓦的數(shù)據(jù)中心必須能夠產(chǎn)生最大的收益和tokens數(shù)量,這直接轉(zhuǎn)化為收入。您希望它產(chǎn)生盡可能多的代幣,從而最大化數(shù)據(jù)中心的收益。我們擁有全球最高的每瓦代幣產(chǎn)量架構(gòu)。最后,如果您的目標(biāo)是租用基礎(chǔ)設(shè)施,我們擁有全球最多的客戶。這就是飛輪效應(yīng)發(fā)揮作用的原因。

Q:有意思。我想問題的關(guān)鍵在于,實際的市場結(jié)構(gòu)究竟如何?因為即便還有其他公司……原本可能存在成千上萬家人工智能公司,它們大致平分計算資源。但即便通過這五家超大規(guī)模數(shù)據(jù)中心,真正使用亞馬遜計算資源的仍然是 Anthropologie、OpenAI 以及那些有能力且能夠自行部署不同加速器的大型基金會實驗室。

黃仁勛:不,我認(rèn)為你的前提是錯誤的。

Q:也許吧。不過,我想問你一個稍微不同的問題。如果價格、性能、每瓦性能等等這些說法都是真的,那么你認(rèn)為為什么像 Anthropic 這樣的公司會在幾天前宣布他們與 Broadcom 和 Google 達(dá)成了一項數(shù)吉瓦的 TPU 協(xié)議,用于他們的大部分計算呢?

顯然,對谷歌來說,TPU 占據(jù)了大部分計算資源。所以,如果我觀察這些大型人工智能公司,會發(fā)現(xiàn)它們的很多計算資源……曾經(jīng)有一段時間它們都依賴英偉達(dá)的加速器,但現(xiàn)在情況并非如此。因此,我很好奇,如果這些說法在理論上成立,它們?yōu)槭裁磿x擇其他加速器呢?

黃仁勛:Anthropic 是一個特例,而非一種趨勢。如果沒有 Anthropic,TPU 又怎會增長?它完全是 Anthropic 的功勞。如果沒有 Anthropic,Trainium 又怎會增長?它也完全是 Anthropic 的功勞。我認(rèn)為這一點已廣為人知。ASIC 的機會并不多,Anthropic 只有一個。

Q:但OpenAI 與 AMD 達(dá)成了協(xié)議……他們正在打造自己的Titan加速器。

黃仁勛:是的,但我想我們都應(yīng)該承認(rèn),它們很大程度上是英偉達(dá)的產(chǎn)品。我們?nèi)匀粫^續(xù)合作。我不介意其他人使用其他產(chǎn)品或嘗試其他技術(shù)。如果他們不去嘗試,又怎么知道我們的產(chǎn)品有多好呢?有時候,我們需要有人提醒自己這一點。我們必須不斷地努力才能保住現(xiàn)在的地位。

總是有很多夸張的說法??纯从卸嗌貯SIC項目被取消就知道了。就算你打算造ASIC……你還得造出比英偉達(dá)更好的產(chǎn)品。造出比英偉達(dá)更好的產(chǎn)品可沒那么容易。實際上,這根本不現(xiàn)實。英偉達(dá)肯定漏掉了什么,真的。因為我們的規(guī)模和速度,我們是世界上唯一一家每年都能持續(xù)產(chǎn)出新產(chǎn)品的公司。每年都有巨大的飛躍。

Q:我猜他們的邏輯是,“嘿,它不需要更好。它只需要比原來的差不超過70%就行了”,因為他們付給你的是70%的利潤率。

黃仁勛:不,別忘了,即使是ASIC芯片,利潤率也相當(dāng)高。比如說,英偉達(dá)的利潤率是70%。但ASIC芯片的利潤率只有65%。你到底能省多少錢?

Q:哦,你是說博通之類的公司嗎?

黃仁勛:當(dāng)然,總得付錢給別人吧。就我所知,ASIC的利潤率非常高。他們自己也這么認(rèn)為,而且他們對ASIC驚人的利潤率相當(dāng)自豪。

所以,你問了為什么。很久以前,我們確實沒有能力做到這一點。當(dāng)時,我并沒有深刻意識到建立像 OpenAI 和 Anthropic 那樣的基礎(chǔ)性人工智能實驗室有多么困難,也沒有意識到他們需要供應(yīng)商投入巨資。我們當(dāng)時根本無力向 Anthropic 投資數(shù)十億美元,讓他們使用我們的計算資源。但谷歌和 AWS 有。他們一開始就投入了巨資,作為回報,Anthropic 可以使用他們的計算資源。而我們當(dāng)時確實沒有能力做到這一點。

我覺得我的錯誤在于,我沒有真正理解他們其實別無選擇,風(fēng)險投資家絕不會把50億到100億美元投資到一個人工智能實驗室,指望它能像Anthropic那樣成功。所以這是我的失誤。但即便我當(dāng)時理解了這一點,我想我們當(dāng)時也沒有能力這么做。但我不會再犯同樣的錯誤了。

我很高興能投資 OpenAI,也很高興能幫助他們擴大規(guī)模,而且我認(rèn)為這樣做至關(guān)重要。后來,當(dāng) Anthropic 找到我們時,我也很高興能成為他們的投資者,幫助他們擴大規(guī)模。只是當(dāng)時我們力不從心。如果一切可以重來——如果英偉達(dá)當(dāng)時就能達(dá)到現(xiàn)在的規(guī)?!医^對會非常樂意這么做。

為什么英偉達(dá)不成為超大規(guī)模數(shù)據(jù)中心運營商?

Q:這確實很有意思。多年來,英偉達(dá)一直是人工智能領(lǐng)域最賺錢的公司,賺了很多錢?,F(xiàn)在你們開始投資人工智能了。據(jù)報道,你們在OpenAI投資了高達(dá)300億美元,在Anthropic投資了100億美元?,F(xiàn)在它們的估值都提高了,我相信還會繼續(xù)增長。

所以,如果你這些年來一直為他們提供計算資源,并且預(yù)見到它的發(fā)展方向,而幾年前——甚至在某些情況下,一年前——他們的價值只有現(xiàn)在的十分之一,而你又手握大量現(xiàn)金——那么,英偉達(dá)完全可以轉(zhuǎn)型為基金會實驗室,進(jìn)行巨額投資來實現(xiàn)這一目標(biāo),或者更早地以現(xiàn)在的估值完成你現(xiàn)在達(dá)成的這些交易。而且你當(dāng)時也有足夠的資金這樣做。所以我很想知道,為什么你沒有更早地這樣做呢?

黃仁勛:我們盡早完成了這件事。如果可以,我甚至?xí)缛プ?。?dāng)時Anthropic需要我們做這件事的時候,我們卻無能為力。這樣做也不符合我們的本性。

Q:怎么會這樣?是現(xiàn)金交易之類的嗎?

黃仁勛:是的,投資規(guī)模的問題。當(dāng)時我們從未在公司外部投資過,而且投資額也不大。我們當(dāng)時沒意識到需要投資。我一直以為他們可以像其他公司一樣,直接去風(fēng)投那里融資,我的天哪。但他們想做的事情,風(fēng)投是做不到的。OpenAI想做的事情,風(fēng)投是做不到的。我現(xiàn)在明白了。當(dāng)時我并不知道。

但這就是他們的過人之處。這就是他們聰明的原因。他們當(dāng)時意識到自己必須做這樣的事。我很高興他們這么做了。盡管我們導(dǎo)致Anthropic不得不轉(zhuǎn)投他人,但我仍然為此感到高興。Anthropic的存在對世界意義重大。我為此感到欣慰。

Q:我猜你仍然賺了很多錢,而且每個季度都在賺得更多。

黃仁勛:有遺憾也是正常的。

Q:所以問題依然存在。既然我們已經(jīng)到了這里,而且你們也一直在賺這筆錢,那么英偉達(dá)應(yīng)該怎么用呢?一個答案是,現(xiàn)在已經(jīng)出現(xiàn)了一個完整的中間商生態(tài)系統(tǒng),可以將這些實驗室的資本支出轉(zhuǎn)化為運營支出,以便他們能夠租用計算資源。因為芯片非常昂貴,而且由于人工智能模型不斷改進(jìn),它們在其生命周期內(nèi)能帶來巨額利潤。因此,它們創(chuàng)造的價值,也就是它們的代幣,正在不斷增長,但搭建這些系統(tǒng)成本很高。英偉達(dá)有足夠的資金來承擔(dān)這些資本支出。事實上,據(jù)報道,你們?yōu)镃oreWeave項目提供了高達(dá)63億美元的支持,并且已經(jīng)投資了20億美元。

為什么英偉達(dá)不自己做云服務(wù)商?為什么不自己做超大規(guī)模云服務(wù)商,把計算資源出租出去?他們有這么多錢可以這么做。

黃仁勛:這是公司的理念,我認(rèn)為很明智。我們應(yīng)該盡可能少地投入,只做必要的事情。這意味著,如果我們不去構(gòu)建我們的計算平臺,我相信這項工作就無法完成。如果我們不承擔(dān)現(xiàn)在承擔(dān)的風(fēng)險——如果我們不以現(xiàn)在的方式構(gòu)建 NVLink,如果我們不構(gòu)建整個技術(shù)棧,如果我們不以現(xiàn)在的方式創(chuàng)建生態(tài)系統(tǒng),如果我們不投入20年的時間,即使大部分時間都在虧損,也要致力于 CUDA 的發(fā)展——如果我們不去做,其他人就不會去做。

如果我們當(dāng)初沒有創(chuàng)建所有CUDA-X 庫,使它們都針對特定領(lǐng)域……十五年前,我們開始大力開發(fā)領(lǐng)域特定庫,因為我們意識到,如果我們不創(chuàng)建這些領(lǐng)域特定庫,無論是光線追蹤、圖像生成,甚至是早期人工智能的模型,無論是數(shù)據(jù)處理、結(jié)構(gòu)化數(shù)據(jù)處理還是矢量數(shù)據(jù)處理,如果我們不創(chuàng)建它們,就不會有人創(chuàng)建。我對此深信不疑。我們創(chuàng)建了一個名為cuLitho的計算光刻庫。如果我們不創(chuàng)建它,就不會有人創(chuàng)建。因此,如果我們不做這些,加速計算就不會發(fā)展到今天這樣的程度。

所以我們應(yīng)該這樣做。我們應(yīng)該傾盡全力,全心全意地投入到這項工作中。然而,世事難料。如果我不做,也會有人去做。因此,我們公司至今仍然秉持著“盡可能多做,但盡可能少做”(doing as much as needed but as little as possible)的理念。我所做的每一件事,都遵循著這個原則。

就云計算而言,如果我們當(dāng)初不支持CoreWeave ,這些 neoclouds、這些 AI 云就不會存在。如果我們當(dāng)初沒有幫助 CoreWeave 發(fā)展,它們也不會存在。如果我們當(dāng)初沒有支持Nscale ,它們就不會有今天的成就。如果我們當(dāng)初沒有支持Nebius ,它們也不會有今天的成就。如今,它們發(fā)展得非常出色。

這算是一種商業(yè)模式嗎?我們應(yīng)該盡可能多地做事,盡可能少地干預(yù)。所以我們投資于我們的生態(tài)系統(tǒng),因為我希望我們的生態(tài)系統(tǒng)蓬勃發(fā)展。我希望架構(gòu)和人工智能能夠與盡可能多的行業(yè)、盡可能多的國家連接起來,使整個地球能夠基于人工智能和美國的技術(shù)棧而運轉(zhuǎn)。這正是我們正在追求的愿景。

您剛才提到的一點是……有很多非常優(yōu)秀的基金會模式公司,我們盡量投資所有這些公司。這也是我們所做的。我們不挑選贏家。我們需要支持所有公司。這是我們投資的樂趣所在,也是我們業(yè)務(wù)的必要組成部分。但我們也會刻意避免挑選贏家。所以,當(dāng)我投資一家公司時,我也會投資所有相關(guān)的公司。

Q:你為什么刻意不去挑選贏家?

黃仁勛:第一,這不是我們的職責(zé)。第二,英偉達(dá)創(chuàng)立之初,有60家3D圖形公司。我們是唯一一家存活下來的。如果你把這60家圖形公司都列出來,問問自己哪家會成功,英偉達(dá)肯定排在失敗名單的首位。

這事發(fā)生在你很久以前,但英偉達(dá)的圖形架構(gòu)一開始確實是錯的,不是一點點錯,而是我們創(chuàng)造了一個徹頭徹尾的錯誤架構(gòu),開發(fā)者根本無法維護(hù)。它注定失敗。我們當(dāng)初的出發(fā)點是好的,但最終卻得到了錯誤的解決方案。所有人都認(rèn)為我們會失敗。而我們現(xiàn)在卻成功了。

所以我足夠謙遜,能夠認(rèn)識到這一點。不要人為地挑選贏家。要么讓他們各自發(fā)展,要么就幫助他們所有人。

Q:有一點我不明白,你說:“我們優(yōu)先發(fā)展這些NeoCloud項目,并非僅僅因為它們是NeoCloud,我們想扶持它們?!钡阌至信e了一堆NeoCloud項目,說如果沒有NVIDIA,它們根本不會存在。這兩件事怎么能自相矛盾呢?

黃仁勛:首先,他們必須有創(chuàng)業(yè)的意愿,并且主動來尋求我們的幫助。當(dāng)他們有創(chuàng)業(yè)意愿,并且擁有商業(yè)計劃、專業(yè)知識和熱情時……他們顯然也必須具備一定的自身能力。但如果最終他們需要一些投資才能啟動項目,我們也會全力支持。不過,他們越早啟動自己的發(fā)展引擎越好……

你的問題是:“我們是否想涉足融資業(yè)務(wù)?”答案是否定的。融資業(yè)務(wù)已經(jīng)存在,我們更愿意與他們合作,而不是自己成為融資者。我們的目標(biāo)是專注于我們自身的核心業(yè)務(wù),盡可能簡化我們的商業(yè)模式,并支持我們的生態(tài)系統(tǒng)。

像 OpenAI 這樣的公司,在上市前就需要300億美元的投資,而我們深信他們,我也深信他們將會成為……嗯,他們現(xiàn)在就已經(jīng)是一家非凡的公司了。他們將會成為一家了不起的公司。世界需要他們,世界希望他們存在,我也希望他們存在。他們現(xiàn)在順風(fēng)順?biāo)W屛覀冎С炙麄儯屗麄儼l(fā)展壯大。我們會進(jìn)行這些投資,因為他們需要我們這樣做。但我們并非試圖盡可能多地投資,而是試圖盡可能少地干預(yù)。

Q:這可能是一個顯而易見的問題,但我們已經(jīng)在 GPU 短缺的情況下生活了很多年,而且隨著模型性能的提高,這種情況現(xiàn)在變得更加嚴(yán)重了。

黃仁勛:我們?nèi)鄙貵PU。

Q:是的。眾所周知,英偉達(dá)在分配稀缺資源方面并非只看出價,而是會考慮“我們想確保這些新云平臺能夠存在。所以我們給CoreWeave分配一些,給Crusoe分配一些,給Lambda分配一些?!边@對英偉達(dá)有什么好處呢?首先,你是否同意這種將市場分割的說法?

黃仁勛:不,不。你的前提完全錯誤。我們對這些事情非常重視。首先,如果沒有采購訂單,再多的討論也無濟于事。在拿到采購訂單之前,我們能做什么?所以,首要任務(wù)是與所有人密切合作,努力完成預(yù)測,因為這些項目需要很長時間才能建成,數(shù)據(jù)中心的建設(shè)更是如此。我們通過預(yù)測來確保供需平衡等等。明白嗎?這是首要任務(wù)。

第二,我們已盡力與盡可能多的人進(jìn)行預(yù)測,但最終您仍然需要下單?;蛟S由于某種原因,您尚未下單。我能怎么辦?在某些情況下,我們會遵循先到先得的原則。但除此之外,如果您因為數(shù)據(jù)中心尚未準(zhǔn)備就緒,或者某些組件尚未到位而無法搭建數(shù)據(jù)中心,我們可能會優(yōu)先服務(wù)其他客戶。這只是為了最大限度地提高我們工廠的產(chǎn)能。我們可能會對此進(jìn)行一些調(diào)整。

除此之外,優(yōu)先級是先進(jìn)先出。你必須下訂單。如果你不下訂單……當(dāng)然,這方面有很多傳聞。比如,這一切都源于一篇關(guān)于拉里和埃隆和我共進(jìn)晚餐的文章,文章里他們懇求我提供GPU 。這事根本沒發(fā)生過(That never happened)。我們確實一起吃了頓飯。我們確實一起吃了頓飯,而且那是一頓非常棒的晚餐。他們從來沒有懇求我提供GPU。他們只需要下訂單。一旦他們下訂單,我們會盡力滿足他們的產(chǎn)能需求。我們的流程很簡單。

Q:好的。聽起來好像有個排隊機制,然后根據(jù)你的數(shù)據(jù)中心是否準(zhǔn)備就緒以及你何時下訂單,你才能在特定時間獲得資源。但這仍然不像是價高者得。這樣做有什么原因嗎?

黃仁勛:我們從來不那樣做。

Q:為什么不直接選擇價高者得呢?

黃仁勛:因為這是糟糕的商業(yè)做法。你定好價格,然后讓別人決定買不買。我知道芯片行業(yè)的其他公司會在需求旺盛時調(diào)整價格,但我們不會。這從來都不是我們的行事方式。您可以信賴我們。我更愿意做一個可靠的人,成為行業(yè)的基石。您無需猜測。如果我報了價,那就是我們報的價格。就是這樣。如果需求激增,那就順其自然。

Q:另一方面,這就是為什么你和臺積電保持著良好的合作關(guān)系,對吧?

黃仁勛:是的,英偉達(dá)和他們合作已經(jīng)快30年了。英偉達(dá)和臺積電之間沒有正式的法律合同。所以總會有些不公平的待遇。有時候我判斷對,有時候我判斷錯。有時候我能拿到更好的價格,有時候會拿到更差的價格。但總的來說,我們之間的關(guān)系非常棒。我完全信任他們,完全可以依靠他們。

選擇英偉達(dá),有一點可以肯定:今年,Vera Rubin將會非常出色。明年,Vera Rubin Ultra將問世。后年,F(xiàn)eynman將橫空出世。再后年,我還沒公布名字呢。每年,你都可以信賴我們。你得去全世界找找其他 ASIC 團(tuán)隊——隨便挑一個——才能找到一個可以讓你說:“我可以把我的全部家產(chǎn)都押上,我可以把我的整個公司都押上,你們每年都會為我服務(wù)。你們的token成本每年都會下降一個數(shù)量級,我可以像信賴時鐘一樣信賴你們?!保ā癐 can bet the farm, I can bet my entire business that you will be here for me every single year. Your token cost will decrease by an order of magnitude every single year. I can count on it like I can count on the clock.”)

我剛才提到了臺積電。歷史上沒有任何其他代工廠能做到這一點。但如今,你可以這樣評價英偉達(dá)。每年你都可以信賴我們。如果你想購買價值十億美元的AI工廠計算資源,沒問題。如果你想購買價值一億美元的,沒問題。你想購買價值一千萬美元的,或者僅僅是一個機架,都沒問題?;蛘邇H僅是一張顯卡,好的,沒問題。如果你想訂購價值一千億美元的AI工廠,沒問題。我們是當(dāng)今世界上唯一一家可以這樣說的公司。

臺積電的情況也一樣。我想買一臺,買十億臺,都沒問題。我們只需要按部就班地做好規(guī)劃,做所有成熟企業(yè)都會做的事情。所以我認(rèn)為,英偉達(dá)能夠成為全球人工智能產(chǎn)業(yè)的基石,是我們花了二十多年才取得的成就。這需要巨大的投入和奉獻(xiàn)。公司的穩(wěn)定性、公司的持續(xù)發(fā)展,對我們來說至關(guān)重要。

我們應(yīng)該向中國出售人工智能芯片嗎?

Q:好的。我想問問關(guān)于中國的問題。其實我也不知道對向中國出售芯片到底好不好有什么看法,但我喜歡和嘉賓唱反調(diào)。所以,上次達(dá)里奧做客“誰支持出口管制”節(jié)目時,我問他,為什么美國和中國不能都擁有數(shù)據(jù)中心領(lǐng)域的天才人才呢?不過既然你持相反觀點,那我就反過來問你。

換個角度來看,Anthropic Games幾天前發(fā)布了Mythos Preview 。他們甚至沒有公開發(fā)布這款Mythos模型,因為他們說它擁有如此強大的網(wǎng)絡(luò)攻擊能力,在確保所有零日漏洞都被修復(fù)之前,世界還沒有做好準(zhǔn)備。但他們表示,Mythos在所有主流操作系統(tǒng)和瀏覽器中都發(fā)現(xiàn)了數(shù)千個高危漏洞。他們甚至在OpenBSD中也發(fā)現(xiàn)了一個漏洞,而OpenBSD正是專門設(shè)計用來避免零日漏洞的操作系統(tǒng)。他們發(fā)現(xiàn)的這個漏洞已經(jīng)存在了27年。

因此,如果中國能夠獲得人工智能芯片,訓(xùn)練像 Claude Mythos 這樣具有網(wǎng)絡(luò)攻擊能力的模型,并利用更強大的計算能力運行數(shù)百萬個實例,這會構(gòu)成威脅嗎?

黃仁勛:首先,Mythos 的訓(xùn)練所用的計算能力和計算量都相當(dāng)普通,但訓(xùn)練所用的卻是一家非常優(yōu)秀的公司。這種計算能力和計算類型在中國非常普遍。所以你首先需要明白,芯片在中國是存在的。

他們生產(chǎn)了全球60%的主流芯片,甚至可能更多。對他們來說,這是一個非常龐大的產(chǎn)業(yè)。他們擁有一些世界上最頂尖的計算機科學(xué)家。眾所周知,所有這些人工智能實驗室中的大多數(shù)人工智能研究人員都是中國人。他們擁有全球50%的人工智能研究人員。所以問題是,考慮到他們已經(jīng)擁有的所有資源——他們擁有豐富的能源、大量的芯片、以及絕大多數(shù)的人工智能研究人員——如果你擔(dān)心他們,那么創(chuàng)造一個安全世界的最佳方法是什么?

將他們視為受害者,把他們變成敵人,可能并非最佳方案。他們是對手。(Victimizing them, turning them into an enemy, likely isn’t the best answer. They are an adversary.)我們希望美國獲勝。但我認(rèn)為,開展對話和研究性對話或許是最穩(wěn)妥的做法。由于我們目前將中國視為對手的態(tài)度,這方面明顯缺失。我們的人工智能研究人員和他們的人工智能研究人員必須進(jìn)行真正的對話。我們必須努力就人工智能的用途達(dá)成共識。

至于查找軟件漏洞,這當(dāng)然是人工智能的職責(zé)所在。它會在很多軟件中發(fā)現(xiàn)漏洞嗎?當(dāng)然會。軟件漏洞數(shù)不勝數(shù)。人工智能軟件中也存在大量漏洞。這正是人工智能的職責(zé)所在,我很高興人工智能已經(jīng)發(fā)展到能夠幫助我們大幅提高生產(chǎn)力的水平。

網(wǎng)絡(luò)安全、人工智能網(wǎng)絡(luò)安全、人工智能安全、人工智能隱私和人工智能保障等領(lǐng)域的生態(tài)系統(tǒng)非常豐富,但卻常常被忽視。一個龐大的人工智能初創(chuàng)企業(yè)生態(tài)系統(tǒng)正在努力為我們創(chuàng)造這樣的未來:一個功能強大的人工智能代理被成千上萬個其他人工智能代理環(huán)繞,共同守護(hù)著它的安全。這樣的未來必將到來。

讓人工智能代理在無人監(jiān)管的情況下四處運行,這簡直是瘋了。我們非常清楚,這個生態(tài)系統(tǒng)需要蓬勃發(fā)展。事實證明,這個生態(tài)系統(tǒng)需要開源。這個生態(tài)系統(tǒng)需要開放的模型。他們需要開放的技術(shù)棧,這樣所有的人工智能研究人員和優(yōu)秀的計算機科學(xué)家才能構(gòu)建強大且安全的AI系統(tǒng)。因此,我們必須確保開源生態(tài)系統(tǒng)的活力。這一點不容忽視。很多開源項目都來自中國。我們不應(yīng)該扼殺它。

關(guān)于中國,我們當(dāng)然希望美國擁有盡可能多的計算能力。我們受限于能源,但我們已經(jīng)投入大量資源來解決這個問題。我們絕不能讓能源成為國家發(fā)展的瓶頸。但我們也希望確保全世界的人工智能開發(fā)者都基于美國的技術(shù)棧進(jìn)行開發(fā),并將人工智能的貢獻(xiàn)和進(jìn)步——尤其是在開源的情況下——貢獻(xiàn)給美國生態(tài)系統(tǒng)。如果建立兩個生態(tài)系統(tǒng)——一個是只能運行在外國技術(shù)棧上的開源生態(tài)系統(tǒng),另一個是運行在美國技術(shù)棧上的封閉生態(tài)系統(tǒng)——那將是極其愚蠢的。我認(rèn)為這對美國來說將是一個糟糕的結(jié)果。

Q:由于事情很多,我先簡單概括一下。我認(rèn)為,回到黑客攻擊中提到的浮點運算能力差距問題,沒錯,他們的確擁有計算能力,但他們實際能夠生產(chǎn)的浮點運算能力只有美國的十分之一。

那么,他們最終能否訓(xùn)練出像 Mythos 這樣的模型呢?答案是肯定的。但問題在于,由于失敗案例更多,美國實驗室能夠率先達(dá)到這種能力水平。因為 Anthropic 公司搶先一步,他們會說:“好吧,我們先保留一個月,讓所有美國公司都有機會使用。他們會修復(fù)所有漏洞,然后我們再發(fā)布?!?/strong>

此外,即便他們訓(xùn)練出了這樣的模型,大規(guī)模部署的能力也至關(guān)重要……如果一個網(wǎng)絡(luò)黑客擁有上百萬個這樣的模型,那肯定比只有一千個要危險得多。所以推理計算能力真的非常重要。事實上,他們擁有如此多優(yōu)秀的AI研究人員,這才是真正令人擔(dān)憂的地方,因為是什么讓這些工程師研究人員如此高效?答案是計算能力。

如果你和美國的任何一家人工智能實驗室交談,他們都會說瓶頸在于計算能力。無論是DeepSeek的創(chuàng)始人,還是Qwen的領(lǐng)導(dǎo)層,都說過類似的話。他們都認(rèn)為瓶頸在于計算能力。那么問題來了,難道不應(yīng)該讓美國公司憑借更強大的計算能力率先達(dá)到Mythos級別,為我們的社會做好準(zhǔn)備,趕在中國之前,因為中國計算能力較弱,這樣做不是更好嗎?

黃仁勛:我們應(yīng)該永遠(yuǎn)爭第一,永遠(yuǎn)擁有更多。但要讓你描述的結(jié)果成真,就必須走極端。他們必須完全沒有計算能力。如果他們有一些計算能力,問題在于需要多少?

中國的計算能力非常龐大。要知道,中國可是全球第二大計算市場。如果他們想整合計算資源,完全可以滿足需求。

而且,他們擁有的能源量簡直驚人,不是嗎?人工智能本質(zhì)上就是一個并行計算問題,不是嗎?既然能源是免費的,為什么他們不能把芯片的數(shù)量增加4倍、10倍甚至更多呢?他們擁有如此多的能源。他們的數(shù)據(jù)中心空空蕩蕩,電力卻依然充足。你知道他們有“鬼城”,他們的數(shù)據(jù)中心也一樣空置。他們的基礎(chǔ)設(shè)施容量如此龐大。如果他們愿意,他們完全可以把更多的芯片集中起來,哪怕是更落后工藝的芯片

他們的芯片制造能力位居世界前列。半導(dǎo)體行業(yè)都知道他們壟斷了主流芯片市場。他們的產(chǎn)能過剩。因此,認(rèn)為中國無法制造人工智能芯片的說法完全是無稽之談。

當(dāng)然,如果你問我,如果全世界完全沒有計算能力,美國會不會更領(lǐng)先?但這根本不可能。這并非現(xiàn)實。他們現(xiàn)在的計算能力已經(jīng)非常充足了。你所擔(dān)心的那個問題,他們所需的計算能力閾值,他們早已達(dá)到,甚至超過了。

所以我認(rèn)為你誤解了人工智能的本質(zhì),它就像一個五層蛋糕,最底層是能源。能源充足時,芯片就足夠了;芯片充足時,能源就足夠了。例如,美國能源匱乏,這就是為什么英偉達(dá)必須不斷改進(jìn)我們的架構(gòu),并進(jìn)行這種極致的協(xié)同設(shè)計,以便在我們出貨的芯片數(shù)量有限的情況下——因為能源供應(yīng)極其有限——實現(xiàn)每瓦吞吐量的驚人水平。

但如果你的瓦數(shù)完全充足,而且是免費的,你又何必在意每瓦性能呢?你已經(jīng)綽綽有余了。你可以用舊芯片來做。所以7nm芯片本質(zhì)上就是Hopper。Hopper的能力……我必須告訴你,如今的模型大多都是基于Hopper算法訓(xùn)練的,也就是Hopper算法的生成。所以7nm芯片已經(jīng)足夠好了。充足的能源是中國的優(yōu)勢。

Q:但問題在于,他們是否真的能夠生產(chǎn)出足夠的芯片。

黃仁勛:但他們的確做到了。證據(jù)是什么?華為剛剛經(jīng)歷了公司歷史上業(yè)績最好的一年。

Q:最先進(jìn)的HBM一定需要EUV?

黃仁勛:不對。完全不對。你可以把它們組合起來,就像我們把它們和NVL72組合起來一樣。他們已經(jīng)展示了硅光子學(xué)技術(shù),可以將所有這些計算能力連接起來,形成一臺巨型超級計算機。你的前提完全錯誤。

事實上,他們的AI研發(fā)進(jìn)展順利。世界上最頂尖的AI研究人員,由于計算能力有限,反而創(chuàng)造出了極其智能的算法。別忘了,我剛才說過摩爾定律每年大約推進(jìn)25%。然而,憑借卓越的計算機科學(xué),我們?nèi)匀豢梢詫⑺惴ㄐ阅芴嵘?0倍。我的意思是,卓越的計算機科學(xué)才是關(guān)鍵所在。

毫無疑問,MoE 是一項偉大的發(fā)明。毫無疑問,所有令人驚嘆的注意力機制都減少了計算量。我們必須承認(rèn),人工智能的大部分進(jìn)步都源于算法的進(jìn)步,而不僅僅是硬件的改進(jìn)。既然大部分進(jìn)步都來自算法、計算機科學(xué)和編程,那么他們龐大的人工智能研究人員隊伍難道不是他們最根本的優(yōu)勢嗎?我們都看到了這一點。DeepSeek 絕非無關(guān)緊要的進(jìn)步。如果 DeepSeek 先在華為平臺上發(fā)布,那對我們國家來說將是災(zāi)難性的。

Q:為什么會這樣?因為目前像 DeepSeek 這樣的模型,只要是開源的,就可以在任何加速器上運行。為什么將來情況會改變呢?

黃仁勛:假設(shè)并非如此。假設(shè)它是針對華為優(yōu)化的,假設(shè)它是針對他們的架構(gòu)優(yōu)化的。那將使我們處于劣勢。你描述的情況在我看來是好消息。一家公司開發(fā)了一款軟件,開發(fā)了一個人工智能模型,而它在美式技術(shù)棧上運行效果最佳。我認(rèn)為這是好消息。但你卻把它設(shè)定為壞消息?,F(xiàn)在我要告訴你壞消息:世界各地的人工智能模型都是在非美國硬件上開發(fā)的,而它們在非美國硬件上運行效果最佳。這對我們來說是壞消息。

Q:我感覺并沒有證據(jù)表明存在如此巨大的差異,足以阻止你更換加速器。美國實驗室正在所有云平臺、所有不同的加速器上運行他們的模型。

黃仁勛:我就是證據(jù)。你拿一個針對英偉達(dá)顯卡優(yōu)化的模型,然后試圖在其他顯卡上運行它,這是行不通的。

Q:但美國實驗室確實會這樣做。

黃仁勛:它們的運行效果并沒有更好。英偉達(dá)的成功就是最好的證明。人工智能模型是在我們的技術(shù)棧上創(chuàng)建的,在我們的技術(shù)棧上運行效果也最好,這難道不合邏輯嗎?

Q:Anthropic 的模型可以在 GPU 上運行,可以在 Trainium 上運行,也可以在 TPU 上運行。

黃仁勛:要改變現(xiàn)狀,需要付出很多努力。但看看全球南方國家,看看中東地區(qū)。如果所有人工智能模型在別人的技術(shù)棧上運行效果最佳,那么你現(xiàn)在提出的“這對美國來說是件好事”的說法就太荒謬了。

Q:但我不太明白這個論點。假設(shè)中國公司率先開發(fā)出下一代Mythos系統(tǒng)。他們率先發(fā)現(xiàn)了美國軟件的所有安全漏洞,但他們可以在英偉達(dá)硬件上運行,然后把產(chǎn)品運往全球南方國家。他們用英偉達(dá)硬件開發(fā),這有什么好處呢?好吧,它的確能在英偉達(dá)硬件上運行——

黃仁勛:這不好,這不好,我們不能讓它發(fā)生。

Q:你為什么認(rèn)為它(指代英偉達(dá)GPU)是完全可替代的,即使你不向他們供貨,華為也能完全替代?他們落后了,對吧?他們的芯片比你的差。

黃仁勛:完全是這樣……現(xiàn)在就有證據(jù)。他們的芯片產(chǎn)業(yè)規(guī)模龐大。

Q:你只要對比H200和華為910C的浮點運算能力、帶寬或內(nèi)存容量就知道了,它們的性能大概只有前者的一半到三分之一。

黃仁勛:他們用量更多。他們用的量是原來的兩倍。

Q:你的論點似乎是,他們擁有巨大的能源,他們需要用芯片來填充這些能源。

黃仁勛:而且他們很擅長制造業(yè)。

Q:我相信最終他們肯定能在生產(chǎn)能力上勝過所有人。但現(xiàn)在還有這關(guān)鍵的幾年。

黃仁勛:你所說的關(guān)鍵年份是指哪一年?如果未來幾年至關(guān)重要,那么我們必須確保在這關(guān)鍵的幾年里,全世界所有的人工智能模型都建立在美國的技術(shù)棧之上。

人工智能產(chǎn)業(yè)有五個層面,每個層面都必須成功。而最需要成功的層面實際上是人工智能應(yīng)用。你為什么如此執(zhí)著于那個人工智能模型?那家公司?究竟是出于什么原因?

能源、芯片以及人工智能研究人員的生態(tài)系統(tǒng)使這一切成為可能。

Q:如果美國的計算能力存在瓶頸,那么向中國出口芯片又如何能使美國保持領(lǐng)先地位呢?

黃仁勛:我認(rèn)為美國理應(yīng)領(lǐng)先。美國的計算能力是世界其他任何地方的100倍。美國理應(yīng)領(lǐng)先。好吧。美國確實領(lǐng)先。

英偉達(dá)致力于研發(fā)最先進(jìn)的技術(shù)。我們確保美國實驗室能夠第一時間獲悉這些技術(shù),并擁有優(yōu)先購買權(quán)。如果他們資金不足,我們甚至?xí)顿Y扶持他們。美國理應(yīng)領(lǐng)先。我們希望竭盡所能確保美國保持領(lǐng)先地位。這一點您同意嗎?我們正在為此竭盡全力。

你認(rèn)為英偉達(dá)是一家美國公司?好的。首先,為什么我們不制定一個更平衡的監(jiān)管政策,讓英偉達(dá)能夠在全球范圍內(nèi)取得成功,而不是讓美國放棄全球市場?你為什么要讓美國放棄全球市場?

芯片產(chǎn)業(yè)是美國生態(tài)系統(tǒng)的一部分,是美國技術(shù)領(lǐng)先地位的一部分,也是人工智能生態(tài)系統(tǒng)的一部分,更是人工智能領(lǐng)先地位的一部分。為什么你們的政策和理念會導(dǎo)致美國放棄世界市場的大部分份額?

將人工智能與你剛才提到的任何東西相提并論都是荒謬的。

Q:所以關(guān)鍵在于,現(xiàn)在賣芯片對我們長遠(yuǎn)發(fā)展有何幫助?特斯拉長期以來一直向中國銷售性能卓越的電動汽車。iPhone在中國也暢銷,而且質(zhì)量極佳。特斯拉并沒有造成中國市場的壟斷。中國仍然會生產(chǎn)自己的電動汽車,并且占據(jù)主導(dǎo)地位。他們的智能手機也占據(jù)主導(dǎo)地位。

黃仁勛:今天我們開始對話時,您也承認(rèn)英偉達(dá)的處境非常特殊。您用了“護(hù)城河”這樣的詞。對我們公司而言,最重要的就是我們生態(tài)系統(tǒng)的豐富性,而這離不開開發(fā)者。全球50%的人工智能開發(fā)者都在中國。美國不應(yīng)該放棄這塊寶地。

Q:但是我們在美國有很多英偉達(dá)的開發(fā)者,但這并不妨礙美國實驗室未來使用其他加速器。事實上,他們現(xiàn)在就在使用其他加速器,這很好,也很棒。如果你向中國銷售英偉達(dá)芯片,我不明白為什么在中國就不能這樣做,就像谷歌可以使用TPU和英偉達(dá)芯片一樣。

黃仁勛:我們必須不斷創(chuàng)新,而且正如你可能知道的,我們的市場份額正在增長,而不是下降。那種認(rèn)為即使我們在中國競爭,最終也會失去那個市場的想法……你不是在跟一個醒來就覺得自己是個失敗者的人說話。那種失敗者的態(tài)度,那種失敗者的假設(shè),在我看來毫無道理。

我們不是汽車。我們不是汽車。我可以今天買這個牌子的車,明天再買另一個牌子的車,這很容易。但計算機領(lǐng)域并非如此。x86架構(gòu)的存在是有原因的。ARM架構(gòu)如此根深蒂固也是有原因的。這些生態(tài)系統(tǒng)難以替代。這需要耗費大量的時間和精力,而且大多數(shù)人都不愿意這樣做。因此,我們的職責(zé)是繼續(xù)培育這個生態(tài)系統(tǒng),不斷推進(jìn)技術(shù)發(fā)展,從而在市場競爭中保持優(yōu)勢。

如果按照你描述的那種前提來劃分市場,我根本無法接受。這完全說不通。因為我不認(rèn)為美國是失敗者,我們的行業(yè)也不是失敗者。這種失敗論調(diào),這種失敗心態(tài),在我看來毫無道理。

Q:但他們之所以從你這里購買是有原因的。我們有來自中國公司創(chuàng)始人的引述,他們表示公司在計算能力方面遇到了瓶頸。

黃仁勛:因為我們的芯片更好??偟膩碚f,我們的芯片更好。這一點毋庸置疑。如果沒有我們的芯片……您能承認(rèn)華為今年的業(yè)績創(chuàng)下紀(jì)錄嗎?您能承認(rèn)一大批芯片公司都上市了嗎?您能承認(rèn)嗎?

您是否也承認(rèn),我們過去在該市場占據(jù)了很大的份額,而現(xiàn)在份額已經(jīng)大幅下降?我們也可以承認(rèn),中國占據(jù)了全球科技產(chǎn)業(yè)約40%的份額。為了美國科技產(chǎn)業(yè)的利益而放棄這個市場,是對我們國家的損害,是對我們國家安全的損害,也是對我們科技領(lǐng)導(dǎo)地位的損害。這一切僅僅是為了一家公司的利益。這在我看來毫無道理。

Q:我有點糊涂了。感覺你好像在說兩件事。一是如果我們能參與競爭,我們的芯片性能會遠(yuǎn)勝華為,所以我們肯定能贏下這場與華為的競爭。二是就算沒有我們,他們也會做同樣的事情。這兩件事怎么可能同時成立呢?

黃仁勛:這顯然是事實。如果沒有更好的選擇,你只能選擇唯一的選擇。這怎么會不合邏輯呢?這明明很合乎邏輯。

Q:他們想要英偉達(dá)芯片的原因是,英偉達(dá)芯片性能更好。

黃仁勛:是的

Q:更好的模型需要更多的計算資源。更多的計算資源意味著你可以訓(xùn)練出更好的模型。

黃仁勛:不,它就是更好。它更好,因為它更容易編程。我們擁有更好的生態(tài)系統(tǒng)。但無論“更好”指的是什么,無論“更好”指的是什么……當(dāng)然,我們會把計算資源輸送給他們。那又怎樣?事實是我們能從中受益。別忘了,我們能享受到美國技術(shù)領(lǐng)先地位帶來的好處。我們能享受到開發(fā)者們在美國技術(shù)棧上工作的益處。隨著這些人工智能模型擴散到世界各地,我們也能享受到美國技術(shù)棧因此成為最佳選擇帶來的好處。我們可以繼續(xù)推進(jìn)和推廣美國技術(shù)。我認(rèn)為這是一件好事。這是美國技術(shù)領(lǐng)先地位中非常重要的一部分。

現(xiàn)在,你所倡導(dǎo)的政策導(dǎo)致美國電信行業(yè)基本上被排擠出了世界市場,以至于我們甚至無法掌控自己的電信業(yè)務(wù)。我認(rèn)為這并不明智。這種做法有些目光短淺,而且導(dǎo)致了一些意想不到的后果,我現(xiàn)在正在向你描述這些后果,但你似乎很難理解。

Q:好的,我們先退一步。問題的關(guān)鍵似乎在于,這里既有潛在的收益,也有潛在的成本。我們正在努力弄清楚的是,收益是否值得付出成本?我想讓你們意識到潛在的成本。計算是訓(xùn)練強大模型的輸入。強大的模型確實擁有強大的攻擊能力,例如網(wǎng)絡(luò)攻擊。美國公司率先達(dá)到 Mythos 級別的能力是一件好事,現(xiàn)在他們決定暫緩發(fā)布這些能力,以便美國公司和美國政府能夠在正式發(fā)布該級別能力之前,更好地保護(hù)他們的軟件。

如果中國擁有更強大的計算能力或更多的眾包計算資源,如果他們能夠更早地開發(fā)出類似 Mythos 那樣的計算模型并進(jìn)行廣泛部署,那將會非常糟糕。這種情況沒有發(fā)生的原因之一是,由于像英偉達(dá)這樣的美國公司,我們擁有了更強大的計算能力。這是將計算資源轉(zhuǎn)移到中國所要付出的代價。所以,我們暫且不談好處。您是否意識到這是一種潛在的代價?

黃仁勛:我還要告訴你,潛在的代價是,我們允許人工智能技術(shù)棧中最重要的一層——芯片層——拱手讓出整個市場——全球第二大市場——讓他們得以發(fā)展規(guī)模,建立自己的生態(tài)系統(tǒng),從而使未來的人工智能模型以與美國技術(shù)棧截然不同的方式進(jìn)行優(yōu)化。隨著人工智能在全球擴散,他們的標(biāo)準(zhǔn)和技術(shù)棧將會超越我們,因為他們的模型是開放的。

Q:我想我只是對英偉達(dá)的內(nèi)核工程師和CUDA工程師有足夠的信心,相信他們能夠進(jìn)行優(yōu)化——

黃仁勛:如你所知,人工智能不僅僅是內(nèi)核優(yōu)化。

中國是全球最大的開源軟件貢獻(xiàn)國。這是事實。中國也是全球最大的開放模型貢獻(xiàn)國。這是事實。如今,它建立在美國的技術(shù)棧之上,也就是英偉達(dá)的技術(shù)棧。這是事實。

人工智能技術(shù)棧的五個層面都至關(guān)重要。美國應(yīng)該力爭拿下所有五個層面。它們都不可或缺。當(dāng)然,最重要的層面是人工智能應(yīng)用層。這一層會滲透到社會各個角落,被應(yīng)用最為廣泛,也將從這場工業(yè)革命中獲益最多。但我的觀點是,每一層都必須成功。

如果我們嚇唬全國人民,讓他們覺得人工智能就像核彈一樣,讓每個人都憎恨人工智能、害怕人工智能,我不知道這對美國有什么好處。這只會害了美國。如果我們嚇得所有人都不敢從事軟件工程工作,因為人工智能會扼殺所有軟件工程崗位——結(jié)果導(dǎo)致我們一個軟件工程師都沒有——那我們也是在害美國。

如果我們因為計算機視覺完全免費,人工智能的工作能力不會比放射科醫(yī)生差,就嚇跑所有人,讓大家都不想當(dāng)放射科醫(yī)生,那我們就誤解了工作和任務(wù)之間的區(qū)別。放射科醫(yī)生的工作是照護(hù)病人,而任務(wù)是解讀掃描結(jié)果。如果我們對這一點理解如此深刻,嚇跑所有人去讀放射科,那么我們將面臨放射科醫(yī)生短缺和醫(yī)療資源匱乏的問題。

所以我的意思是,當(dāng)你設(shè)定一個如此極端的前提,一切都從零到無窮大,最終只會嚇到人們,而這根本不是事實。生活并非如此。我們希望美國領(lǐng)先嗎?當(dāng)然希望。我們需要在各個層面都保持領(lǐng)先地位嗎?當(dāng)然需要。當(dāng)然需要。今天你談到Mythos,是因為Mythos很重要。沒錯。太好了。

但幾年后,我預(yù)言,當(dāng)我們想要推廣美國技術(shù)體系,當(dāng)我們希望美國技術(shù)走向世界——走向印度、走向中東、走向非洲、走向東南亞——當(dāng)我們的國家想要出口,因為我們想要出口我們的技術(shù),我們想要出口我們的標(biāo)準(zhǔn)時,我希望你我再次進(jìn)行同樣的對話。我會詳細(xì)地告訴你今天的對話,告訴你你的政策和你的設(shè)想是如何導(dǎo)致美國毫無理由地拱手讓出世界第二大市場。

我們不應(yīng)該放棄。如果輸了,那就輸了。但我們?yōu)槭裁匆艞壞??現(xiàn)在沒人主張非此即彼。沒人主張非此即彼,也就是說我們應(yīng)該一直把所有東西都運到中國去。沒人主張那樣。我們應(yīng)該始終擁有最先進(jìn)的技術(shù)。我們應(yīng)該始終擁有最多的技術(shù),并且是第一。但我們也應(yīng)該努力在全球范圍內(nèi)競爭并取得勝利。這兩件事可以同時進(jìn)行。這需要一些細(xì)致入微的思考,一些成熟的態(tài)度,而不是絕對的。世界本來就不是絕對的。

Q:因為受到各種限制(例如拿不到EUV光刻機),中國的芯片真的能出口到世界各地,從而確立行業(yè)標(biāo)準(zhǔn)嗎?

黃仁勛:那我們直接看事實吧?Blackwell的光刻技術(shù)真的比Hopper先進(jìn)50倍嗎?真的有50倍嗎?差遠(yuǎn)了。我一直在重復(fù)這句話:摩爾定律已經(jīng)失效了。從晶體管本身的性能來看,Hopper和Blackwell之間的差距大概是75%。兩者相隔三年,差距高達(dá)75%。Blackwell爾的性能是Hopper的50倍。

我的觀點是,架構(gòu)至關(guān)重要。計算機科學(xué)至關(guān)重要。半導(dǎo)體物理固然重要,但計算機科學(xué)才是重中之重。人工智能的影響很大程度上源于計算棧,這也是CUDA如此高效、如此受人喜愛的原因。它是一個生態(tài)系統(tǒng),一種計算架構(gòu),它提供了極大的靈活性,以至于如果你想徹底改變架構(gòu)——比如創(chuàng)建類似MoE的架構(gòu)、類似擴散的架構(gòu)、或者創(chuàng)建解耦架構(gòu)——你都能做到。這很容易。

所以事實是,人工智能不僅關(guān)乎底層架構(gòu),也關(guān)乎上層技術(shù)棧。如果我們擁有針對自身技術(shù)棧和生態(tài)系統(tǒng)進(jìn)行優(yōu)化的架構(gòu)和軟件棧,那當(dāng)然是好事,因為我們今天一開始就討論了英偉達(dá)生態(tài)系統(tǒng)的豐富性。為什么人們總是喜歡先寫CUDA?確實如此。中國的研究人員也是如此。

但如果我們被迫離開中國,首先,這是一個政策錯誤。顯然,這會引發(fā)強烈反彈。這對美國來說后果很嚴(yán)重。它促進(jìn)了中國的芯片產(chǎn)業(yè)發(fā)展,加速了其人工智能生態(tài)系統(tǒng)的轉(zhuǎn)型升級,迫使其人工智能生態(tài)系統(tǒng)專注于內(nèi)部架構(gòu)。現(xiàn)在亡羊補牢,為時未晚,但事已至此。

未來你會看到,他們顯然不會止步于于此。他們的制造工藝很出色,他們會繼續(xù)在現(xiàn)有及更先進(jìn)的工藝基礎(chǔ)上發(fā)展。先進(jìn)工藝的差距有10倍嗎?答案是否定的。架構(gòu)很重要,網(wǎng)絡(luò)也很重要。這就是英偉達(dá)收購Mellanox的原因。網(wǎng)絡(luò)很重要,能源也很重要。所有這些都很重要。事情并不像你試圖簡化的那樣簡單。

為什么英偉達(dá)不生產(chǎn)多種不同的芯片架構(gòu)?

Q:我們之前討論過臺積電在內(nèi)存等方面的瓶頸問題。

所以,如果我們身處這樣一個世界:你已經(jīng)占據(jù)了N3的大部分份額——而且在某個時候你會進(jìn)入N2時代,并占據(jù)N2的大部分份額——你是否認(rèn)為你可以回到N7時代,也就是利用舊工藝節(jié)點的剩余產(chǎn)能,然后說:“嘿,人工智能的需求如此巨大,而我們擴展前沿技術(shù)的能力卻無法滿足,所以我們要制造一個Hopper或Ampere架構(gòu)的處理器,但要運用我們目前掌握的所有數(shù)值計算知識以及你提到的所有其他改進(jìn)”?你認(rèn)為這種情況會在2030年之前發(fā)生嗎?

黃仁勛:沒必要。原因在于,每一代產(chǎn)品的架構(gòu)都不僅僅局限于晶體管的尺寸。它還涉及到大量的工程設(shè)計、封裝、堆疊、數(shù)值計算和系統(tǒng)架構(gòu)。

當(dāng)產(chǎn)能耗盡時,想要輕易地回到之前的制程節(jié)點……那需要投入大量的研發(fā)資源,誰也負(fù)擔(dān)不起。我們有能力向前發(fā)展,但我認(rèn)為我們負(fù)擔(dān)不起回頭路。現(xiàn)在,假設(shè)有一天,我們突然意識到:“我們再也無法擁有更多的產(chǎn)能了?!蔽視x擇回到7nm制程嗎?當(dāng)然會毫不猶豫地選擇它。

Q:我之前和人討論時,有人問過我一個問題:為什么英偉達(dá)不同時開展多個架構(gòu)完全不同的芯片項目?比如,可以開發(fā)類似Cerebras的晶圓級芯片,也可以開發(fā)類似Dojo 的大型封裝芯片,還可以開發(fā)不使用 CUDA 的芯片。英偉達(dá)擁有足夠的資源和工程人才來并行開發(fā)所有這些芯片。考慮到人工智能和架構(gòu)的未來發(fā)展方向難以預(yù)測,為什么要把所有雞蛋都放在一個籃子里呢?

黃仁勛:哦,我們當(dāng)然可以。只是我們沒有更好的辦法。我們能做所有這些事情,但效果并不理想。我們在模擬器里模擬了所有情況,結(jié)果證明更糟。所以我們不會這么做。我們現(xiàn)在做的正是我們想做的項目。如果工作負(fù)載發(fā)生巨大變化——我指的不是算法,而是工作負(fù)載本身,而這取決于市場格局——我們可能會考慮增加其他加速器。

例如,我們最近新增了Groq ,并且計劃將其整合到我們的 CUDA 生態(tài)系統(tǒng)中。我們現(xiàn)在這樣做是因為token價值飆升,可以采用不同的定價策略。就在幾年前token要么是免費的,要么價格非常低廉。但現(xiàn)在,我們的客戶群體各不相同,他們需要不同的解決方案。因為客戶收入很高——例如我們的軟件工程師——如果我能為他們提供響應(yīng)速度更快的代幣,從而讓他們比現(xiàn)在更高效,我愿意為此付費。

但這個市場是最近才出現(xiàn)的。所以我認(rèn)為我們現(xiàn)在有能力基于響應(yīng)時間,將同一個模型劃分成不同的細(xì)分市場。這就是我們決定擴展帕累托前沿,并創(chuàng)建一個響應(yīng)時間更快、但吞吐量更低的推理細(xì)分市場的原因。在此之前,更高的吞吐量總是更好的。我們認(rèn)為,未來可能會出現(xiàn)平均售價(ASP)非常高的代幣,即使工廠的吞吐量較低,ASP 也能彌補這一點。

這就是我們這么做的原因。但除此之外,從架構(gòu)角度來看,如果我有更多資金,我會加大對英偉達(dá)架構(gòu)的投入。

Q:最后一個問題。假設(shè)深度學(xué)習(xí)革命沒有發(fā)生,英偉達(dá)會做什么?

黃仁勛:加速計算,這和我們一直以來所做的一模一樣。我們公司的理念是摩爾定律將會……通用計算在很多方面都很出色,但對于很多計算任務(wù)來說,它并非理想之選。

因此,我們將一種名為GPU(CUDA)的架構(gòu)與CPU結(jié)合起來,從而加速CPU的工作負(fù)載。不同的代碼內(nèi)核或算法可以卸載到GPU上執(zhí)行。這樣一來,應(yīng)用程序的運行速度就能提升100倍、200倍。這項技術(shù)有哪些應(yīng)用呢?顯然,它適用于工程、科學(xué)、物理、數(shù)據(jù)處理、計算機圖形學(xué)、圖像生成等各個領(lǐng)域。即使人工智能今天尚未出現(xiàn),英偉達(dá)的規(guī)模也會非常龐大。

原因相當(dāng)根本,那就是通用計算的擴展能力已基本達(dá)到極限。而唯一的方法……或者說,實現(xiàn)這一目標(biāo)的方法之一,就是通過領(lǐng)域特定加速。我們最初關(guān)注的領(lǐng)域之一是計算機圖形學(xué),但還有許多其他領(lǐng)域。種類繁多,包括粒子物理和流體動力學(xué)、結(jié)構(gòu)化數(shù)據(jù)處理,以及各種各樣能夠從 CUDA 中受益的算法。

我們的使命是真正將加速計算帶給全世界,推進(jìn)通用計算無法勝任的應(yīng)用,并擴展到足以幫助某些科學(xué)領(lǐng)域取得突破的水平。早期的一些應(yīng)用包括分子動力學(xué)、用于能源勘探的地震數(shù)據(jù)處理、圖像處理等等,所有這些領(lǐng)域通用計算的效率都太低,無法勝任。

如果沒有人工智能,我會非常難過。但正因為我們在計算機領(lǐng)域取得了進(jìn)步,深度學(xué)習(xí)才得以普及。我們讓任何研究人員、任何科學(xué)家、任何學(xué)生,無論身處何地,都能使用個人電腦或GeForce顯卡,開展令人驚嘆的科學(xué)研究。這一根本承諾從未改變,絲毫未變。

如果你看過GTC,就會發(fā)現(xiàn)它最初的部分完全與人工智能無關(guān)。無論是計算光刻、量子化學(xué),還是數(shù)據(jù)處理等等,都與人工智能無關(guān)。而且這些內(nèi)容仍然非常重要。我知道人工智能非常有趣,也很令人興奮,但還有很多人在做著與人工智能無關(guān)的重要工作,張量也不是唯一的計算方法。我們希望能夠幫助到所有人。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
家長擔(dān)心女兒太美,發(fā)明“防早戀”發(fā)型,網(wǎng)友:顏值已經(jīng)很安全了

家長擔(dān)心女兒太美,發(fā)明“防早戀”發(fā)型,網(wǎng)友:顏值已經(jīng)很安全了

蝴蝶花雨話教育
2026-04-10 13:25:02
梅西令人震驚地收購自己的足球俱樂部,官方聲明已發(fā)布

梅西令人震驚地收購自己的足球俱樂部,官方聲明已發(fā)布

綠茵情報局
2026-04-17 01:17:52
歐拉弄不是絕色佳人,卻深受泰王寵愛,受寵程度不輸年輕時的貴妃

歐拉弄不是絕色佳人,卻深受泰王寵愛,受寵程度不輸年輕時的貴妃

小書生吃瓜
2026-04-16 17:34:46
卡馬文加道歉:皇馬更衣室出了什么問題

卡馬文加道歉:皇馬更衣室出了什么問題

熱血體育社
2026-04-17 09:06:38
梅根穿衣翻車!皮膚粗糙3層肚腩醒目,在網(wǎng)飛CEO面前一臉諂媚

梅根穿衣翻車!皮膚粗糙3層肚腩醒目,在網(wǎng)飛CEO面前一臉諂媚

毒舌小紅帽
2026-04-16 18:54:30
上海江蘇跨省“血販鏈條”曝光:400毫升無償獻(xiàn)血證被中介層層倒賣至2000元,獻(xiàn)血者僅拿到400元營養(yǎng)費,中介稱帶病服藥也能獻(xiàn)血

上海江蘇跨省“血販鏈條”曝光:400毫升無償獻(xiàn)血證被中介層層倒賣至2000元,獻(xiàn)血者僅拿到400元營養(yǎng)費,中介稱帶病服藥也能獻(xiàn)血

大風(fēng)新聞
2026-04-16 18:35:07
3千萬畢業(yè)生天崩開局

3千萬畢業(yè)生天崩開局

經(jīng)濟學(xué)教授V
2026-04-15 18:23:37
美軍尋求擴大印尼領(lǐng)空使用權(quán),印尼外交部罕見致函國防部“高度關(guān)切”

美軍尋求擴大印尼領(lǐng)空使用權(quán),印尼外交部罕見致函國防部“高度關(guān)切”

澎湃新聞
2026-04-16 15:24:28
慘敗!6億豪陣啊!輸?shù)锰牧耍∮忠亟耍?>
    </a>
        <h3>
      <a href=籃球盛世
2026-04-16 12:36:36
順峰餐廳北京門店全部關(guān)閉:司法糾紛不斷,消費者上萬儲值打水漂?

順峰餐廳北京門店全部關(guān)閉:司法糾紛不斷,消費者上萬儲值打水漂?

北京商報
2026-04-15 20:03:10
哎呀,見到了真人才知道她真的有多美!比電視上還好看還自然

哎呀,見到了真人才知道她真的有多美!比電視上還好看還自然

喜歡歷史的阿繁
2026-04-16 14:37:01
湖南省原長沙市建設(shè)發(fā)展集團(tuán)有限公司黨委書記、董事長鄧子維接受審查調(diào)查

湖南省原長沙市建設(shè)發(fā)展集團(tuán)有限公司黨委書記、董事長鄧子維接受審查調(diào)查

環(huán)球網(wǎng)資訊
2026-04-16 16:16:53
馬克西31+6助76人戰(zhàn)勝魔術(shù)將對陣綠軍,喬治16+5貝恩34分

馬克西31+6助76人戰(zhàn)勝魔術(shù)將對陣綠軍,喬治16+5貝恩34分

湖人崛起
2026-04-16 10:15:16
時隔3年重返WNBA!韓旭訓(xùn)練營合同簽紐約自由人 多位國手留洋

時隔3年重返WNBA!韓旭訓(xùn)練營合同簽紐約自由人 多位國手留洋

醉臥浮生
2026-04-15 23:58:33
第6艘船出事,美軍艦攔截成功,難題已拋給中國,俄政府準(zhǔn)備救場

第6艘船出事,美軍艦攔截成功,難題已拋給中國,俄政府準(zhǔn)備救場

回京歷史夢
2026-04-16 16:27:26
武大楊某媛曬工作照被認(rèn)出!改名換姓被揭穿,品牌連夜切割跑路

武大楊某媛曬工作照被認(rèn)出!改名換姓被揭穿,品牌連夜切割跑路

番外行
2026-04-17 08:17:05
睡遍好萊塢的種馬影帝:性欲成癮每天與情人交歡,私生子多達(dá)25人

睡遍好萊塢的種馬影帝:性欲成癮每天與情人交歡,私生子多達(dá)25人

錢小刀娛樂
2026-04-15 21:30:57
何潤東拍完《楚漢傳奇》殺青那天,抱著盔甲哭成了淚人

何潤東拍完《楚漢傳奇》殺青那天,抱著盔甲哭成了淚人

小椰的奶奶
2026-04-17 02:57:25
好萊塢風(fēng)流往事:沃倫體力太好,一天數(shù)次求歡,讓麥當(dāng)娜欲罷不能

好萊塢風(fēng)流往事:沃倫體力太好,一天數(shù)次求歡,讓麥當(dāng)娜欲罷不能

錢小刀娛樂
2026-04-15 15:40:52
浙金中心事件最新通報:39人被抓捕,涉案金額高達(dá)229億

浙金中心事件最新通報:39人被抓捕,涉案金額高達(dá)229億

資管裕道人
2026-04-15 21:21:04
2026-04-17 09:27:00
半導(dǎo)體行業(yè)觀察 incentive-icons
半導(dǎo)體行業(yè)觀察
專注觀察全球半導(dǎo)體行業(yè)資訊
13418文章數(shù) 34877關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

古巴國家主席:美國可能對古巴發(fā)動軍事侵略

頭條要聞

古巴國家主席:美國可能對古巴發(fā)動軍事侵略

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

本地
教育
親子
數(shù)碼
健康

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

教育要聞

獨家!2026海淀高三一模五分段排名出爐!預(yù)估本科線是...

親子要聞

6款寶寶營養(yǎng)肉餅合集??補鐵補鈣 鮮嫩多汁

數(shù)碼要聞

MacBook Neo全球爆賣,多個市場蘋果官網(wǎng)發(fā)貨排期已至5月

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進(jìn)入關(guān)懷版