国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌云CEO:自研TPU構(gòu)筑競(jìng)爭(zhēng)護(hù)城河,第八代芯片即將發(fā)布,外部需求已超供給上限

0
分享至

在全球AI實(shí)驗(yàn)室深陷“算力荒”的當(dāng)下,谷歌正憑借超過(guò)十年的自研芯片積累,構(gòu)筑起一道競(jìng)爭(zhēng)對(duì)手難以復(fù)制的結(jié)構(gòu)性護(hù)城河。

谷歌云CEO Thomas Kurian近日在接受專(zhuān)訪(fǎng)時(shí)表示,即將公布的第八代TPU將拆分為專(zhuān)注大規(guī)模訓(xùn)練的v8T與推理優(yōu)化的v8i兩條獨(dú)立產(chǎn)品線(xiàn),單個(gè)訓(xùn)練系統(tǒng)可容納兩個(gè)Petabyte的內(nèi)存。外部AI實(shí)驗(yàn)室對(duì)TPU的需求已"遠(yuǎn)超我們所能滿(mǎn)足的上限",并以此作為成本競(jìng)爭(zhēng)力的最直接佐證:"如果我們的成本貴得多,他們根本不會(huì)來(lái)找我們要TPU。"

芯片優(yōu)勢(shì)正在加速兌現(xiàn)為商業(yè)增長(zhǎng)。Kurian披露,Gemini企業(yè)版Token處理量已從今年1月的每分鐘100億躍升至160億,企業(yè)用戶(hù)數(shù)環(huán)比增長(zhǎng)40%。他同時(shí)向行業(yè)發(fā)出警告:在算力產(chǎn)能持續(xù)受限的市場(chǎng)環(huán)境下,沒(méi)有自研芯片的玩家單位經(jīng)濟(jì)成本將"越來(lái)越貴";而依靠風(fēng)險(xiǎn)投資輸血、無(wú)法以推理收入覆蓋訓(xùn)練成本的商業(yè)模式,終將面臨資金來(lái)源枯竭——"這個(gè)缺口越拉越大,你能找到的資金來(lái)源就會(huì)越來(lái)越少。"

Kurian將這一優(yōu)勢(shì)定性為貫穿未來(lái)十年的長(zhǎng)期壁壘,并以"平臺(tái)公司邏輯"回應(yīng)外界對(duì)谷歌同時(shí)服務(wù)Anthropic等競(jìng)爭(zhēng)對(duì)手的質(zhì)疑:為對(duì)手提供底層算力與在模型層正面競(jìng)爭(zhēng)并不矛盾,且恰因TPU同時(shí)服務(wù)內(nèi)外部需求,谷歌在供應(yīng)鏈談判中能獲得更有利的合同條款,進(jìn)一步加深了這條結(jié)構(gòu)性護(hù)城河。


十一年積累的復(fù)利效應(yīng):TPU從專(zhuān)用AI芯片走向通用算力

Kurian將谷歌今日的算力優(yōu)勢(shì),追溯至超過(guò)十一年前啟動(dòng)的TPU自研項(xiàng)目。他表示,谷歌早在多年前便預(yù)判AI浪潮的到來(lái),并從能源多元化、土地儲(chǔ)備、數(shù)據(jù)中心建造模式轉(zhuǎn)型等多個(gè)維度提前布局,以確保不在物理資源層面受到制約。

在數(shù)據(jù)中心建設(shè)層面,谷歌已將傳統(tǒng)建筑施工模式轉(zhuǎn)向工廠(chǎng)預(yù)制化模式,以更大的粒度進(jìn)行預(yù)組裝和預(yù)測(cè)試,從而大幅壓縮產(chǎn)能部署周期。Kurian表示,這些決策的累積效應(yīng),在技術(shù)棧各層形成了復(fù)利——從TensorFlow到JAX,再到XLA和Pathways,谷歌圍繞TPU構(gòu)建的完整編程棧,是當(dāng)前系統(tǒng)效率的核心來(lái)源之一。

值得關(guān)注的是,TPU的應(yīng)用場(chǎng)景已開(kāi)始向AI之外延伸。Kurian提到,對(duì)沖基金Citadel已公開(kāi)談及如何將TPU用于資本市場(chǎng)的算法交易,美國(guó)能源部及高性能計(jì)算領(lǐng)域的客戶(hù)也在采用這一方案。其邏輯在于:算法交易過(guò)去依賴(lài)數(shù)值計(jì)算,受制于摩爾定律放緩,而轉(zhuǎn)向推理計(jì)算可帶來(lái)顯著的性能躍升。部分頂級(jí)金融機(jī)構(gòu)已要求將TPU部署在靠近交易所的客戶(hù)自有數(shù)據(jù)中心,谷歌正在探索這一新型商業(yè)模式。

第八代TPU拆分為推理與訓(xùn)練兩條產(chǎn)品線(xiàn),應(yīng)對(duì)智能體時(shí)代需求

Kurian透露,即將發(fā)布的第八代TPU包含三款產(chǎn)品:面向大規(guī)模訓(xùn)練的v8T,以及混合用途的Ironwood。其中v8i主要針對(duì)推理場(chǎng)景優(yōu)化,可在無(wú)需水冷的條件下運(yùn)行,便于部署至更多地點(diǎn)以管理推理延遲。

在技術(shù)規(guī)格層面,Kurian介紹,v8T訓(xùn)練芯片在單個(gè)系統(tǒng)內(nèi)可容納兩個(gè)Petabyte的內(nèi)存,相當(dāng)于美國(guó)國(guó)會(huì)圖書(shū)館全部數(shù)字化內(nèi)容的約100倍。v8擁有9600塊芯片互聯(lián),v8i則有1152塊,全部運(yùn)行在統(tǒng)一的光學(xué)Taurus網(wǎng)絡(luò)上,具備極低的可預(yù)測(cè)延遲,內(nèi)存到芯片的數(shù)據(jù)吞吐效率極高。

谷歌以"goodput"(有效吞吐量)作為核心衡量指標(biāo)。Kurian表示,谷歌三四年前便預(yù)判能源供給將趨于緊張,因此將每瓦特算力的產(chǎn)出Token數(shù)作為優(yōu)化重心,這一決策如今已成為眾多客戶(hù)選擇TPU的重要原因。他明確表示,谷歌完全有信心憑借TPU為世界上最大規(guī)模的模型提供服務(wù),且其分離式部署(disaggregated serving)技術(shù)棧對(duì)TPU的使用效率在所有模型提供商中最高。

對(duì)于業(yè)界關(guān)于預(yù)訓(xùn)練擴(kuò)展放緩的討論,Kurian給出了明確回應(yīng):"從芯片設(shè)計(jì)、系統(tǒng)設(shè)計(jì)或產(chǎn)能層面,我們都沒(méi)有看到這種放緩。"

智能體時(shí)代重塑算力架構(gòu):存儲(chǔ)瓶頸成下一個(gè)關(guān)鍵約束

在Kurian的框架中,AI應(yīng)用正經(jīng)歷三個(gè)演進(jìn)階段:以搜索問(wèn)答為核心的第一階段、以多模態(tài)內(nèi)容生成為特征的第二階段,以及以智能體自主完成復(fù)雜任務(wù)為核心的第三階段。他指出,智能體的興起正在從根本上改變芯片和系統(tǒng)設(shè)計(jì)的優(yōu)化方向。

智能體任務(wù)可能持續(xù)運(yùn)行6至12小時(shí),對(duì)KV緩存設(shè)計(jì)提出了全新要求,內(nèi)存駐留成本的控制將直接決定推理服務(wù)的經(jīng)濟(jì)性。與此同時(shí),推理場(chǎng)景需要在大量地點(diǎn)分散部署,這與訓(xùn)練可集中在少數(shù)超大規(guī)模地點(diǎn)完成的特性截然不同,v8i支持風(fēng)冷運(yùn)行正是對(duì)這一需求的直接回應(yīng)。

在存儲(chǔ)層面,谷歌即將推出兩項(xiàng)新方案:其一是面向大規(guī)模訓(xùn)練的托管Lustre解決方案,吞吐量達(dá)每秒10太字節(jié);其二是面向推理場(chǎng)景的超低延遲"Rapid Storage",吞吐量達(dá)每秒15太字節(jié),可掛載于靠近推理芯片的位置。此外,谷歌還將推出新型網(wǎng)絡(luò)架構(gòu)Virgo,提供超大規(guī)模集群內(nèi)的超低延遲高速互聯(lián)。

Kurian指出,智能體普及的下一個(gè)重大瓶頸將出現(xiàn)在消費(fèi)者側(cè)——讓虛擬機(jī)按需激活、停用,并高效處理本地存儲(chǔ)讀寫(xiě),將是降低智能體使用成本、實(shí)現(xiàn)大眾化普及的核心工程挑戰(zhàn)。

平臺(tái)邏輯下的商業(yè)模式:為競(jìng)爭(zhēng)對(duì)手供給算力不影響自身競(jìng)爭(zhēng)力

針對(duì)外界對(duì)谷歌同時(shí)為Anthropic提供TPU算力、卻又在模型層面直接競(jìng)爭(zhēng)這一矛盾的質(zhì)疑,Kurian將其歸結(jié)為平臺(tái)公司的內(nèi)在邏輯。他表示,谷歌的不同業(yè)務(wù)部門(mén)與市場(chǎng)參與者同時(shí)存在競(jìng)合關(guān)系,蘋(píng)果已與谷歌簽訂模型合同同樣屬于這一邏輯的體現(xiàn)。

對(duì)于如何在內(nèi)部算力需求與外部供給之間做出權(quán)衡,Kurian表示,分配決策由以Sundar Pichai為首的管理團(tuán)隊(duì)共同討論做出,并強(qiáng)調(diào)"擁有自己的芯片和需求,遠(yuǎn)比沒(méi)有自己的芯片要好得多"。谷歌不依賴(lài)外部芯片采購(gòu),因此無(wú)論如何分配,均能在自有知識(shí)產(chǎn)權(quán)基礎(chǔ)上獲得利潤(rùn),這與純粹轉(zhuǎn)賣(mài)他人IP的商業(yè)模式有本質(zhì)區(qū)別。

在對(duì)比英偉達(dá)的總擁有成本主張時(shí),Kurian以客戶(hù)反饋?zhàn)鳛榛貞?yīng)——"我們有很多客戶(hù)說(shuō)我們的總擁有成本是最低的",并重申大量外部AI實(shí)驗(yàn)室對(duì)TPU的需求已超出谷歌供給能力,視其為成本競(jìng)爭(zhēng)力的最直接證明。

網(wǎng)絡(luò)安全成AI軍備競(jìng)賽新戰(zhàn)場(chǎng),谷歌推三層應(yīng)對(duì)體系

Kurian對(duì)AI模型在網(wǎng)絡(luò)安全領(lǐng)域的風(fēng)險(xiǎn)持高度警覺(jué)態(tài)度。他指出,無(wú)論如何限制閉源模型的擴(kuò)散,開(kāi)源模型必然會(huì)流入對(duì)手手中,且隨時(shí)間推移持續(xù)進(jìn)化。因此,核心問(wèn)題在于:Anthropic認(rèn)為Mythos過(guò)于危險(xiǎn)而暫緩發(fā)布的那些漏洞檢測(cè)能力,有多大比例可以被開(kāi)源模型復(fù)現(xiàn)?

谷歌的應(yīng)對(duì)策略分為三層:第一,借助Gemini提升漏洞檢測(cè)速度,并推出能夠輔助修復(fù)代碼的新模型,因?yàn)槁┒幢话l(fā)現(xiàn)的速度已遠(yuǎn)超人工修復(fù)的速度;第二,引入"持續(xù)紅隊(duì)演練"智能體——第一個(gè)智能體持續(xù)發(fā)動(dòng)攻擊測(cè)試,第二個(gè)對(duì)漏洞進(jìn)行優(yōu)先級(jí)排序,第三個(gè)輔助完成修復(fù);第三,與Wiz整合后,將持續(xù)檢測(cè)能力融入云端安全體系,形成從發(fā)現(xiàn)到修復(fù)再到部署的閉環(huán)。

Kurian亦對(duì)"AI將取代軟件工程師"的論斷提出反駁。他表示,在模型能力提升帶來(lái)大量安全漏洞的當(dāng)下,恰恰是最需要大量軟件工程師配合模型工作的時(shí)刻,行業(yè)容易在"不再需要任何人"的論斷上矯枉過(guò)正,而現(xiàn)實(shí)往往相反。谷歌堅(jiān)持代碼同行評(píng)審制度,并正在探索引入"監(jiān)督模型"以不同方式審查AI生成代碼,以應(yīng)對(duì)AI既生成代碼又審查代碼所帶來(lái)的認(rèn)知盲區(qū)風(fēng)險(xiǎn)。


以下為訪(fǎng)談全文:

主持人:好的,Thomas,感謝您今天來(lái)接受我的采訪(fǎng)。我們現(xiàn)在在谷歌云園區(qū),非常感激您抽出時(shí)間。
Thomas Kurian:感謝邀請(qǐng)。
主持人:我非常期待這次對(duì)話(huà),有很多問(wèn)題想問(wèn)您。
Thomas Kurian:好的,盡管問(wèn)。
主持人:我最近一直在思考的第一個(gè)問(wèn)題是關(guān)于TPU產(chǎn)能的。當(dāng)你看看Anthropic和OpenAI這些前沿實(shí)驗(yàn)室,他們一直掛在嘴邊的就是算力受限的問(wèn)題。但反觀(guān)谷歌,你們擁有完整的技術(shù)棧,有自研芯片,而且你們不僅在服務(wù)自己的推理需求,還在做訓(xùn)練、銷(xiāo)售推理服務(wù),同時(shí)還允許一些競(jìng)爭(zhēng)對(duì)手在你們自己的芯片上構(gòu)建產(chǎn)品,甚至還在直接銷(xiāo)售芯片。你們是怎么做到有這么充足的產(chǎn)能的?而其他前沿實(shí)驗(yàn)室似乎永遠(yuǎn)都不夠用?
Thomas Kurian:你想想我們?cè)谌蚍秶鷥?nèi)實(shí)際上變現(xiàn)了多大比例——在某些場(chǎng)景下,我們同時(shí)對(duì)算力和推理請(qǐng)求收費(fèi);在另一些場(chǎng)景下,我們提供的是算力,運(yùn)行的是別人的模型,但底層芯片是我們的。這背后的部分原因,要追溯到很多年前我們所做的長(zhǎng)期規(guī)劃。當(dāng)我們預(yù)見(jiàn)到這波AI浪潮到來(lái)時(shí),我們從多個(gè)維度入手,確保自己不會(huì)在物理資源上受到制約。
我們多元化了能源來(lái)源,提前鎖定了土地以便建設(shè)數(shù)據(jù)中心,改變了數(shù)據(jù)中心的建造方式——我們從傳統(tǒng)的建筑施工模式轉(zhuǎn)向了更多的工廠(chǎng)預(yù)制化模式,因?yàn)楣S(chǎng)制造永遠(yuǎn)比現(xiàn)場(chǎng)施工更快。我們還縮短了機(jī)器部署的周期。這些都是我們已經(jīng)做到的事,也在產(chǎn)能上幫了我們很大的忙。
在芯片層面,我們一直與英偉達(dá)保持合作伙伴關(guān)系,但同時(shí)我們也一直致力于研發(fā)自己的芯片,而且已經(jīng)做了——我想大概是第十一年還是第十二年了。第八代TPU將會(huì)在我們的發(fā)布活動(dòng)上正式公布。
主持人:是的,我們待會(huì)兒會(huì)聊到這個(gè)。
Thomas Kurian:我們?cè)谶@件事上已經(jīng)積累了深厚的經(jīng)驗(yàn),一代又一代地做,一次又一次地交付這種優(yōu)勢(shì),F(xiàn)在很有意思的是,我們不僅看到來(lái)自AI實(shí)驗(yàn)室的需求,還看到來(lái)自其他行業(yè)的需求。比如Citadel在資本市場(chǎng)領(lǐng)域就公開(kāi)談到了他們?nèi)绾问褂梦覀兊腡PU;美國(guó)能源部以及高性能計(jì)算領(lǐng)域的客戶(hù)也在談?wù)撨@個(gè)。所以我們正在看到TPU變得越來(lái)越通用,不再局限于A(yíng)I算法,而是成為更廣泛的基礎(chǔ)設(shè)施。
主持人:那當(dāng)你面對(duì)TPU這塊大蛋糕,需要在各種不同的用途之間分配算力時(shí),你是怎么比較和權(quán)衡的?如果你愿意分享具體數(shù)字當(dāng)然很好,但哪怕是粗略對(duì)比一下——直接銷(xiāo)售TPU、讓Anthropic或OpenAI通過(guò)你們的基礎(chǔ)設(shè)施運(yùn)行推理、還是服務(wù)自己的Gemini模型——這幾種模式相比較如何?
Thomas Kurian:我們?cè)谶@幾者之間保持投入的平衡,而且無(wú)論哪種方式我們都能獲得不錯(cuò)的利潤(rùn),因?yàn)槲覀儞碛凶约旱闹R(shí)產(chǎn)權(quán)。我們不是單純?cè)诜咒N(xiāo)別人的IP。我認(rèn)為這一點(diǎn)幫助了我們,你也看到我們的營(yíng)收和運(yùn)營(yíng)利潤(rùn)率都在持續(xù)提升。
我們還把TPU擴(kuò)展到了新的場(chǎng)景,比如資本市場(chǎng)。我們發(fā)現(xiàn)一個(gè)非常有趣的現(xiàn)象:算法交易過(guò)去主要依賴(lài)數(shù)值計(jì)算,而這類(lèi)計(jì)算主要運(yùn)行在傳統(tǒng)算力上,受摩爾定律的制約,每代之間的性能提升越來(lái)越慢。所以很多頂級(jí)機(jī)構(gòu)已經(jīng)發(fā)現(xiàn),轉(zhuǎn)向推理計(jì)算可以帶來(lái)巨大的性能飛躍——與其用數(shù)值方法做計(jì)算,不如轉(zhuǎn)向推理,就能享受推理性能提升所帶來(lái)的紅利。隨著這些機(jī)構(gòu)陸續(xù)加入,他們希望我們的機(jī)器能部署在更靠近交易所的地方,比如放在他們自己的數(shù)據(jù)中心里。所以我們已經(jīng)開(kāi)始把TPU引入部分核心客戶(hù)自己的場(chǎng)地,這是一種略有不同的商業(yè)模式。
從宏觀(guān)角度看,我認(rèn)為多元化本身就能促進(jìn)產(chǎn)品進(jìn)步,因?yàn)槟隳軓母鱾(gè)地方接收到需求反饋。商業(yè)化渠道的多元化也幫助我們實(shí)現(xiàn)增長(zhǎng)。舉個(gè)例子,當(dāng)我們和供應(yīng)鏈供應(yīng)商談判時(shí),正因?yàn)槲覀兪褂眠@些芯片不僅僅是為了滿(mǎn)足自身需求,還為市場(chǎng)提供服務(wù),他們會(huì)說(shuō)谷歌的需求量是一個(gè)更大的總盤(pán)子,所以我們能拿到更有利的合同條款。
主持人:我想在這個(gè)點(diǎn)上再多停留一會(huì)兒。如果算力需求是無(wú)限的,哪怕只從研發(fā)角度來(lái)看,為什么不干脆把算力全部留給自己?更直白地說(shuō),如果AGI真的是所有AI實(shí)驗(yàn)室都在追求的終極目標(biāo),而且誰(shuí)先到達(dá)、誰(shuí)先規(guī);渴鹫l(shuí)就贏(yíng),那么把產(chǎn)能全部留給自己、留給自己的模型,似乎才是最有利的選擇。我的理解哪里有偏差?
Thomas Kurian:你必須賺錢(qián)才能支撐這一切。谷歌確實(shí)賺了很多錢(qián),但你必須持續(xù)產(chǎn)生現(xiàn)金流,而這是我們生成足夠現(xiàn)金流的另一個(gè)杠桿。我們分配給外部的算力始終是在和自身需求及資本需求之間做平衡的。而且你知道,不管你是哪家實(shí)驗(yàn)室,風(fēng)險(xiǎn)投資是沒(méi)辦法無(wú)限期地支撐你的。隨著算力成本不斷上漲,如果你做的是虧本買(mǎi)賣(mài)——你虧錢(qián),而且從推理服務(wù)等手段中賺到的錢(qián)不足以覆蓋訓(xùn)練成本——這個(gè)缺口越拉越大,你能找到的資金來(lái)源就會(huì)越來(lái)越少。
主持人:我一直在說(shuō)谷歌處于多么獨(dú)特的位置:有現(xiàn)金奶牛、有芯片、有模型。你們的Gemini團(tuán)隊(duì)有沒(méi)有來(lái)找你說(shuō)過(guò)"我們不夠用"?我知道我在這個(gè)點(diǎn)上很糾結(jié),其他那些公司就是跟不上,這對(duì)我來(lái)說(shuō)真的太不可思議了。
Thomas Kurian:對(duì)這類(lèi)東西的需求永遠(yuǎn)存在,而且我認(rèn)為未來(lái)十年需求會(huì)始終超過(guò)供給,如果你有自己的芯片,這是個(gè)很好的位置。如果你沒(méi)有,你就只是在轉(zhuǎn)賣(mài)別人的東西。在一個(gè)產(chǎn)能受限的環(huán)境下,你的單位經(jīng)濟(jì)成本會(huì)變得越來(lái)越貴。而我們的情況是,因?yàn)槲覀冋瓶匦酒瑔挝唤?jīng)濟(jì)效益仍然具有吸引力。所以擁有自研芯片將是我們的一個(gè)核心優(yōu)勢(shì)。
主持人:那如果你把你們TPU的整個(gè)算力池、整個(gè)計(jì)算基礎(chǔ)設(shè)施看成一塊大餅,你能談?wù)動(dòng)?xùn)練、推理、銷(xiāo)售TPU、為其他實(shí)驗(yàn)室服務(wù)推理這幾塊大概各占多少嗎?
Thomas Kurian:粗略地說(shuō),我們不會(huì)公開(kāi)詳細(xì)數(shù)字,所以我不會(huì)逐項(xiàng)拆解。但大體上從宏觀(guān)來(lái)看,谷歌云大約占Alphabet總資本支出的一半,而且還在增長(zhǎng),因?yàn)樗脑鏊龠h(yuǎn)超其他業(yè)務(wù),這個(gè)你們應(yīng)該清楚。所以這是一個(gè)大致的劃分比例。而在我們這邊,我們相當(dāng)大比例的增長(zhǎng)來(lái)自Gemini和我們自己的模型,你可以把這個(gè)作為一個(gè)粗略的參考。
主持人:好的。你剛才提到了數(shù)據(jù)中心和數(shù)據(jù)中心建設(shè)。你能解釋一下你所說(shuō)的"建筑施工"和"工廠(chǎng)制造"在數(shù)據(jù)中心層面的區(qū)別是什么嗎?
Thomas Kurian:說(shuō)白了就是你部署產(chǎn)能時(shí)的基本單元是什么。比如,你可以在數(shù)據(jù)中心里一個(gè)機(jī)架一個(gè)機(jī)架地組裝;也可以整排整排地部署。你能以越大的粒度來(lái)部署,就越能在一個(gè)集中地點(diǎn)提前完成預(yù)組裝和預(yù)測(cè)試,部署速度也就越快。
主持人:當(dāng)你在規(guī)劃新數(shù)據(jù)中心的部署時(shí)——我想你比任何人都更清楚,美國(guó)社會(huì)對(duì)數(shù)據(jù)中心目前有相當(dāng)負(fù)面的看法,我記得支持率大概只有20%左右。你是怎么看待這個(gè)問(wèn)題的?整個(gè)AI行業(yè)又該如何扭轉(zhuǎn)公眾對(duì)人工智能、以及對(duì)部署數(shù)據(jù)中心這件事的看法——畢竟數(shù)據(jù)中心的部署實(shí)際上賦予了美國(guó)戰(zhàn)略?xún)?yōu)勢(shì)?我個(gè)人對(duì)AI是相當(dāng)樂(lè)觀(guān)的,你是怎么看的?
Thomas Kurian:人們對(duì)數(shù)據(jù)中心的擔(dān)憂(yōu)主要集中在幾個(gè)方面。第一,數(shù)據(jù)中心會(huì)不會(huì)推高我所在的州或縣的能源價(jià)格?第二,數(shù)據(jù)中心所在的社區(qū)能不能獲得足夠的就業(yè)機(jī)會(huì)?
針對(duì)這些問(wèn)題,我們正在做幾件事。首先,我們正在投資"表后"(behind the meter)技術(shù),也就是說(shuō)我們不從電網(wǎng)取電,而是在州政府有意愿的情況下與電網(wǎng)互聯(lián),這樣當(dāng)電網(wǎng)出現(xiàn)短缺時(shí),我們的能源反過(guò)來(lái)可以反哺電網(wǎng)。我們?cè)谕顿Y替代能源,因?yàn)槲覀冋J(rèn)為傳統(tǒng)的"發(fā)電+配電"模式并不是能源供應(yīng)進(jìn)入市場(chǎng)的唯一方式。所以我們正在研究的一個(gè)問(wèn)題是:能否借助AI帶來(lái)的能源需求,推動(dòng)新型能源配送方式的出現(xiàn),從而降低單位能源成本,并進(jìn)而服務(wù)于更廣泛的市場(chǎng)?
第三,我們非常重視PUE(電源使用效率)指標(biāo),也就是我們所消耗的每一度電的效率。簡(jiǎn)單來(lái)說(shuō),如果你需要100兆瓦的計(jì)算功率,你從能源側(cè)實(shí)際消耗的額外兆瓦數(shù)越少,就說(shuō)明你越?jīng)]有在浪費(fèi)能源。我們?cè)谶@方面是全球最高效的,背后涉及熱力學(xué)交換、散熱方式等數(shù)以千計(jì)的優(yōu)化細(xì)節(jié)。
最后,我們會(huì)深度投入我們所在的社區(qū)。為了避免讓當(dāng)?shù)厣鐓^(qū)覺(jué)得谷歌把所有資源都集中在一個(gè)龐大的地點(diǎn),我們把數(shù)據(jù)中心分散部署在許多地方,這樣沒(méi)有哪個(gè)州會(huì)覺(jué)得我們成了他們資源的一個(gè)沉重負(fù)擔(dān)。我們?cè)谶@方面有著很好的記錄。我去過(guò)我們很多數(shù)據(jù)中心,當(dāng)你深入到當(dāng)?shù)氐慕?jīng)濟(jì)環(huán)境中,看到當(dāng)?shù)貙W(xué)校里的孩子,看到運(yùn)營(yíng)我們數(shù)據(jù)中心的員工——他們對(duì)我們來(lái)說(shuō)極為重要——看到我們?yōu)槟切┢h(yuǎn)社區(qū)帶來(lái)了多少經(jīng)濟(jì)發(fā)展,你會(huì)覺(jué)得這是我們應(yīng)盡的責(zé)任的一部分。
主持人:這很好。但如果說(shuō)到更廣泛的社會(huì)層面的看法,而不僅僅是你進(jìn)入的那個(gè)當(dāng)?shù)厣鐓^(qū)——你進(jìn)去了、創(chuàng)造了就業(yè)、投入了資金、沒(méi)有直接推高電價(jià),這一切都很好——但你究竟要怎么真正改變更廣大美國(guó)民眾對(duì)人工智能的看法?
Thomas Kurian:這將是一個(gè)過(guò)程。我認(rèn)為關(guān)鍵在于找到那些能讓技術(shù)真正造福社會(huì)的應(yīng)用場(chǎng)景,而不是引發(fā)人們對(duì)工作被取代的恐懼。讓我舉幾個(gè)例子。
在我們的發(fā)布會(huì)上你會(huì)看到一家叫Signal的公司,他們平時(shí)不怎么公開(kāi)宣傳自己——他們是德國(guó)最大的健康保險(xiǎn)公司。他們目前大規(guī)模部署了基于Gemini企業(yè)版構(gòu)建的AI智能體,來(lái)幫助他們的團(tuán)隊(duì)工作。非常有意思的是,當(dāng)我們剛開(kāi)始合作時(shí),內(nèi)部有很多焦慮,擔(dān)心這會(huì)導(dǎo)致裁員。但他們一個(gè)人都沒(méi)裁,而且他們發(fā)現(xiàn),在回答客戶(hù)關(guān)于"我是否符合這項(xiàng)治療的報(bào)銷(xiāo)資格"這類(lèi)問(wèn)題時(shí),準(zhǔn)確率和速度都大幅提升——有些情況下,過(guò)去需要23分鐘才能查清楚的問(wèn)題,現(xiàn)在只需要幾秒鐘就能回答。所以這既提升了效率,也提升了客戶(hù)服務(wù)的質(zhì)量,而且沒(méi)有動(dòng)過(guò)一個(gè)工作崗位。
我們還與美國(guó)臨床腫瘤學(xué)會(huì)合作——他們是全美51,000名腫瘤科醫(yī)生的行業(yè)組織。他們希望有一個(gè)AI應(yīng)用,能在醫(yī)生坐診時(shí)幫助他們查閱標(biāo)準(zhǔn)治療指南。比如這位患者來(lái)看病,她有乳腺癌,標(biāo)準(zhǔn)治療方案是什么?但她同時(shí)還有糖尿病,如果是這種類(lèi)型的糖尿病,我就不能給她開(kāi)化療——這類(lèi)規(guī)則極其復(fù)雜,很多情況下還互相交叉。他們希望AI能幫助提供答案,而且這些答案必須是百分之百準(zhǔn)確的,絕對(duì)不能出現(xiàn)幻覺(jué)。我們幫助他們實(shí)現(xiàn)了這一點(diǎn),幫助醫(yī)生更好地照護(hù)患者,他們會(huì)員的反饋令人非常振奮。
還有很多這樣的例子。我們經(jīng)常說(shuō),最重要的應(yīng)用之一是打造一個(gè)"財(cái)富顧問(wèn)"。想想普通市民的處境:如果你是高凈值人士,你可以去私人銀行,有專(zhuān)業(yè)的財(cái)富管理顧問(wèn)為你服務(wù);但如果你是沒(méi)有那些經(jīng)濟(jì)資源的普通人,你可能根本得不到高質(zhì)量的理財(cái)建議;ㄆ旒瘓F(tuán)正在開(kāi)發(fā)一款財(cái)富顧問(wèn)應(yīng)用,他們會(huì)在活動(dòng)上進(jìn)行展示,這款應(yīng)用將借助Gemini的推理和任務(wù)管理能力,為用戶(hù)提供理財(cái)建議,并在用戶(hù)需要時(shí)幫助他們執(zhí)行投資操作。
這些都是社會(huì)將會(huì)認(rèn)可其價(jià)值的例子。從"AI會(huì)造成大規(guī)模失業(yè)"到聽(tīng)到這一面的聲音,需要時(shí)間來(lái)實(shí)現(xiàn)平衡,而這是我們作為一個(gè)社會(huì)共同走過(guò)的旅程的一部分。
主持人:我想繼續(xù)聊一個(gè)話(huà)題——算力需求如果是無(wú)限的,尤其在研發(fā)層面,為什么不干脆把算力全部留給自己?擁有自己的芯片,在算力受限的環(huán)境下保持單位經(jīng)濟(jì)效益,這將是谷歌的一大優(yōu)勢(shì),因?yàn)槟銈儞碛羞@些芯片。接下來(lái),我想問(wèn)你關(guān)于模型發(fā)布和安全邊界的問(wèn)題:你是否有某條紅線(xiàn),某個(gè)基準(zhǔn),讓你判斷Gemini已經(jīng)不再安全到可以向公眾發(fā)布?
Thomas Kurian:我們從其他所有AI實(shí)驗(yàn)室那里得到的需求已經(jīng)超過(guò)了我們所能滿(mǎn)足的上限。
主持人:Thomas,什么事情會(huì)讓你夜不能寐?
主持人:我確實(shí)同意。我認(rèn)為工作崗位被取代這個(gè)問(wèn)題,尤其令美國(guó)普通民眾感到非常擔(dān)憂(yōu)。我想直接問(wèn)您——就您的組織谷歌云而言,現(xiàn)在隨著人工智能讓您的工程師和其他部門(mén)的員工效率大幅提升、自動(dòng)化程度不斷提高,請(qǐng)問(wèn)您們是在招人、裁員,還是保持穩(wěn)定?你們目前處于哪個(gè)階段?
Thomas Kurian:我們?cè)诋a(chǎn)品和銷(xiāo)售方面都在增加人手。我們?cè)谑袌?chǎng)拓展團(tuán)隊(duì)方面招募了大量人員,也在大量招聘部署工程師。在我們開(kāi)發(fā)新產(chǎn)品的領(lǐng)域,我們也在擴(kuò)充能力。
舉個(gè)人們通?床坏降睦印茉缫郧埃覀兙皖A(yù)判到兩件事:第一,隨著模型在理解代碼方面越來(lái)越強(qiáng)大;第二,隨著模型學(xué)會(huì)使用計(jì)算機(jī)來(lái)執(zhí)行任務(wù),它們?cè)诤芏嗍虑樯夏茏龅梅浅3錾5斫獯a帶來(lái)的一個(gè)問(wèn)題是,模型同樣能發(fā)現(xiàn)代碼中的漏洞,因此新模型引發(fā)了大量關(guān)于網(wǎng)絡(luò)安全漏洞的焦慮。這個(gè)話(huà)題我們等會(huì)兒會(huì)聊到。
很早以前我們就決定做三件事:第一,借助 Gemini 提升漏洞檢測(cè)能力,目前已有大量客戶(hù)在使用;第二,打造一個(gè)能夠修復(fù)代碼的模型——因?yàn)槿绻隳芸焖侔l(fā)現(xiàn)漏洞,人工往往跟不上修復(fù)速度,那么模型能否協(xié)助你修復(fù)?我們針對(duì)這一點(diǎn)即將推出新功能。此外,在我們收購(gòu) Wiz 之后,你將看到我們結(jié)合 Wiz 展示的新能力,其核心是持續(xù)檢測(cè)。
有人稱(chēng)之為"持續(xù)紅隊(duì)演練"。我們將展示三種不同類(lèi)型的智能體(Agent):第一個(gè)智能體持續(xù)對(duì)你發(fā)動(dòng)攻擊,確保漏洞能被及時(shí)修復(fù)、不被打個(gè)措手不及——這是以前無(wú)法做到的;第二個(gè)智能體對(duì)發(fā)現(xiàn)的問(wèn)題進(jìn)行優(yōu)先級(jí)排序,幫你明確哪些漏洞是最需要優(yōu)先處理的;第三個(gè)智能體則協(xié)助你完成修復(fù)工作。
主持人:聽(tīng)到你們?nèi)栽谡腥,我很高興——效率提升了,還在擴(kuò)招。不過(guò)外面確實(shí)有一些公司采取了不同的做法。Block 是個(gè)典型案例,Jack Dorsey 發(fā)了一篇博文,Block 裁減了將近一半的員工,并將 AI 列為原因之一。您認(rèn)為谷歌這種"效率提升同時(shí)持續(xù)擴(kuò)招"的方式,與 Block 那種"重塑公司結(jié)構(gòu)、以一半的人力實(shí)現(xiàn)更好效果"的方式之間,差異究竟在哪里?
Thomas Kurian:每家公司對(duì)自己產(chǎn)品和服務(wù)的需求情況不同,每位 CEO 都會(huì)做出自己的判斷。我們看到的是強(qiáng)勁的市場(chǎng)需求,所以我們選擇持續(xù)投入。
主持人:我們來(lái)聊聊英偉達(dá)。黃仁勛最近接受了 Taresh 的播客采訪(fǎng),他談到英偉達(dá)及其架構(gòu)在每個(gè) Token 的總擁有成本上是最低的,這得益于 CUDA、NVLink 網(wǎng)絡(luò)以及各種工具鏈所帶來(lái)的更優(yōu) Token 經(jīng)濟(jì)性。您認(rèn)同這個(gè)判斷嗎?您認(rèn)為谷歌在總擁有成本上是否最具競(jìng)爭(zhēng)力?如果不是,谷歌打算如何追趕?
Thomas Kurian:我們有很多客戶(hù)說(shuō)我們的總擁有成本是最低的。
主持人:好吧,我想這就是答案了,對(duì)吧?
Thomas Kurian:是的,現(xiàn)實(shí)情況是,如果你是一家 AI 實(shí)驗(yàn)室,你會(huì)選擇最好的平臺(tái)。不只是谷歌自己的團(tuán)隊(duì)在用,其他 AI 實(shí)驗(yàn)室對(duì)我們 TPU 的需求,已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)我們所能滿(mǎn)足的上限。我只想說(shuō):如果我們的成本貴得多,他們根本不會(huì)來(lái)找我們要 TPU。
主持人:TPU 的核心優(yōu)勢(shì)之一是速度嗎?我注意到 Gemini 系列模型速度非?,作為一個(gè)速度控,我非常欣賞這一點(diǎn)。通常來(lái)說(shuō),專(zhuān)用 ASIC 芯片往往比通用 GPU 快得多。這對(duì) AI 實(shí)驗(yàn)室或您的客戶(hù)來(lái)說(shuō)是一大賣(mài)點(diǎn),還是他們始終把質(zhì)量放在第一位?
Thomas Kurian:質(zhì)量。質(zhì)量是第一位的。但我認(rèn)為這是一個(gè)組合,有三個(gè)核心要素——因?yàn)殛P(guān)鍵不只是芯片本身,而是整個(gè)系統(tǒng)。以 TPU v8 為例,它擁有 9600 塊芯片;v8i 則有 1152 塊,全部連接在一個(gè)單一的光學(xué) Taurus 網(wǎng)絡(luò)上。這帶來(lái)了極高的帶寬,以及整個(gè) Pod 中所有芯片之間超可預(yù)測(cè)的低延遲。這使得我們能以極高的效率將數(shù)據(jù)從內(nèi)存中取出進(jìn)行處理,并再寫(xiě)回內(nèi)存。舉個(gè)例子,v8T 訓(xùn)練芯片可以在單個(gè)系統(tǒng)中容納兩個(gè) Petabyte 的內(nèi)存——這相當(dāng)于美國(guó)國(guó)會(huì)圖書(shū)館全部數(shù)字化內(nèi)容的約 100 倍。
由于網(wǎng)絡(luò)延遲極低,內(nèi)存到芯片的數(shù)據(jù)吞吐量也極為迅速。第三,在硬件層之上,從編程棧的角度來(lái)看,谷歌開(kāi)發(fā)并貢獻(xiàn)給業(yè)界的工具非常豐富,例如用于編譯器優(yōu)化的 JAX,我們?cè)?PyTorch 上也做了大量工作,還有 XLA、Pathways——這些都是谷歌構(gòu)建的技術(shù)。把這一切加在一起,即便你看推理和視覺(jué)語(yǔ)言模型,我們也針對(duì)其中大量技術(shù)進(jìn)行了深度優(yōu)化。正是這整套技術(shù)棧,讓 TPU 系統(tǒng)如此高效、如此強(qiáng)大。
我們通過(guò)一個(gè)叫做"goodput(有效吞吐量)"的指標(biāo)來(lái)衡量這一點(diǎn)——它衡量的是你實(shí)際獲得的有效吞吐量。我們?nèi)哪昵斑做了一個(gè)決策:預(yù)見(jiàn)到能源將會(huì)供不應(yīng)求,于是我們專(zhuān)注于優(yōu)化每瓦特算力的性?xún)r(jià)比,也就是每瓦特能產(chǎn)出多少 Token。這也是如今很多人選擇我們的重要原因之一。
主持人:您之前提到 TPU 的布局已有 11 年歷史了。在科技行業(yè),11 年是一段相當(dāng)漫長(zhǎng)的時(shí)間,能看到一個(gè)如此久遠(yuǎn)的決策在近幾年結(jié)出如此豐碩的果實(shí),實(shí)在令人感慨。那么,您的規(guī)劃會(huì)隨著市場(chǎng)的變化產(chǎn)生多大幅度的調(diào)整?是多年前的決策仍然堅(jiān)定不移地貫徹執(zhí)行,還是你們需要不斷地調(diào)整方向?
Thomas Kurian:我們?cè)诩夹g(shù)棧各層積累的歷史經(jīng)驗(yàn),隨著時(shí)間推移形成了復(fù)利效應(yīng)。當(dāng)我們做 TensorFlow 的時(shí)候,我們意識(shí)到訓(xùn)練需要一個(gè)大規(guī)模分布式編程模型,于是我們開(kāi)發(fā)了 JAX。JAX 正是在 TensorFlow 的經(jīng)驗(yàn)積累上,以及人們對(duì)新型分布式訓(xùn)練模型的需求上,進(jìn)一步迭代的產(chǎn)物。所以,很多東西是隨著時(shí)間推移不斷積累的,我們從過(guò)去的實(shí)踐中學(xué)習(xí),并持續(xù)改進(jìn)。
與此同時(shí),我們也極其敏銳地關(guān)注市場(chǎng)、傾聽(tīng)客戶(hù)的聲音。比如有人問(wèn)我們:為什么要專(zhuān)門(mén)開(kāi)發(fā) v8i 這顆推理芯片?原因在于我們看到一個(gè)規(guī)律——無(wú)論一家公司多么財(cái)大氣粗,如果不能靠推理賺錢(qián),就無(wú)力持續(xù)負(fù)擔(dān)訓(xùn)練的成本。你必須至少讓推理收入能抵消訓(xùn)練的成本,而不能永遠(yuǎn)依賴(lài)風(fēng)險(xiǎn)投資來(lái)輸血。所以我們判斷推理的需求將會(huì)爆發(fā)式增長(zhǎng),明確了推理所需的優(yōu)化方向,而事實(shí)上,v8i 推理芯片的市場(chǎng)需求,遠(yuǎn)遠(yuǎn)超出了我們?cè)鹊念A(yù)期。
主持人:我們來(lái)聊聊第八代芯片。這是你們首次將芯片拆分成兩個(gè)不同的系列——一個(gè)專(zhuān)注推理,一個(gè)專(zhuān)注預(yù)訓(xùn)練。首先請(qǐng)確認(rèn)一下,Ironwood 是主要為推理設(shè)計(jì)的嗎?
Thomas Kurian:Ironwood 是混合用途的,既用于訓(xùn)練,也用于推理。我認(rèn)為人們使用推理時(shí)有很強(qiáng)的時(shí)間規(guī)律性——白天用戶(hù)醒來(lái)會(huì)問(wèn)大量問(wèn)題,到了晚上有些人還是會(huì)睡覺(jué)的,所以那段時(shí)間很多推理任務(wù)會(huì)用 Spot 實(shí)例來(lái)跑;訓(xùn)練后微調(diào)(post-training)也有很多人在夜間用 Spot 實(shí)例來(lái)完成。所以 Ironwood 是一款通用型芯片。v8T 則主要面向訓(xùn)練,但也有人在考慮將其用于推理。v8i 主要用于推理,不過(guò)對(duì)于規(guī)模較小的模型,也有人用它來(lái)做訓(xùn)練。
主持人:從你們決定拆分這兩款芯片這件事來(lái)看,您認(rèn)為計(jì)算工作負(fù)載將向何處演進(jìn)?您現(xiàn)在觀(guān)察到了什么?未來(lái)五年,主要的工作負(fù)載會(huì)集中在哪里?
Thomas Kurian:這一點(diǎn),從我們?cè)?Gemini 上做的工作中體現(xiàn)得并不亞于芯片設(shè)計(jì)本身。如果你觀(guān)察 Gemini,我們大致看到了模型發(fā)展的三個(gè)階段:
第一階段,用戶(hù)向模型提問(wèn),模型作出回答,可能會(huì)經(jīng)歷多輪對(duì)話(huà)迭代,但整體上更像是一種搜索式聊天機(jī)器人體驗(yàn)。我們的 Gemini 企業(yè)版提供了搜索問(wèn)答的能力,并加入了"深度研究"功能用于深度分析。
第二階段,人們過(guò)去主要用擴(kuò)散模型來(lái)生成內(nèi)容,比如圖像、音頻、視頻。從 Gemini 2.5 Nano 開(kāi)始,多模態(tài)輸入其實(shí)一直存在,但多模態(tài)輸出成為主模型的原生能力。我們看到 WPP 等創(chuàng)意公司,以及各類(lèi)消費(fèi)品公司,開(kāi)始使用 Gemini 企業(yè)版——我們的企業(yè)級(jí) AI 平臺(tái)——來(lái)進(jìn)行內(nèi)容創(chuàng)作,各式各樣的內(nèi)容創(chuàng)作場(chǎng)景應(yīng)運(yùn)而生。
然后,模型在處理現(xiàn)實(shí)世界的各種抽象層面變得越來(lái)越強(qiáng)大。所謂"抽象",是指在企業(yè)場(chǎng)景中,模型需要接入各種各樣的系統(tǒng)——比如對(duì)接 CRM 系統(tǒng)來(lái)回答客戶(hù)相關(guān)的問(wèn)題,查閱供應(yīng)鏈和計(jì)劃系統(tǒng)等等。而終極的抽象,是將整個(gè)世界抽象成一臺(tái)計(jì)算機(jī)——因?yàn)槿绻隳芎陀?jì)算機(jī)對(duì)話(huà),計(jì)算機(jī)就能和一切對(duì)話(huà),因?yàn)樗熊浖举|(zhì)上都是計(jì)算機(jī)與外界溝通的抽象形式。
主持人:您認(rèn)為"模型能夠控制計(jì)算機(jī)、使用瀏覽器"是終極形態(tài)的抽象嗎?而且不只是"我能和計(jì)算機(jī)對(duì)話(huà)",還需要能理解計(jì)算機(jī)返回的信息并做出響應(yīng)——您明白我的意思嗎?
Thomas Kurian:是的,這正是"智能體"(Agent)這一概念的由來(lái)。智能體是一個(gè)模塊,你可以向它委派任務(wù)。智能體描述自身?yè)碛械募寄芗,知道如何操作一系列工具,包括?jì)算機(jī),并能代表你執(zhí)行任務(wù)。這使得 Xfinity 能用我們的技術(shù)來(lái)調(diào)度和管理整個(gè)客戶(hù)服務(wù)體系,沃爾瑪能在從供應(yīng)鏈規(guī)劃到排班的各種場(chǎng)景中使用我們,博世將我們用于制造業(yè),默克(Merck)則談到了如何將我們用于研究——從藥物發(fā)現(xiàn),一直到將藥品交付給患者,整個(gè)流程的自動(dòng)化。這就是下一個(gè)進(jìn)化階段。
我們?cè)谀撤N程度上是"協(xié)同設(shè)計(jì)"的——隨著模型能力的進(jìn)步,我們能夠不斷擴(kuò)展可自動(dòng)化的任務(wù)邊界。
主持人:把這個(gè)拉回到芯片拆分的決策上——推理和訓(xùn)練分開(kāi),這兩者之間有什么內(nèi)在聯(lián)系?
Thomas Kurian:回到第一階段,也就是搜索問(wèn)答的階段:輸入 Token 遠(yuǎn)多于輸出 Token,因?yàn)槟銜?huì)給模型一個(gè)很長(zhǎng)很復(fù)雜的問(wèn)題,它返回一個(gè)相對(duì)簡(jiǎn)單的答案。
進(jìn)入內(nèi)容生成階段,你只需給出一個(gè)簡(jiǎn)單的提示詞,比如"生成一段視頻,展示我的狗穿著超人斗篷在開(kāi)車(chē)",然后模型需要花很長(zhǎng)時(shí)間來(lái)生成大量輸出 Token。這就產(chǎn)生了截然不同的 Token 構(gòu)成比例——多模態(tài)是一大變量,輸出 Token 的體量也大幅增長(zhǎng)。
到了智能體階段,對(duì)芯片設(shè)計(jì)的影響體現(xiàn)在三四個(gè)不同維度。首先是內(nèi)存駐留時(shí)間的問(wèn)題:你委派給智能體的任務(wù)可能需要運(yùn)行 6 小時(shí)、7 小時(shí)甚至 12 小時(shí),你不希望頻繁地將內(nèi)容換入換出內(nèi)存,因?yàn)槟菚?huì)帶來(lái)高昂的 Token 計(jì)算成本。因此,KV 緩存的設(shè)計(jì)需要重新考量,這是一個(gè)典型例子。
所以當(dāng)人們問(wèn)我們,這些經(jīng)歷是如何影響你們芯片研發(fā)方向的——我們不僅與英特爾合作,我們自己也有ARM芯片,我們研發(fā)它是因?yàn)槲覀兛吹搅诉@些工具帶來(lái)的通用算力需求。當(dāng)你運(yùn)行一個(gè)需要執(zhí)行很多很多不同步驟的推理智能體時(shí),有些事情涉及到你希望如何在模型中保留和固定對(duì)象,從而讓模型運(yùn)行得極為高效,因?yàn)檫@能大幅優(yōu)化推理成本。我們?cè)谛酒绾卧趦?nèi)存中保存數(shù)據(jù)這方面做了很多內(nèi)部工作。另外,因?yàn)槿藗兿胍庇^(guān)的例子——人們希望在很多地方都能部署推理,因?yàn)樗麄冃枰芾硌舆t,這和訓(xùn)練不同,訓(xùn)練可以集中在少數(shù)幾個(gè)大型地點(diǎn)完成。
所以一個(gè)實(shí)際的例子是:8i可以在非水冷模式下運(yùn)行,這樣你就可以把它部署在更多地點(diǎn),因?yàn)轱L(fēng)冷仍然是大多數(shù)數(shù)據(jù)中心的主要散熱方式。這些決策背后都有大量的深思熟慮。我只是舉三個(gè)簡(jiǎn)單的例子來(lái)說(shuō)明。
主持人:是的,我覺(jué)得智能體這塊確實(shí)很有意思,因?yàn)樗嬲淖兞诉@些token在實(shí)際中的使用方式。英偉達(dá)大談極致協(xié)同設(shè)計(jì)(extreme co-design),谷歌看起來(lái)在每個(gè)層面都在做極致協(xié)同設(shè)計(jì)。
Thomas Kurian:是的。
主持人:先聊聊智能體的使用場(chǎng)景,尤其是當(dāng)你需要做大量的硬盤(pán)讀寫(xiě)操作時(shí),有很多方面需要去優(yōu)化。在TPU技術(shù)棧上,你們最近優(yōu)化的是什么?基于智能體使用量的增長(zhǎng),你認(rèn)為下一個(gè)大的瓶頸在哪里?
Thomas Kurian:我們一直在審視整個(gè)系統(tǒng)。舉幾個(gè)例子:我們下周將發(fā)布兩項(xiàng)全新的存儲(chǔ)解決方案。
第一個(gè)是我們的托管Lustre解決方案,我們將其吞吐量提升到了每秒10太字節(jié),它真正為大規(guī)模訓(xùn)練而設(shè)計(jì)。你可以將它與一個(gè)超大規(guī)模集群交叉互聯(lián),因?yàn)槟銚碛写笮蛿?shù)據(jù)集,你現(xiàn)在可以從大規(guī)模Lustre集群中將數(shù)據(jù)讀取到大型訓(xùn)練集群中,實(shí)現(xiàn)超高效率的擴(kuò)展。
第二個(gè)是我們推出的一種全新的超低延遲推理存儲(chǔ)系統(tǒng),稱(chēng)為"Rapid Storage"。它的理念是:你可以將需要用于推理的信息集中存儲(chǔ)在云存儲(chǔ)中,但可以將其掛載在靠近推理芯片運(yùn)行位置的地方——可以把它想象成一種前向代理機(jī)制。從你的推理處理器到存儲(chǔ)系統(tǒng)Rapid Storage進(jìn)行數(shù)據(jù)獲取,速度極快,達(dá)到每秒15太字節(jié),實(shí)現(xiàn)超低延遲。
同時(shí),你還需要在一個(gè)統(tǒng)一的網(wǎng)絡(luò)骨干上優(yōu)化所有這些。所以我們正在推出一種新型網(wǎng)絡(luò)架構(gòu),叫做Virgo,它能在超大規(guī)模集群內(nèi)提供超低延遲的高速互聯(lián)。此外,還有很多其他層面的工作我們也在進(jìn)行協(xié)同設(shè)計(jì),這些都是為了應(yīng)對(duì)智能體的到來(lái),核心目標(biāo)是以最高效的成本結(jié)構(gòu),為人們提供性能最佳、質(zhì)量最好的智能體運(yùn)行環(huán)境。
主持人:下一個(gè)大瓶頸在哪里?
Thomas Kurian:下一個(gè)大瓶頸很大程度上將出現(xiàn)在消費(fèi)者使用虛擬機(jī)的環(huán)節(jié)。比如說(shuō),我是一個(gè)家庭用戶(hù),我構(gòu)建了一個(gè)智能體,這個(gè)智能體將幫我安排出行——假設(shè)你要去度假,你讓它完成一系列任務(wù),比如查詢(xún)八個(gè)旅行網(wǎng)站,這些網(wǎng)站作為工具暴露出來(lái),也就是現(xiàn)在大家常說(shuō)的MCP或API,讓它去找所有旅行網(wǎng)站,假設(shè)是訂一趟去歐洲或東南亞的行程,幫我計(jì)算總費(fèi)用并告知我的預(yù)算。
消費(fèi)者負(fù)擔(dān)不起讓虛擬機(jī)永久運(yùn)行的成本,那非常昂貴,正如你所知道的。所以人們希望在任務(wù)完成時(shí)隨時(shí)激活、停用虛擬機(jī)。而且因?yàn)檫@些工具需要本地存儲(chǔ),這些虛擬機(jī)雖然可以超量部署,但你也可以配置本地磁盤(pán)來(lái)實(shí)現(xiàn)超高效的讀寫(xiě),這將成為一個(gè)瓶頸,因?yàn)樗鼤?huì)直接影響這項(xiàng)技術(shù)能夠普及的廣度。企業(yè)當(dāng)然可以為此付費(fèi),越便宜、越高效,他們就能使用越多;但如果你想把這項(xiàng)技術(shù)普及到消費(fèi)者,對(duì)他們來(lái)說(shuō)成本很快就會(huì)變得高昂。如果你想觸達(dá)所有人,就必須在工程層面解決這些成本結(jié)構(gòu)的問(wèn)題。而正是那種能夠跨層貫通的能力——從智能體層到Gemini層,再到存儲(chǔ)系統(tǒng)和計(jì)算系統(tǒng)——才讓我們能夠做協(xié)同設(shè)計(jì)。
主持人:謝謝你的分享。我想聊一聊Anthropic。Anthropic是谷歌的客戶(hù),他們?cè)诤芏喾矫娑己塥?dú)特。Claude是谷歌最強(qiáng)勁的競(jìng)爭(zhēng)對(duì)手之一,但與此同時(shí),你們實(shí)際上又是他們大量訓(xùn)練和推理工作的基礎(chǔ)設(shè)施支撐。你們是如何看待這個(gè)決策的?我知道我們之前稍有提及,但我想深入探討一下:你如何看待為Anthropic的模型提供算力,而他們同時(shí)又在與谷歌競(jìng)爭(zhēng)?這是AWS的打法——為所有人提供服務(wù),不偏袒任何一方?還是有所不同?
Thomas Kurian:谷歌是一家平臺(tái)公司。當(dāng)你是一家平臺(tái)公司時(shí),你的業(yè)務(wù)的不同部分會(huì)與市場(chǎng)上的不同玩家形成競(jìng)爭(zhēng),某些業(yè)務(wù)部分可能為他們提供供給,另一些部分又與他們競(jìng)爭(zhēng)。我們致力于在模型層面做到業(yè)界最佳,我們對(duì)自己所做的工作感到非常自豪,不僅僅是Gemini這個(gè)模型本身,還包括我們圍繞Gemini構(gòu)建的完整工具鏈,以及我們的企業(yè)工具組合。與此同時(shí),有些客戶(hù)希望使用我們的TPU,Anthropic就是其中一個(gè)例子。這只是作為一家平臺(tái)公司的一部分。就像人們問(wèn)我們,你們的模型與蘋(píng)果的合作優(yōu)化做得如何?蘋(píng)果已經(jīng)與我們簽訂了模型合同,你也知道。于是人們問(wèn):這不是在和你們的Android平臺(tái)及生態(tài)系統(tǒng)競(jìng)爭(zhēng)嗎?是的,但這就是平臺(tái)公司的一部分。
主持人:我還是有點(diǎn)執(zhí)念于A(yíng)nthropic這個(gè)問(wèn)題,因?yàn)樗麄儺吘乖谄髽I(yè)層面是直接競(jìng)爭(zhēng)的,而蘋(píng)果則不然。我在想,你們給他們提供算力,而到了某個(gè)時(shí)間點(diǎn)——盡管你說(shuō)現(xiàn)在TPU產(chǎn)能還很充!珜脮r(shí)可能就必須做出艱難的抉擇:這些產(chǎn)能是給Anthropic,還是留給Gemini?留給我們自己的研究?你怎么做這個(gè)決策?
Thomas Kurian:我們有一個(gè)以Sundar為首的管理團(tuán)隊(duì),我們會(huì)在一起討論,就像任何一家成熟的公司一樣做出這些決策。每天都有艱難的判斷。比如說(shuō),我們收到的需求不僅僅來(lái)自Anthropic。所以哪怕你說(shuō)有X量的產(chǎn)能留給Gemini,Y量的產(chǎn)能留給其他所有人,那么在這Y之中,你又如何分配給Anthropic,以及數(shù)百家其他實(shí)驗(yàn)室和客戶(hù)呢?這些都是任何人都必須面對(duì)的復(fù)雜決策。但我可以告訴你一件事:擁有自己的芯片和需求,遠(yuǎn)比沒(méi)有自己的芯片要好得多。
主持人:說(shuō)得好。Mythos據(jù)傳是第一個(gè)萬(wàn)億參數(shù)規(guī)模的模型,谷歌現(xiàn)在在10萬(wàn)億參數(shù)模型這個(gè)領(lǐng)域有所布局嗎?還是接近了?你們目前處于這個(gè)發(fā)展周期的哪個(gè)階段?
Thomas Kurian:關(guān)于Gemini,你會(huì)在Next大會(huì)以及之后不久看到我們的新動(dòng)作。在模型能力方面,我們對(duì)Gemini所處的位置非常自豪。它長(zhǎng)期以來(lái)都處于業(yè)界領(lǐng)先水平。我們有一個(gè)新版本的Gemini即將推出,從我們看到的所有基準(zhǔn)測(cè)試來(lái)看,我們對(duì)此同樣充滿(mǎn)信心。
主持人:假設(shè)性地問(wèn)一下,如果考慮一個(gè)10萬(wàn)億參數(shù)的模型,基于你在TPU層面的統(tǒng)籌,這在當(dāng)前世界的技術(shù)狀態(tài)下,是一個(gè)可行的服務(wù)規(guī)模嗎?
Thomas Kurian:我們長(zhǎng)期以來(lái)具備分離式部署(disaggregated serving)的能力,這使我們能夠非常出色地?cái)U(kuò)展非常大型的稠密模型,這一能力已經(jīng)存在很長(zhǎng)時(shí)間了。所以,我們不會(huì)設(shè)計(jì)出我們自己都無(wú)法部署的模型。我們完全有信心,TPU能夠服務(wù)世界上最大的模型。最重要的是,我們用于分離式部署的服務(wù)棧,在所有模型提供商中,對(duì)TPU的使用效率是最高的。所以我們完全有信心,能夠服務(wù)最大的模型,尤其是最大的Gemini模型。
主持人:這是否意味著我們?cè)陬A(yù)訓(xùn)練的擴(kuò)展側(cè)沒(méi)有看到任何放緩?你們完全沒(méi)有感受到嗎?因?yàn)闃I(yè)界有一段時(shí)間在討論預(yù)訓(xùn)練正在放緩,應(yīng)該把重心轉(zhuǎn)向強(qiáng)化學(xué)習(xí),轉(zhuǎn)向思考時(shí)間(thinking time)。你們完全沒(méi)有這種感覺(jué)嗎?
Thomas Kurian:從芯片設(shè)計(jì)、系統(tǒng)設(shè)計(jì)或產(chǎn)能層面,我們都沒(méi)有看到這種放緩。
主持人:那底層數(shù)據(jù)方面呢?你們是否看到合成數(shù)據(jù)有更高效的應(yīng)用?
Thomas Kurian:我來(lái)舉兩三個(gè)我們實(shí)際觀(guān)察到的例子。歷史上,輸入模型的數(shù)據(jù)大多是非結(jié)構(gòu)化數(shù)據(jù),比如文本、音頻、視頻、文件等,這些數(shù)據(jù)量持續(xù)增長(zhǎng)。但現(xiàn)實(shí)情況是,在企業(yè)場(chǎng)景中有很多元素,實(shí)際上相對(duì)容易處理。比如你向智能體提問(wèn),讓它告訴你答案的引用來(lái)源,如果是文檔中的內(nèi)容,就很簡(jiǎn)單,只需展示一個(gè)鏈接即可。
但想象一下,你問(wèn)模型一個(gè)問(wèn)題:"告訴我需要備貨多少才能滿(mǎn)足這款產(chǎn)品的需求。"這就需要轉(zhuǎn)化為對(duì)SAP之類(lèi)系統(tǒng)或某種供應(yīng)鏈系統(tǒng)的查詢(xún),它需要?jiǎng)討B(tài)地查詢(xún)一組數(shù)據(jù)表。首先,準(zhǔn)確地將這個(gè)查詢(xún)分解到對(duì)應(yīng)的數(shù)據(jù)表,然后展示響應(yīng)時(shí)——引用來(lái)源在哪里?你怎么知道你給我的答案是正確的?這是一個(gè)復(fù)雜得多的問(wèn)題。
正因?yàn)槲覀冊(cè)谄髽I(yè)領(lǐng)域的工作,我們能夠向Gemini的軌跡優(yōu)化訓(xùn)練框架輸入更多的結(jié)構(gòu)化數(shù)據(jù)循環(huán),包括結(jié)構(gòu)化數(shù)據(jù)和復(fù)雜字段這類(lèi)復(fù)雜內(nèi)容。比如,你有沒(méi)有見(jiàn)過(guò)——在討論瀏覽器中的計(jì)算機(jī)使用時(shí)——一個(gè)有一千個(gè)字段、下拉列表等的企業(yè)應(yīng)用?沒(méi)有任何消費(fèi)級(jí)應(yīng)用會(huì)有如此高的復(fù)雜度。在這個(gè)領(lǐng)域深耕,也讓我們能夠?qū)⑦@些內(nèi)容教給我們的Gemini系統(tǒng),并將其融入訓(xùn)練框架。
主持人:那我們繼續(xù)聊訓(xùn)練框架和智能體編程這個(gè)話(huà)題吧。我最近自己也在大量編程。有一條帖子在網(wǎng)上瘋傳,說(shuō)是某人有位朋友在谷歌,那位朋友基本說(shuō)谷歌在內(nèi)部并沒(méi)有站在智能體編程的前沿。你怎么看這件事?谷歌內(nèi)部是如何采用智能體編程的?尤其是,我必須再次提到Anthropic,他們的發(fā)布速度令人嘆為觀(guān)止。谷歌是如何擁抱智能體編程前沿的?
Thomas Kurian:目前,我們有大量工程師在使用Jet Ski,這是我們內(nèi)部的編程框架,其反饋正在實(shí)時(shí)傳遞給DeepMind,形成強(qiáng)化學(xué)習(xí)的閉環(huán),每天都在提升Gemini在編程方面的質(zhì)量。我的組織里有很多人都在使用它。
主持人:有一件事我注意到——我比以前更有生產(chǎn)力了,我發(fā)布產(chǎn)品的速度非?,過(guò)程非常愉快,我沒(méi)有逐行審查代碼。實(shí)際上,我審查的代碼行數(shù)非常少。但谷歌不能這樣做。我的項(xiàng)目都是小玩具項(xiàng)目,而谷歌要處理的是高風(fēng)險(xiǎn)的項(xiàng)目、服務(wù)和產(chǎn)品。你們?nèi)绾渭日驹谥悄荏w編程的前沿、產(chǎn)出海量代碼,同時(shí)又保證質(zhì)量,確保每一行部署的代碼都經(jīng)過(guò)了審查?
Thomas Kurian:當(dāng)我們談?wù)撥浖こ躺a(chǎn)力時(shí),我們的看法與外部報(bào)道的視角略有不同。如果你在一家像谷歌這樣開(kāi)發(fā)產(chǎn)品的公司工作,現(xiàn)實(shí)情況是有兩三件事非常重要。比如,一位資深工程師寫(xiě)的代碼比一位初級(jí)工程師緊湊得多。所以我們不以代碼行數(shù)作為衡量指標(biāo),因?yàn)橥ǔ?lái)說(shuō),能力相對(duì)弱的工程師需要寫(xiě)更多的代碼來(lái)完成同一個(gè)任務(wù),而資深工程師寫(xiě)得更精煉。
主持人:這幾乎是個(gè)老生常談的說(shuō)法了,多年來(lái)一直如此,但我覺(jué)得現(xiàn)在比以往任何時(shí)候都更重要的是整體的交付速度。
Thomas Kurian:是的,重要的是我們?cè)黾恿硕嗌俟δ堋?br/>第二,谷歌一直有一個(gè)傳統(tǒng):提交代碼時(shí)需要同伴評(píng)審,通常由資深主管來(lái)完成,而他們往往成為瓶頸。因此,我們引入了Gemini,人們也在使用它——例如,我們最近在Cloud中引入了它來(lái)掃描代碼中的安全漏洞。所以這個(gè)工具不僅僅用于生成代碼,我們也用它來(lái)檢查代碼,這有助于在資深工程師來(lái)做最終審查之前,預(yù)先完成大量前置工作。
第三,從長(zhǎng)遠(yuǎn)來(lái)看,在任何真正的軟件公司里,工程師們發(fā)現(xiàn)自己花在低效工作上的大部分時(shí)間,是在調(diào)試問(wèn)題。所以我們構(gòu)建了一個(gè)Gemini的特定版本,我們下周將展示的其中一件事就是:世界上最復(fù)雜的計(jì)算機(jī)就是云。與之相比,個(gè)人電腦不過(guò)是個(gè)玩具。我們將整個(gè)云的能力和工具全部開(kāi)放給模型,F(xiàn)在我們正在用Gemini來(lái)排查正在發(fā)生的故障事件,這也幫助我們提升了工作效率,進(jìn)而提高了模型本身的質(zhì)量。我們從多個(gè)維度來(lái)審視這個(gè)問(wèn)題。但隨著生產(chǎn)力不斷提升、功能迭代越來(lái)越快——代碼行數(shù)當(dāng)然不是衡量標(biāo)準(zhǔn),但它確實(shí)是這種速度提升的一個(gè)體現(xiàn)——終究會(huì)到達(dá)一個(gè)臨界點(diǎn),你根本無(wú)法審查每一行代碼。
主持人:更進(jìn)一步來(lái)想,隨著時(shí)間推移,人類(lèi)對(duì)實(shí)際代碼的理解會(huì)越來(lái)越少。尤其是您剛才提到的,如果用AI來(lái)審查代碼、調(diào)試代碼——如果AI既負(fù)責(zé)生成代碼,又負(fù)責(zé)審查代碼,我們是否正在失去對(duì)代碼本身以及所部署功能的核心理解?
Thomas Kurian:這是整個(gè)行業(yè)都必須管控的風(fēng)險(xiǎn)。人們常說(shuō):我給你一個(gè)提示詞,它就能生成一段代碼,你不需要理解代碼,因?yàn)槟憷斫馓崾驹~就夠了。但現(xiàn)實(shí)是,對(duì)于一個(gè)復(fù)雜的系統(tǒng),提示詞并不能解釋代碼所有潛在的行為。比如,你該如何處理異常?
每次出現(xiàn)這種論調(diào),我都覺(jué)得似曾相識(shí)。前些年有人說(shuō)不需要那么多軟件工程師了,結(jié)果模型出來(lái)之后發(fā)現(xiàn)了大量安全漏洞——就在這個(gè)節(jié)骨眼上,我們反而需要大量軟件工程師來(lái)配合模型工作。比如我們正在推出一個(gè)新版本的模型,它能夠修復(fù)漏洞、專(zhuān)門(mén)修復(fù)安全漏洞,但你依然需要一個(gè)人來(lái)使用這個(gè)工具并加以專(zhuān)注地把控。這個(gè)行業(yè)有時(shí)候容易矯枉過(guò)正,說(shuō)"根本不需要任何人",結(jié)果恰恰是在最需要人的時(shí)候這么說(shuō)。
所以我們始終保持更長(zhǎng)遠(yuǎn)的視角。我們一直在思考,比如是否需要一個(gè)"監(jiān)督模型"以不同的方式來(lái)審查代碼——這也是為什么我說(shuō)我們依然堅(jiān)持代碼的同行評(píng)審,并且?guī)椭覀兊母呒?jí)工程師使用工具來(lái)完成審查。接下來(lái)的問(wèn)題是:這個(gè)工具是否有足夠的自我感知——如果是它自己生成的代碼,它能否發(fā)現(xiàn)其中的問(wèn)題?因?yàn)樗鼘?duì)某些代碼模式可能缺乏自我認(rèn)知。這是我們正在探索解決方案的方向。
我們的目標(biāo)始終是打造最優(yōu)秀的模型,并將其大規(guī)模應(yīng)用。僅在我的團(tuán)隊(duì)中,就有數(shù)千人每天都在使用它。如果你走到對(duì)面的園區(qū),可以看到有人同時(shí)開(kāi)著六個(gè)窗口——一個(gè)在寫(xiě)代碼,一個(gè)在編譯,一個(gè)在部署和測(cè)試,另一個(gè)在后臺(tái)跑代碼審查任務(wù)。整套工具鏈有大量的人在使用,這就是工作方式演進(jìn)的一部分。
主持人:您提到了網(wǎng)絡(luò)安全,我們就以這個(gè)話(huà)題收尾。Anthropic認(rèn)為其Mythos模型在網(wǎng)絡(luò)安全能力方面過(guò)于先進(jìn),暫時(shí)不宜公開(kāi)發(fā)布。對(duì)于谷歌而言,您如何看待這件事?您的第一反應(yīng)是什么?另外,是否存在某條紅線(xiàn)或某個(gè)基準(zhǔn),一旦觸及,您就會(huì)認(rèn)為Gemini不再適合公開(kāi)發(fā)布?
Thomas Kurian:我們正在研究這條線(xiàn)應(yīng)該劃在哪里。但我們面臨的核心問(wèn)題是:Mythos發(fā)現(xiàn)的那些漏洞,有多大比例同樣可以用開(kāi)源模型發(fā)現(xiàn)?我之所以提到開(kāi)源模型,是因?yàn)闊o(wú)論你怎么防范,即便能確保閉源模型不落入對(duì)手之手,開(kāi)源模型肯定是會(huì)流入對(duì)手手中的,而且它們還在持續(xù)進(jìn)化、越來(lái)越強(qiáng)。所以遲早有一天,其中某些能力——也許不是全部——是可以被檢測(cè)和利用的。
那么我們應(yīng)該如何應(yīng)對(duì)?我們有獨(dú)特的優(yōu)勢(shì),因?yàn)槲覀兗仁浅笠?guī)模云服務(wù)商,又是模型提供商,同時(shí)還擁有網(wǎng)絡(luò)安全團(tuán)隊(duì)——包括我們的Mandiant團(tuán)隊(duì)和Wiz。我們采取了三項(xiàng)切實(shí)舉措:
第一,如果人們要用模型來(lái)發(fā)現(xiàn)漏洞,你就需要用模型來(lái)幫助修復(fù)漏洞——因?yàn)槁┒幢话l(fā)現(xiàn)的速度遠(yuǎn)超人工修復(fù)的速度,所以必須用模型來(lái)輔助修復(fù)。
第二,如果對(duì)手用模型來(lái)發(fā)現(xiàn)漏洞,他們也會(huì)利用模型和計(jì)算機(jī)來(lái)發(fā)動(dòng)大規(guī)模攻擊。面對(duì)這種威脅,每月只做一次紅隊(duì)測(cè)試是遠(yuǎn)遠(yuǎn)不夠的。因此,我們需要引入能夠持續(xù)進(jìn)行紅隊(duì)測(cè)試的智能體,以及能夠輔助修復(fù)的智能體——修復(fù)代碼是一回事,找出所有運(yùn)行舊代碼的地方、將其清除、再部署經(jīng)過(guò)補(bǔ)丁更新的新代碼,這又是另一回事。
第三,現(xiàn)存代碼量如此龐大,從哪里開(kāi)始下手?這又是一個(gè)問(wèn)題。我們?yōu)榇藰?gòu)建了工具,幫助人們識(shí)別并確定優(yōu)先級(jí)。
主持人:這是否意味著開(kāi)源軟件(注意不是開(kāi)源模型,而是開(kāi)源軟件)是弊大于利的?如果你的代碼是開(kāi)源的,全都暴露在外,模型就可以?huà)呙琛l(fā)現(xiàn)漏洞并加以利用。閉源則沒(méi)有這個(gè)問(wèn)題。但另一方面,開(kāi)源代碼會(huì)被更快速地加固。您怎么看?這到底是支持還是反對(duì)開(kāi)源的論據(jù)?
Thomas Kurian:我們谷歌大量使用開(kāi)源,也大量貢獻(xiàn)開(kāi)源。我們會(huì)用自己的工具幫助開(kāi)源社區(qū)修復(fù)這些問(wèn)題。我只是在陳述現(xiàn)實(shí):對(duì)手會(huì)使用模型,他們首先會(huì)掃描的,就是那些流行的開(kāi)源庫(kù),因?yàn)檫@能給他們提供最大的攻擊面。這是我們認(rèn)為必須認(rèn)真對(duì)待、積極修復(fù)的問(wèn)題,我們正在與業(yè)界其他伙伴共同推進(jìn)。
主持人:Thomas,最后一個(gè)問(wèn)題:什么事情會(huì)讓您夜不能寐?
Thomas Kurian:我們需要平衡很多事情。第一,我們是否有面向未來(lái)的長(zhǎng)期計(jì)劃——數(shù)據(jù)中心、網(wǎng)絡(luò)基礎(chǔ)設(shè)施,以及足夠多的TPU?第二,我們是否始終在聚焦最核心、最重要的問(wèn)題?三年前,我們就判斷隨著AI能力增強(qiáng),網(wǎng)絡(luò)安全領(lǐng)域必將受到深遠(yuǎn)影響。當(dāng)我們提出收購(gòu)Wiz的時(shí)候,很多人問(wèn):你們?yōu)槭裁匆@么做?
再舉個(gè)例子,看看我們的Gemini企業(yè)平臺(tái):從今年一月到現(xiàn)在,我們的Token處理量已經(jīng)從每分鐘100億增長(zhǎng)到每分鐘160億。Gemini企業(yè)版的企業(yè)用戶(hù)數(shù)環(huán)比增長(zhǎng)了40%。
所以,我們始終在追問(wèn):我們是否在為客戶(hù)和用戶(hù)解決正確的問(wèn)題?這始終是我們的核心聚焦所在。只要我們持續(xù)積極地推進(jìn)問(wèn)題的解決,保持對(duì)市場(chǎng)的領(lǐng)先——在技術(shù)如此快速演進(jìn)的今天,當(dāng)某件事發(fā)生時(shí),你必須提前就準(zhǔn)備好解決方案。我們的團(tuán)隊(duì)做出了令人驚嘆的成果,我們?yōu)樗麄兏械綗o(wú)比自豪,也期待接下來(lái)的活動(dòng)。
主持人:Thomas,非常感謝您,真的非常感謝!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
禮物刷不停!馬蹄露直播間痛哭,感謝網(wǎng)友支持!霍汶希好感度沒(méi)了

禮物刷不停!馬蹄露直播間痛哭,感謝網(wǎng)友支持!霍汶希好感度沒(méi)了

娛樂(lè)團(tuán)長(zhǎng)
2026-04-24 15:40:59
車(chē)評(píng)人和媒體痛罵的特斯拉,3月銷(xiāo)量第一

車(chē)評(píng)人和媒體痛罵的特斯拉,3月銷(xiāo)量第一

難得君
2026-04-23 13:01:29
鄧超此生最大的幸運(yùn),就是遇見(jiàn)孫儷,生了一個(gè)“縮小版的自己”

鄧超此生最大的幸運(yùn),就是遇見(jiàn)孫儷,生了一個(gè)“縮小版的自己”

小蘭聊歷史
2026-04-25 09:21:24
兩次將妻子捉奸在床,情夫:睡你老婆又怎樣!丈夫絕望喝下百草枯

兩次將妻子捉奸在床,情夫:睡你老婆又怎樣!丈夫絕望喝下百草枯

游戲收藏指南
2026-04-25 12:30:55
直播調(diào)整!丁俊暉戰(zhàn)趙心童有變,肖國(guó)棟危險(xiǎn),美女裁判抽煙惹爭(zhēng)議

直播調(diào)整!丁俊暉戰(zhàn)趙心童有變,肖國(guó)棟危險(xiǎn),美女裁判抽煙惹爭(zhēng)議

曹說(shuō)體育
2026-04-24 13:05:42
有人說(shuō):打麻將和性生活是縣城的底色?

有人說(shuō):打麻將和性生活是縣城的底色?

燈錦年
2026-04-21 12:32:46
“見(jiàn)過(guò)最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

“見(jiàn)過(guò)最廉價(jià)的兜底”,一份山姆燒雞,讓低認(rèn)知母子淪為全網(wǎng)笑柄

妍妍教育日記
2026-04-15 09:30:09
身價(jià)百億,坐擁北京一條街,出門(mén)私人飛機(jī),圈中頂級(jí)富婆都有誰(shuí)?

身價(jià)百億,坐擁北京一條街,出門(mén)私人飛機(jī),圈中頂級(jí)富婆都有誰(shuí)?

天馬幸福的人生
2026-04-25 10:51:27
男子送相親對(duì)象回家遇其忘帶鑰匙,開(kāi)房遭拒后女子怒斥男子真沒(méi)用

男子送相親對(duì)象回家遇其忘帶鑰匙,開(kāi)房遭拒后女子怒斥男子真沒(méi)用

番外行
2026-04-24 08:55:30
1979年打越南,高層其實(shí)吵翻了天?葉劍英粟裕為何反對(duì)出兵?

1979年打越南,高層其實(shí)吵翻了天?葉劍英粟裕為何反對(duì)出兵?

勇哥讀史
2026-04-21 07:52:13
女演員自曝:曾流產(chǎn)5次失去7個(gè)寶寶,如今43歲仍努力拼二胎!

女演員自曝:曾流產(chǎn)5次失去7個(gè)寶寶,如今43歲仍努力拼二胎!

豬小艷吖
2026-04-24 13:49:15
2026款本田CR-V實(shí)車(chē)亮相 家用SUV顏值與實(shí)用雙升級(jí)

2026款本田CR-V實(shí)車(chē)亮相 家用SUV顏值與實(shí)用雙升級(jí)

西莫的藝術(shù)宮殿
2026-04-25 07:05:54
今晚10點(diǎn) 利物浦打響復(fù)仇戰(zhàn):贏(yíng)球?qū)⒆(wěn)英超前5 央視直播

今晚10點(diǎn) 利物浦打響復(fù)仇戰(zhàn):贏(yíng)球?qū)⒆(wěn)英超前5 央視直播

葉青足球世界
2026-04-25 09:10:33
“來(lái)杯姬尾酒”用飲料澆滅吸煙者煙頭導(dǎo)致被扒內(nèi)褲裸檢引發(fā)熱議

“來(lái)杯姬尾酒”用飲料澆滅吸煙者煙頭導(dǎo)致被扒內(nèi)褲裸檢引發(fā)熱議

魔都囡
2026-04-25 11:57:01
至今,還有13個(gè)國(guó)家和中國(guó)沒(méi)有建交,他們都是誰(shuí)?

至今,還有13個(gè)國(guó)家和中國(guó)沒(méi)有建交,他們都是誰(shuí)?

深度報(bào)
2026-04-22 22:30:57
馬筱梅說(shuō)到做到,玥兒今年生日一點(diǎn)動(dòng)靜都沒(méi)有,張?zhí)m暗喻優(yōu)秀女人

馬筱梅說(shuō)到做到,玥兒今年生日一點(diǎn)動(dòng)靜都沒(méi)有,張?zhí)m暗喻優(yōu)秀女人

草莓解說(shuō)體育
2026-04-25 12:46:02
虞書(shū)欣戛納翻車(chē)!官方親自下場(chǎng)辟謠,網(wǎng)友:丟臉丟到國(guó)外

虞書(shū)欣戛納翻車(chē)!官方親自下場(chǎng)辟謠,網(wǎng)友:丟臉丟到國(guó)外

手工制作阿殲
2026-04-25 02:42:30
中國(guó)首艘核航母官宣!海軍用兩字通告全球,舷號(hào)19,命名江蘇艦?

中國(guó)首艘核航母官宣!海軍用兩字通告全球,舷號(hào)19,命名江蘇艦?

阿握聊事
2026-04-25 09:49:53
全球男女壽命越拉越大!Nature:雄激素是關(guān)鍵,抑制可多活20%

全球男女壽命越拉越大!Nature:雄激素是關(guān)鍵,抑制可多活20%

思思夜話(huà)
2026-04-25 11:05:11
發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象:百病纏身的人,都是經(jīng)常被身邊人無(wú)限消耗

發(fā)現(xiàn)一個(gè)奇怪的現(xiàn)象:百病纏身的人,都是經(jīng)常被身邊人無(wú)限消耗

富書(shū)
2026-03-17 13:19:16
2026-04-25 13:59:00
華爾街見(jiàn)聞官方 incentive-icons
華爾街見(jiàn)聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
145151文章數(shù) 2653361關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

頭條要聞

美能源出口創(chuàng)新高 二戰(zhàn)以來(lái)首次接近成為原油凈出口國(guó)

頭條要聞

美能源出口創(chuàng)新高 二戰(zhàn)以來(lái)首次接近成為原油凈出口國(guó)

體育要聞

火箭0-3觸發(fā)百分百出局定律:本季加時(shí)賽9戰(zhàn)8敗

娛樂(lè)要聞

鄧超最大的幸運(yùn),就是遇見(jiàn)孫儷

財(cái)經(jīng)要聞

90%訂單消失,中東旺季沒(méi)了

汽車(chē)要聞

2026款樂(lè)道L90亮相北京車(chē)展 樂(lè)道L80正式官宣

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
教育
手機(jī)
軍事航空

火了30年的off-duty,不費(fèi)力,才是真本事

藝術(shù)要聞

荒廢十多年!福建石獅“最美爛尾樓”,德國(guó)品牌接盤(pán)了

教育要聞

小學(xué)教師中碩博士越來(lái)越多,超5900名擁有博士學(xué)歷

手機(jī)要聞

vivo X300 FE真機(jī)現(xiàn)身,蔡司加持,售價(jià)大亮

軍事要聞

美防長(zhǎng):戰(zhàn)事不會(huì)“沒(méi)完沒(méi)了”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版