網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

在OpenAI“創(chuàng)新已經(jīng)變得困難”！離職高管深喉爆料

2026-01-23 19:54:21　來(lái)源: 智東西

北京舉報(bào)

分享至

智東西
編譯陳駿達(dá)
編輯 Panken

智東西1月23日消息，昨天，由知名媒體人和作家Ashlee Vance主辦的Core Memory播客，發(fā)布了對(duì)OpenAI前研究副總裁Jerry Tworek的深度專訪。今年1月初決定離開(kāi)的OpenAI的Tworek分享了一個(gè)關(guān)鍵洞察：隨著競(jìng)爭(zhēng)加劇與組織急速膨脹，OpenAI正逐漸陷入一種難以再承擔(dān)真正高風(fēng)險(xiǎn)研究的結(jié)構(gòu)性困境，一些前沿創(chuàng)新的研究方向，已經(jīng)難以在OpenAI內(nèi)部推進(jìn)。

在正式進(jìn)入訪談內(nèi)容前，我們有必要了解下Tworek的傳奇履歷。Tworek是OpenAI元老級(jí)成員，2019年便加入該公司。他是OpenAI推理模型o1、o3背后的關(guān)鍵人物，將強(qiáng)化學(xué)習(xí)做到了極致，也讓強(qiáng)化學(xué)習(xí)、推理模型真正進(jìn)入了主流視野。此外，Tworek還在編程和Agent領(lǐng)域頗有建樹(shù)。

今年1月7日，Tworek在X平臺(tái)上分享了自己離職的消息，評(píng)論區(qū)涌入了諸多OpenAI大佬，言語(yǔ)間滿是不舍之情。

這場(chǎng)訪談長(zhǎng)達(dá)70分鐘，實(shí)錄近2萬(wàn)字，智東西梳理出Tworek分享的八大關(guān)鍵洞察：

1、OpenAI的創(chuàng)新困境：成本、增長(zhǎng)壓力等多重因素影響了OpenAI對(duì)風(fēng)險(xiǎn)的“胃口”，同時(shí)該公司尚未找到良好的跨團(tuán)隊(duì)的研究協(xié)作模式。

2、谷歌崛起：與其說(shuō)是谷歌“回歸”，不如說(shuō)是OpenAI自己犯了錯(cuò)誤，沒(méi)能充分把握住自己的領(lǐng)先優(yōu)勢(shì)。OpenAI本應(yīng)該持續(xù)領(lǐng)先。

3、行業(yè)弊?。?/strong>5家頭部AI公司路徑完全趨同，研究員想在主流機(jī)器學(xué)習(xí)范式之外做點(diǎn)不同的事情，幾乎找不到合適的地方，這令人沮喪。

4、人才爭(zhēng)奪戰(zhàn)：人才爭(zhēng)奪戰(zhàn)已演變成一場(chǎng)肥皂劇，有些人頻繁地更換工作，而真正投入到工作的時(shí)間不多。

5、創(chuàng)新引擎：明星AI研究員并不是驅(qū)動(dòng)創(chuàng)新的核心因素，公司本身能否打造個(gè)人責(zé)任感強(qiáng)、允許探索和做大事的環(huán)境，可能更為關(guān)鍵。

6、什么阻礙了創(chuàng)新：阻礙AI Lab研究的因素不是算力短缺，而是缺乏專注。對(duì)OpenAI來(lái)說(shuō)，“集中力量辦大事”已經(jīng)變得有些困難。

7、AGI時(shí)間表：目前AGI仍然缺失關(guān)鍵拼圖，架構(gòu)創(chuàng)新與持續(xù)學(xué)習(xí)是兩大重要方向，但AGI將會(huì)在2029年左右實(shí)現(xiàn)。

8、強(qiáng)化學(xué)習(xí)的回歸：科學(xué)史已經(jīng)反復(fù)證明，好的想法往往會(huì)卷土重來(lái)，判斷一個(gè)想法是否重要并不難，難的是判斷它什么時(shí)候會(huì)變得重要。

以下是訪談內(nèi)容的完整編譯：

一、競(jìng)爭(zhēng)激烈、組織膨脹，OpenAI的創(chuàng)新困境

主持人：你的離職聲明寫(xiě)得很好，充滿感情。你在OpenAI經(jīng)歷了非常重要的一段時(shí)間，見(jiàn)證了巨大的變化。那種感覺(jué)怎么樣？

Jerry Tworek：在OpenAI的每一年，都是一家完全不同的公司。公司本身的高速成長(zhǎng)，以及整個(gè)AI世界的變化。

這種經(jīng)歷我覺(jué)得在人類歷史上都很少見(jiàn)。我很慶幸自己能親身經(jīng)歷這一切。正如我之前說(shuō)的，每一個(gè)階段都完全不同。

主持人：OpenAI在2019年時(shí)大概只有30個(gè)人？現(xiàn)在已經(jīng)是幾千人了吧？

Jerry Tworek：說(shuō)實(shí)話，很難統(tǒng)計(jì)清楚。全球多地辦公室，遍布世界各地。現(xiàn)在幾乎找不到?jīng)]聽(tīng)說(shuō)過(guò)OpenAI的人了。而我剛加入的時(shí)候，只是幾個(gè)小團(tuán)隊(duì)，各自做著自己的研究項(xiàng)目。

但有一件事始終沒(méi)變——OpenAI的野心。從一開(kāi)始就瞄準(zhǔn)AGI，想真正改變世界，并且?guī)?lái)正面的影響。而通過(guò)ChatGPT，把智能和實(shí)用性真正分發(fā)給了全球用戶，我覺(jué)得這是一件非常了不起的事情。

主持人：所以你發(fā)了那條推文之后，是不是全球所有基礎(chǔ)模型實(shí)驗(yàn)室都來(lái)找你了？

Jerry Tworek：確實(shí)有很多。我現(xiàn)在也在思考下一步該做什么。在這個(gè)行業(yè)這么多年，我已經(jīng)認(rèn)識(shí)了很多人。我并不急著做決定。

我已經(jīng)連續(xù)高強(qiáng)度工作很多年了，甚至沒(méi)太多時(shí)間好好和人聊天。現(xiàn)在正好可以慢下來(lái)，想一想：接下來(lái)的七年，我想怎么度過(guò)。但確實(shí)，我正在和很多人交流。

主持人：你在推文里提到，你想做一些在OpenAI沒(méi)法做的研究。能具體說(shuō)說(shuō)嗎？

Jerry Tworek：當(dāng)前，在全球范圍內(nèi)爭(zhēng)奪“最佳AI模型”的競(jìng)爭(zhēng)異常激烈且嚴(yán)苛。想要保持競(jìng)爭(zhēng)力，公司在運(yùn)營(yíng)的多個(gè)層面都面臨著極大的挑戰(zhàn)。

其中一個(gè)核心問(wèn)題在于風(fēng)險(xiǎn)承擔(dān)的意愿：從避免落后的角度出發(fā)，公司自然會(huì)被迫思考，究竟愿意承擔(dān)多大的風(fēng)險(xiǎn)。無(wú)論是用戶增長(zhǎng)指標(biāo)，還是持續(xù)支付高昂的GPU成本，現(xiàn)實(shí)都極其殘酷。

也正因如此，持續(xù)展示實(shí)力、不斷推出最強(qiáng)模型，對(duì)所有人而言都變得至關(guān)重要。這是當(dāng)下幾乎所有主要AI公司共同面臨的處境，而這種壓力無(wú)疑會(huì)影響一家機(jī)構(gòu)對(duì)風(fēng)險(xiǎn)的“胃口”。

另一組同樣難以權(quán)衡的因素來(lái)自組織結(jié)構(gòu)。公司有其組織架構(gòu)圖，而組織架構(gòu)往往在很大程度上決定了你能夠開(kāi)展什么樣的研究：每個(gè)團(tuán)隊(duì)都需要明確的身份認(rèn)同、研究邊界以及其專注解決的問(wèn)題集合。

跨組織的研究往往異常困難，而如何在大規(guī)模條件下高效地組織研究，這個(gè)問(wèn)題可能還沒(méi)有被真正解決。

研究本身偏好活力，甚至可以說(shuō)偏好某種程度的混亂；而大型組織卻需要秩序、結(jié)構(gòu)與清晰的分工。這正是為什么“你最終交付的是你的組織架構(gòu)圖”這一說(shuō)法如此流行：研究工作往往會(huì)演變成那些最適合現(xiàn)有人員配置的項(xiàng)目。

我也正是在這種背景下意識(shí)到，有一些我真正想做的研究方向，并不是OpenAI當(dāng)前的組織架構(gòu)所能支持的。

二、Transformer肯定不是最終形態(tài)，有很多路徑尚未得到系統(tǒng)性實(shí)踐

主持人：我曾在播客里和Mark Chen（OpenAI首席研究官）聊過(guò)這個(gè)問(wèn)題——幾乎所有人都在向他（以及Jakub，OpenAI首席科學(xué)家）提出自己的想法。OpenAI的確有一個(gè)優(yōu)良傳統(tǒng)：愿意承擔(dān)風(fēng)險(xiǎn)，愿意去做一些其他實(shí)驗(yàn)室不敢做的事情。

但現(xiàn)實(shí)是，無(wú)論聚集了多少聰明人，資源已相當(dāng)可觀，這終究是一家資源有限的公司。它必須做出重大的取舍：哪些方向值得投入，哪些現(xiàn)在還無(wú)法承擔(dān)成本。

而真正足夠新穎的路徑，往往恰恰是那種讓人猶豫的方向——我們不知道現(xiàn)在該不該走，也不知道錢(qián)包是否負(fù)擔(dān)得起。

Jerry Tworek：關(guān)于Ilya提出的“研究時(shí)代”這一概念，我不確定它是否像他所描述的那樣非此即彼，但我確信，在AI和機(jī)器學(xué)習(xí)領(lǐng)域，仍然存在大量尚未被充分探索的可能性。

六年前，我們選定了Transformer架構(gòu)，此后人們不斷對(duì)其進(jìn)行Scaling，并且效果顯著。路徑非常清晰：每個(gè)季度訓(xùn)練更大的模型，使用更多計(jì)算資源和數(shù)據(jù)，而進(jìn)步似乎從未真正停滯。

但問(wèn)題在于：這就是全部了嗎？這是最終形態(tài)嗎？我相當(dāng)確定不是。模型仍然可以通過(guò)多種方式改進(jìn)，而其中許多路徑至今尚未被系統(tǒng)性地實(shí)踐。

正如你提到的，我曾在推理和強(qiáng)化學(xué)習(xí)擴(kuò)展方面投入大量工作。在那之前，整個(gè)領(lǐng)域幾乎把所有賭注都押在了Transformer預(yù)訓(xùn)練的Scaling上。

這種方式確實(shí)有效：每一次預(yù)訓(xùn)練都可以打造出更強(qiáng)的模型，其能力都會(huì)全面提升，各項(xiàng)評(píng)測(cè)指標(biāo)也隨之改善。因此，人們很容易得出結(jié)論：只要不斷擴(kuò)展預(yù)訓(xùn)練，模型就會(huì)持續(xù)變好。

但后來(lái)，一些研究者開(kāi)始相信，我們能做的不止于此。他們嘗試證明：如果在語(yǔ)言模型之上，以與預(yù)訓(xùn)練相當(dāng)?shù)挠?jì)算規(guī)模去擴(kuò)展強(qiáng)化學(xué)習(xí)，就能教會(huì)模型一些僅靠預(yù)訓(xùn)練永遠(yuǎn)無(wú)法獲得的能力。

正是由于這種探索，我們今天才擁有了這些能夠自動(dòng)化復(fù)雜任務(wù)、顯著降低計(jì)算與數(shù)據(jù)需求的智能體系統(tǒng)。一旦發(fā)現(xiàn)新的擴(kuò)展路徑，就能解鎖全新的能力，而如果只沿著預(yù)訓(xùn)練的擴(kuò)展定律前進(jìn)，這些能力可能需要極其漫長(zhǎng)的時(shí)間才能出現(xiàn)。

在我看來(lái)，自GPT-4發(fā)布以來(lái)，推理模型代表了一次真正重大的能力躍遷。而我也堅(jiān)信，類似這樣的突破并非孤例。研究者不應(yīng)只滿足于漸進(jìn)式改進(jìn)，更應(yīng)持續(xù)思考如何從根本上改變游戲規(guī)則。

三、頭部AI玩家路徑趨同，這是件令人遺憾的事兒

主持人：去年在NeurIPS上，Ilya提到“我們正在耗盡數(shù)據(jù)”，暗示預(yù)訓(xùn)練終將觸及瓶頸。

Jerry Tworek：我并不認(rèn)為這意味著預(yù)訓(xùn)練即將終結(jié)，它仍然在持續(xù)改進(jìn)，也依然有許多優(yōu)化空間。但預(yù)訓(xùn)練并不是提升模型能力的唯一方式，而且在很多情況下，它提升得非常緩慢。其他方法，或許能更快地推動(dòng)能力躍遷。

主持人：硅谷長(zhǎng)期存在一種有趣的現(xiàn)象：科技公司往往會(huì)提出一些在外界看來(lái)怪異、甚至離經(jīng)叛道的想法，而正是這些想法催生了真正顛覆性的創(chuàng)新。

但一旦某條路徑被證明是成功的，局面就會(huì)迅速反轉(zhuǎn)，形成強(qiáng)烈的共識(shí)，所有人開(kāi)始沿著同一方向競(jìng)賽。

這正是我們當(dāng)前所處的階段。模型競(jìng)賽已經(jīng)持續(xù)了兩三年，幾乎所有主要實(shí)驗(yàn)室都在做同一件事。你認(rèn)為這是個(gè)問(wèn)題嗎？

Jerry Tworek：我對(duì)此感到相當(dāng)、相當(dāng)遺憾，幾乎所有公司都在做和OpenAI一樣的事兒。OpenAI無(wú)疑取得了巨大成功，做對(duì)了更多事兒，引領(lǐng)了擴(kuò)展Transformer的范式，也證明了大規(guī)模模型能夠?yàn)槭澜鐒?chuàng)造真實(shí)而廣泛的價(jià)值。

但如今，有多少公司在做著幾乎一模一樣的事情？競(jìng)爭(zhēng)當(dāng)然有其價(jià)值，但我們現(xiàn)在大概有五家嚴(yán)肅的AI公司，使用幾乎相同的技術(shù)配方，在同一技術(shù)基礎(chǔ)上構(gòu)建略有差異的產(chǎn)品。

也許這是正確的路徑，但我仍然希望看到更多多樣性，模型之間真正的差異，而不僅是微小的調(diào)優(yōu)。

如果你觀察當(dāng)下最頂級(jí)的模型，很少有人能真正分辨它們之間的不同?；蛟S我們應(yīng)該進(jìn)行更多盲測(cè)：讓用戶與不同模型對(duì)話，看看他們是否能分辨出差異。

我懷疑99.9%的用戶做不到。這些模型在體驗(yàn)上極其相似，即便它們來(lái)自不同團(tuán)隊(duì)、采用了略有不同的技術(shù)選擇。在這樣的環(huán)境中，真正的探索在哪里？真正的創(chuàng)新，以及與他人區(qū)分開(kāi)來(lái)的能力，又在哪里？

四、與OpenAI已出現(xiàn)實(shí)質(zhì)性分歧，分開(kāi)比勉強(qiáng)合作更健康

主持人：我問(wèn)一個(gè)有些尖銳的問(wèn)題：你在OpenAI內(nèi)外都被視為傳奇人物，參與的項(xiàng)目成功率極高。如果連你這樣的人，都覺(jué)得自己真正想做的事情在公司內(nèi)部難以推進(jìn)——無(wú)論公司是否明確反對(duì)，這種阻力本身就已經(jīng)存在。

對(duì)于一家最初以研究實(shí)驗(yàn)室起家的公司而言，這是否是一個(gè)值得警惕的信號(hào)？

Jerry Tworek：我的看法是，有時(shí)候人們會(huì)成長(zhǎng)到某個(gè)階段，需要與過(guò)去分道揚(yáng)鑣。對(duì)一家公司及其成員來(lái)說(shuō)，就目標(biāo)和前進(jìn)方向達(dá)成一致極其重要。

而在某個(gè)時(shí)刻，我意識(shí)到自己對(duì)未來(lái)研究路線的看法，與OpenAI所選擇的方向在某種實(shí)質(zhì)性層面上出現(xiàn)了分歧。在這種情況下，分開(kāi)也許比勉強(qiáng)合作要更健康。

正因如此，我也認(rèn)為，如果不同公司能夠真正專注于不同的事情，行業(yè)會(huì)因此變得更好。專注對(duì)一家公司而言至關(guān)重要，而OpenAI很可能正在做所有正確的事情。

也許只是我懷抱了一些不切實(shí)際的夢(mèng)想。我是一個(gè)相對(duì)樂(lè)觀的人，我相信世界上始終還有很多不同的事情可以去做，這在原則上完全是可能的。

關(guān)鍵在于專注，把真正核心的事情做到極致。事實(shí)上，很多事情、很多公司，只有做到這一點(diǎn)，才能生存下來(lái)并進(jìn)入下一個(gè)階段。

在一個(gè)理想的世界里，應(yīng)該存在大量做著不同事情的公司。尤其是對(duì)研究人員而言，他們很難在一個(gè)自己并不真正相信的研究方向上長(zhǎng)期投入。他們理應(yīng)能夠找到一個(gè)地方，在那里從事自己最篤信的研究，并讓時(shí)間來(lái)檢驗(yàn)其價(jià)值。

也正因?yàn)槿绱?，我?duì)如今幾乎所有公司都在做同樣的事情感到有些難過(guò)?，F(xiàn)實(shí)是，如果你想在主流機(jī)器學(xué)習(xí)范式之外做點(diǎn)不同的事情，幾乎找不到合適的地方。這可能是目前讓我最沮喪的一點(diǎn)。

主持人：當(dāng)你開(kāi)始認(rèn)真思考“下一步要做什么”時(shí)，這種同質(zhì)化的問(wèn)題會(huì)變得尤為明顯。如果所有實(shí)驗(yàn)室都在做同樣的事，你自然也不會(huì)覺(jué)得自己只是換一家大實(shí)驗(yàn)室就能獲得真正不同的空間。

Jerry Tworek：我確實(shí)在思考人生的下一個(gè)階段，但如果世界上能有更多選擇，讓人可以稍微偏離主流，去做一些不那么熱門(mén)、但可能同樣重要的事情，那會(huì)讓我更開(kāi)心，也更容易做出決定。

主持人：這就引出了一個(gè)問(wèn)題：我們到底需要什么，才能真正偏離主流？

一個(gè)投入了如此多資金和資源、又處在聚光燈下的公司，會(huì)本能地害怕承擔(dān)風(fēng)險(xiǎn)。但問(wèn)題在于，這些風(fēng)險(xiǎn)也許恰恰是必要的。那么，究竟需要改變什么？這種狀況未來(lái)會(huì)不會(huì)發(fā)生改變？

Jerry Tworek：有趣的是，我個(gè)人其實(shí)非常喜歡冒險(xiǎn)，別人也常這樣形容我。冒險(xiǎn)本身是一件好事。

但當(dāng)風(fēng)險(xiǎn)和巨額資金綁定在一起時(shí)，愿意、也有能力承擔(dān)這種風(fēng)險(xiǎn)的人就會(huì)變得極其稀少。風(fēng)險(xiǎn)承受能力是一種高度個(gè)人化、極其獨(dú)特的特質(zhì)。我與很多人共事過(guò)，深切體會(huì)到這一點(diǎn)。

我真心認(rèn)為，人們本該更愿意承擔(dān)風(fēng)險(xiǎn)，去嘗試更多不同的事情。尤其是研究人員這一群體——如今AI領(lǐng)域的薪酬水平已經(jīng)相當(dāng)夸張了，而這反而可能帶來(lái)一種副作用：人們變得不愿意失去工作，不愿意經(jīng)歷糟糕的績(jī)效周期。于是，他們更傾向于追逐短期回報(bào)。

很多研究人員本身非常聰明、也很有想法，只是整個(gè)系統(tǒng)的激勵(lì)機(jī)制過(guò)于短視?？汕∏∈茄芯咳藛T，才最應(yīng)該被鼓勵(lì)去冒險(xiǎn)、去做大膽的嘗試——因?yàn)檎嬲倪M(jìn)步，正是這樣產(chǎn)生的。

五、算力門(mén)檻正阻礙創(chuàng)新，“探索與利用”的權(quán)衡是關(guān)鍵問(wèn)題

主持人：當(dāng)然，我們也看到了一些例子。比如游戲教父John Carmack，他去了達(dá)拉斯的“洞穴”，一度幾乎是獨(dú)自工作，現(xiàn)在可能也只有極少數(shù)員工。Carmack說(shuō)過(guò)：“也許我未必能做出真正不同的東西，但至少應(yīng)該有人在認(rèn)真嘗試一條完全不同的路徑。”

我也和Ilya聊過(guò)，不過(guò)我并不清楚他具體在研究什么。所以我無(wú)法判斷，他的工作是在延續(xù)過(guò)去的方向，還是某種更加激進(jìn)的嘗試。但可以肯定的是，如果他不認(rèn)為那是一條不同的道路，就不會(huì)去籌集那么多資金來(lái)做這件事。楊立昆顯然也有與主流不同的理念。

這正是讓我覺(jué)得這個(gè)領(lǐng)域非常有趣的地方。AI在某種意義上是一個(gè)非常古老的領(lǐng)域，可以追溯到幾十年前；但當(dāng)下這套主流范式，其實(shí)是相對(duì)較新的。當(dāng)我和研究人員交流時(shí)，他們?nèi)匀粫?huì)說(shuō)：“只要把主要論文都讀一遍，很快就能跟上進(jìn)度?！?/p>

可我時(shí)常會(huì)想，會(huì)不會(huì)有某個(gè)人，突然帶著一個(gè)極其激進(jìn)、全新的想法出現(xiàn)，徹底推動(dòng)整個(gè)領(lǐng)域向前？如今這件事似乎變得更難了，因?yàn)槟憧赡苄枰粋€(gè)州那么大的數(shù)據(jù)中心來(lái)支撐實(shí)驗(yàn)。

Jerry Tworek：這是一個(gè)巨大的資源門(mén)檻，也確實(shí)讓問(wèn)題變得更加棘手。但這同樣是一個(gè)值得認(rèn)真思考、試圖解決的問(wèn)題。

世界上有大量學(xué)術(shù)研究在進(jìn)行，許多學(xué)生在做各種各樣的探索，但其中絕大多數(shù)都嚴(yán)重缺乏資源。結(jié)果是，許多原本可能很有潛力的研究，最終不了了之，因?yàn)檎嬲P(guān)鍵的研究往往需要大規(guī)模實(shí)驗(yàn)。

也正因如此，我對(duì)當(dāng)下的一個(gè)趨勢(shì)感到非常欣慰：確實(shí)有相當(dāng)多的資金開(kāi)始流向那些支持新穎、激進(jìn)想法的嘗試。像Carmack、Ilya、楊立昆這樣的人，正是當(dāng)下應(yīng)該存在、也應(yīng)該被資助的對(duì)象。

顯然，并不是所有嘗試都會(huì)成功，但其中一些一定會(huì)——世界上的創(chuàng)新正是以這種方式發(fā)生的。

在強(qiáng)化學(xué)習(xí)領(lǐng)域，“探索與利用”的權(quán)衡早已是一個(gè)經(jīng)典概念。即便是我們?cè)趦?yōu)化智能體時(shí)，也始終面臨這個(gè)問(wèn)題：是選擇那些已被驗(yàn)證有效、成功路徑明確的策略，還是嘗試全新的方法，用不同的方式解決舊問(wèn)題？

這是一個(gè)艱難但無(wú)法回避的權(quán)衡。當(dāng)我們思考智能體該如何行動(dòng)時(shí)，也許同樣應(yīng)該反思我們自己是如何做選擇的。

主持人：至于那個(gè)由頂尖AI研究者組成的小圈子，人們是否真的清楚Carmack在做什么？

Jerry Tworek：說(shuō)實(shí)話，我并不完全清楚。我的印象是，他正在大力押注于通過(guò)鼠標(biāo)和鍵盤(pán)，在電子游戲中進(jìn)行端到端的強(qiáng)化學(xué)習(xí)。如果我沒(méi)記錯(cuò)的話，大致是這樣。

而這恰恰讓我覺(jué)得非常有意思。長(zhǎng)期以來(lái)，我一直認(rèn)為電子游戲是訓(xùn)練智能的絕佳環(huán)境之一。游戲是為人類大腦設(shè)計(jì)的，要讓人類覺(jué)得有趣，它們?nèi)诤狭斯适?、?quán)力幻想、解謎和問(wèn)題解決，必須持續(xù)保持新鮮感，不能變得重復(fù)。

從某種意義上說(shuō)，電子游戲是為人類認(rèn)知量身定制的學(xué)習(xí)環(huán)境，而問(wèn)題解決這樣的能力，正是我們希望智能體具備的能力。

但我們至今還沒(méi)有真正聰明的模型，能夠在這種高頻、多模態(tài)的環(huán)境中穩(wěn)定運(yùn)行。這也許暴露了某些架構(gòu)層面的限制。但我依然認(rèn)為，在電子游戲上訓(xùn)練AI，是一件非常有前景的事情。

強(qiáng)化學(xué)習(xí)之父Richard Sutton過(guò)去做過(guò)大量相關(guān)工作，不僅是電子游戲，還有撲克等復(fù)雜博弈。我曾去過(guò)他的實(shí)驗(yàn)室。當(dāng)然，他當(dāng)年的游戲環(huán)境，比我們后來(lái)在OpenAI讓模型玩Dota時(shí)要簡(jiǎn)單得多。DeepMind CEO Demis Hassabis也一直在堅(jiān)持類似的想法。

六、好的想法，往往會(huì)卷土重來(lái)

主持人：有趣的是，這些思路曾一度被認(rèn)為“過(guò)時(shí)”。在ChatGPT時(shí)代，它們看起來(lái)不像是主流方向。

Jerry Tworek：科學(xué)史反復(fù)告訴我們：好的想法往往會(huì)卷土重來(lái)。判斷一個(gè)想法是否重要并不難，難的是判斷它什么時(shí)候會(huì)變得重要。

七年前我剛加入OpenAI時(shí)，基于游戲的強(qiáng)化學(xué)習(xí)是絕對(duì)的熱點(diǎn)。我們解決了Dota、《星際爭(zhēng)霸》。當(dāng)時(shí)DeepMind的AlphaGo更是一個(gè)里程碑。

但這些模型有一個(gè)非常明顯的問(wèn)題：它們幾乎沒(méi)有世界知識(shí)。它們只是在從零開(kāi)始學(xué)習(xí)如何玩某一個(gè)游戲，而并不真正理解我們的世界。

顯然，這不是正確的路徑。模型首先需要對(duì)現(xiàn)實(shí)世界形成高層次的理解，而不僅僅是對(duì)像素作出反應(yīng)。從零開(kāi)始的強(qiáng)化學(xué)習(xí)，更像是一種“蜥蜴腦”或“猴腦”的學(xué)習(xí)方式。我們真正希望的是讓模型具備更抽象的概念結(jié)構(gòu)。

而經(jīng)過(guò)多年大規(guī)模預(yù)訓(xùn)練，我們終于獲得了對(duì)世界極其豐富、穩(wěn)固的表征。現(xiàn)在，是時(shí)候在此基礎(chǔ)上重新引入強(qiáng)化學(xué)習(xí)了。推理模型的真正魔力，正是在于：它們?cè)谝粋€(gè)強(qiáng)大的世界表征之上，通過(guò)強(qiáng)化學(xué)習(xí)構(gòu)建能力層級(jí)。這才是未來(lái)的方向。

主持人：至于世界模型，谷歌做過(guò)相關(guān)探索，楊立昆和李飛飛的研究在某種程度上也指向這一方向。我們作為嬰兒并不是生活在黑箱中，而是通過(guò)不斷試探來(lái)理解世界。所以，將世界模型與強(qiáng)化學(xué)習(xí)結(jié)合，在我看來(lái)是非常合理的。

Jerry Tworek：這個(gè)想法顯然是正確的。真正有趣的地方在于，我們?nèi)绾螌⑹澜缒Ｐ偷谋碚鳂?gòu)建與強(qiáng)化學(xué)習(xí)結(jié)合起來(lái)。強(qiáng)化學(xué)習(xí)用于教會(huì)模型各種技能，而這些技能正是模型在現(xiàn)實(shí)世界中運(yùn)作所必需的——它賦予模型實(shí)現(xiàn)自身目標(biāo)的能力。

然而，要想實(shí)現(xiàn)目標(biāo)，模型首先必須理解自己所處的世界；只有在具備這種理解之后，它才能形成有效的計(jì)劃與策略。這正是為什么世界模型與強(qiáng)化學(xué)習(xí)必須協(xié)同發(fā)展的原因。一旦有人能夠在一個(gè)訓(xùn)練良好的世界模型之上成功地進(jìn)行強(qiáng)化學(xué)習(xí)，那將會(huì)是一個(gè)極其令人振奮、具有里程碑意義的時(shí)刻。

七、架構(gòu)創(chuàng)新與持續(xù)學(xué)習(xí)是兩大方向，AGI仍然缺失關(guān)鍵拼圖

主持人：你現(xiàn)在對(duì)什么最感興趣？

Jerry Tworek：總體上，我認(rèn)為簡(jiǎn)單地去重復(fù)實(shí)驗(yàn)室里已經(jīng)在做的事情，其實(shí)意義不大。在現(xiàn)有的范式和設(shè)置中，仍然有很多可以調(diào)整、可以改進(jìn)的地方，但有兩個(gè)方向，我覺(jué)得要么被明顯低估了，要么至少?zèng)]有得到足夠的資源去真正推進(jìn)。

第一個(gè)方向是架構(gòu)層面的創(chuàng)新。我們?cè)赥ransformer架構(gòu)上多少有些過(guò)于固步自封了。它無(wú)疑是一個(gè)偉大的架構(gòu)，也已經(jīng)被極其深入地探索過(guò)。

人們?cè)趯?duì)Transformer進(jìn)行局部改進(jìn)、試圖通過(guò)一些小的結(jié)構(gòu)調(diào)整來(lái)進(jìn)一步提升它時(shí)，確實(shí)遇到了不少困難，當(dāng)然，也有一些相當(dāng)成功的嘗試——比如稀疏性顯然就非常成功，各種降低注意力機(jī)制計(jì)算成本的方法也取得了不錯(cuò)的效果。

但問(wèn)題是：Transformer會(huì)是機(jī)器學(xué)習(xí)的終極架構(gòu)嗎？顯然不會(huì)。盡管Transformer的提出者們做了極其出色的工作，幾乎定義了接下來(lái)十年機(jī)器學(xué)習(xí)的發(fā)展格局，但事情遠(yuǎn)不止于此。

一定還存在其他訓(xùn)練大模型的方法——它們可能看起來(lái)有點(diǎn)像Transformer，也可能完全不像。這是一個(gè)非常值得投入精力去探索的問(wèn)題。如果沒(méi)有人去做這件事，那我會(huì)很樂(lè)意自己試一試。

第二個(gè)方向是一個(gè)更熱門(mén)的話題，但我并不認(rèn)為目前有人真正把它做好了，那就是持續(xù)學(xué)習(xí)，以及如何真正地、徹底地將test time與train time融合在一起。

對(duì)人類而言，這種方式再自然不過(guò)了：我們并不存在一個(gè)明確分離的“學(xué)習(xí)模式”和“回答模式”，一切都是在持續(xù)不斷地同時(shí)發(fā)生的。我們的模型也應(yīng)該更接近這種運(yùn)作方式。

這很可能是我們?cè)趯?shí)現(xiàn)AGI之前，仍然缺失的幾個(gè)關(guān)鍵能力要素之一。如果模型無(wú)法從它們所接觸到的數(shù)據(jù)中持續(xù)學(xué)習(xí)，那么無(wú)論它們?cè)谄渌矫娑嗝磸?qiáng)大，依然會(huì)給人一種受限、甚至有些“愚鈍”的感覺(jué)。

主持人：說(shuō)到AGI，我們上次聊天時(shí)我提到過(guò)，相比一兩年前，現(xiàn)在我已經(jīng)不太常聽(tīng)到關(guān)于時(shí)間線的討論了。甚至連關(guān)于AGI本身的討論似乎也減少了。所以我其實(shí)挺好奇的。

你稱自己對(duì)AI持謹(jǐn)慎樂(lè)觀的態(tài)度。那么在你看來(lái)，我們現(xiàn)在處在AGI時(shí)間線的哪個(gè)位置？

Jerry Tworek：是的，我個(gè)人的看法其實(shí)也略有更新。我一直認(rèn)為，擴(kuò)大強(qiáng)化學(xué)習(xí)的規(guī)模是實(shí)現(xiàn)AGI的必要組成部分。大約在一年前或一年半前，我?guī)缀鯃?jiān)信，只要我們把模型的強(qiáng)化學(xué)習(xí)規(guī)模做大，它就會(huì)成為AGI。

而現(xiàn)在，我不得不稍微修正這一觀點(diǎn)。不過(guò)有些東西，只有在真正進(jìn)入下一個(gè)階段之后你才能看清。我們也必須承認(rèn)，今天的模型在非常非常多的方面已經(jīng)做得相當(dāng)出色了。

它們?cè)诰幊谭矫嫠茏龅降氖虑椋瑢?duì)我來(lái)說(shuō)尤其震撼——因?yàn)閷?xiě)代碼本身就是我最喜歡的事情之一。你現(xiàn)在可以非常、非常快地完成大量工作。

對(duì)十年前的一些人來(lái)說(shuō)，如果你向他們展示我們今天所擁有的能力，他們可能已經(jīng)會(huì)把這稱作AGI了。所以，談?wù)揂GI已經(jīng)不再像過(guò)去那樣離譜或瘋狂。

但至少按照我自己的定義，當(dāng)前的模型仍然不能算是AGI，因?yàn)槌掷m(xù)學(xué)習(xí)還沒(méi)有以任何實(shí)質(zhì)性的方式與我們的模型真正整合在一起。同時(shí)，從模型目前的狀態(tài)來(lái)看，甚至在多模態(tài)感知這樣的能力上也仍有明顯缺失。

如果模型看不到外部世界，或者無(wú)法觀看視頻并對(duì)其進(jìn)行良好的理解，那么即便它們?cè)谖谋纠斫夂途幊谭矫娣浅３錾?，我們真的能稱它們?yōu)锳GI嗎？

因此，要真正實(shí)現(xiàn)構(gòu)建AGI這一文明級(jí)別的里程碑，還有許多我稱之為“必要步驟”的問(wèn)題需要解決。

一段時(shí)間我曾想過(guò)，如果我們真的非常努力，如果所有事情都做得非常好，也許2026年至少會(huì)成為我們?cè)谡嬲齼?yōu)秀的持續(xù)學(xué)習(xí)和真正通用的強(qiáng)化學(xué)習(xí)方面取得突破的一年。

我的時(shí)間線判斷依然是有些浮動(dòng)的。但與此同時(shí)，AI領(lǐng)域的發(fā)展速度確實(shí)非常快。投資每年都在不斷增長(zhǎng)，越來(lái)越多的人進(jìn)入AI領(lǐng)域，這擴(kuò)大了人才儲(chǔ)備，也增加了我們能夠探索的想法數(shù)量。

所以我并不認(rèn)為這個(gè)想法完全荒誕或不切實(shí)際。也許會(huì)更早一些，也許會(huì)稍晚一些——可能是26年，也可能是27年、28年，甚至29年。我不認(rèn)為會(huì)比這再晚太多。

當(dāng)然，還有大量工作要做，但確實(shí)有很多人正在為實(shí)現(xiàn)AGI而努力。

八、我們正處在變革時(shí)代，保持擔(dān)憂和謹(jǐn)慎有必要

主持人：如果我的記憶沒(méi)錯(cuò)的話，在“Strawberry”項(xiàng)目出現(xiàn)之前，你是不是在研究Q*項(xiàng)目？那時(shí)候有很多風(fēng)聲，大家都在談?wù)揑lya看到了Q*，知道AGI已經(jīng)來(lái)了，這把所有人都嚇壞了。

我的意思是，聽(tīng)你剛才這么說(shuō)，反而讓人覺(jué)得有點(diǎn)好笑。因?yàn)檫@確實(shí)是一件非常棘手的事情：這些系統(tǒng)能做到一些極其令人印象深刻的事，于是我們就會(huì)變得異常興奮。然后時(shí)間過(guò)去，

你知道，就像現(xiàn)在的“Strawberry”項(xiàng)目一樣——它確實(shí)令人難以置信，幾乎改變了整個(gè)領(lǐng)域，但我并不覺(jué)得我第一次使用它的時(shí)候被“嚇到了”。

Jerry Tworek：我明白你的意思。這是人類心理中非常有趣的一部分，在某種程度上也反映了我們與技術(shù)互動(dòng)的方式。

對(duì)我來(lái)說(shuō)，強(qiáng)化學(xué)習(xí)Scale up的效果仍然非常顯著，而且隨著時(shí)間推移，我們會(huì)看到更多這樣的成果。尤其是在編程領(lǐng)域，這將以許多不同的方式影響我們的生活。

今天，進(jìn)行任何大規(guī)模編程項(xiàng)目的體驗(yàn)，與一年前相比幾乎是天壤之別。我們會(huì)在各種各樣的事情中看到這些變化。當(dāng)我和我的團(tuán)隊(duì)，以及OpenAI的許多人，在兩年前第一次看到Q*開(kāi)始顯現(xiàn)出有效跡象時(shí)，

你坐在一個(gè)房間里，目睹一項(xiàng)具有實(shí)質(zhì)性意義的新技術(shù)。如果你在那一刻沒(méi)有感到哪怕一點(diǎn)點(diǎn)害怕、一點(diǎn)點(diǎn)擔(dān)憂，沒(méi)有對(duì)“我們正在做這件事會(huì)帶來(lái)什么后果”產(chǎn)生一絲疑慮，那么我會(huì)認(rèn)為你對(duì)自己的工作不夠負(fù)責(zé)。

我覺(jué)得每一位AI研究人員都應(yīng)該問(wèn)自己：如果我正在做的事情是全新的，具備前所未有的能力，那么它會(huì)給世界帶來(lái)什么影響？事實(shí)上，很多研究人員確實(shí)在這樣思考。有時(shí)候，人們也確實(shí)會(huì)不小心走得快了一兩步。

到目前為止，AI還沒(méi)有對(duì)世界造成任何真正的傷害。盡管像“阿諛?lè)畛小边@樣的問(wèn)題或許可以爭(zhēng)論一下，其他問(wèn)題至少據(jù)我們所知還沒(méi)有。

但即便如此，我仍然認(rèn)為，在向世界發(fā)布任何新技術(shù)時(shí)，保持擔(dān)憂和謹(jǐn)慎是一種非常好的、也非常健康的反應(yīng)。

我們正處在一個(gè)變革的時(shí)代，一個(gè)許多新事物不斷向世界擴(kuò)散的時(shí)代。它們會(huì)產(chǎn)生許多影響，影響人們?nèi)绾味冗^(guò)一生，影響人們?nèi)绾慰创约?、看待他人，影響人際關(guān)系，也影響國(guó)際關(guān)系，還會(huì)影響GDP和生產(chǎn)力。

有時(shí)候，有人寫(xiě)下一行代碼，所引發(fā)的連鎖反應(yīng)卻會(huì)像瀑布一樣，貫穿這一切。而其中所承載的責(zé)任，是相當(dāng)沉重的。

主持人：這些想法確實(shí)都很有道理，其實(shí)我之前也一直在反復(fù)思考這些問(wèn)題。我們此前大概也零星討論過(guò)一些。只是那段時(shí)間里，隨著所謂的“OpenAI政變”事件逐漸浮出水面，我總會(huì)下意識(shí)地試著設(shè)身處地為你著想。

但在這樣一個(gè)關(guān)鍵的時(shí)刻，一個(gè)本應(yīng)被認(rèn)真理解的創(chuàng)造物，卻率先成為人們迷戀、投射與爭(zhēng)奪的對(duì)象，這本身難道不會(huì)讓人感到一種微妙的怪異嗎？

而與此同時(shí)，我看到你所創(chuàng)造的東西被推到聚光燈下，在尚未真正被理解之前，就被媒體反復(fù)談?wù)摚直痪砣胍粓?chǎng)近乎肥皂劇式的紛爭(zhēng)之中。我一時(shí)間甚至不知道該用什么詞來(lái)形容這種感覺(jué)——說(shuō)“好笑”似乎并不完全貼切。

Jerry Tworek：很難將科技世界、概念世界、人類情感、人類生活、人類之間的共同點(diǎn)以及分歧彼此分離開(kāi)來(lái)。我們生活在這樣一個(gè)世界：AI領(lǐng)域的重要參與者之間，存在著極其復(fù)雜、跨越多個(gè)層面的關(guān)系網(wǎng)絡(luò)。

要真正理清這一切，歷史學(xué)家恐怕需要花費(fèi)很多年，甚至幾十年，才能弄清這里究竟發(fā)生了什么，真實(shí)情況到底是什么。

說(shuō)實(shí)話，即便是我自己，現(xiàn)在對(duì)“OpenAI政變”期間發(fā)生的一切，也只保留著非常零碎的記憶。每當(dāng)有新的證詞出現(xiàn)，每當(dāng)新的文件被披露，我們都會(huì)了解到一些此前未知的事實(shí)。將來(lái)肯定會(huì)有人把所有真相拼湊出來(lái)，但世界本身就是復(fù)雜的。

或許我們確實(shí)需要一種更健康的方式來(lái)討論技術(shù)，找到一個(gè)合適的討論平臺(tái)，讓這些分歧在某種程度上得到解決。但我們生活在一個(gè)沒(méi)有完美解決方案的世界，也沒(méi)有完美的討論方式。

九、分歧不可避免，只能依靠想法、信念與夢(mèng)想

主持人：你也不認(rèn)為X平臺(tái)是一個(gè)理想的媒介？

Jerry Tworek：我個(gè)人其實(shí)很喜歡在X上發(fā)帖，喜歡和研究社區(qū)、和身邊所有人分享想法，但X平臺(tái)也并不是一個(gè)完全嚴(yán)肅的地方。所以很多時(shí)候，討論總是介于玩笑和認(rèn)真之間。

那么，什么才是正確的解決方案呢？當(dāng)一個(gè)人擔(dān)心某項(xiàng)技術(shù)過(guò)于危險(xiǎn)，主張應(yīng)當(dāng)停止研究，而另一個(gè)人卻認(rèn)為它或許應(yīng)當(dāng)繼續(xù)推進(jìn)，因?yàn)樗軌驍U(kuò)展人類的能力。第一個(gè)人又進(jìn)一步認(rèn)為，這甚至不是一條正確的研究路徑，我們理應(yīng)轉(zhuǎn)向完全不同的方向。

在技術(shù)進(jìn)步與科研探索的領(lǐng)域中，這樣的分歧幾乎不可避免，而一切又都籠罩在未知之中。沒(méi)有人真正知道未來(lái)會(huì)走向何方。我們所能依靠的，只有想法、信念與夢(mèng)想。在這種根本性的不可確定性里，我們?nèi)匀槐仨毨^續(xù)生活、繼續(xù)選擇，并且往往不得不在許多關(guān)鍵問(wèn)題上，以某種方式學(xué)會(huì)求同存異。

主持人：是的，考慮到當(dāng)時(shí)媒體對(duì)Q*的高度關(guān)注，諸如“伊利亞看到了什么”之類的敘事，相關(guān)的炒作確實(shí)過(guò)于密集了，而且?guī)缀跏且辉陆又辉虏粩嗌?jí)。我對(duì)此并非沒(méi)有意識(shí)到，只是仍然感到有些困惑。

我之所以好奇，是因?yàn)槲覀冎械脑S多人在推特上都非?；钴S，也都在不同程度上參與、放大，甚至推動(dòng)了這種討論和想象。那么，從你的角度來(lái)看，你如何看待這種持續(xù)升溫的炒作？你是否也覺(jué)得，它或許需要稍微降溫一些了？我個(gè)人認(rèn)為，我們確實(shí)應(yīng)該大幅降溫。

Jerry Tworek：但與此同時(shí)，如果有人在七年前告訴你，OpenAI會(huì)成為一家萬(wàn)億美元級(jí)別的公司，會(huì)建設(shè)史上最大規(guī)模的數(shù)據(jù)中心，擁有全球最大的網(wǎng)絡(luò)產(chǎn)品之一，所有人都會(huì)時(shí)刻談?wù)揂I。你當(dāng)時(shí)一定會(huì)覺(jué)得那些人瘋了。這聽(tīng)起來(lái)本身就像是炒作。

我其實(shí)認(rèn)為，在很多方面，炒作背后是有實(shí)質(zhì)內(nèi)容的。有時(shí)它會(huì)過(guò)頭，有時(shí)又不夠，但AI確實(shí)很重要，也確實(shí)需要被討論。我想現(xiàn)在已經(jīng)沒(méi)有人會(huì)認(rèn)為AI是一個(gè)不重要的話題了。

幾年前的情況肯定不同，當(dāng)時(shí)確實(shí)有很多人認(rèn)為AI不重要。但現(xiàn)在已經(jīng)很清楚了，AI可能是這個(gè)世界上最重要的話題之一，值得我們持續(xù)討論和深入思考。

進(jìn)展會(huì)有多快？哪些路徑是正確的？它到底有多安全，或者多危險(xiǎn)？這些問(wèn)題當(dāng)然可以存在分歧和爭(zhēng)論，但AI已經(jīng)深度地融入了這個(gè)世界，而且只會(huì)變得越來(lái)越強(qiáng)。

十、有些人頻繁跳槽，做的實(shí)事并不多

主持人：完全同意。但如果暫時(shí)把技術(shù)本身放在一邊，我的意思是，我報(bào)道過(guò)Meta的挖角狂潮。這件事已經(jīng)變成了一場(chǎng)肥皂劇、一檔真人秀，而不再只是關(guān)于硬核科學(xué)的問(wèn)題。你已經(jīng)在這個(gè)領(lǐng)域工作了這么久。我只是好奇，我們是不是已經(jīng)越界，進(jìn)入了真人秀的范疇？

Jerry Tworek：但問(wèn)題是，究竟是誰(shuí)在制造這場(chǎng)肥皂劇呢？肯定不是我。

主持人：我的年齡足以讓我親歷互聯(lián)網(wǎng)泡沫，以及更早幾個(gè)技術(shù)周期。而這一次的感覺(jué)，確實(shí)更像一場(chǎng)肥皂劇。即便回想當(dāng)年的生產(chǎn)力軟件大戰(zhàn)，事情也并非如此。

很大一部分原因在于，今天的利害關(guān)系實(shí)在過(guò)于巨大。牽涉的資金規(guī)模、研究人員在各個(gè)實(shí)驗(yàn)室之間的流動(dòng)，再加上一連串高度戲劇化的事件，這些因素疊加在一起，讓整個(gè)局勢(shì)長(zhǎng)期處于緊繃狀態(tài)。

從一開(kāi)始我就有一種強(qiáng)烈的感覺(jué)：舊金山仿佛為自己創(chuàng)造了一個(gè)獨(dú)立的世界。與其說(shuō)這是泡沫，不如說(shuō)是我們彼此不斷說(shuō)服自己，這就是終局，賭注巨大，這是一場(chǎng)競(jìng)賽，既可能極其精彩，也可能極其糟糕。一切都高度緊張，也因此帶來(lái)了額外的心理負(fù)擔(dān)。

所以我確實(shí)覺(jué)得，這一次很不一樣。互聯(lián)網(wǎng)泡沫時(shí)期，一切源于一個(gè)簡(jiǎn)單而天真的念頭：這太酷了，世界上所有的信息都觸手可及，人可以彼此連接。公司是后來(lái)才出現(xiàn)的，金錢(qián)競(jìng)爭(zhēng)更是逐漸浮現(xiàn)的結(jié)果。而現(xiàn)在卻仿佛從一開(kāi)始，整個(gè)世界的重量就壓在了這件事情上。

老實(shí)說(shuō)，我不知道你們是怎么撐過(guò)來(lái)的。我看到無(wú)論是OpenAI、Anthropic還是其他實(shí)驗(yàn)室，都在拼命工作、彼此競(jìng)爭(zhēng)，而賭注又如此之高。連續(xù)七八年處在這樣的狀態(tài)里，任何人都會(huì)被消耗。我完全理解，為什么你會(huì)想停下來(lái)休息一段時(shí)間。

這不僅是體力上的消耗，更是心理上的磨損。因?yàn)橐坏┠阏嬲邮芰诉@種設(shè)定，它本身就會(huì)不斷侵蝕你。

Jerry Tworek：確實(shí)，這一切都會(huì)帶來(lái)心理上的損耗。不過(guò)我可以告訴你，曾經(jīng)有一位在應(yīng)對(duì)壓力方面比我經(jīng)驗(yàn)豐富得多的人對(duì)我說(shuō)過(guò)一句話：每經(jīng)歷一次高壓時(shí)刻，就像是做了一次俯臥撐，你對(duì)壓力的承受能力都會(huì)稍微增強(qiáng)一點(diǎn)。

坦率地說(shuō)這七年的工作確實(shí)鍛煉了我極強(qiáng)的心理與情感韌性。至少我真切地感覺(jué)到，自己能夠屏蔽掉大量噪音和無(wú)謂的干擾，在無(wú)論發(fā)生什么情況時(shí)，都盡量保持穩(wěn)定和堅(jiān)定，不管是公司瀕臨崩潰、研究人員頻繁流動(dòng)，還是項(xiàng)目被不斷重新分配。

總會(huì)有一些事情發(fā)生。我也聽(tīng)到有人把人才挖角比作體育隊(duì)的轉(zhuǎn)會(huì)。體育聯(lián)盟之所以能相對(duì)有序地運(yùn)作，在于它們有清晰的角色分工，以及明確的轉(zhuǎn)會(huì)規(guī)則，何時(shí)可以流動(dòng)，何時(shí)不能流動(dòng)。遺憾的是，加州法律在這方面幾乎沒(méi)有真正的限制。

我確實(shí)認(rèn)為，如果能在這方面建立一些規(guī)則，或許會(huì)是一件好事。因?yàn)樵谶@個(gè)行業(yè)里，確實(shí)存在這樣一種現(xiàn)象：有些人頻繁地更換工作，而真正投入到工作的時(shí)間，反而顯得更少。這種情況正在發(fā)生，而且并不罕見(jiàn)。

主持人：那么，給AI領(lǐng)域加上工資帽怎么樣？

Jerry Tworek：確實(shí)有些人在頻繁跳槽，也有些人仍然在堅(jiān)持工作，努力把前沿繼續(xù)向前推進(jìn)。不過(guò)，AI 毫無(wú)疑問(wèn)已經(jīng)是一門(mén)大生意了。

主持人：前兩天我還在和同事聊，我們需要列一份名單，上面包括所有在前沿AI機(jī)構(gòu)工作過(guò)的人，還要標(biāo)注他們?cè)诿恳粋€(gè)地方待了多久?？隙ㄖ辽儆胁簧偃送瓿闪恕盀硡^(qū)大滿貫”，每家都呆過(guò)。

十一、揭秘OpenAI內(nèi)部“波蘭黑手黨”：勤奮是項(xiàng)重要品質(zhì)

主持人：我們能聊聊“波蘭黑手黨”嗎？當(dāng)我剛開(kāi)始寫(xiě)這本關(guān)于OpenAI的書(shū)的時(shí)候，大概是2018年左右，那時(shí)整個(gè)公司里大約只有三十個(gè)人。這個(gè)最初的群體中，有相當(dāng)一部分來(lái)自波蘭，數(shù)量多得出人意料。他們幾乎都是數(shù)學(xué)天才，有些人從小就彼此認(rèn)識(shí)，有些則并非如此。

不過(guò)，這確實(shí)在某種程度上反映了蘇聯(lián)教育體系在數(shù)學(xué)人才培養(yǎng)方面的卓越之處，或者也可能只是因?yàn)?，只要有一個(gè)人先去了OpenAI，大家彼此認(rèn)識(shí)，就陸續(xù)跟著去了。

Jerry Tworek：就我個(gè)人而言，在最終加入OpenAI之前，我完全不認(rèn)識(shí)那里任何一個(gè)人，來(lái)到OpenAI純屬機(jī)緣巧合。

但在OpenAI的早期階段，波蘭人的比例確實(shí)非常高。我并不認(rèn)為這種趨勢(shì)能夠長(zhǎng)期持續(xù)?，F(xiàn)在，波蘭裔員工的絕對(duì)人數(shù)比早期更多了，但考慮到公司規(guī)模擴(kuò)大了上百倍，這個(gè)比例其實(shí)已經(jīng)不算高了。

不過(guò)，我們的教育系統(tǒng)確實(shí)有點(diǎn)東西。不過(guò)我沒(méi)有親身經(jīng)歷過(guò)其他教育體系，所以也無(wú)法真正判斷波蘭教育體系是否真的如此出色。

波蘭確實(shí)擁有很多杰出的人才。而我非常欣賞波蘭的一點(diǎn)，就是波蘭人非常勤奮。其實(shí)隨著時(shí)間推移，尤其是在許多發(fā)達(dá)國(guó)家，勤奮工作似乎越來(lái)越不被重視。生活變得更安逸了，人們有更多其他事情可以關(guān)注和優(yōu)先考慮，這本身也很正常。但波蘭人確實(shí)非?？粗厍趭^。

在我出生之前，波蘭還是一個(gè)共產(chǎn)主義國(guó)家。就在我出生的那一年，國(guó)家轉(zhuǎn)型為自由市場(chǎng)經(jīng)濟(jì)。這個(gè)過(guò)程相當(dāng)殘酷，但社會(huì)擁抱了這種變化，努力摸索如何變得更具創(chuàng)業(yè)精神，如何為自己的未來(lái)奮斗，如何實(shí)現(xiàn)經(jīng)濟(jì)繁榮。而事實(shí)證明，這是成功的。

我是一個(gè)移居海外的人，如今并不住在波蘭。但每次回去，大概一年一兩次吧，我都能清楚地看到國(guó)家在持續(xù)建設(shè)和發(fā)展。我看到它變得更好、更美麗、更繁榮。這真的是一個(gè)了不起的故事。

主持人：你在當(dāng)?shù)厮闶莻€(gè)名人嗎？我總覺(jué)得，波蘭政府可能在想：該死，我們本來(lái)可以把這件事做成的。我們當(dāng)初應(yīng)該把這些人都留下來(lái)。我去年去了波蘭，我知道他們已經(jīng)意識(shí)到這一點(diǎn)了。幾乎每個(gè)人都會(huì)問(wèn)：你認(rèn)識(shí)Wojciech（OpenAI聯(lián)合創(chuàng)始人之一，也是少數(shù)仍在OpenAI工作的早期OpenAI成員）嗎？

Jerry Tworek：Wojciech真的是一個(gè)了不起的人，非常友善。不過(guò)硅谷也是完全獨(dú)一無(wú)二的，雄心、規(guī)模以及活力，這并不是在世界任何地方都能輕易實(shí)現(xiàn)的。但我可以向你保證，波蘭人非常勤奮，而且能夠識(shí)破“忽悠”。這一點(diǎn)，在生活中真的能讓你走得很遠(yuǎn)。

十二、谷歌的回歸背后，是OpenAI在犯錯(cuò)

主持人：你對(duì)谷歌的回歸，或者說(shuō)重新崛起感到驚訝嗎？看起來(lái)他們做對(duì)了很多事情，你們一直都認(rèn)為他們最終能理清思路，然后迎頭趕上嗎？還是說(shuō)，這其實(shí)是個(gè)意外？

Jerry Tworek：我個(gè)人認(rèn)為，與其說(shuō)是谷歌的“回歸”，不如說(shuō)是OpenAI自己犯了一些錯(cuò)誤。盡管OpenAI做對(duì)了很多事情，但即便在理想環(huán)境下，它也犯過(guò)幾次錯(cuò)，執(zhí)行速度比本可以做到的要慢。

如果你是一家領(lǐng)先的公司，并且擁有OpenAI所具備的全部?jī)?yōu)勢(shì)，那么你理應(yīng)始終保持領(lǐng)先。但如果你在這個(gè)過(guò)程中做出了錯(cuò)誤決策，而別人做出了正確決策，那么別人就會(huì)趕上來(lái)。

谷歌確實(shí)做對(duì)了很多事情，他們?cè)谟布⑷瞬诺确矫鎿碛芯薮蟮慕Y(jié)構(gòu)性優(yōu)勢(shì)。當(dāng)OpenAI剛起步時(shí)，谷歌在幾乎所有機(jī)器學(xué)習(xí)與研究方向上都是明顯的第一名。

OpenAI能夠脫穎而出，主要源于對(duì)某一特定方向、特定路徑的堅(jiān)定研究信念。而世界花了極其漫長(zhǎng)的時(shí)間，才意識(shí)到這是一個(gè)很好的信念、一個(gè)很好的方向。

即便在GPT-2、GPT-3、GPT-3.5被訓(xùn)練出來(lái)的時(shí)候，也并沒(méi)有太多人真正放在心上。你去NeurIPS和研究人員交流，大家會(huì)覺(jué)得OpenAI挺酷，但其他實(shí)驗(yàn)室往往會(huì)說(shuō)：嗯，我們遲早也能復(fù)現(xiàn)。那些大語(yǔ)言模型挺有意思，但也就那樣。

只有當(dāng)OpenAI開(kāi)始通過(guò)ChatGPT真正賺錢(qián)時(shí)，其他公司才突然意識(shí)到：哦，這東西現(xiàn)在能盈利了，我們真的需要做這件事了。

這給了OpenAI一個(gè)極其漫長(zhǎng)的時(shí)間窗口，從構(gòu)建技術(shù)到實(shí)現(xiàn)商業(yè)化，而其他人直到后來(lái)才意識(shí)到“我們真的、真的需要做了”。谷歌也是從那時(shí)起才開(kāi)始認(rèn)真對(duì)待大語(yǔ)言模型的訓(xùn)練。

而由于OpenAI沒(méi)能充分把握住自己的領(lǐng)先優(yōu)勢(shì)，谷歌如今在模型能力和訓(xùn)練方面已經(jīng)非常、非常接近了。對(duì)谷歌來(lái)說(shuō)，這是件好事，我會(huì)給他們送上祝賀，因?yàn)樗麄兣まD(zhuǎn)了局面、并且執(zhí)行得非常出色。

主持人：有哪些失誤？我記得當(dāng)時(shí)我報(bào)道你們推出搜索功能時(shí)，外界的說(shuō)法是：OpenAI推出搜索，谷歌要完了。我當(dāng)時(shí)就想，我并不確定會(huì)是這樣。那么，具體的失誤是什么呢？

Jerry Tworek：我不太想深入討論內(nèi)部決策的細(xì)節(jié)，哪些是對(duì)的，哪些是錯(cuò)的。但我再?gòu)?qiáng)調(diào)一次：在理想的執(zhí)行情況下，如果你一開(kāi)始就領(lǐng)先，你本應(yīng)保持領(lǐng)先。

十三、OpenAI需要加快進(jìn)度，Anthropic令人欽佩

主持人：看起來(lái)你認(rèn)為OpenAI存在一些技術(shù)層面的失誤，同時(shí)公司內(nèi)部的一些戲劇性事件在某些階段拖慢了進(jìn)度。我和足夠多的OpenAI內(nèi)部人士聊過(guò)，他們一直在思考公司該如何繼續(xù)向前。然后在某個(gè)階段，一批關(guān)鍵人物離開(kāi)了。但聽(tīng)起來(lái)，你剛才更多是在談技術(shù)層面的問(wèn)題。

Jerry Tworek：這些事情有時(shí)是相關(guān)的。從技術(shù)上講，我并不認(rèn)為人員流動(dòng)本身是一個(gè)嚴(yán)重問(wèn)題。在任何公司，人來(lái)人往都應(yīng)該是正常的現(xiàn)象。但有時(shí)，人員離開(kāi)確實(shí)是問(wèn)題的征兆。

但如果公司有人說(shuō)：“有人在做錯(cuò)誤的事情，我們不再相信這家公司了，我們應(yīng)該離開(kāi)”，那可能確實(shí)說(shuō)明存在更深層次的問(wèn)題。不過(guò)，正如我之前所說(shuō)，有些事情的進(jìn)展速度顯然是可以更快的。

主持人：正如你所說(shuō)，各大實(shí)驗(yàn)室在總體方向上做的是類似的事情。那么Meta在某種程度上算是后來(lái)者。雖然他們?cè)缇蜕孀鉇I，但現(xiàn)在看起來(lái)，他們是想用不同方式來(lái)做這件事，同時(shí)從其他公司挖人。

我不太清楚Meta具體在做什么，但給我的感覺(jué)是，他們并不是要走出一條真正不同的道路，而是想走同一條路。這在我看來(lái)是一個(gè)根本性的問(wèn)題。你來(lái)得晚了一點(diǎn)，卻在做和別人一樣的事情，結(jié)果可能不會(huì)太好。你覺(jué)得他們真的有不同的方法嗎？

Jerry Tworek：我對(duì)他們的策略并不是特別熟悉，所以無(wú)法確定。但從外部來(lái)看，我覺(jué)得他們意識(shí)到了一點(diǎn)：在當(dāng)前的AI世界里，你可以用兩種方式來(lái)思考你想做什么。

一種是，我們想打造一個(gè)在某些方面明顯優(yōu)于他人的模型；另一種是，我想打造一個(gè)和別人同樣優(yōu)秀的模型，但以不同的方式去使用它，或者圍繞它構(gòu)建不同的產(chǎn)品。

就我對(duì)Meta的理解而言，這家公司關(guān)注的是連接人、建立關(guān)系、打造體驗(yàn)，無(wú)論是元宇宙、社交網(wǎng)絡(luò)，還是其他形式的體驗(yàn)。我再?gòu)?qiáng)調(diào)一次，這只是我的推測(cè)，但我認(rèn)為他們的思路是，利用行業(yè)已經(jīng)理解并掌握的AI技術(shù)和Transformer，來(lái)嘗試構(gòu)建這些體驗(yàn)。

從一家極其盈利、擁有全球最大社交網(wǎng)絡(luò)的公司角度來(lái)看，這可能是一種相當(dāng)不錯(cuò)的策略。

主持人：我們剛剛談到了谷歌的回歸。在OpenAI與其他公司的持續(xù)競(jìng)爭(zhēng)中，有沒(méi)有某個(gè)AI Lab給留下了特別深刻的印象？

Jerry Tworek：我得說(shuō)，這是最近才發(fā)生的變化，但在過(guò)去一年里，我對(duì)Anthropic的欽佩程度確實(shí)大幅上升。我從來(lái)都不是特別關(guān)注模型“個(gè)性”的那種人。雖然我聽(tīng)說(shuō)Claude的個(gè)性不錯(cuò)，也許吧。

但他們?cè)诰幊棠Ｐ秃途幊讨悄荏w方面所做的事情，他們圍繞這些成果建立的品牌以及他們所擁有的大量開(kāi)發(fā)者，這些絕對(duì)是令人震驚的成就。

Anthropic起步更晚，計(jì)算資源受限，團(tuán)隊(duì)規(guī)模也更小，在獲取優(yōu)質(zhì)算力和硬件方面遇到了許多困難，但他們依然成功構(gòu)建了卓越的產(chǎn)品。這些產(chǎn)品正在改變?nèi)藗冮_(kāi)發(fā)軟件的方式，并且據(jù)我所知，顯著提升了企業(yè)生產(chǎn)力。祝賀他們。

主持人：他們似乎正處在一個(gè)高光時(shí)刻。我認(rèn)識(shí)的每一個(gè)人都在談?wù)揅laude Code，但我確實(shí)不知道，他們是如何做出一個(gè)如此出色、像ChatGPT一樣被廣泛喜愛(ài)的Claude Code的。似乎很多實(shí)驗(yàn)室確實(shí)在借鑒這個(gè)工具，還有些實(shí)驗(yàn)室被斷供了。

Jerry Tworek：是的。在OpenAI，我們也在開(kāi)發(fā)Codex，這是我們自己的編程工具，它也挺不錯(cuò)的。有意思的是，我自己其實(shí)并沒(méi)有怎么用過(guò)Claude Code。畢竟我當(dāng)時(shí)受雇于OpenAI，所以沒(méi)怎么用過(guò)。

所以我真的說(shuō)不太準(zhǔn)。但我覺(jué)得Codex不是一個(gè)壞產(chǎn)品。只不過(guò)，從Twitter上的情緒來(lái)看，Claude確實(shí)深受全球開(kāi)發(fā)者的喜愛(ài)。

十四、AI圈缺乏專注度已成普遍問(wèn)題，OpenAI很難“集中力量辦大事”

主持人：根據(jù)我們之前的對(duì)話，你似乎在智識(shí)層面上對(duì)科學(xué)懷有濃厚興趣。你關(guān)于推理的研究，源自你想創(chuàng)造“AI科學(xué)家”的長(zhǎng)期愿景。當(dāng)我看到你宣布離開(kāi)的那條推文時(shí)，我就在想，你究竟是會(huì)繼續(xù)留在這場(chǎng)以基礎(chǔ)模型為中心的競(jìng)賽中，還是會(huì)走一條不同的道路。我感覺(jué)你可能會(huì)進(jìn)入生物技術(shù)領(lǐng)域，或類似的方向，以一種相當(dāng)不同的方式去追求這個(gè)目標(biāo)。

Jerry Tworek：如果我能克隆自己，去做多種不同的事情，我真的很想那樣做。但長(zhǎng)話短說(shuō)，在某些時(shí)刻我醒來(lái)，會(huì)意識(shí)到自己對(duì)一生中所取得的成就感到相當(dāng)滿足，也感到自豪。

但我現(xiàn)在真正想做的，是押注一兩個(gè)重大的研究方向，并竭盡全力讓它們成功。我認(rèn)為人們應(yīng)該愿意承擔(dān)風(fēng)險(xiǎn)。我是那種愿意嘗試瘋狂想法、擁有極高風(fēng)險(xiǎn)承受能力的人之一。我覺(jué)得我應(yīng)該把這種能力用在一些有益的事情上。

主持人：把你腦海中的想法真正落地，需要多長(zhǎng)時(shí)間？這是一個(gè)一年的項(xiàng)目嗎？還是你所說(shuō)的“高風(fēng)險(xiǎn)”，需要投入四五年的人生，去追逐一個(gè)可能并不比現(xiàn)有技術(shù)更好的東西？

Jerry Tworek：我絕對(duì)愿意投入大量時(shí)間。同時(shí)，我也認(rèn)為人們應(yīng)該快速執(zhí)行，做事慢并不是值得驕傲的理由。為了在研究項(xiàng)目上執(zhí)行得好，我希望能盡快做好。

但真正重要的部分，還是我之前提到的：專注和信念。如果你同時(shí)做很多不同的事情，就會(huì)分散你的注意力，分散你的資源。盡管AI Lab經(jīng)常說(shuō)他們受限于計(jì)算資源，因此研究變慢了，這也確實(shí)是重要的影響因素之一。但很多時(shí)候，更常見(jiàn)、更普遍的問(wèn)題，其實(shí)是缺乏專注力。畢竟，你每天能分配的注意力是有限的。

我經(jīng)常告訴我合作的研究人員：減少實(shí)驗(yàn)次數(shù)，但要對(duì)每一次實(shí)驗(yàn)思考得更深入。因?yàn)橛袝r(shí)候，即便只是花時(shí)間，比如幾個(gè)小時(shí)，不運(yùn)行任何程序，僅僅更仔細(xì)地分析實(shí)驗(yàn)數(shù)據(jù)，相比于運(yùn)行更多實(shí)驗(yàn)，反而更容易帶來(lái)突破。

主持人：像OpenAI這樣擁有大量計(jì)算資源的機(jī)構(gòu)，其實(shí)只是把資源分散在了太多項(xiàng)目上。實(shí)際上，如果把這些資源集中到更少的項(xiàng)目中，算力本身是完全足夠的。

Jerry Tworek：這又回到了風(fēng)險(xiǎn)承擔(dān)和信念的問(wèn)題。如果你同時(shí)做三個(gè)項(xiàng)目，其中一個(gè)成功了，另外兩個(gè)可能被放棄。如果三個(gè)都成功了，那當(dāng)然非常棒，但如果你只做一個(gè)項(xiàng)目，會(huì)推進(jìn)得快得多，因?yàn)槟憧梢愿訉Ｗⅲ拍钜哺訄?jiān)定。

當(dāng)然，如果項(xiàng)目最后失敗了，麻煩就大了，但如果成功了，就可能擁有世界上最好的模型。

對(duì)OpenAI來(lái)說(shuō)，目前要讓整個(gè)公司集中力量去做一些全新的、完全不同的事情，是有點(diǎn)困難的。要讓我們完全不在乎Gemini下個(gè)季度會(huì)不會(huì)有更好的模型，也非常難做到。

這樣的事情絕對(duì)需要一種特定類型的人，只有這種人才愿意去承擔(dān)風(fēng)險(xiǎn)。這正是關(guān)鍵所在。

主持人：我知道你不能談?wù)撃切┧^的“秘密配方”。但我還是很好奇，OpenAI正在朝哪個(gè)方向發(fā)展？或者至少，從宏觀上看，他們把資源投向了哪里？最近OpenAI給ChatGPT加廣告的消息刷爆了全網(wǎng)。

Jerry Tworek：我不應(yīng)該、也不能談?wù)揙penAI的任何計(jì)劃。

主持人：你覺(jué)得，在這些模型公司中，會(huì)不會(huì)有哪一家有勇氣像OpenAI一樣加入廣告？也許“勇氣”這個(gè)詞并不準(zhǔn)確，因?yàn)椴环艔V告可能本身就是一個(gè)糟糕的決定。廣告變現(xiàn)是不是不可避免的？

Jerry Tworek：這是一個(gè)商業(yè)策略問(wèn)題，而我的工作是訓(xùn)練模型。

十五、OpenAI真正擅長(zhǎng)的是“1到100”，驅(qū)動(dòng)創(chuàng)新的是“運(yùn)作方式”

主持人：我并不是想為難你，只是在進(jìn)行了這次完整的對(duì)話之后，我仍然在試圖理清一些想法。當(dāng)你談到你想要追求的新方向時(shí)，你確實(shí)需要一定的“馬力”。你會(huì)自己進(jìn)行嘗試，還是必須身處一個(gè)擁有足夠“能量”的地方，才能進(jìn)行你想做的研究？

Jerry Tworek：這是我目前正在努力理解的首要問(wèn)題。每一項(xiàng)AI研究仍然需要GPU，需要算力，我需要考慮什么才是最好的方式。

主持人：這是波蘭的機(jī)會(huì)。他們需要給你一個(gè)國(guó)家級(jí)數(shù)據(jù)中心。

Jerry Tworek：這個(gè)主意或許不錯(cuò)。我還在逐漸理清自己的速錄，我知道自己想做哪些類型的研究，也在不斷嘗試弄清楚，什么才是實(shí)現(xiàn)它們的最佳路徑。

我不止一次聽(tīng)別人說(shuō)，你離職后比以前快樂(lè)多了。我從一個(gè)現(xiàn)在自己創(chuàng)業(yè)的人那里聽(tīng)說(shuō)，在OpenAI工作比創(chuàng)業(yè)壓力還要更大，這讓我非常震驚。OpenAI確實(shí)是一個(gè)相當(dāng)有壓力的地方。

主持人：最后一個(gè)問(wèn)題，除了大家追逐的東西過(guò)于相似之外，你有沒(méi)有觀察到AI領(lǐng)域內(nèi)其他的重大錯(cuò)誤？

Jerry Tworek：我不認(rèn)為存在什么巨大的錯(cuò)誤。因?yàn)橐屗腥硕挤赶峦粋€(gè)巨大錯(cuò)誤，其實(shí)很難。我覺(jué)得這里只有一個(gè)真正的問(wèn)題：如何在探索和延續(xù)原有技術(shù)路線之間取得平衡？

主持人：我剛才那個(gè)問(wèn)題可能問(wèn)得不太好，我更想問(wèn)的是，在研究界中，是否存在一些你認(rèn)為被低估了、沒(méi)有得到世界足夠關(guān)注的想法？

Jerry Tworek：說(shuō)實(shí)話，這樣的想法有很多，但它們最需要的，其實(shí)只是多一點(diǎn)關(guān)注、多一點(diǎn)計(jì)算資源，以及多一點(diǎn)為之奮斗的精神。

我覺(jué)得有一點(diǎn)比較獨(dú)特：很多研究人員喜歡做從0到1的工作。很多學(xué)術(shù)研究正是如此，創(chuàng)造出一些全新的想法，證明它在某種程度上是可行的，然后就把它發(fā)表出來(lái)。

而我認(rèn)為，我和我在OpenAI的團(tuán)隊(duì)真正擅長(zhǎng)的，以及我覺(jué)得我們做得非常出色的一點(diǎn)，是把研究從1推進(jìn)到100，也就是采納那些不同的、我們以前沒(méi)有做過(guò)、但已經(jīng)初步被驗(yàn)證的想法，并找出如何讓它們?cè)诖笠?guī)模訓(xùn)練前沿模型時(shí)，可靠地工作，同時(shí)還要整合許多其他相關(guān)因素。

這正是大量學(xué)術(shù)研究所欠缺的東西。概念驗(yàn)證當(dāng)然很酷，但要用某種特定技術(shù)訓(xùn)練出世界上最有能力的模型之一，需要做大量非常具體、細(xì)致的工作。如果方法不對(duì)，可能需要數(shù)年時(shí)間，但如果你有合適的算法，知道如何引入這些東西，可能只需要幾個(gè)月。這正是我未來(lái)想多多嘗試的事情。

主持人：當(dāng)我們談到OpenAI的一些人員離職時(shí)，你曾說(shuō)，公司應(yīng)該能夠承受這些損失。但AI領(lǐng)域在某種程度上似乎一直是由“明星”驅(qū)動(dòng)的，比如Alec Radford這樣的明星人物。挖人的行為也是持續(xù)不斷。

從這些實(shí)驗(yàn)室的行為來(lái)看，顯然這些公司認(rèn)為AI一個(gè)由研究明星驅(qū)動(dòng)的領(lǐng)域。我很好奇你的看法。你剛才似乎對(duì)這個(gè)問(wèn)題有些猶豫。行業(yè)中既有整個(gè)學(xué)界、整個(gè)領(lǐng)域長(zhǎng)期積累的工作，也有一些關(guān)鍵時(shí)刻和重大的突破來(lái)自極少數(shù)個(gè)人。

Jerry Tworek：這是一個(gè)相當(dāng)復(fù)雜的話題，但我覺(jué)得兩件事可以同時(shí)成立。很多時(shí)候，就像你在OpenAI看到的那樣，確實(shí)是極少數(shù)個(gè)人產(chǎn)生了超乎尋常的影響，推動(dòng)了一系列完全開(kāi)創(chuàng)性的成果，并將其擴(kuò)散到整個(gè)行業(yè)。我一次又一次地看到這種情況發(fā)生。

但與此同時(shí)，每當(dāng)我看到人們換公司時(shí)，我很少看到這對(duì)原公司造成真正重大的影響。公司本身的特質(zhì)，或者說(shuō)一種近乎“運(yùn)作方式”的東西，才是真正的研究引擎，而不是某一個(gè)特定研究員是否還在這里。

我也觀察到，那些在公司之間跳槽的研究員，往往在新環(huán)境中并沒(méi)有那么高效。即使他們過(guò)去常常做出偉大的工作，來(lái)到新地方后，也可能變得有些分心，需要時(shí)間適應(yīng)環(huán)境，或者暫時(shí)沒(méi)有特別新鮮的想法。

當(dāng)然，在這個(gè)領(lǐng)域的經(jīng)驗(yàn)肯定能帶來(lái)一些優(yōu)勢(shì)，但更重要的是，創(chuàng)造一種個(gè)人責(zé)任感強(qiáng)、允許探索、能夠賦能人們?nèi)プ龃笫碌姆諊?/p>

而且，無(wú)論是這批人，還是另一批人，都完全有可能組建出許多能夠做出偉大成果的團(tuán)隊(duì)。我并不認(rèn)為某個(gè)特定的人是不可替代的。在我看來(lái)，良好的研究結(jié)構(gòu)、良好的研究文化、良好的協(xié)作方式，遠(yuǎn)比某個(gè)具體的人是否在你的團(tuán)隊(duì)中重要得多。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁(yè) 下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點(diǎn)推薦

馬斯克首席AI腦與萊姆病抗?fàn)?！曾師從丘成桐，楊格宣布辭職

新智元 2026-01-21 18:27:14
6 跟貼 6

SaaS舊王隕落，RaaS新王加冕，企業(yè)軟件的下一場(chǎng)范式更替

智東西 2026-01-23 14:56:06
0 跟貼 0

OpenAI前高管坦言公司“掉鏈子” 讓競(jìng)爭(zhēng)對(duì)手谷歌得以翻身

財(cái)聯(lián)社 2026-01-23 19:56:06
0 跟貼 0

OpenAI：以后大家用AI賺的錢(qián)，我可能要抽成

機(jī)器之心Pro 2026-01-23 16:38:19
10 跟貼 10

融資5.6億的AI語(yǔ)音新星被谷歌盯上，核心團(tuán)隊(duì)入職DeepMind

智東西 2026-01-23 19:54:21
0 跟貼 0

微軟CEO納德拉：AI別只讓大廠賺錢(qián)，不然早晚玩完

智東西 2026-01-22 19:07:10
4 跟貼 4

冰壺 = 冰上國(guó)際象棋？萌化冰壺君帶你2 分鐘看懂冰壺的規(guī)則、裝備和得分秘訣！原來(lái)冰壺還有這么多小門(mén)

咪咕體育 2026-01-22 23:32:26
1 跟貼 1

官方通報(bào)1014人死后多領(lǐng)養(yǎng)老金

北京日?qǐng)?bào) 2026-01-23 16:44:54
7560 跟貼 7560

大學(xué)無(wú)用？奧特曼輟學(xué)當(dāng)了CEO，但名校生撐起了整個(gè)OpenAI！

36氪 2026-01-18 10:45:08
31 跟貼 31

馬斯克在達(dá)沃斯預(yù)測(cè)：AI將在5年內(nèi)超越全人類集體智慧，機(jī)器人數(shù)量將超過(guò)人類

環(huán)球網(wǎng)資訊 2026-01-23 11:10:23
1437 跟貼 1437

田忌賽馬新解：象棋版策略，如何巧妙避害絆敵？！

難寄期許w 2026-01-21 06:34:21
0 跟貼 0

陳天奇、賈揚(yáng)清點(diǎn)贊：Vibe Coding版PyTorch，連論文都是AI寫(xiě)的

機(jī)器之心Pro 2026-01-23 16:51:26
0 跟貼 0

中國(guó)古代真的領(lǐng)先世界嗎？別被忽悠了，這才是中國(guó)科技落后的真相

潘鍵旅行浪子 2026-01-23 10:43:25
0 跟貼 0

超10億！開(kāi)年最大種子輪誕生

智東西 2026-01-23 19:01:10
0 跟貼 0

波士頓機(jī)器狗練成“輕功”！連續(xù)七個(gè)后空翻

量子位 2025-09-07 01:03:18
19 跟貼 19

印度男子冒充醫(yī)生，技術(shù)不到位沒(méi)關(guān)系，演技到位就行！

磨自明 2026-01-23 16:32:08
4 跟貼 4

AI應(yīng)用的“妖風(fēng)”還能吹多久？

虎嗅APP 2026-01-24 02:00:15
0 跟貼 0

通過(guò)模型了解各種有意思的機(jī)械工作原理！

看你像個(gè)寶 2026-01-22 16:06:23
1 跟貼 1

李四川民調(diào)領(lǐng)跑碾壓蘇巧慧，柯建銘策略變了，當(dāng)眾挑釁賴清德權(quán)威

軍衛(wèi)防務(wù) 2026-01-23 18:06:37
0 跟貼 0

豆包再向C端猛沖

華爾街見(jiàn)聞官方 2026-01-21 19:38:09
4 跟貼 4

大模型也會(huì)賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0

DeepMind負(fù)責(zé)人：2036 AI意識(shí)覺(jué)醒？LeCun怒懟：LLM路線全錯(cuò)！

新智元 2025-12-16 16:55:25
0 跟貼 0

日本眾議院正式解散

央視新聞客戶端 2026-01-23 12:05:47
5113 跟貼 5113

機(jī)器人進(jìn)汽車廠，給波士頓動(dòng)力，裝上谷歌最強(qiáng)大腦

機(jī)器之心Pro 2026-01-06 19:02:05
3 跟貼 3

一個(gè)想法的成功之路：從程序員要不要穿西裝說(shuō)起

安安小小姐姐 2026-01-23 06:35:07
0 跟貼 0

一夜之間！金飾1克突破1500元

南方都市報(bào) 2026-01-23 11:02:43
3519 跟貼 3519

2.4萬(wàn)億參數(shù)“最強(qiáng)文科生”，文心5.0正式版，你挺懂山東人??？

量子位 2026-01-23 21:37:41
0 跟貼 0

CUDA要涼？Claude 30分鐘鏟平英偉達(dá)護(hù)城河，AMD要笑醒了

新智元 2026-01-23 10:22:39
41 跟貼 41

三連敗！遼籃已到懸崖邊三連冠掩蓋核心問(wèn)題楊鳴面臨無(wú)米之炊

胖子噴球 2026-01-23 21:56:48
59 跟貼 59

下一代谷歌頭顯，XREAL x Google 定義混合現(xiàn)實(shí)頭顯

愛(ài)范兒 2025-12-10 05:12:08
0 跟貼 0

美油企稱若條件具備可迅速擴(kuò)大在委內(nèi)瑞拉業(yè)務(wù)

財(cái)聯(lián)社 2026-01-24 02:12:04
0 跟貼 0

戰(zhàn)日本隊(duì)，轉(zhuǎn)播計(jì)劃出爐！

新京報(bào)政事兒 2026-01-23 20:51:25
21 跟貼 21

英特爾股價(jià)下跌16%

每日經(jīng)濟(jì)新聞 2026-01-23 23:13:04
1 跟貼 1

阿里投的語(yǔ)音AI“小巨人”重啟IPO！創(chuàng)業(yè)14年未脫虧損

智東西 2026-01-23 22:58:31
0 跟貼 0

荒野求生（機(jī)器狗全自主版），2025ATEC挑戰(zhàn)真實(shí)戶外無(wú)遙操

量子位 2025-12-08 19:24:34
0 跟貼 0

你領(lǐng)導(dǎo)厲不厲害，看他開(kāi)會(huì)就知道了

細(xì)說(shuō)職場(chǎng) 2026-01-20 14:39:04
4 跟貼 4

幫老爸工作壓力很大，作為亞裔后代壓力更大

盧菁老師 2026-01-21 07:00:20
0 跟貼 0

蘋(píng)果股價(jià)下跌勢(shì)創(chuàng)2022年以來(lái)最長(zhǎng)周度連跌紀(jì)錄

財(cái)聯(lián)社 2026-01-23 23:52:06
0 跟貼 0

馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
6 跟貼 6

俄美會(huì)談開(kāi)始后俄方發(fā)布轟炸機(jī)巡航消息

魯中晨報(bào) 2026-01-23 09:22:12
3122 跟貼 3122

HWG！羅馬諾：亞伯拉罕加盟阿斯頓維拉，轉(zhuǎn)會(huì)費(fèi)2100萬(wàn)英鎊
懂球帝
2026-01-23 20:37:34

國(guó)家下狠手了！體制內(nèi)大地震，少爺、公主們的“天”，要塌了
霹靂炮
2026-01-19 22:24:13

工廠停擺、門(mén)店撤退：理想汽車的“嚴(yán)冬”，比預(yù)想中來(lái)得更冷
科技Nice
2026-01-23 11:27:59

中國(guó)隊(duì)vs日本！U23亞洲杯決賽未開(kāi)始，傳來(lái)2個(gè)不利消息，奪冠難了
侃球熊弟
2026-01-24 00:30:03

解放軍涉臺(tái)措辭有變，臺(tái)媒警告賴清德，黃國(guó)昌發(fā)聲：考慮到訪大陸
阿紿聊社會(huì)
2026-01-22 09:52:23

高中，你不知道的幾個(gè)潛規(guī)則：中等生就是默認(rèn)被放棄的群體！
好爸育兒
2026-01-22 22:13:24

WC！字母哥+詹姆斯！勇士，太牛逼了...
技巧君侃球
2026-01-23 23:17:29

臺(tái)海戰(zhàn)爭(zhēng)爆發(fā)西方可凍結(jié) 3.2 萬(wàn)億中國(guó)資產(chǎn)，但中國(guó)手里也有王炸
boss外傳
2025-12-01 12:00:03

牢A含金量在升級(jí)！斬殺線拯救了很多中國(guó)中產(chǎn)，有人放棄移民計(jì)劃
火山詩(shī)話
2026-01-23 07:08:08

美女美圖8395期
鄉(xiāng)野小珥
2026-01-19 14:35:20

江蘇即將迎來(lái)兩次降雪
最江陰
2026-01-24 00:15:02

CBA排名變動(dòng)：廣東喜獲第8，遼寧僅剩2希望
民哥臺(tái)球解說(shuō)
2026-01-23 23:58:35

風(fēng)向變了！美德法韓英加拿大等國(guó)媒體紛紛把目光轉(zhuǎn)向了中國(guó)武漢
忠于法紀(jì)
2026-01-10 19:33:30

香菜成為焦點(diǎn)！調(diào)查發(fā)現(xiàn)：經(jīng)常吃香菜的人，一段時(shí)間后或有5變化
冷眼看世界728
2025-11-29 13:42:51

“大傻”去世15年后，兒子入獄孫子身亡，王晶曝他舊事：是狠角色
妙知
2026-01-22 16:41:19

中日韓電視出貨量差距斷崖：日僅1.9%，韓高達(dá)16％，中國(guó)令人意外
青梅侃史啊
2026-01-23 20:24:08

馬筱梅挺八月孕肚帶貨，孕晚期臉部浮腫，骨架增大，越來(lái)越母性
吳蒂旅行ing
2026-01-22 22:52:12

“和平委員會(huì)”草草開(kāi)場(chǎng)，特朗普講話吞吞吐吐 | 京釀館
新京報(bào)評(píng)論
2026-01-23 11:47:51

川普稱又訂了超過(guò)現(xiàn)役的25架B-2，暗示動(dòng)態(tài)：用于攻擊地下核設(shè)施
邵旭峰域
2026-01-22 16:07:58

奇才總裁溫格：交易走阿夫迪亞絕非失誤，23歲的他年紀(jì)有點(diǎn)大
懂球帝
2026-01-23 16:53:07

2026-01-24 03:23:00

智東西

聚焦智能變革，服務(wù)產(chǎn)業(yè)升級(jí)。

11117文章數(shù) 116945關(guān)注度

往期回顧全部

科技要聞

TikTok守住了算法"靈魂" 更握緊了"錢(qián)袋子"

馬斯克：美國(guó)AI缺電得靠中國(guó)，F(xiàn)SD入華已進(jìn)倒計(jì)時(shí)

蘋(píng)果擴(kuò)大硬件主管職權(quán)，CEO接班人選進(jìn)一步明朗

幾千億只是開(kāi)胃菜，AI基建還得再砸?guī)兹f(wàn)億

日系彩電時(shí)代“徹底落幕”

頭條要聞

疑在達(dá)沃斯受挫 79歲的特朗普轉(zhuǎn)發(fā)超80條帖子發(fā)泄怒氣

媒體：特朗普在達(dá)沃斯演講數(shù)十次點(diǎn)名中國(guó) 重點(diǎn)就兩個(gè)

走失被找回女碩士曾遭兩村民強(qiáng)奸穿開(kāi)襠褲女兒被猥褻

妻子駕車致丈夫受傷保險(xiǎn)拒賠丈夫起訴妻子和保險(xiǎn)公司

印尼、巴基斯坦等八國(guó)同意加入"和平委員會(huì)" 中方回應(yīng)

頭條要聞

疑在達(dá)沃斯受挫 79歲的特朗普轉(zhuǎn)發(fā)超80條帖子發(fā)泄怒氣

媒體：特朗普在達(dá)沃斯演講數(shù)十次點(diǎn)名中國(guó) 重點(diǎn)就兩個(gè)

走失被找回女碩士曾遭兩村民強(qiáng)奸穿開(kāi)襠褲女兒被猥褻

妻子駕車致丈夫受傷保險(xiǎn)拒賠丈夫起訴妻子和保險(xiǎn)公司

印尼、巴基斯坦等八國(guó)同意加入"和平委員會(huì)" 中方回應(yīng)

體育要聞

杜蘭特鏖戰(zhàn)44分鐘累癱轟36+7卻致命失誤

小卡復(fù)出24分快船險(xiǎn)勝湖人東契奇32+11+8詹姆斯23+5+6

遼寧不敵山東3連敗高詩(shī)巖14+5+4+5斷趙繼偉12+7+6

安東尼奧：中國(guó)足球和日本差距巨大！會(huì)努力讓特別的事情發(fā)生

郭艾倫復(fù)出16分廣州加時(shí)力克同曦徐昕22+14郭昊文30+6+6

娛樂(lè)要聞

演員孫濤澄清閆學(xué)晶言論落淚維護(hù)妻子

正主開(kāi)撕，場(chǎng)外助攻，這瓜越看越好笑

2026春節(jié)檔，你最期待看哪一部？

讓陳星旭王玉雯來(lái)演“癲系喜劇”的人真是天才

被央視都在夸的李亞鵬，讓看不起他的人閉了嘴

財(cái)經(jīng)要聞

2026年，消費(fèi)沒(méi)有新故事？

AI應(yīng)用的“妖風(fēng)”還能吹多久？

2025年收益率超90%的主動(dòng)權(quán)益基金都有什么特點(diǎn)？

永輝超市，越“胖”越虧

豬市“冰與火”：豬企賣(mài)得多了、賺得少了

汽車要聞

主打家庭大六座奕境首款SUV將北京車展亮相

租電版售21.08萬(wàn)起/標(biāo)配專屬套裝樂(lè)道L90馬到成功版上市

英偉達(dá)開(kāi)源自動(dòng)駕駛核心工具鏈按下"物理AI時(shí)代"啟動(dòng)鍵

智界V9更多官圖放出內(nèi)飾設(shè)計(jì)即將揭曉

最高續(xù)航810公里沃爾沃EX60家族正式發(fā)布

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

親子

時(shí)尚

藝術(shù)

本地

教育要聞

AI是在彌合教育差距還是帶來(lái)新的“不公平”？家長(zhǎng)面對(duì)“AI寒門(mén)論”該怎么辦？千問(wèn)官方回應(yīng)來(lái)了

該不該讓孩子用AI？讓高考作文題告訴你該不該讓孩子用AI，讓近幾年的高考作文題來(lái)告訴你吧。尤其是大...

從“育分”走向“育人” 多地中小學(xué)取消非畢業(yè)年級(jí)“期末統(tǒng)考”

震撼美味!!!!!!!

父母先安靜下來(lái)，孩子才有心學(xué)習(xí)

親子要聞

“一個(gè)桃就拐走了！”寶媽在水果店頻頻拒絕女兒，評(píng)論區(qū)太真實(shí)！

閑聊一會(huì)兒，明天我也去聚一聚

云南4個(gè)月女?huà)肽笅氲觌x奇死亡事件，不能這么快消失在熱搜……

配料表升級(jí)，是否能成為奶粉增長(zhǎng)新機(jī)遇？

寶媽必學(xué)，監(jiān)控救不了你孩子的命！

今日熱點(diǎn)：車銀優(yōu)代言廣告被隱藏；《巔峰對(duì)決》主演擔(dān)任米蘭冬奧會(huì)火炬手……

過(guò)了40歲才發(fā)現(xiàn)，衣柜里的“基礎(chǔ)款”只要搭對(duì)了，簡(jiǎn)約又高級(jí)

短劇都沒(méi)有她的故事精彩？62歲活成了多少人羨慕的樣子

告別臃腫！這種簡(jiǎn)約的高級(jí)穿法，別拒絕

藝術(shù)要聞

人像攝影背后的真相，模特并不是全部！

誰(shuí)還說(shuō)它是涼亭？江西“國(guó)寶級(jí)四方牌坊”，風(fēng)雨400年容顏未老

現(xiàn)在的春聯(lián)太俗了，還是過(guò)去的“老對(duì)聯(lián)”高雅！

書(shū)法愛(ài)好者必看：16字看眼力，柳楷書(shū)寫(xiě)有何秘訣？

本地新聞

云游中國(guó)｜格爾木的四季朋友圈，張張值得你點(diǎn)贊

云游遼寧｜漫步千年小城晨昏，“康”復(fù)好心情

云游內(nèi)蒙｜黃沙與碧波撞色，烏海天生會(huì)“混搭”

邵陽(yáng)公益訴訟檢察主題曲：《守望星》

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

在OpenAI“創(chuàng)新已經(jīng)變得困難”！離職高管深喉爆料

TikTok守住了算法"靈魂" 更握緊了"錢(qián)袋子"

疑在達(dá)沃斯受挫 79歲的特朗普轉(zhuǎn)發(fā)超80條帖子發(fā)泄怒氣

疑在達(dá)沃斯受挫 79歲的特朗普轉(zhuǎn)發(fā)超80條帖子發(fā)泄怒氣

杜蘭特鏖戰(zhàn)44分鐘累癱 轟36+7卻致命失誤

演員孫濤澄清閆學(xué)晶言論 落淚維護(hù)妻子

2026年，消費(fèi)沒(méi)有新故事？

主打家庭大六座 奕境首款SUV將北京車展亮相

態(tài)度原創(chuàng)

AI是在彌合教育差距還是帶來(lái)新的“不公平”？家長(zhǎng)面對(duì)“AI寒門(mén)論”該怎么辦？千問(wèn)官方回應(yīng)來(lái)了

“一個(gè)桃就拐走了！”寶媽在水果店頻頻拒絕女兒，評(píng)論區(qū)太真實(shí)！

今日熱點(diǎn)：車銀優(yōu)代言廣告被隱藏；《巔峰對(duì)決》主演擔(dān)任米蘭冬奧會(huì)火炬手……

人像攝影背后的真相，模特并不是全部！

云游中國(guó)｜格爾木的四季朋友圈，張張值得你點(diǎn)贊

杜蘭特鏖戰(zhàn)44分鐘累癱轟36+7卻致命失誤

演員孫濤澄清閆學(xué)晶言論落淚維護(hù)妻子

2026年，消費(fèi)沒(méi)有新故事？

主打家庭大六座奕境首款SUV將北京車展亮相

AI是在彌合教育差距還是帶來(lái)新的“不公平”？家長(zhǎng)面對(duì)“AI寒門(mén)論”該怎么辦？千問(wèn)官方回應(yīng)來(lái)了

“一個(gè)桃就拐走了！”寶媽在水果店頻頻拒絕女兒，評(píng)論區(qū)太真實(shí)！

今日熱點(diǎn)：車銀優(yōu)代言廣告被隱藏；《巔峰對(duì)決》主演擔(dān)任米蘭冬奧會(huì)火炬手……

人像攝影背后的真相，模特并不是全部！

云游中國(guó)｜格爾木的四季朋友圈，張張值得你點(diǎn)贊