拒絕DeepSeek的清華學(xué)霸，如何拿捏OpenAI的最新大模型？

2026-01-20 22:49:06　來源: 智東西

北京舉報

分享至

智東西
作者江宇
編輯冰倩

智東西1月20日報道，ChatGPT背后的一位中國工程師——OpenAI核心貢獻(xiàn)者翁家翌，日前在AI播客WhynotTV Podcast接受專訪，他首次詳盡講述了自己從清華少年到OpenAI infra骨干的經(jīng)歷。

▲圖源自翁家翌GitHub主頁

作為強化學(xué)習(xí)與后訓(xùn)練（Post-Training）系統(tǒng)的關(guān)鍵工程師，翁家翌深度參與了GPT-3.5、GPT-4、GPT-5等核心模型的訓(xùn)練，其搭建的infra系統(tǒng)已成為OpenAI內(nèi)部大模型訓(xùn)練與迭代的基礎(chǔ)底座，也是ChatGPT持續(xù)進(jìn)化的關(guān)鍵支撐。

在這場長達(dá)兩個多小時的對談中，翁家翌披露了OpenAI內(nèi)部Post-Training系統(tǒng)的構(gòu)建邏輯，也解釋了OpenAI為何能持續(xù)產(chǎn)出爆款模型。

他還分享了他對AGI定義、OpenAI不“open”批評以及內(nèi)部人才流動加劇等現(xiàn)象的第一手觀察。

面對DeepSeek、TikTok、英偉達(dá)、谷歌等科技巨頭拋來的橄欖枝，他為何最終選擇了OpenAI？

談及職業(yè)方向，他又為何自稱“賣鏟子里最面向客戶的那位”，并立下目標(biāo)“我要最大化我在OpenAI Blog上出現(xiàn)的次數(shù)”？

這場對談，給出了答案。

一、“賣鏟子”到主導(dǎo)Post-Training，他是OpenAI模型背后的基礎(chǔ)構(gòu)建者

在OpenAI內(nèi)部，幾乎每一個大型模型的發(fā)布名單里，都能看到翁家翌的名字，他主導(dǎo)搭建了OpenAI強化學(xué)習(xí)后訓(xùn)練（Post-Training）階段的核心基礎(chǔ)設(shè)施。

“每發(fā)一個大的release，每發(fā)一個大的模型，我的名字就得放上去。”他說，“因為大家都在用整個Post-Training infra去訓(xùn)練RHF的模型。”

他說自己“是賣鏟子里最面向客戶的那位”，因為強化學(xué)習(xí)模塊處在整個基礎(chǔ)設(shè)施棧的最頂端。他還給自己的職業(yè)生涯設(shè)定過一個指標(biāo)：“我要最大化我在OpenAI Blog上出現(xiàn)的次數(shù)?！?/strong>

面對年輕人，他的建議仍是：持續(xù)投入工程建設(shè)，而不是學(xué)術(shù)研究。他不避諱地說：“長遠(yuǎn)來看，我還是覺得現(xiàn)代學(xué)術(shù)界應(yīng)該要被重構(gòu)?！痹谒磥?，如果目標(biāo)是進(jìn)入工業(yè)界，最重要的是匹配真實的工作需求，“AI Lab最缺的其實就是Infra人才，infra是個無底洞。”

學(xué)術(shù)界研究往往陷在一些困境里，如Atari、MoJoCo等任務(wù)上過度擬合，并不能轉(zhuǎn)化為實際問題的解決能力。他談及，“我在2022年8月就意識到這個問題，所以逐步停止了天授的開發(fā)，轉(zhuǎn)向在OpenAI內(nèi)部構(gòu)建更有意義的RL Infra?！?/p>

而在OpenAI內(nèi)，他目睹了一系列“半偶然半必然”的變革。加入之初，他參與的就是WebGPT后續(xù)項目，通過強化學(xué)習(xí)讓模型更好地與用戶交互。他負(fù)責(zé)構(gòu)建的RL訓(xùn)練系統(tǒng)在ChatGPT爆發(fā)式上線之前，已成為公司內(nèi)部主力使用的infra之一。

發(fā)布當(dāng)天，OpenAI服務(wù)器數(shù)次被擠爆，他形容這種“自發(fā)涌現(xiàn)的需求”就像自己做tuixue online時遇到的情形，“說明這確實是一個值得投入精力的方向”。

被問到OpenAI為何能做出如此爆款，翁家翌歸結(jié)于兩個因素：一是單位時間迭代效率足夠高，二是領(lǐng)導(dǎo)層真正懂技術(shù)。

OpenAI在引入了幾位前Google工程負(fù)責(zé)人之后（如Barret Zoph、Liam Fedus），團(tuán)隊開始系統(tǒng)性提升工程效率，單位時間的迭代次數(shù)和成功率是正比的。

他強調(diào)，“RL本質(zhì)上就是trial-and-error（試錯）。你試得越快越多，成功就越近。”

OpenAI的領(lǐng)導(dǎo)層也保持對細(xì)節(jié)的強關(guān)注。Greg Brockman（聯(lián)合創(chuàng)始人兼總裁）幾乎參與過公司所有基礎(chǔ)設(shè)施模塊，而Sam Altman（聯(lián)合創(chuàng)始人兼CEO）則通過研究助理及時了解公司內(nèi)部進(jìn)展。他認(rèn)為這種技術(shù)細(xì)節(jié)的敏感性和上下信息通暢正是OpenAI創(chuàng)新持續(xù)不斷的原因。

翁家翌稱，“管公司就像管代碼庫，一旦不一致，整個系統(tǒng)就會像拼裝的人類，身子動了，腳沒動。”

二、他為ChatGPT模型搭建后訓(xùn)練系統(tǒng)，也在重構(gòu)下一代Infra

ChatGPT 3.5正式發(fā)布之前，OpenAI內(nèi)部其實已開始在GPT-4上驗證強化學(xué)習(xí)后訓(xùn)練（RLHF）流程的可行性。

翁家翌回憶，當(dāng)時他負(fù)責(zé)的正是RLHF訓(xùn)練Pipeline的整體搭建：舊的infra是跑不動的，我在新infra上調(diào)通了第一版，先在4上做通，再遷回3.5。這套Post-Training系統(tǒng)隨后被用于整個ChatGPT系列模型的訓(xùn)練中。

這并不是一條“拿來即用”的流水線。他談及，OpenAI內(nèi)部并沒有現(xiàn)成可復(fù)用的RLHF基線，很多關(guān)鍵流程都需要從頭構(gòu)建。

真正的挑戰(zhàn)，是模型效果的衡量標(biāo)準(zhǔn)并不清晰?！澳阌?xùn)練出很多個checkpoint（檢查點），但你不知道哪個是真的更好?！庇萌祟惙答仾剟钤u估時，模型可能一開始獎勵信號很高，之后卻因過度擬合（hacking）而性能下降。

最終，團(tuán)隊只能依賴“human-in-the-loop（人機協(xié)同）”的評估流程，即讓內(nèi)部員工親自交互測試、打分投票，選出效果最佳的版本。

從技術(shù)結(jié)構(gòu)上看，這套Post-Training系統(tǒng)的難度遠(yuǎn)高于他曾經(jīng)開發(fā)的“天授”框架。toy task（驗證算法的小規(guī)模仿真環(huán)境）的瓶頸在環(huán)境，而大模型的瓶頸在模型本身。

環(huán)境是一個Prompt，計算只要幾微秒，但模型訓(xùn)練和采樣則是幾百甚至上千秒。系統(tǒng)工程的復(fù)雜性在于吞吐與擴(kuò)展的平衡，以及對GPU資源的極限壓榨。

而他正是那個站在強化學(xué)習(xí)、系統(tǒng)工程與大語言模型交叉點的人。他不僅要懂RL本身的邏輯，也得理解分布式系統(tǒng)、語言模型的推理方式以及底層架構(gòu)。

工作強度一度讓他因頭痛被送進(jìn)急診。“基本是早上醒來開始debug，寫到晚上睡覺，一周六天?！弊阅且院螅麖娭谱约好恐芘軆纱?000米，恢復(fù)體力。翁家翌回憶稱，“我之前在清華的時候，上體育課是就是3000米不及格，然后完全不會跑3000米的。”

同時，翁家翌也正在參與OpenAI下一代RL Infra的重構(gòu)工作。“舊架構(gòu)已經(jīng)三年多了，堆積的問題其實已經(jīng)很多了?！監(jiān)penAI要推倒重來，目標(biāo)是清理技術(shù)債，幫助研究員以更高迭代效率推進(jìn)實。

三、他在福建省隊拿下“唯一一塊銅牌”，叩開清華大門

面對“你小時候是個什么樣的小孩”的問題，翁家翌從奧數(shù)講起。他在數(shù)學(xué)上展現(xiàn)出超常的直覺能力，常常別人還在計算時他就已經(jīng)寫完了答案。

盡管解題速度快，他卻并不認(rèn)為自己是學(xué)得快的人，反而覺得自己在理解新知識時總是比別人慢，需要付出兩到三倍的時間。同時，他也具備一種策略意識：既然慢，就要提前學(xué)。

他在初中就主動找數(shù)學(xué)老師問高中課程內(nèi)容，初二就完成了大部分高中數(shù)學(xué)學(xué)習(xí)，初三開始學(xué)微積分。翁家翌坦言，“我想投資自己的未來?！?/strong>

進(jìn)入高中后，他因為升學(xué)壓力開始參加信息學(xué)競賽OI（Olympiad in Informatics），希望以此作為進(jìn)入頂尖大學(xué)的路徑。他說，對于非北京的學(xué)生而言，直接考入清華北大“幾乎難如登天”。

他曾在數(shù)學(xué)競賽上小有成績，但因為學(xué)校資源有限、自己準(zhǔn)備不充分，最終選擇放棄數(shù)學(xué)競賽，轉(zhuǎn)而專注于OI。

他在福建省內(nèi)的選拔中一路拼到省隊，在高二那年憑借一道最小二分覆蓋題得到了全場最高分，順利拿到清華“降60分”錄取資格。但他也坦言，這是一次“險勝”：“那年福建省隊只有一個銅牌，就是我?！?/strong>

而這一路的訓(xùn)練，也塑造了他的習(xí)慣和思維方式。他回憶高三備考期間仍“偷偷寫代碼”，甚至在沒有編譯器的iPad上直接鍵盤敲代碼，這樣的經(jīng)歷訓(xùn)練了自己對程序結(jié)構(gòu)的完整認(rèn)知與快速定位bug的能力。

他尤其沉迷于“常數(shù)優(yōu)化”這種在算法競賽中優(yōu)化時間和代碼長度的工程挑戰(zhàn)，盡管他說這可能“沒什么用”，但“真的很有意思”。他總結(jié)說，OI讓他意識到，“我真的可以從里面獲得快樂”。

四、他在清華開源作業(yè)、修校園網(wǎng)Bug，誤打誤撞走進(jìn)了強化學(xué)習(xí)

進(jìn)入高校后，如果要說清華生活里最“出圈”的事，是翁家翌給把所有的作業(yè)都開源了。

他收集了前幾屆流傳下來的“上古作業(yè)”和課程材料，在征得無版權(quán)部分的確認(rèn)后，悉數(shù)上傳到了GitHub。他說，在清華，信息差往往被當(dāng)作一種生存資源，但“我覺得每個人都應(yīng)該平等地?fù)碛羞@些信息”。

他笑稱，“隨便我們抓一個計算機的學(xué)弟，問問你認(rèn)不認(rèn)識捐樓的人，哪怕他把名字放在樓上面，你認(rèn)不認(rèn)識他？不認(rèn)識。但你們認(rèn)識我，因為畢竟大家都看我作業(yè)活的。”他還打趣說，“比捐樓還有用?！?/p>

除了“火遍校園”的作業(yè)庫，翁家翌在大二也開啟了科研之路。他誤打誤撞報了清華計算機系的“學(xué)術(shù)新興計劃”。當(dāng)時他對科研方向還一無所知，只是模糊覺得“圖像的東西挺有意思”，于是盲選了強化學(xué)習(xí)，結(jié)果本以為是搞圖像的，后來發(fā)現(xiàn)其實是打游戲的。

他其實一直對多個方向有濃厚興趣。除了AI，他也喜歡圖形學(xué)和網(wǎng)絡(luò)安全。在大學(xué)時，他曾和學(xué)長一起發(fā)現(xiàn)并修復(fù)了清華網(wǎng)的漏洞，使得本應(yīng)收費十元的成績單可以免費甚至一分錢下載。他修好Bug之后，還反饋給了教務(wù)部門。

圖形學(xué)一度是他的最愛。他在圖形學(xué)課程中投入了大量時間與情感，完成了一個幾乎沒有人敢嘗試的“16K高清圖渲染”大作業(yè)，并發(fā)明了一種加速迭代收斂的新算法，最終拿到了全班僅有的兩個A+之一。

但最終，他還是放棄了圖形學(xué)?！案憧蒲胁荒苣_踏兩條船”，他做了取舍，選擇了繼續(xù)走強化學(xué)習(xí)的路。

五、那些看似“折騰”的科研嘗試，成了他走向OpenAI的“前傳”

自此，翁家翌開啟了他的第一個科研項目：在一個上世紀(jì)90年代的游戲中訓(xùn)練神經(jīng)網(wǎng)絡(luò)，讓智能體在固定地圖里完成從出生點到終點的任務(wù)，包括殺怪、撿血包、避障、通關(guān)。

最終，他用強化學(xué)習(xí)方法拿下冠軍。

盡管結(jié)果不錯，他卻坦言并不享受整個過程。“這個環(huán)境太單一了，要瘋狂地用技巧防止訓(xùn)練崩掉。即使不崩，你也不知道怎么調(diào)參才能保持?！彼f，“這種感覺就像‘煉丹’，這比CV（計算機視覺）調(diào)參難十倍、一百倍，全靠heuristics（啟發(fā)式方法）?！?/p>

也正因此，他在大四有意識地將重心轉(zhuǎn)向工具層面，嘗試搭建一套面向強化學(xué)習(xí)的小型基礎(chǔ)設(shè)施庫?！拔曳浅Ｉ瞄L做軟件工程的事，可以重構(gòu)代碼、優(yōu)化用戶體驗?！彼f，“但至于怎么調(diào)，那不是我想碰的東西?！?/p>

大三暑假，他曾前往蒙特利爾的Mila研究所交流實習(xí)。彼時他投出大量套磁信卻遲遲沒有回應(yīng)，最終在清華導(dǎo)師的幫助下，才聯(lián)系上實習(xí)機會。他回憶，那年是2019年夏天，正好是Mila創(chuàng)始人、本體研究所負(fù)責(zé)人Yoshua Bengio榮獲圖靈獎的幾個月后，“好在我是提前聯(lián)系的，不然估計就進(jìn)不去了?！北M管進(jìn)入的是Bengio所在的實驗室，但他直接跟隨的是一位Postdoc，任務(wù)是嘗試做一個類似MoE（混合專家模型）的項目。

那是他第一次接觸Transformer和語言建模。他花了很長時間上手，最終也只是“撮了一個東西出來”，沒什么效果。他回憶：“要讓這種東西work，首先得有算力、有工程能力，還要能scale up。當(dāng)時就我一個人幾塊卡，哪怕方向?qū)?，也搞不出來?！?/p>

“NLP的任務(wù)太分散了?！彼灿^察到，當(dāng)時很多人在嘗試把RL用于訓(xùn)練語言模型，但Transformer容易在強化學(xué)習(xí)中崩塌，沒人知道怎么讓它不崩。

后來人們才發(fā)現(xiàn)，要讓它work，環(huán)境必須“純”，比如純文本輸入。

他坦言，當(dāng)時對這些方向并沒有清晰認(rèn)知，只覺得處處受限?！八懔Σ粔?，認(rèn)知也不夠，哪怕有今天的理解，當(dāng)時還是做不出來。”

大三暑假交流歸來后，翁家翌開始準(zhǔn)備出國深造的申請。但那段時間并不順利。他坦言，狀態(tài)其實“不太好”。

眼看身邊的同學(xué)紛紛進(jìn)入CMU、Stanford等名校實驗室，發(fā)出ICLR、NeurIPS等會議論文，而自己“什么都沒有”，落差感襲來?！爱?dāng)時的話，我確實是有一點失望的，其實也花了一段時間來調(diào)整自己。后面覺得我一直以來應(yīng)該都是想做一些讓自己與眾不同的事情?！?/p>

最終，他只申請上了碩士。“當(dāng)時確實有些失落”，他說在清華，哪怕是國外的PhD和Master，也會被視作天差地別。

翁家翌坦言，“我一直覺得，GPA不是唯一的評價指標(biāo)。你得創(chuàng)造自己的評價體系?！彼脤?dǎo)師的標(biāo)準(zhǔn)：“計算機系的三大指標(biāo)：論文、比賽、GitHub三位數(shù)以上的Star?！边@句話影響了他很久，也讓他意識到，除了刷成績，還有很多“可見的價值”能讓一個學(xué)生被世界看到。

本科期間，他努力在“盡可能少花時間”的前提下保持成績剛好夠用，“夠用就行，多一分都不想花時間?！彼麜谄谀┣坝嬎惝?dāng)前的GPA，“比如87分是B+，那我就很滿意了?！?/p>

不過，面對出國這個選擇，他也并非完全獨立于大環(huán)境之外。那是在2019年12月，他拿到offer時正值疫情。

六、他用兩個項目“做慈善”：天授與tuixue online，一炮而紅

在申請季與疫情交疊的那段時間，翁家翌做了兩個項目，一個叫“天授”，一個是“tuixue online”。他形容這兩個項目都不是功利性的。

“我不想發(fā)paper，覺得沒有意義?！蔽碳乙钐寡?/strong>。對他來說，多一篇少一篇論文并沒有意義?！拔疑暾堃呀?jīng)夠用了，比賽我也有了，GitHub三位數(shù)star也勉強算有。我更想做一個正兒八經(jīng)的、能被真正用起來的項目。”

“天授”的起點，是不想再浪費時間“煉丹”。2019年底，他意識到強化學(xué)習(xí)（RL）領(lǐng)域的問題不在于算法本身，而在于實驗平臺。

他看了當(dāng)時最主流的RLlib源代碼，發(fā)現(xiàn)抽象極度復(fù)雜，幾十萬行代碼幾乎無法動手，干脆推倒重來。于是他在2020年春節(jié)假期開始自寫一套RL實驗平臺，第一版兩周就完成了。

不同于RLlib的“腐化”，天授從設(shè)計伊始就追求極致的一致性（consistency）。翁家翌認(rèn)為，天授“火”的核心在于真正抓住了科研用戶的需求：一套簡單、好改、穩(wěn)定的框架。

另一個項目“tuixue online”，則源自親身需求。他急需一個實時爬蟲工具來查詢簽證預(yù)約狀態(tài)?！坝谑?，我就手?jǐn)]了一個輕量爬蟲，不然沒辦法?！彼f。同時，翁家翌也覺得很多人應(yīng)該有這個需求，所以就開源了。

這個項目迅速傳播，一開始就有一百多萬點擊，現(xiàn)在累積已經(jīng)破千萬。雖然最終因為美領(lǐng)館升級系統(tǒng)而失效，他也沒再維護(hù)，但這個“短命項目”完成了自己的使命。

他把這兩個項目都稱作“做慈善”?！巴耆玭onprofit（非盈利），這種慈善項目讓我感覺非常滿足過?！?/p>

當(dāng)被問及這種“對impact（影響力）的追求”是何時萌芽的，他回憶起高三時一個“靈光一現(xiàn)”的想法：“如果人生是場游戲，結(jié)算分?jǐn)?shù)就是死后還有多少人記得你的名字?！?/strong>

翁家翌稱，“我覺得，你不可能對所有人都好，這個是很難做到的事情。但是，我可以嘗試力所能及地對我身邊的人好，做一些對大家有意義的事?！?/p>

七、加入OpenAI之前，他已徹底想清楚：要工程，不要煉丹

2020年，翁家翌遠(yuǎn)程開始了CMU的碩士課程，因疫情一年都在家上網(wǎng)課。也正是在這段時期，他開始準(zhǔn)備找工作。他一開始投了18家公司，僅收到Google和AutoML（陳天奇團(tuán)隊）的offer。“我不想去Google，在大廠當(dāng)螺絲釘，然后做一些自己不是那么喜歡的事兒?！?/p>

在此之后，他繼續(xù)投遞并陸續(xù)拿到更多公司offer，包括幻方量化、英偉達(dá)、TikTok，以及Facebook AI Research（FAIR），其中幻方彼時正在籌建AI Lab（后來成為DeepSeek）。

他坦言，如果沒有其他選擇，可能就會加入幻方做強化學(xué)習(xí)infra。但最終，他選擇了OpenAI。

這時距OpenAI尚未進(jìn)入大眾視野，ChatGPT時刻還未來臨。

他做出這個選擇，更多是出于對強化學(xué)習(xí)和系統(tǒng)能力的認(rèn)同?！爱?dāng)時OpenAI和DeepMind是強化學(xué)習(xí)做得最好的兩個lab。”他想體驗“世界最前沿的research是怎么做的”，而不是留在幾個PhD手搓的小作坊式科研環(huán)境里。他想學(xué)的是工業(yè)級科研的方法論。

他最終進(jìn)入了OpenAI的強化學(xué)習(xí)組，由John Schulman（OpenAI聯(lián)合創(chuàng)始人之一）親自招入?！笆撬H自面試的我。我很感激他給了我機會。他離職那天，我難過了一整個下午，把電腦都關(guān)了?！?/p>

面試中，John Schulman只給了兩個人同一道工程題目，一個是翁家翌，另一個是Codex項目的關(guān)鍵成員Andrey Mishchenko?！澳鞘且坏蓝说蕉说念}，很開放，他給了我3小時，我兩個小時就寫完了，現(xiàn)場還修好了一個bug。”

他猜測，John看重的是他的工程能力，“Schulman說我的GitHub主頁很‘漂亮’，他應(yīng)該也認(rèn)可我這個評價體系?！?/p>

談及是否考慮過讀PhD，翁家翌說從未認(rèn)真想過。“如果想進(jìn)工業(yè)界，讀PhD其實是在浪費生命。”他說：“你完全可以以master為跳板，然后來湊夠PhD進(jìn)工業(yè)界的標(biāo)準(zhǔn)。能夠讓對方挑選master的你，而不是另外一個PhD。我覺得是想清楚差異化，這個是很關(guān)鍵的?！?/p>

PhD的訓(xùn)練是讓你擅長講故事、寫paper、畫圖，而工業(yè)界要的是快速迭代和系統(tǒng)正確性。他說，自己的一位OpenAI同事也曾是強化學(xué)習(xí)方向的PhD，后來開發(fā)了一個很出名的RL框架。這位同事總結(jié)過一句話，讓他印象深刻：“教一個researcher如何做好engineering，比教一個engineer如何做好research難得多。”

在翁家翌看來，研究的價值在于驗證，而驗證的關(guān)鍵是infrastructure。只要基礎(chǔ)系統(tǒng)正確、超參合理、迭代效率高，就能快速篩選出有效想法。而“idea is cheap”，真正稀缺的是驗證的效率和質(zhì)量。

“每家infrastructure都有不同程度的bug，誰修的bug多，誰的模型性能就越好。”他直言不諱地說，自己沒興趣再做調(diào)參式的研究了，“我更愿意賣鏟子?！?/strong>

翁家翌的想法是：把infra地基打好，讓別人去玩，讓別人去發(fā)paper，也許還能帶上掛名。

八、OpenAI還“Open”嗎？從AGI定義到組織焦慮，翁家翌給出答案

在翁家翌看來，“Agent”和“強化學(xué)習(xí)的post-training”之間沒有本質(zhì)差別。“它們本質(zhì)上是一個東西，只是中間多了幾步交互。”他認(rèn)為，在技術(shù)路徑上，環(huán)境變化是主要區(qū)別，但并不構(gòu)成新挑戰(zhàn)。

談及AGI的定義，他并不認(rèn)同有統(tǒng)一標(biāo)準(zhǔn)。“OpenAI內(nèi)部你抓15個人，可能有20種定義AGI的方法。”他自己的定義是：“如果它能完成80%、90%我認(rèn)為有意義的任務(wù)，那它可能就是是AGI了。”

而當(dāng)前他日常負(fù)責(zé)的代碼上，尚無法放心交給模型修改。翁家翌稱，“AI infra的數(shù)據(jù)集覆蓋極低，成本太高了，目前還觸及不到這塊?！?/p>

在被問及是否擔(dān)憂自己被AI取代時，他認(rèn)為每個人往往會過度反應(yīng)，“但實際上不會這樣的，它是個很慢的、循序漸進(jìn)的過程?！?/strong>

翁家翌自稱熱愛開源，但也非常清楚這背后的權(quán)衡?！?strong>你沒法直接把最好的模型開源，因為公司要生存?！遍_源與公司生存之間是不可避免的取舍，尤其在資源密集型的模型研發(fā)階段，必須保障資本輸血與商業(yè)可持續(xù)。

在他看來，OpenAI的“Open”戰(zhàn)略并不意味著對所有同行開放，而是盡可能以低門檻的方式讓普通人用上強大工具。“比如ChatGPT有免費版本，還有語音模式體驗，這樣可能是更有利于‘造福全人類’，而不是直接開源。你給出裸的模型權(quán)重，普通人也不知道怎么用?！?/p>

對于外界關(guān)于“OpenAI已不Open”的批評，他回應(yīng)：理論上可以做到開源和社區(qū)反饋，但現(xiàn)實很難。你一開源，別人就立刻閉源壓你，導(dǎo)致你融不到錢，沒法繼續(xù)實驗。

他也坦言，如果公司資源不受限，“我當(dāng)然會很開心地開源RL Infra團(tuán)隊這兩三年的成果。

被問到OpenAI實現(xiàn)AGI的最大挑戰(zhàn)，他用一個詞概括：“執(zhí)行?！痹谒磥?，“只要組織能在正確方向上穩(wěn)定執(zhí)行，就足夠了?！彼寡?，“就比如說差點倒閉那次，只要別再那樣就好。”

對于Sam Altman那場風(fēng)波，他回憶稱：“董事會對Sam的不信任投票，把他趕了出去?！钡讓訂T工的反應(yīng)是“震驚”，因為對他們來說，董事會之前對內(nèi)部幾乎沒有透明度，“我們也不知道這個決策是怎么做的”。

他還提到，OpenAI最終支持Sam回歸，是因為“純技術(shù)出身的人并不一定能撐起整個AI公司”?！澳阈枰粋€能搞錢、搞算力、搞資源的人，不是只有很好的研究經(jīng)驗就行。”

他將Sam抽象成一個“identity（精神符號）”，并說：“如果你試圖用AI來替代這個identity，別人對它的認(rèn)同就會缺失。”

他并不避諱團(tuán)隊流失的問題。對于人才流動，他的態(tài)度是：“一個健康的組織，所有人都是可以被替代的?！敝灰性煅芰?，培養(yǎng)新人，OpenAI就能持續(xù)運轉(zhuǎn)。

但他也承認(rèn)，OpenAI并非在所有關(guān)鍵指標(biāo)上都處于全球領(lǐng)先，比如在infra迭代速度上。

“比如DeepSeek那波聲稱迭代很快，這確實讓內(nèi)部很多人警覺?！彼岬剑@也是重構(gòu)一版Infra的原因，Infra的迭代是OpenAI生死線，“我們早就不做為了刷榜而做的事了?！?/p>

他還解釋說，大公司結(jié)構(gòu)復(fù)雜、use case（應(yīng)用場景）眾多，難免影響效率。相比之下，“一個初創(chuàng)團(tuán)隊集中做一個方向，斜率肯定高?！彼a充道：“所有公司做大了都會變慢，看哪個‘沒那么差’而已。”

他也提出一個設(shè)想：一個擁有無限上下文記憶能力的AI Agent，或許才是最合適的CEO。

現(xiàn)在的組織臃腫、context共享不一致，是人類無法克服的限制，但AI可以。這樣的Agent未來能解決管理的核心問題，承擔(dān)起決策者角色。他說：“人類的context是有限的，但AI可以。”

九、如果AI真的能預(yù)測未來，人類該不該按下暫停鍵

在這段對話的最后，話題轉(zhuǎn)向了一個更抽象的問題：如果讓AI去解決一個世界難題，翁家翌最想做的是什么。他給出的答案是如何預(yù)測未來。

他坦言，“所有的東西都是可以被預(yù)測的，所以理論上它是可以用AI解決的。”

正因為如此，他反而認(rèn)為，“如果你能拿到一個能夠預(yù)測未來的機器的話，那么對個人而言，其實是一個災(zāi)難，我覺得這會導(dǎo)致所有的價值體系的崩塌?！?/p>

他目前采取的應(yīng)對方式，是“忘掉這一切”，假裝不知道世界是否確定，只專注于當(dāng)下的體驗與選擇。

他也提出了一種解釋：時間或許并非線性流動。未來的我，幫助過去的我來完成某些決策。

當(dāng)話題回到現(xiàn)實，他對創(chuàng)業(yè)與未來的態(tài)度并不明朗。他并不否認(rèn)創(chuàng)業(yè)的可能性，但明確稱目前還沒有看到足夠好的想法，也認(rèn)為OpenAI依然是一個值得留下的地方。

他更偏好有真實需求的產(chǎn)品，正如他過去做過的“天授”和“退學(xué)online”。在他看來，“技術(shù)不重要，重要的是就是抓住需求。”

談到更長遠(yuǎn)的未來，他并沒有給自己設(shè)定明確的終點。他希望十年后的自己，能夠“做當(dāng)時想做的事”，有足夠的資源與足夠的能力。他仍然選擇繼續(xù)“投資未來”，讓他有選擇的權(quán)利。

在播客的最后，翁家翌留下了一句答案。他坦言，“我曾經(jīng)一度想通了我自己想要什么，但是我其實還是沒有那么想通，這個問題值得一生去思考?！?/p>

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

大模型聽懂語音卻變笨？港中深與微軟聯(lián)合解決語音大模型降智問題

機器之心Pro 2026-01-19 13:27:44
0 跟貼 0

大學(xué)無用？奧特曼輟學(xué)當(dāng)了CEO，但名校生撐起了整個OpenAI！

36氪 2026-01-18 10:45:08
29 跟貼 29

谷歌新發(fā)現(xiàn)：DeepSeek推理分裂出多重人格，左右腦互搏越來越聰明

量子位 2026-01-20 13:00:06
9 跟貼 9

AI人格集體黑化？Anthropic首次「賽博切腦」，物理斬斷毀滅指令

新智元 2026-01-20 13:06:34
1 跟貼 1

營收過億，這個多模態(tài)生成式AI黑馬開啟新一程

36氪 2026-01-20 17:25:22
0 跟貼 0

AI也邪修！Qwen3改Bug測試直接搜GitHub，太擬人了

量子位 2025-09-04 14:49:30
29 跟貼 29

屏幕消失之后：OpenAI的智能硬件新賭注

鈦媒體APP 2026-01-20 18:52:30
0 跟貼 0

擊敗GPT、Gemini，復(fù)旦×創(chuàng)智孵化創(chuàng)業(yè)團(tuán)隊模思智能，語音模型上新

機器之心Pro 2026-01-20 18:29:15
0 跟貼 0

“AI蜜月期結(jié)束”！德銀：2026將是獨立模型公司的生死年

華爾街見聞官方 2026-01-20 20:19:25
0 跟貼 0

是別針還是耳機？OpenAI首款A(yù)I硬件形態(tài)成謎

鈦媒體APP 2026-01-20 16:46:12
0 跟貼 0

開年的AI狂歡，是利好還是隱憂？

鈦媒體APP 2026-01-20 19:56:11
0 跟貼 0

讓兩個大模型在線吵架，跑通全網(wǎng)95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0

從平面幾何出發(fā)：形式化驗證如何驅(qū)動MLLM的推理能力躍遷

機器之心Pro 2026-01-20 19:17:51
0 跟貼 0

中國創(chuàng)造一門新編程語言的黃金時代來了？

虎嗅APP 2025-12-23 03:54:05
42 跟貼 42

荒野求生（機器狗全自主版），2025ATEC挑戰(zhàn)真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0

大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0

行業(yè)最大規(guī)模具身數(shù)據(jù)集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0

行業(yè)最大規(guī)模具身數(shù)據(jù)集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0

陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0

靈巧手作為獨立執(zhí)行平臺，實現(xiàn)工業(yè)與家庭場景應(yīng)用

量子位 2025-12-11 03:38:13
0 跟貼 0

未來醫(yī)生摘得全球第一，臨床安全有效性評估新基準(zhǔn)

量子位 2025-11-19 11:14:03
0 跟貼 0

機器人管家Figure 03來了，承包一切家務(wù)！

量子位 2025-10-11 10:13:00
0 跟貼 0

五八智能四足機器人平臺Q20A，適用于千行百業(yè)

量子位 2025-09-30 15:35:41
0 跟貼 0

波士頓機器狗練成“輕功”！連續(xù)七個后空翻

量子位 2025-09-07 01:03:18
0 跟貼 0

獵豹移動傅盛：AI讓機器圍著人轉(zhuǎn) 要找到好場景以終為始|財專訪

財聯(lián)社 2026-01-20 23:54:10
0 跟貼 0

恭喜四中孟令輝！又一清華苗子再添章丘驕傲！

章丘人論壇 2026-01-20 17:09:55
2 跟貼 2

外網(wǎng)熱議：兒子清華，35名同學(xué)全赴美國，網(wǎng)友：人才為何留不?。?/a>

脫韁凱Kk 2026-01-19 01:31:19
0 跟貼 0

貴州工商職業(yè)學(xué)院校長潘毅受邀在清華CCSS年度會議分享創(chuàng)新實踐

金臺資訊 2026-01-20 16:10:10
0 跟貼 0

機器人做手術(shù)超越所有醫(yī)生？心外科專家不服，輸了直播吃心臟模型

曾博士 2026-01-18 21:02:00
23 跟貼 23

清華大學(xué)發(fā)現(xiàn)：心臟決定壽命，經(jīng)常吃這4樣，心臟更健康！

陌上開花了 2026-01-20 12:48:32
0 跟貼 0

DeepSeek R1發(fā)布一年了，不卷功能、不融資、不著急，憑什么「硬控」硅谷

愛范兒 2026-01-20 15:22:30
5 跟貼 5

幾年級可以看出孩子是不是學(xué)霸？1-4年級無學(xué)霸，五年級看出苗頭

好爸育兒 2026-01-20 17:31:14
19 跟貼 19

喜報 | 2人保送清北、1人入選清華物理“攀登計劃”！

湖北省黃岡中學(xué) 2026-01-20 15:11:59
0 跟貼 0

開源新王炸！10B多模態(tài)小模型屠榜，性能媲美20倍巨無霸

智東西 2026-01-20 23:17:30
0 跟貼 0

震撼排名：中升美降浙江大學(xué)第1,哈佛第3,前10中國占了7席

可愛大王呼 2026-01-19 01:36:24
0 跟貼 0

智譜新模型也用DeepSeek的MLA，蘋果M5就能跑

量子位 2026-01-20 17:17:42
2 跟貼 2

剛剛，馬斯克開源平臺推薦算法

愛范兒 2026-01-20 17:56:20
0 跟貼 0

馮德萊恩:歐盟決定永久凍結(jié)俄羅斯資產(chǎn)并保留使用權(quán)利

央視新聞客戶端 2026-01-20 18:45:02
12990 跟貼 12990

肯定選清華啊

川哥川 2026-01-19 11:08:14
0 跟貼 0

20天估值暴漲34億！北京AI獨角獸曝新融資

智東西 2026-01-20 12:51:16
1 跟貼 1

“特朗普計劃4月訪華”，中方回應(yīng)！
占豪
2026-01-21 00:04:15

國家發(fā)改委：正在研究制定穩(wěn)崗擴(kuò)容提質(zhì)行動和城鄉(xiāng)居民增收計劃，增強居民消費能力
每日經(jīng)濟(jì)新聞
2026-01-20 11:02:04

CBA一夜上演雙絕殺！廣東苦主慘遭反絕殺：深圳無愧第1絕殺大隊
籃球快餐車
2026-01-21 00:49:51

向余望梅開二度國足4分鐘進(jìn)2球 U23亞洲杯國足2-0領(lǐng)先越南
環(huán)球體壇啄木鳥
2026-01-21 00:52:59

為什么抖音阿里美團(tuán)，都動不了攜程的壟斷地位？
25號觀察員
2026-01-20 17:46:59

剛剛，深圳全市預(yù)警生效
深圳晚報
2026-01-20 18:02:31

特朗普和平委員會吸引全球關(guān)注，多國爭相加入！
特約前排觀眾
2026-01-21 00:10:06

又美又能打！王欣瑜澳網(wǎng)2-0晉級：中國莎娃進(jìn)化，霸氣轟10記ACE
李喜林籃球絕殺
2026-01-20 11:46:40

身價7億二婚娶師妹，劉翔愛旅游不創(chuàng)業(yè)不奢侈，女友是暗黑休閑風(fēng)
科學(xué)發(fā)掘
2026-01-20 05:09:08

轟然倒下！NBA最強壯的籃板怪獸，累計正負(fù)值+194，火箭天塌了
球童無忌
2026-01-20 13:50:15

越媒：越南U23隊長家邀請全村看球，并準(zhǔn)備了100公斤瓜子糖果
懂球帝
2026-01-20 21:21:07

李亞鵬翻紅了！帶貨金額和打賞收入，全網(wǎng)第一
金牌娛樂
2026-01-19 09:47:35

海島：一劑名為“融化”的處方
疾跑的小蝸牛
2026-01-20 22:03:41

沒飛機可飛了：俄羅斯被迫重啟30年前的老客機
桂系007
2026-01-19 23:45:57

美財長貝森特稱日本國債拋售潮外溢至美債市場已與日方對口官員溝通
財聯(lián)社
2026-01-20 23:17:16

傳說曾是刑場？深圳這棟“蠟燭樓”，看一眼后背發(fā)涼！
GA環(huán)球建筑
2026-01-20 18:36:15

國家發(fā)改委：今年將研究制定出臺2026—2030年擴(kuò)大內(nèi)需戰(zhàn)略實施方案
澎湃新聞
2026-01-20 11:23:17

壞消息傳來，要嚴(yán)查退休人員，“4類人”可能逃不掉
巢客HOME
2025-08-03 19:09:22

新加坡總理黃循財表示，絕不允許東方大國在新加坡爭奪芯片資源
南權(quán)先生
2026-01-20 15:55:21

李亞鵬直播間被“砸場子”！砸場的不是別人，是他親閨女竇靖童！
樂悠悠娛樂
2026-01-19 10:00:18

2026-01-21 01:15:00

智東西

聚焦智能變革，服務(wù)產(chǎn)業(yè)升級。

11095文章數(shù) 116943關(guān)注度

往期回顧全部

科技要聞

收藏｜這可能是CES2026最清醒一份復(fù)盤

美國有算力，中國有數(shù)據(jù)：AI制藥上演“相愛相殺”

64萬年終獎刷屏！AI正悄悄掏空你的錢包

OpenAI年化收入首超200億美元，定調(diào)2026

OpenAI首款硬件設(shè)備有望于2026年下半年亮相

頭條要聞

14999元華為智能門鎖上市即倒掛二級市場折讓3千多元

10月大男嬰全身被母親扎數(shù)百針放血不聽話就會被扎針

12歲女孩被3名男子多次性侵當(dāng)?shù)鼐讲挥枇?自愿的

英方承認(rèn)：美國反復(fù)插手中國使館新館舍的建造計劃

特朗普發(fā)張圖加拿大、格陵蘭和委內(nèi)瑞拉被涂上星條旗

頭條要聞

14999元華為智能門鎖上市即倒掛二級市場折讓3千多元

10月大男嬰全身被母親扎數(shù)百針放血不聽話就會被扎針

12歲女孩被3名男子多次性侵當(dāng)?shù)鼐讲挥枇?自愿的

英方承認(rèn)：美國反復(fù)插手中國使館新館舍的建造計劃

特朗普發(fā)張圖加拿大、格陵蘭和委內(nèi)瑞拉被涂上星條旗

體育要聞

勇士遭暴擊！巴特勒重傷賽季報銷

U23國足半場0-0越南！射門數(shù)+控球率占優(yōu) 楊希險破門李昊3次救險

U23國足首發(fā)出爐！安東尼奧連換6人，蒯紀(jì)聞先發(fā)，王鈺棟替補

CBA-上海19分大勝殘陣北京古德溫24分張鎮(zhèn)麟9分

日本靜候U23國足！3次晉級決賽平紀(jì)錄，韋世豪8年前傳射建功

娛樂要聞

網(wǎng)紅版閆學(xué)晶！600萬粉博主阿爆翻車

貝克漢姆長子在說謊？英國媒體爆料婚紗實情

讓代旭來演霸總的人，真是一個天才！

網(wǎng)紅小英再曝猛料！上拉如出軌親表妹

成毅效仿趙露思操作致歡瑞股價暴跌損失慘重

財經(jīng)要聞

李迅雷：2026買房不如租房

永輝2025年第四季度預(yù)虧14.3億

財政部：財政總體支出力度"只增不減"

年內(nèi)首只大牛股狂飆229％

爆降71%，白酒股又一顆“雷”落地了！

汽車要聞

奇瑞張貴兵：墨甲不做秀技術(shù)的企業(yè) 只做痛點終結(jié)者

滿配MPV三排平權(quán) 吉利銀河V900上市限時26.98萬起

滿“雪”出發(fā) 領(lǐng)克的汽車運動已經(jīng)Next Level

新款阿維塔12實車首曝光華為靳玉志評其脫胎換骨

出行場景升級/還支持餐廳排隊方程豹鈦7推送第二次OTA

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

手機

教育

家居

本地

冬季不臃腫穿搭指南來了，奔五奔六照著穿，拿捏溫暖與高級感

不露腿也想穿好看，最關(guān)鍵的是這一點

帽子選對，風(fēng)格翻倍！冬日造型點睛術(shù)

“大衣+運動鞋”才是冬天最時髦搭配，這樣穿松弛又減齡！

手機要聞

聯(lián)想moto X70 Air Pro發(fā)布：4499元起 5000萬像素旗艦三攝

iQOO 15 Ultra跑分曝光，挑戰(zhàn)行業(yè)最高跑分成績

3499元起，紅魔11Air發(fā)布輕薄高顏值電競機

小米18標(biāo)準(zhǔn)版大提升！玄戒O2曝光

教育要聞

高考地理中的生態(tài)退化

一個奇怪的現(xiàn)象：父母越勤快，做得越多，對孩子越?jīng)]要求，孩子越自私；反之父母越“懶”，孩子未來越成功

教育家精神萬里行｜吳凱：以熱愛為底色以堅守筑初心

985高校2025屆畢業(yè)生去向，公布！

來上課了——不一樣的形容詞高中考點全擊破第3段

家居要聞

雋永之章清雅無塵

歲月柔情現(xiàn)代品質(zhì)輕奢

自在自宅個性自由

心之所向現(xiàn)代建構(gòu)之美

本地新聞

云游遼寧｜漫步千年小城晨昏，“康”復(fù)好心情

云游內(nèi)蒙｜黃沙與碧波撞色，烏海天生會“混搭”

邵陽公益訴訟檢察主題曲：《守望星》

云游內(nèi)蒙｜到巴彥淖爾去，赴一場塞上江南的邀約

手機 / 數(shù)碼

房產(chǎn) / 家居

拒絕DeepSeek的清華學(xué)霸，如何拿捏OpenAI的最新大模型？

收藏｜這可能是CES2026最清醒一份復(fù)盤

14999元華為智能門鎖上市即倒掛 二級市場折讓3千多元

14999元華為智能門鎖上市即倒掛 二級市場折讓3千多元

勇士遭暴擊！巴特勒重傷賽季報銷

網(wǎng)紅版閆學(xué)晶！600萬粉博主阿爆翻車

李迅雷：2026買房不如租房

奇瑞張貴兵：墨甲不做秀技術(shù)的企業(yè) 只做痛點終結(jié)者

態(tài)度原創(chuàng)

冬季不臃腫穿搭指南來了，奔五奔六照著穿，拿捏溫暖與高級感

聯(lián)想moto X70 Air Pro發(fā)布：4499元起 5000萬像素旗艦三攝

高考地理中的生態(tài)退化

雋永之章 清雅無塵

云游遼寧｜漫步千年小城晨昏，“康”復(fù)好心情

拒絕DeepSeek的清華學(xué)霸，如何拿捏OpenAI的最新大模型？

14999元華為智能門鎖上市即倒掛二級市場折讓3千多元

14999元華為智能門鎖上市即倒掛二級市場折讓3千多元

勇士遭暴擊！巴特勒重傷賽季報銷

網(wǎng)紅版閆學(xué)晶！600萬粉博主阿爆翻車

冬季不臃腫穿搭指南來了，奔五奔六照著穿，拿捏溫暖與高級感

雋永之章清雅無塵