国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

拒絕DeepSeek的清華學(xué)霸,如何拿捏OpenAI的最新大模型?

0
分享至


智東西
作者 江宇
編輯 冰倩

智東西1月20日報道,ChatGPT背后的一位中國工程師——OpenAI核心貢獻(xiàn)者翁家翌,日前在AI播客WhynotTV Podcast接受專訪,他首次詳盡講述了自己從清華少年到OpenAI infra骨干的經(jīng)歷。


▲圖源自翁家翌GitHub主頁

作為強化學(xué)習(xí)與后訓(xùn)練(Post-Training)系統(tǒng)的關(guān)鍵工程師,翁家翌深度參與了GPT-3.5、GPT-4、GPT-5等核心模型的訓(xùn)練,其搭建的infra系統(tǒng)已成為OpenAI內(nèi)部大模型訓(xùn)練與迭代的基礎(chǔ)底座,也是ChatGPT持續(xù)進(jìn)化的關(guān)鍵支撐。

在這場長達(dá)兩個多小時的對談中,翁家翌披露了OpenAI內(nèi)部Post-Training系統(tǒng)的構(gòu)建邏輯,也解釋了OpenAI為何能持續(xù)產(chǎn)出爆款模型。

他還分享了他對AGI定義、OpenAI不“open”批評以及內(nèi)部人才流動加劇等現(xiàn)象的第一手觀察。

面對DeepSeek、TikTok、英偉達(dá)、谷歌等科技巨頭拋來的橄欖枝,他為何最終選擇了OpenAI?

談及職業(yè)方向,他又為何自稱“賣鏟子里最面向客戶的那位”,并立下目標(biāo)“我要最大化我在OpenAI Blog上出現(xiàn)的次數(shù)”?

這場對談,給出了答案。

一、“賣鏟子”到主導(dǎo)Post-Training,他是OpenAI模型背后的基礎(chǔ)構(gòu)建者

在OpenAI內(nèi)部,幾乎每一個大型模型的發(fā)布名單里,都能看到翁家翌的名字,他主導(dǎo)搭建了OpenAI強化學(xué)習(xí)后訓(xùn)練(Post-Training)階段的核心基礎(chǔ)設(shè)施。

每發(fā)一個大的release,每發(fā)一個大的模型,我的名字就得放上去。”他說,“因為大家都在用整個Post-Training infra去訓(xùn)練RHF的模型。”

他說自己“是賣鏟子里最面向客戶的那位”,因為強化學(xué)習(xí)模塊處在整個基礎(chǔ)設(shè)施棧的最頂端。他還給自己的職業(yè)生涯設(shè)定過一個指標(biāo):“我要最大化我在OpenAI Blog上出現(xiàn)的次數(shù)?!?/strong>

面對年輕人,他的建議仍是:持續(xù)投入工程建設(shè),而不是學(xué)術(shù)研究。他不避諱地說:“長遠(yuǎn)來看,我還是覺得現(xiàn)代學(xué)術(shù)界應(yīng)該要被重構(gòu)?!痹谒磥?,如果目標(biāo)是進(jìn)入工業(yè)界,最重要的是匹配真實的工作需求,“AI Lab最缺的其實就是Infra人才,infra是個無底洞。

學(xué)術(shù)界研究往往陷在一些困境里,如Atari、MoJoCo等任務(wù)上過度擬合,并不能轉(zhuǎn)化為實際問題的解決能力。他談及,“我在2022年8月就意識到這個問題,所以逐步停止了天授的開發(fā),轉(zhuǎn)向在OpenAI內(nèi)部構(gòu)建更有意義的RL Infra?!?/p>

而在OpenAI內(nèi),他目睹了一系列“半偶然半必然”的變革。加入之初,他參與的就是WebGPT后續(xù)項目,通過強化學(xué)習(xí)讓模型更好地與用戶交互。他負(fù)責(zé)構(gòu)建的RL訓(xùn)練系統(tǒng)在ChatGPT爆發(fā)式上線之前,已成為公司內(nèi)部主力使用的infra之一。

發(fā)布當(dāng)天,OpenAI服務(wù)器數(shù)次被擠爆,他形容這種“自發(fā)涌現(xiàn)的需求”就像自己做tuixue online時遇到的情形,“說明這確實是一個值得投入精力的方向”。

被問到OpenAI為何能做出如此爆款,翁家翌歸結(jié)于兩個因素:一是單位時間迭代效率足夠高,二是領(lǐng)導(dǎo)層真正懂技術(shù)。

OpenAI在引入了幾位前Google工程負(fù)責(zé)人之后(如Barret Zoph、Liam Fedus),團(tuán)隊開始系統(tǒng)性提升工程效率,單位時間的迭代次數(shù)和成功率是正比的。

他強調(diào),“RL本質(zhì)上就是trial-and-error(試錯)。你試得越快越多,成功就越近。”

OpenAI的領(lǐng)導(dǎo)層也保持對細(xì)節(jié)的強關(guān)注。Greg Brockman(聯(lián)合創(chuàng)始人兼總裁)幾乎參與過公司所有基礎(chǔ)設(shè)施模塊,而Sam Altman(聯(lián)合創(chuàng)始人兼CEO)則通過研究助理及時了解公司內(nèi)部進(jìn)展。他認(rèn)為這種技術(shù)細(xì)節(jié)的敏感性和上下信息通暢正是OpenAI創(chuàng)新持續(xù)不斷的原因。

翁家翌稱,“管公司就像管代碼庫,一旦不一致,整個系統(tǒng)就會像拼裝的人類,身子動了,腳沒動。”

二、他為ChatGPT模型搭建后訓(xùn)練系統(tǒng),也在重構(gòu)下一代Infra

ChatGPT 3.5正式發(fā)布之前,OpenAI內(nèi)部其實已開始在GPT-4上驗證強化學(xué)習(xí)后訓(xùn)練(RLHF)流程的可行性。

翁家翌回憶,當(dāng)時他負(fù)責(zé)的正是RLHF訓(xùn)練Pipeline的整體搭建:舊的infra是跑不動的,我在新infra上調(diào)通了第一版,先在4上做通,再遷回3.5。這套Post-Training系統(tǒng)隨后被用于整個ChatGPT系列模型的訓(xùn)練中。

這并不是一條“拿來即用”的流水線。他談及,OpenAI內(nèi)部并沒有現(xiàn)成可復(fù)用的RLHF基線,很多關(guān)鍵流程都需要從頭構(gòu)建。

真正的挑戰(zhàn),是模型效果的衡量標(biāo)準(zhǔn)并不清晰?!澳阌?xùn)練出很多個checkpoint(檢查點),但你不知道哪個是真的更好?!庇萌祟惙答仾剟钤u估時,模型可能一開始獎勵信號很高,之后卻因過度擬合(hacking)而性能下降。

最終,團(tuán)隊只能依賴“human-in-the-loop(人機協(xié)同)”的評估流程,即讓內(nèi)部員工親自交互測試、打分投票,選出效果最佳的版本。

從技術(shù)結(jié)構(gòu)上看,這套Post-Training系統(tǒng)的難度遠(yuǎn)高于他曾經(jīng)開發(fā)的“天授”框架。toy task(驗證算法的小規(guī)模仿真環(huán)境)的瓶頸在環(huán)境,而大模型的瓶頸在模型本身。

環(huán)境是一個Prompt,計算只要幾微秒,但模型訓(xùn)練和采樣則是幾百甚至上千秒。系統(tǒng)工程的復(fù)雜性在于吞吐與擴(kuò)展的平衡,以及對GPU資源的極限壓榨。

而他正是那個站在強化學(xué)習(xí)、系統(tǒng)工程與大語言模型交叉點的人。他不僅要懂RL本身的邏輯,也得理解分布式系統(tǒng)、語言模型的推理方式以及底層架構(gòu)。

工作強度一度讓他因頭痛被送進(jìn)急診。“基本是早上醒來開始debug,寫到晚上睡覺,一周六天?!弊阅且院螅麖娭谱约好恐芘軆纱?000米,恢復(fù)體力。翁家翌回憶稱,“我之前在清華的時候,上體育課是就是3000米不及格,然后完全不會跑3000米的。”

同時,翁家翌也正在參與OpenAI下一代RL Infra的重構(gòu)工作。“舊架構(gòu)已經(jīng)三年多了,堆積的問題其實已經(jīng)很多了?!監(jiān)penAI要推倒重來,目標(biāo)是清理技術(shù)債,幫助研究員以更高迭代效率推進(jìn)實。

三、他在福建省隊拿下“唯一一塊銅牌”,叩開清華大門

面對“你小時候是個什么樣的小孩”的問題,翁家翌從奧數(shù)講起。他在數(shù)學(xué)上展現(xiàn)出超常的直覺能力,常常別人還在計算時他就已經(jīng)寫完了答案。

盡管解題速度快,他卻并不認(rèn)為自己是學(xué)得快的人,反而覺得自己在理解新知識時總是比別人慢,需要付出兩到三倍的時間。同時,他也具備一種策略意識:既然慢,就要提前學(xué)。

他在初中就主動找數(shù)學(xué)老師問高中課程內(nèi)容,初二就完成了大部分高中數(shù)學(xué)學(xué)習(xí),初三開始學(xué)微積分。翁家翌坦言,“我想投資自己的未來?!?/strong>

進(jìn)入高中后,他因為升學(xué)壓力開始參加信息學(xué)競賽OI(Olympiad in Informatics),希望以此作為進(jìn)入頂尖大學(xué)的路徑。他說,對于非北京的學(xué)生而言,直接考入清華北大“幾乎難如登天”。

他曾在數(shù)學(xué)競賽上小有成績,但因為學(xué)校資源有限、自己準(zhǔn)備不充分,最終選擇放棄數(shù)學(xué)競賽,轉(zhuǎn)而專注于OI。

他在福建省內(nèi)的選拔中一路拼到省隊,在高二那年憑借一道最小二分覆蓋題得到了全場最高分,順利拿到清華“降60分”錄取資格。但他也坦言,這是一次“險勝”:“那年福建省隊只有一個銅牌,就是我?!?/strong>

而這一路的訓(xùn)練,也塑造了他的習(xí)慣和思維方式。他回憶高三備考期間仍“偷偷寫代碼”,甚至在沒有編譯器的iPad上直接鍵盤敲代碼,這樣的經(jīng)歷訓(xùn)練了自己對程序結(jié)構(gòu)的完整認(rèn)知與快速定位bug的能力。

他尤其沉迷于“常數(shù)優(yōu)化”這種在算法競賽中優(yōu)化時間和代碼長度的工程挑戰(zhàn),盡管他說這可能“沒什么用”,但“真的很有意思”。他總結(jié)說,OI讓他意識到,“我真的可以從里面獲得快樂”。

四、他在清華開源作業(yè)、修校園網(wǎng)Bug,誤打誤撞走進(jìn)了強化學(xué)習(xí)

進(jìn)入高校后,如果要說清華生活里最“出圈”的事,是翁家翌給把所有的作業(yè)都開源了。

他收集了前幾屆流傳下來的“上古作業(yè)”和課程材料,在征得無版權(quán)部分的確認(rèn)后,悉數(shù)上傳到了GitHub。他說,在清華,信息差往往被當(dāng)作一種生存資源,但“我覺得每個人都應(yīng)該平等地?fù)碛羞@些信息”。

他笑稱,“隨便我們抓一個計算機的學(xué)弟,問問你認(rèn)不認(rèn)識捐樓的人,哪怕他把名字放在樓上面,你認(rèn)不認(rèn)識他?不認(rèn)識。但你們認(rèn)識我,因為畢竟大家都看我作業(yè)活的。”他還打趣說,“比捐樓還有用?!?/p>

除了“火遍校園”的作業(yè)庫,翁家翌在大二也開啟了科研之路。他誤打誤撞報了清華計算機系的“學(xué)術(shù)新興計劃”。當(dāng)時他對科研方向還一無所知,只是模糊覺得“圖像的東西挺有意思”,于是盲選了強化學(xué)習(xí),結(jié)果本以為是搞圖像的,后來發(fā)現(xiàn)其實是打游戲的。

他其實一直對多個方向有濃厚興趣。除了AI,他也喜歡圖形學(xué)和網(wǎng)絡(luò)安全。在大學(xué)時,他曾和學(xué)長一起發(fā)現(xiàn)并修復(fù)了清華網(wǎng)的漏洞,使得本應(yīng)收費十元的成績單可以免費甚至一分錢下載。他修好Bug之后,還反饋給了教務(wù)部門。

圖形學(xué)一度是他的最愛。他在圖形學(xué)課程中投入了大量時間與情感,完成了一個幾乎沒有人敢嘗試的“16K高清圖渲染”大作業(yè),并發(fā)明了一種加速迭代收斂的新算法,最終拿到了全班僅有的兩個A+之一。

但最終,他還是放棄了圖形學(xué)?!案憧蒲胁荒苣_踏兩條船”,他做了取舍,選擇了繼續(xù)走強化學(xué)習(xí)的路。

五、那些看似“折騰”的科研嘗試,成了他走向OpenAI的“前傳”

自此,翁家翌開啟了他的第一個科研項目:在一個上世紀(jì)90年代的游戲中訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓智能體在固定地圖里完成從出生點到終點的任務(wù),包括殺怪、撿血包、避障、通關(guān)。

最終,他用強化學(xué)習(xí)方法拿下冠軍。

盡管結(jié)果不錯,他卻坦言并不享受整個過程。“這個環(huán)境太單一了,要瘋狂地用技巧防止訓(xùn)練崩掉。即使不崩,你也不知道怎么調(diào)參才能保持?!彼f,“這種感覺就像‘煉丹’,這比CV(計算機視覺)調(diào)參難十倍、一百倍,全靠heuristics(啟發(fā)式方法)?!?/p>

也正因此,他在大四有意識地將重心轉(zhuǎn)向工具層面,嘗試搭建一套面向強化學(xué)習(xí)的小型基礎(chǔ)設(shè)施庫?!拔曳浅I瞄L做軟件工程的事,可以重構(gòu)代碼、優(yōu)化用戶體驗?!彼f,“但至于怎么調(diào),那不是我想碰的東西?!?/p>

大三暑假,他曾前往蒙特利爾的Mila研究所交流實習(xí)。彼時他投出大量套磁信卻遲遲沒有回應(yīng),最終在清華導(dǎo)師的幫助下,才聯(lián)系上實習(xí)機會。他回憶,那年是2019年夏天,正好是Mila創(chuàng)始人、本體研究所負(fù)責(zé)人Yoshua Bengio榮獲圖靈獎的幾個月后,“好在我是提前聯(lián)系的,不然估計就進(jìn)不去了?!北M管進(jìn)入的是Bengio所在的實驗室,但他直接跟隨的是一位Postdoc,任務(wù)是嘗試做一個類似MoE(混合專家模型)的項目。

那是他第一次接觸Transformer和語言建模。他花了很長時間上手,最終也只是“撮了一個東西出來”,沒什么效果。他回憶:“要讓這種東西work,首先得有算力、有工程能力,還要能scale up。當(dāng)時就我一個人幾塊卡,哪怕方向?qū)?,也搞不出來?!?/p>

“NLP的任務(wù)太分散了?!彼灿^察到,當(dāng)時很多人在嘗試把RL用于訓(xùn)練語言模型,但Transformer容易在強化學(xué)習(xí)中崩塌,沒人知道怎么讓它不崩。

后來人們才發(fā)現(xiàn),要讓它work,環(huán)境必須“純”,比如純文本輸入。

他坦言,當(dāng)時對這些方向并沒有清晰認(rèn)知,只覺得處處受限?!八懔Σ粔?,認(rèn)知也不夠,哪怕有今天的理解,當(dāng)時還是做不出來。”

大三暑假交流歸來后,翁家翌開始準(zhǔn)備出國深造的申請。但那段時間并不順利。他坦言,狀態(tài)其實“不太好”。

眼看身邊的同學(xué)紛紛進(jìn)入CMU、Stanford等名校實驗室,發(fā)出ICLR、NeurIPS等會議論文,而自己“什么都沒有”,落差感襲來?!爱?dāng)時的話,我確實是有一點失望的,其實也花了一段時間來調(diào)整自己。后面覺得我一直以來應(yīng)該都是想做一些讓自己與眾不同的事情?!?/p>

最終,他只申請上了碩士。“當(dāng)時確實有些失落”,他說在清華,哪怕是國外的PhD和Master,也會被視作天差地別。

翁家翌坦言,“我一直覺得,GPA不是唯一的評價指標(biāo)。你得創(chuàng)造自己的評價體系?!彼脤?dǎo)師的標(biāo)準(zhǔn):“計算機系的三大指標(biāo):論文、比賽、GitHub三位數(shù)以上的Star?!边@句話影響了他很久,也讓他意識到,除了刷成績,還有很多“可見的價值”能讓一個學(xué)生被世界看到。

本科期間,他努力在“盡可能少花時間”的前提下保持成績剛好夠用,“夠用就行,多一分都不想花時間?!彼麜谄谀┣坝嬎惝?dāng)前的GPA,“比如87分是B+,那我就很滿意了?!?/p>

不過,面對出國這個選擇,他也并非完全獨立于大環(huán)境之外。那是在2019年12月,他拿到offer時正值疫情。

六、他用兩個項目“做慈善”:天授與tuixue online,一炮而紅

在申請季與疫情交疊的那段時間,翁家翌做了兩個項目,一個叫“天授”,一個是“tuixue online”。他形容這兩個項目都不是功利性的

“我不想發(fā)paper,覺得沒有意義?!蔽碳乙钐寡?/strong>。對他來說,多一篇少一篇論文并沒有意義?!拔疑暾堃呀?jīng)夠用了,比賽我也有了,GitHub三位數(shù)star也勉強算有。我更想做一個正兒八經(jīng)的、能被真正用起來的項目。”

“天授”的起點,是不想再浪費時間“煉丹”。2019年底,他意識到強化學(xué)習(xí)(RL)領(lǐng)域的問題不在于算法本身,而在于實驗平臺。

他看了當(dāng)時最主流的RLlib源代碼,發(fā)現(xiàn)抽象極度復(fù)雜,幾十萬行代碼幾乎無法動手,干脆推倒重來。于是他在2020年春節(jié)假期開始自寫一套RL實驗平臺,第一版兩周就完成了。

不同于RLlib的“腐化”,天授從設(shè)計伊始就追求極致的一致性(consistency)。翁家翌認(rèn)為,天授“火”的核心在于真正抓住了科研用戶的需求:一套簡單、好改、穩(wěn)定的框架。

另一個項目“tuixue online”,則源自親身需求。他急需一個實時爬蟲工具來查詢簽證預(yù)約狀態(tài)?!坝谑?,我就手?jǐn)]了一個輕量爬蟲,不然沒辦法?!彼f。同時,翁家翌也覺得很多人應(yīng)該有這個需求,所以就開源了。

這個項目迅速傳播,一開始就有一百多萬點擊,現(xiàn)在累積已經(jīng)破千萬。雖然最終因為美領(lǐng)館升級系統(tǒng)而失效,他也沒再維護(hù),但這個“短命項目”完成了自己的使命。

他把這兩個項目都稱作“做慈善”?!巴耆玭onprofit(非盈利),這種慈善項目讓我感覺非常滿足過?!?/p>

當(dāng)被問及這種“對impact(影響力)的追求”是何時萌芽的,他回憶起高三時一個“靈光一現(xiàn)”的想法:“如果人生是場游戲,結(jié)算分?jǐn)?shù)就是死后還有多少人記得你的名字?!?/strong>

翁家翌稱,“我覺得,你不可能對所有人都好,這個是很難做到的事情。但是,我可以嘗試力所能及地對我身邊的人好,做一些對大家有意義的事?!?/p>

七、加入OpenAI之前,他已徹底想清楚:要工程,不要煉丹

2020年,翁家翌遠(yuǎn)程開始了CMU的碩士課程,因疫情一年都在家上網(wǎng)課。也正是在這段時期,他開始準(zhǔn)備找工作。他一開始投了18家公司,僅收到Google和AutoML(陳天奇團(tuán)隊)的offer。“我不想去Google,在大廠當(dāng)螺絲釘,然后做一些自己不是那么喜歡的事兒?!?/p>

在此之后,他繼續(xù)投遞并陸續(xù)拿到更多公司offer,包括幻方量化、英偉達(dá)、TikTok,以及Facebook AI Research(FAIR),其中幻方彼時正在籌建AI Lab(后來成為DeepSeek)。

他坦言,如果沒有其他選擇,可能就會加入幻方做強化學(xué)習(xí)infra。但最終,他選擇了OpenAI。

這時距OpenAI尚未進(jìn)入大眾視野,ChatGPT時刻還未來臨。

他做出這個選擇,更多是出于對強化學(xué)習(xí)和系統(tǒng)能力的認(rèn)同?!爱?dāng)時OpenAI和DeepMind是強化學(xué)習(xí)做得最好的兩個lab。”他想體驗“世界最前沿的research是怎么做的”,而不是留在幾個PhD手搓的小作坊式科研環(huán)境里。他想學(xué)的是工業(yè)級科研的方法論。

他最終進(jìn)入了OpenAI的強化學(xué)習(xí)組,由John Schulman(OpenAI聯(lián)合創(chuàng)始人之一)親自招入?!笆撬H自面試的我。我很感激他給了我機會。他離職那天,我難過了一整個下午,把電腦都關(guān)了?!?/p>

面試中,John Schulman只給了兩個人同一道工程題目,一個是翁家翌,另一個是Codex項目的關(guān)鍵成員Andrey Mishchenko?!澳鞘且坏蓝说蕉说念},很開放,他給了我3小時,我兩個小時就寫完了,現(xiàn)場還修好了一個bug。”

他猜測,John看重的是他的工程能力,“Schulman說我的GitHub主頁很‘漂亮’,他應(yīng)該也認(rèn)可我這個評價體系?!?/p>

談及是否考慮過讀PhD,翁家翌說從未認(rèn)真想過。“如果想進(jìn)工業(yè)界,讀PhD其實是在浪費生命。”他說:“你完全可以以master為跳板,然后來湊夠PhD進(jìn)工業(yè)界的標(biāo)準(zhǔn)。能夠讓對方挑選master的你,而不是另外一個PhD。我覺得是想清楚差異化,這個是很關(guān)鍵的?!?/p>

PhD的訓(xùn)練是讓你擅長講故事、寫paper、畫圖,而工業(yè)界要的是快速迭代和系統(tǒng)正確性。他說,自己的一位OpenAI同事也曾是強化學(xué)習(xí)方向的PhD,后來開發(fā)了一個很出名的RL框架。這位同事總結(jié)過一句話,讓他印象深刻:“教一個researcher如何做好engineering,比教一個engineer如何做好research難得多。”

在翁家翌看來,研究的價值在于驗證,而驗證的關(guān)鍵是infrastructure。只要基礎(chǔ)系統(tǒng)正確、超參合理、迭代效率高,就能快速篩選出有效想法。而“idea is cheap”,真正稀缺的是驗證的效率和質(zhì)量。

“每家infrastructure都有不同程度的bug,誰修的bug多,誰的模型性能就越好。”他直言不諱地說,自己沒興趣再做調(diào)參式的研究了,“我更愿意賣鏟子?!?/strong>

翁家翌的想法是:把infra地基打好,讓別人去玩,讓別人去發(fā)paper,也許還能帶上掛名。

八、OpenAI還“Open”嗎?從AGI定義到組織焦慮,翁家翌給出答案

在翁家翌看來,“Agent”和“強化學(xué)習(xí)的post-training”之間沒有本質(zhì)差別。“它們本質(zhì)上是一個東西,只是中間多了幾步交互。”他認(rèn)為,在技術(shù)路徑上,環(huán)境變化是主要區(qū)別,但并不構(gòu)成新挑戰(zhàn)。

談及AGI的定義,他并不認(rèn)同有統(tǒng)一標(biāo)準(zhǔn)。“OpenAI內(nèi)部你抓15個人,可能有20種定義AGI的方法。”他自己的定義是:“如果它能完成80%、90%我認(rèn)為有意義的任務(wù),那它可能就是是AGI了。”

而當(dāng)前他日常負(fù)責(zé)的代碼上,尚無法放心交給模型修改。翁家翌稱,“AI infra的數(shù)據(jù)集覆蓋極低,成本太高了,目前還觸及不到這塊?!?/p>

在被問及是否擔(dān)憂自己被AI取代時,他認(rèn)為每個人往往會過度反應(yīng),“但實際上不會這樣的,它是個很慢的、循序漸進(jìn)的過程?!?/strong>

翁家翌自稱熱愛開源,但也非常清楚這背后的權(quán)衡?!?strong>你沒法直接把最好的模型開源,因為公司要生存?!遍_源與公司生存之間是不可避免的取舍,尤其在資源密集型的模型研發(fā)階段,必須保障資本輸血與商業(yè)可持續(xù)。

在他看來,OpenAI的“Open”戰(zhàn)略并不意味著對所有同行開放,而是盡可能以低門檻的方式讓普通人用上強大工具。“比如ChatGPT有免費版本,還有語音模式體驗,這樣可能是更有利于‘造福全人類’,而不是直接開源。你給出裸的模型權(quán)重,普通人也不知道怎么用?!?/p>

對于外界關(guān)于“OpenAI已不Open”的批評,他回應(yīng):理論上可以做到開源和社區(qū)反饋,但現(xiàn)實很難。你一開源,別人就立刻閉源壓你,導(dǎo)致你融不到錢,沒法繼續(xù)實驗。

他也坦言,如果公司資源不受限,“我當(dāng)然會很開心地開源RL Infra團(tuán)隊這兩三年的成果。

被問到OpenAI實現(xiàn)AGI的最大挑戰(zhàn),他用一個詞概括:“執(zhí)行?!痹谒磥?,“只要組織能在正確方向上穩(wěn)定執(zhí)行,就足夠了?!彼寡?,“就比如說差點倒閉那次,只要別再那樣就好。”

對于Sam Altman那場風(fēng)波,他回憶稱:“董事會對Sam的不信任投票,把他趕了出去?!钡讓訂T工的反應(yīng)是“震驚”,因為對他們來說,董事會之前對內(nèi)部幾乎沒有透明度,“我們也不知道這個決策是怎么做的”。

他還提到,OpenAI最終支持Sam回歸,是因為“純技術(shù)出身的人并不一定能撐起整個AI公司”?!澳阈枰粋€能搞錢、搞算力、搞資源的人,不是只有很好的研究經(jīng)驗就行。”

他將Sam抽象成一個“identity(精神符號)”,并說:“如果你試圖用AI來替代這個identity,別人對它的認(rèn)同就會缺失。”

他并不避諱團(tuán)隊流失的問題。對于人才流動,他的態(tài)度是:“一個健康的組織,所有人都是可以被替代的?!敝灰性煅芰?,培養(yǎng)新人,OpenAI就能持續(xù)運轉(zhuǎn)。

但他也承認(rèn),OpenAI并非在所有關(guān)鍵指標(biāo)上都處于全球領(lǐng)先,比如在infra迭代速度上。

“比如DeepSeek那波聲稱迭代很快,這確實讓內(nèi)部很多人警覺?!彼岬剑@也是重構(gòu)一版Infra的原因,Infra的迭代是OpenAI生死線,“我們早就不做為了刷榜而做的事了?!?/p>

他還解釋說,大公司結(jié)構(gòu)復(fù)雜、use case(應(yīng)用場景)眾多,難免影響效率。相比之下,“一個初創(chuàng)團(tuán)隊集中做一個方向,斜率肯定高?!彼a充道:“所有公司做大了都會變慢,看哪個‘沒那么差’而已。”

他也提出一個設(shè)想:一個擁有無限上下文記憶能力的AI Agent,或許才是最合適的CEO。

現(xiàn)在的組織臃腫、context共享不一致,是人類無法克服的限制,但AI可以。這樣的Agent未來能解決管理的核心問題,承擔(dān)起決策者角色。他說:“人類的context是有限的,但AI可以。”

九、如果AI真的能預(yù)測未來,人類該不該按下暫停鍵

在這段對話的最后,話題轉(zhuǎn)向了一個更抽象的問題:如果讓AI去解決一個世界難題,翁家翌最想做的是什么。他給出的答案是如何預(yù)測未來。

他坦言,“所有的東西都是可以被預(yù)測的,所以理論上它是可以用AI解決的。”

正因為如此,他反而認(rèn)為,“如果你能拿到一個能夠預(yù)測未來的機器的話,那么對個人而言,其實是一個災(zāi)難,我覺得這會導(dǎo)致所有的價值體系的崩塌?!?/p>

他目前采取的應(yīng)對方式,是“忘掉這一切”,假裝不知道世界是否確定,只專注于當(dāng)下的體驗與選擇。

他也提出了一種解釋:時間或許并非線性流動。未來的我,幫助過去的我來完成某些決策。

當(dāng)話題回到現(xiàn)實,他對創(chuàng)業(yè)與未來的態(tài)度并不明朗。他并不否認(rèn)創(chuàng)業(yè)的可能性,但明確稱目前還沒有看到足夠好的想法,也認(rèn)為OpenAI依然是一個值得留下的地方。

他更偏好有真實需求的產(chǎn)品,正如他過去做過的“天授”和“退學(xué)online”。在他看來,“技術(shù)不重要,重要的是就是抓住需求。”

談到更長遠(yuǎn)的未來,他并沒有給自己設(shè)定明確的終點。他希望十年后的自己,能夠“做當(dāng)時想做的事”,有足夠的資源與足夠的能力。他仍然選擇繼續(xù)“投資未來”,讓他有選擇的權(quán)利。

在播客的最后,翁家翌留下了一句答案。他坦言,“我曾經(jīng)一度想通了我自己想要什么,但是我其實還是沒有那么想通,這個問題值得一生去思考?!?/p>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“特朗普計劃4月訪華”,中方回應(yīng)!

“特朗普計劃4月訪華”,中方回應(yīng)!

占豪
2026-01-21 00:04:15
國家發(fā)改委:正在研究制定穩(wěn)崗擴(kuò)容提質(zhì)行動和城鄉(xiāng)居民增收計劃,增強居民消費能力

國家發(fā)改委:正在研究制定穩(wěn)崗擴(kuò)容提質(zhì)行動和城鄉(xiāng)居民增收計劃,增強居民消費能力

每日經(jīng)濟(jì)新聞
2026-01-20 11:02:04
CBA一夜上演雙絕殺!廣東苦主慘遭反絕殺:深圳無愧第1絕殺大隊

CBA一夜上演雙絕殺!廣東苦主慘遭反絕殺:深圳無愧第1絕殺大隊

籃球快餐車
2026-01-21 00:49:51
向余望梅開二度 國足4分鐘進(jìn)2球 U23亞洲杯國足2-0領(lǐng)先越南

向余望梅開二度 國足4分鐘進(jìn)2球 U23亞洲杯國足2-0領(lǐng)先越南

環(huán)球體壇啄木鳥
2026-01-21 00:52:59
為什么抖音阿里美團(tuán),都動不了攜程的壟斷地位?

為什么抖音阿里美團(tuán),都動不了攜程的壟斷地位?

25號觀察員
2026-01-20 17:46:59
剛剛,深圳全市預(yù)警生效

剛剛,深圳全市預(yù)警生效

深圳晚報
2026-01-20 18:02:31
特朗普和平委員會吸引全球關(guān)注,多國爭相加入!

特朗普和平委員會吸引全球關(guān)注,多國爭相加入!

特約前排觀眾
2026-01-21 00:10:06
又美又能打!王欣瑜澳網(wǎng)2-0晉級:中國莎娃進(jìn)化,霸氣轟10記ACE

又美又能打!王欣瑜澳網(wǎng)2-0晉級:中國莎娃進(jìn)化,霸氣轟10記ACE

李喜林籃球絕殺
2026-01-20 11:46:40
身價7億二婚娶師妹,劉翔愛旅游不創(chuàng)業(yè)不奢侈,女友是暗黑休閑風(fēng)

身價7億二婚娶師妹,劉翔愛旅游不創(chuàng)業(yè)不奢侈,女友是暗黑休閑風(fēng)

科學(xué)發(fā)掘
2026-01-20 05:09:08
轟然倒下!NBA最強壯的籃板怪獸,累計正負(fù)值+194,火箭天塌了

轟然倒下!NBA最強壯的籃板怪獸,累計正負(fù)值+194,火箭天塌了

球童無忌
2026-01-20 13:50:15
越媒:越南U23隊長家邀請全村看球,并準(zhǔn)備了100公斤瓜子糖果

越媒:越南U23隊長家邀請全村看球,并準(zhǔn)備了100公斤瓜子糖果

懂球帝
2026-01-20 21:21:07
李亞鵬翻紅了!帶貨金額和打賞收入,全網(wǎng)第一

李亞鵬翻紅了!帶貨金額和打賞收入,全網(wǎng)第一

金牌娛樂
2026-01-19 09:47:35
海島:一劑名為“融化”的處方

海島:一劑名為“融化”的處方

疾跑的小蝸牛
2026-01-20 22:03:41
沒飛機可飛了:俄羅斯被迫重啟30年前的老客機

沒飛機可飛了:俄羅斯被迫重啟30年前的老客機

桂系007
2026-01-19 23:45:57
美財長貝森特稱日本國債拋售潮外溢至美債市場 已與日方對口官員溝通

美財長貝森特稱日本國債拋售潮外溢至美債市場 已與日方對口官員溝通

財聯(lián)社
2026-01-20 23:17:16
傳說曾是刑場?深圳這棟“蠟燭樓”,看一眼后背發(fā)涼!

傳說曾是刑場?深圳這棟“蠟燭樓”,看一眼后背發(fā)涼!

GA環(huán)球建筑
2026-01-20 18:36:15
國家發(fā)改委:今年將研究制定出臺2026—2030年擴(kuò)大內(nèi)需戰(zhàn)略實施方案

國家發(fā)改委:今年將研究制定出臺2026—2030年擴(kuò)大內(nèi)需戰(zhàn)略實施方案

澎湃新聞
2026-01-20 11:23:17
壞消息傳來,要嚴(yán)查退休人員,“4類人”可能逃不掉

壞消息傳來,要嚴(yán)查退休人員,“4類人”可能逃不掉

巢客HOME
2025-08-03 19:09:22
新加坡總理黃循財表示,絕不允許東方大國在新加坡爭奪芯片資源

新加坡總理黃循財表示,絕不允許東方大國在新加坡爭奪芯片資源

南權(quán)先生
2026-01-20 15:55:21
李亞鵬直播間被“砸場子”!砸場的不是別人,是他親閨女竇靖童!

李亞鵬直播間被“砸場子”!砸場的不是別人,是他親閨女竇靖童!

樂悠悠娛樂
2026-01-19 10:00:18
2026-01-21 01:15:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
11095文章數(shù) 116943關(guān)注度
往期回顧 全部

科技要聞

收藏|這可能是CES2026最清醒一份復(fù)盤

頭條要聞

14999元華為智能門鎖上市即倒掛 二級市場折讓3千多元

頭條要聞

14999元華為智能門鎖上市即倒掛 二級市場折讓3千多元

體育要聞

勇士遭暴擊!巴特勒重傷賽季報銷

娛樂要聞

網(wǎng)紅版閆學(xué)晶!600萬粉博主阿爆翻車

財經(jīng)要聞

李迅雷:2026買房不如租房

汽車要聞

奇瑞張貴兵:墨甲不做秀技術(shù)的企業(yè) 只做痛點終結(jié)者

態(tài)度原創(chuàng)

時尚
手機
教育
家居
本地

冬季不臃腫穿搭指南來了,奔五奔六照著穿,拿捏溫暖與高級感

手機要聞

聯(lián)想moto X70 Air Pro發(fā)布:4499元起 5000萬像素旗艦三攝

教育要聞

高考地理中的生態(tài)退化

家居要聞

雋永之章 清雅無塵

本地新聞

云游遼寧|漫步千年小城晨昏,“康”復(fù)好心情

無障礙瀏覽 進(jìn)入關(guān)懷版