離開OpenAI后，這位27歲的首席AI科學(xué)家要帶騰訊走向AI的下半場｜姚順雨

2025-12-17 20:41:00　來源: AI進(jìn)化論花生

北京舉報

分享至

今年9月，姚順雨從OpenAI離職的消息傳出來的時候，就已經(jīng)有很多傳聞?wù)f他會加入騰訊，甚至有人說騰訊給出了"億元年薪"。這個新聞一直沒得到肯定，也沒否定，就這么在AI圈懸著。

在今天，騰訊的一則內(nèi)部公告終于讓這個從硅谷到中國的AI圈頂級人才流轉(zhuǎn)塵埃落定了。

27歲的姚順雨正式出任騰訊「CEO/總裁辦公室」首席AI科學(xué)家，直接向總裁劉熾平匯報，同時兼任AI Infra部、大語言模型部負(fù)責(zé)人。年薪是不是這么夸張我們無人知曉，但騰訊確實動了真格——同時宣布升級大模型研發(fā)架構(gòu)，新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部。

朱嘯虎前段時間剛說「騰訊還沒真正發(fā)力」，評價騰訊往往等局面打明白后再加速追趕——從第五第六，追到第三第二，最后追到第一。今天騰訊就用一個27歲的年輕人回應(yīng)了。

微信就是這么干的。2011年從零起步，一年時間追上QQ，最終成為移動互聯(lián)網(wǎng)時代的王者。這次騰訊要在AI領(lǐng)域重演這個故事，姚順雨是關(guān)鍵棋子。

但問題是...為什么是他？

騰訊為什么會有信心，讓一個27歲的年輕人，掌舵騰訊AI的下半場？

姚班出來的，都不是普通人

要說姚順雨的起點，得從2015年說起。那年他高考704分，安徽省理科探花，進(jìn)了清華姚班。

AI圈的人都知道姚班是什么概念。每年只招30人左右，出了一批又一批頂尖人才。但姚班厲害的地方，我覺得不只是招到了天才，更在于它提供了一套系統(tǒng)的訓(xùn)練體系。

這讓我想到費曼說的第一性原理——真正重要的不是記住多少知識，而是學(xué)會如何思考。姚班從大一開始就讓學(xué)生接觸前沿研究，參與實際項目。培養(yǎng)的不只是編程能力，更是發(fā)現(xiàn)問題、定義問題、解決問題的能力。

姚順雨在這個環(huán)境里待了4年，建立了扎實的理論基礎(chǔ)和研究直覺。2019年畢業(yè)后，他去了普林斯頓讀博，導(dǎo)師是Karthik Narasimhan，專注語言智能體和人機(jī)交互。這個方向選擇為他后來的突破埋下了伏筆。

ReAct和Tree of Thoughts，這兩篇論文改變了什么？

普林斯頓的五年，姚順雨其實就做了一件事：把大語言模型從「對話系統(tǒng)」變成「任務(wù)執(zhí)行系統(tǒng)」。這在今天當(dāng)然算不得多新鮮的概念，畢竟今年就是所謂AI Agent的元年。我們也見證過今年年初能實際執(zhí)行操作，幫用戶解決問題的Manus的誕生。

但回到兩年前，也就是2023月的時候，這還是鮮被討論的一個概念，姚順雨發(fā)表了ReAct論文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很簡單：讓大語言模型不只能"想"（推理），還能"做"（行動），而且兩者交替進(jìn)行。

傳統(tǒng)的Chain of Thought（思維鏈）只讓模型"想"，但不讓它"做"。ReAct的突破在于，讓模型在推理的同時，可以調(diào)用工具、查詢信息、執(zhí)行操作，再根據(jù)反饋繼續(xù)推理。這種"想-做-想-做"的循環(huán)，讓AI從"回答問題的系統(tǒng)"變成了"解決問題的助手"。

這篇論文在2023年的ICLR大會上被評為Oral（頂會中只有不到5%的論文能拿到的榮譽）。更重要的是，ReAct成了整個AI Agent領(lǐng)域的基礎(chǔ)框架，至今已被引用超過4300次。

2023年5月，姚順雨又發(fā)了Tree of Thoughts（思維樹）。如果說ReAct是讓AI學(xué)會"邊想邊做"，那Tree of Thoughts就是讓AI學(xué)會"深思熟慮"。

有個數(shù)據(jù)很能說明問題：在Game of 24這個經(jīng)典游戲里，GPT-4用傳統(tǒng)思維鏈方法，成功率只有4%。用了Tree of Thoughts后，成功率直接飆到74%。這不是漸進(jìn)式改進(jìn)，是范式級的跨越。

Tree of Thoughts的核心想法是：讓AI解決問題時，不只是線性思考，而是像人類一樣，探索多個可能的推理路徑，評估每條路徑的可行性，必要時回溯重來。這種"搜索式思考"讓大語言模型真正有了規(guī)劃和決策能力。

這篇論文也在2023年的NeurIPS大會上拿了Oral。

到2024年5月答辯的時候，姚順雨的博士論文題目是《Language Agents: From Next-Token Prediction to Digital Automation》（語言智能體：從下一個詞預(yù)測到數(shù)字自動化）。這個標(biāo)題其實很精準(zhǔn)地概括了他五年的研究成果：讓大語言模型從"預(yù)測文字"變成"執(zhí)行任務(wù)"。

現(xiàn)在的Google Scholar顯示，姚順雨論文的總引用次數(shù)達(dá)到19977次，h-index為27。這個數(shù)據(jù)在27歲這個年齡段，還真挺夸張的。

去OpenAI的8個月，他干了什么？

2024年8月，剛從普林斯頓畢業(yè)的姚順雨加入了OpenAI。

這是個關(guān)鍵轉(zhuǎn)折點。此前的姚順雨是純學(xué)術(shù)派——理論框架、基準(zhǔn)測試、論文發(fā)表。但在OpenAI的8個月，他完成了從"學(xué)術(shù)派"到"產(chǎn)品派"的轉(zhuǎn)變，而且速度快得有點驚人。

他深度參與了OpenAI在2024年底推出的三個重要產(chǎn)品：

Computer-Using Agent：讓AI像人類一樣操作電腦，移動鼠標(biāo)、點擊按鈕、瀏覽網(wǎng)頁
Deep Research：讓AI在互聯(lián)網(wǎng)上自主研究，整理信息，生成報告
Operator：OpenAI首個正式發(fā)布的Agent產(chǎn)品

這些產(chǎn)品背后，都能看到ReAct和Tree of Thoughts的影子。姚順雨在學(xué)術(shù)上提出的"推理與行動結(jié)合"框架，在這里變成了真實可用的產(chǎn)品功能。

8個月時間，參與3個核心產(chǎn)品的開發(fā)——這個速度在OpenAI這樣的頂尖公司也很罕見。說明姚順雨不只會寫論文，還有快速落地、快速迭代的產(chǎn)品能力。

不過，真正讓他變得被大眾所熟知的，其實是他在今年4月份發(fā)表的《AI的下半場》的文章。

這篇文章在AI圈引起了很多討論，因為它提出了一個在當(dāng)時看來很大膽的判斷：

"AI正處在中場休息。"

過去幾十年，AI的主要精力都在開發(fā)新的訓(xùn)練方法和模型。從DeepBlue、AlphaGo，到GPT-4、o-series，歷史性的突破都來自"如何訓(xùn)練出更好的模型"。但現(xiàn)在，游戲規(guī)則在變。

他總結(jié)了一個"配方"：大規(guī)模語言預(yù)訓(xùn)練 + 數(shù)據(jù)和算力擴(kuò)展 + "推理與行動"理念。這個配方已經(jīng)基本標(biāo)準(zhǔn)化、產(chǎn)業(yè)化了，能解決各種各樣的任務(wù)——軟件開發(fā)、創(chuàng)意寫作、IMO級別的數(shù)學(xué)題、鍵鼠操作，甚至長篇問答。

那么，AI的下半場要做什么？

"下半場將把重心從'解決問題'轉(zhuǎn)向'定義問題'。我們不再只問'能不能訓(xùn)練出一個模型解決X問題？'，而是要問'我們究竟應(yīng)該讓AI去做什么？又該如何衡量真正的進(jìn)展？'"

姚順雨提出了一個關(guān)鍵概念：效用問題（Utility Problem）。

"AI已經(jīng)在國際象棋和圍棋上擊敗了世界冠軍，在SAT和律師資格考試中超過了大多數(shù)人類，甚至在IOI和IMO上拿下了金牌?？墒澜绮]有發(fā)生太大改變——至少從經(jīng)濟(jì)和GDP的角度來看如此。"

問題出在哪？他認(rèn)為，根源在于我們的評估方式跟現(xiàn)實世界不一致。

比如，在評估中，任務(wù)"應(yīng)該"自動運行：智能體接收輸入，自主執(zhí)行，得到獎勵。但現(xiàn)實中，智能體必須在任務(wù)過程中持續(xù)跟人類互動——你不會只給客服發(fā)一段超長文字，等上10分鐘，就指望對方給你一份完整回復(fù)。

再比如，評估"應(yīng)該"是i.i.d.（獨立同分布）的。如果有500個任務(wù)的測試集，就會獨立運行每個任務(wù)，最后取平均?？稍诂F(xiàn)實中，我們解決問題往往是順序進(jìn)行的，不是并行。一個Google工程師處理代碼庫問題時，隨著對代碼越來越熟悉，效率會越來越高；但一個AI Agent在同一個代碼庫中解決了很多問題，卻無法獲得這種"熟悉度"。

所以，下半場的新玩法是：

"開發(fā)新的評估方式或任務(wù)，以衡量真實世界的效用。用現(xiàn)有配方去解決它們，或在配方上加入新的組件。"

這需要什么？產(chǎn)品經(jīng)理的思維方式。

騰訊為什么選他？

騰訊不缺技術(shù)，也不缺人才。過去一年，騰訊混元發(fā)布了超過30個新模型，混元2.0在復(fù)雜推理和文本生成場景國內(nèi)領(lǐng)先，混元3D模型保持全球領(lǐng)先水準(zhǔn)。

但騰訊缺的，可能是一個能帶他們走向AI下半場的人。

姚順雨的價值，我覺得不只在學(xué)術(shù)成就，而在于他對"AI應(yīng)該解決什么問題"的理解。

學(xué)術(shù)貢獻(xiàn)：他定義了AI Agent的基本范式——ReAct讓AI學(xué)會"邊想邊做"，Tree of Thoughts讓AI學(xué)會"深思熟慮"。這些不是漸進(jìn)式改進(jìn)，而是范式級創(chuàng)新。

產(chǎn)品能力：他在OpenAI的8個月，證明了不只會寫論文，還能把理論快速轉(zhuǎn)化為產(chǎn)品。Computer-Using Agent、Deep Research、Operator——都是真實可用的產(chǎn)品，不是實驗室demo。

思想深度：《AI的下半場》不是簡單的行業(yè)預(yù)測，而是對整個AI研究方法論的深刻反思。他看到了AI從"刷榜"到"創(chuàng)造價值"的轉(zhuǎn)折點，這是騰訊需要的戰(zhàn)略視野。

這讓我想到張小龍說的產(chǎn)品哲學(xué)——好的產(chǎn)品不是功能堆砌，而是找到真正的用戶需求。姚順雨對"效用問題"的思考，本質(zhì)上就是在追問：AI到底應(yīng)該為用戶創(chuàng)造什么價值？

2025年5月，姚順雨在一次和張小郡的對談中被問到："如果你是微信一號位，會怎么做Agent？"

他說："我可能會不急，先觀望觀望。"

這種思考方式，恰恰是騰訊最需要的——不是盲目跟風(fēng)，不是簡單模仿，而是深刻理解技術(shù)本質(zhì)，找到真正有價值的應(yīng)用場景。

12月17日，騰訊官宣姚順雨的同時，還宣布了一系列組織架構(gòu)調(diào)整：升級大模型研發(fā)架構(gòu)，新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部。AI Infra部負(fù)責(zé)大模型訓(xùn)練和推理平臺技術(shù)能力建設(shè)，聚焦分布式訓(xùn)練、高性能推理等核心技術(shù)。

這是個信號：騰訊不只是挖了個明星研究員，而是在為高強度的技術(shù)攻關(guān)補齊兵力、夯實底座。

他能給騰訊帶來什么？

短期來看，姚順雨肯定會提升混元的Agent能力。

ReAct和Tree of Thoughts已經(jīng)是AI Agent領(lǐng)域的基礎(chǔ)框架，被廣泛應(yīng)用。姚順雨對這些框架的理解和實踐經(jīng)驗，會直接提升混元在任務(wù)執(zhí)行、多步推理、工具調(diào)用等方面的能力。

中期來看，他可能會推動微信生態(tài)的AI改造。

在那次對談中，姚順雨提到，微信既承載社交關(guān)系，也承載職業(yè)交互——購物咨詢、法律服務(wù)、客服溝通等。如果能把Agent能力深度整合到微信生態(tài)，讓每個用戶都能擁有自己的AI助手，想象空間會很大。

朱嘯虎說騰訊往往是"追趕者"，但歷史告訴我們，騰訊追趕能力極強。微信從零起步，一年追上QQ，最終超越QQ成為移動互聯(lián)網(wǎng)時代的王者。這次騰訊要在AI領(lǐng)域重演這個故事。

姚順雨的加入，讓這個故事有了不同可能性。他不只是執(zhí)行者，更是思想者。他對"效用問題"的理解，對"AI下半場"的預(yù)判，對"評估方式"的反思，都代表著一種新的研究范式和產(chǎn)品思維。

27歲，對大多數(shù)人來說，可能還在摸索職業(yè)方向。

但姚順雨已經(jīng)參與定義了AI Agent的基本范式，參與了OpenAI的核心產(chǎn)品開發(fā)，成為了騰訊AI的掌舵人。

AI的下半場，剛開始。

騰訊能不能在這場競賽中追到第一名，誰都無法預(yù)測。事實上，這也不是簡單地靠招幾個「小天才」型人物就能解決的問題。

不過你至少也借此看到騰訊的方向和決心，他們希望讓AI具備在現(xiàn)實世界現(xiàn)實場景中解決問題的能力，這是騰訊作為守位者的需要，也是姚順雨所真正擅長的。

以及，有一點可以確定的是：國內(nèi)的頭部企業(yè)也具有吸引硅谷頭部人才的能力，AI圈國內(nèi)與國外華人的競爭還在持續(xù)發(fā)生。

而這個27歲的年輕人，已經(jīng)站在了AI下半場的舞臺中央。

參考資料：

姚順雨個人網(wǎng)站: https://ysymyth.github.io/
《AI的下半場》: https://ysymyth.github.io/The-Second-Half/
Latent.Space訪談: https://www.latent.space/p/shunyu
Tree of Thoughts論文: https://arxiv.org/abs/2305.10601
ReAct項目官網(wǎng): https://react-lm.github.io/
騰訊新聞: https://36kr.com/p/3599367248412930

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.