国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

離開OpenAI后,這位27歲的首席AI科學(xué)家要帶騰訊走向AI的下半場|姚順雨

0
分享至


今年9月,姚順雨從OpenAI離職的消息傳出來的時候,就已經(jīng)有很多傳聞?wù)f他會加入騰訊,甚至有人說騰訊給出了"億元年薪"。這個新聞一直沒得到肯定,也沒否定,就這么在AI圈懸著。

在今天,騰訊的一則內(nèi)部公告終于讓這個從硅谷到中國的AI圈頂級人才流轉(zhuǎn)塵埃落定了。

27歲的姚順雨正式出任騰訊「CEO/總裁辦公室」首席AI科學(xué)家,直接向總裁劉熾平匯報,同時兼任AI Infra部、大語言模型部負(fù)責(zé)人。年薪是不是這么夸張我們無人知曉,但騰訊確實動了真格——同時宣布升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部。

朱嘯虎前段時間剛說「騰訊還沒真正發(fā)力」,評價騰訊往往等局面打明白后再加速追趕——從第五第六,追到第三第二,最后追到第一。今天騰訊就用一個27歲的年輕人回應(yīng)了。

微信就是這么干的。2011年從零起步,一年時間追上QQ,最終成為移動互聯(lián)網(wǎng)時代的王者。這次騰訊要在AI領(lǐng)域重演這個故事,姚順雨是關(guān)鍵棋子。

但問題是...為什么是他?

騰訊為什么會有信心,讓一個27歲的年輕人,掌舵騰訊AI的下半場?

姚班出來的,都不是普通人

要說姚順雨的起點,得從2015年說起。那年他高考704分,安徽省理科探花,進(jìn)了清華姚班。

AI圈的人都知道姚班是什么概念。每年只招30人左右,出了一批又一批頂尖人才。但姚班厲害的地方,我覺得不只是招到了天才,更在于它提供了一套系統(tǒng)的訓(xùn)練體系。

這讓我想到費曼說的第一性原理——真正重要的不是記住多少知識,而是學(xué)會如何思考。姚班從大一開始就讓學(xué)生接觸前沿研究,參與實際項目。培養(yǎng)的不只是編程能力,更是發(fā)現(xiàn)問題、定義問題、解決問題的能力。

姚順雨在這個環(huán)境里待了4年,建立了扎實的理論基礎(chǔ)和研究直覺。2019年畢業(yè)后,他去了普林斯頓讀博,導(dǎo)師是Karthik Narasimhan,專注語言智能體和人機(jī)交互。這個方向選擇為他后來的突破埋下了伏筆。

ReAct和Tree of Thoughts,這兩篇論文改變了什么?

普林斯頓的五年,姚順雨其實就做了一件事:把大語言模型從「對話系統(tǒng)」變成「任務(wù)執(zhí)行系統(tǒng)」。這在今天當(dāng)然算不得多新鮮的概念,畢竟今年就是所謂AI Agent的元年。我們也見證過今年年初能實際執(zhí)行操作,幫用戶解決問題的Manus的誕生。

但回到兩年前,也就是2023月的時候,這還是鮮被討論的一個概念,姚順雨發(fā)表了ReAct論文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很簡單:讓大語言模型不只能"想"(推理),還能"做"(行動),而且兩者交替進(jìn)行。

傳統(tǒng)的Chain of Thought(思維鏈)只讓模型"想",但不讓它"做"。ReAct的突破在于,讓模型在推理的同時,可以調(diào)用工具、查詢信息、執(zhí)行操作,再根據(jù)反饋繼續(xù)推理。這種"想-做-想-做"的循環(huán),讓AI從"回答問題的系統(tǒng)"變成了"解決問題的助手"。

這篇論文在2023年的ICLR大會上被評為Oral(頂會中只有不到5%的論文能拿到的榮譽)。更重要的是,ReAct成了整個AI Agent領(lǐng)域的基礎(chǔ)框架,至今已被引用超過4300次。

2023年5月,姚順雨又發(fā)了Tree of Thoughts(思維樹)。如果說ReAct是讓AI學(xué)會"邊想邊做",那Tree of Thoughts就是讓AI學(xué)會"深思熟慮"。

有個數(shù)據(jù)很能說明問題:在Game of 24這個經(jīng)典游戲里,GPT-4用傳統(tǒng)思維鏈方法,成功率只有4%。用了Tree of Thoughts后,成功率直接飆到74%。這不是漸進(jìn)式改進(jìn),是范式級的跨越。

Tree of Thoughts的核心想法是:讓AI解決問題時,不只是線性思考,而是像人類一樣,探索多個可能的推理路徑,評估每條路徑的可行性,必要時回溯重來。這種"搜索式思考"讓大語言模型真正有了規(guī)劃和決策能力。

這篇論文也在2023年的NeurIPS大會上拿了Oral。

到2024年5月答辯的時候,姚順雨的博士論文題目是《Language Agents: From Next-Token Prediction to Digital Automation》(語言智能體:從下一個詞預(yù)測到數(shù)字自動化)。這個標(biāo)題其實很精準(zhǔn)地概括了他五年的研究成果:讓大語言模型從"預(yù)測文字"變成"執(zhí)行任務(wù)"。

現(xiàn)在的Google Scholar顯示,姚順雨論文的總引用次數(shù)達(dá)到19977次,h-index為27。這個數(shù)據(jù)在27歲這個年齡段,還真挺夸張的。


去OpenAI的8個月,他干了什么?

2024年8月,剛從普林斯頓畢業(yè)的姚順雨加入了OpenAI。

這是個關(guān)鍵轉(zhuǎn)折點。此前的姚順雨是純學(xué)術(shù)派——理論框架、基準(zhǔn)測試、論文發(fā)表。但在OpenAI的8個月,他完成了從"學(xué)術(shù)派"到"產(chǎn)品派"的轉(zhuǎn)變,而且速度快得有點驚人。

他深度參與了OpenAI在2024年底推出的三個重要產(chǎn)品:

  • Computer-Using Agent:讓AI像人類一樣操作電腦,移動鼠標(biāo)、點擊按鈕、瀏覽網(wǎng)頁

  • Deep Research:讓AI在互聯(lián)網(wǎng)上自主研究,整理信息,生成報告

  • Operator:OpenAI首個正式發(fā)布的Agent產(chǎn)品

這些產(chǎn)品背后,都能看到ReAct和Tree of Thoughts的影子。姚順雨在學(xué)術(shù)上提出的"推理與行動結(jié)合"框架,在這里變成了真實可用的產(chǎn)品功能。

8個月時間,參與3個核心產(chǎn)品的開發(fā)——這個速度在OpenAI這樣的頂尖公司也很罕見。說明姚順雨不只會寫論文,還有快速落地、快速迭代的產(chǎn)品能力。

不過,真正讓他變得被大眾所熟知的,其實是他在今年4月份發(fā)表的《AI的下半場》的文章。


這篇文章在AI圈引起了很多討論,因為它提出了一個在當(dāng)時看來很大膽的判斷:

"AI正處在中場休息。"

過去幾十年,AI的主要精力都在開發(fā)新的訓(xùn)練方法和模型。從DeepBlue、AlphaGo,到GPT-4、o-series,歷史性的突破都來自"如何訓(xùn)練出更好的模型"。但現(xiàn)在,游戲規(guī)則在變。

他總結(jié)了一個"配方":大規(guī)模語言預(yù)訓(xùn)練 + 數(shù)據(jù)和算力擴(kuò)展 + "推理與行動"理念。這個配方已經(jīng)基本標(biāo)準(zhǔn)化、產(chǎn)業(yè)化了,能解決各種各樣的任務(wù)——軟件開發(fā)、創(chuàng)意寫作、IMO級別的數(shù)學(xué)題、鍵鼠操作,甚至長篇問答。

那么,AI的下半場要做什么?

"下半場將把重心從'解決問題'轉(zhuǎn)向'定義問題'。我們不再只問'能不能訓(xùn)練出一個模型解決X問題?',而是要問'我們究竟應(yīng)該讓AI去做什么?又該如何衡量真正的進(jìn)展?'"

姚順雨提出了一個關(guān)鍵概念:效用問題(Utility Problem)。

"AI已經(jīng)在國際象棋和圍棋上擊敗了世界冠軍,在SAT和律師資格考試中超過了大多數(shù)人類,甚至在IOI和IMO上拿下了金牌??墒澜绮]有發(fā)生太大改變——至少從經(jīng)濟(jì)和GDP的角度來看如此。"

問題出在哪?他認(rèn)為,根源在于我們的評估方式跟現(xiàn)實世界不一致。

比如,在評估中,任務(wù)"應(yīng)該"自動運行:智能體接收輸入,自主執(zhí)行,得到獎勵。但現(xiàn)實中,智能體必須在任務(wù)過程中持續(xù)跟人類互動——你不會只給客服發(fā)一段超長文字,等上10分鐘,就指望對方給你一份完整回復(fù)。

再比如,評估"應(yīng)該"是i.i.d.(獨立同分布)的。如果有500個任務(wù)的測試集,就會獨立運行每個任務(wù),最后取平均??稍诂F(xiàn)實中,我們解決問題往往是順序進(jìn)行的,不是并行。一個Google工程師處理代碼庫問題時,隨著對代碼越來越熟悉,效率會越來越高;但一個AI Agent在同一個代碼庫中解決了很多問題,卻無法獲得這種"熟悉度"。

所以,下半場的新玩法是:

"開發(fā)新的評估方式或任務(wù),以衡量真實世界的效用。用現(xiàn)有配方去解決它們,或在配方上加入新的組件。"

這需要什么?產(chǎn)品經(jīng)理的思維方式。

騰訊為什么選他?

騰訊不缺技術(shù),也不缺人才。過去一年,騰訊混元發(fā)布了超過30個新模型,混元2.0在復(fù)雜推理和文本生成場景國內(nèi)領(lǐng)先,混元3D模型保持全球領(lǐng)先水準(zhǔn)。

但騰訊缺的,可能是一個能帶他們走向AI下半場的人。

姚順雨的價值,我覺得不只在學(xué)術(shù)成就,而在于他對"AI應(yīng)該解決什么問題"的理解。

學(xué)術(shù)貢獻(xiàn):他定義了AI Agent的基本范式——ReAct讓AI學(xué)會"邊想邊做",Tree of Thoughts讓AI學(xué)會"深思熟慮"。這些不是漸進(jìn)式改進(jìn),而是范式級創(chuàng)新。

產(chǎn)品能力:他在OpenAI的8個月,證明了不只會寫論文,還能把理論快速轉(zhuǎn)化為產(chǎn)品。Computer-Using Agent、Deep Research、Operator——都是真實可用的產(chǎn)品,不是實驗室demo。

思想深度:《AI的下半場》不是簡單的行業(yè)預(yù)測,而是對整個AI研究方法論的深刻反思。他看到了AI從"刷榜"到"創(chuàng)造價值"的轉(zhuǎn)折點,這是騰訊需要的戰(zhàn)略視野。

這讓我想到張小龍說的產(chǎn)品哲學(xué)——好的產(chǎn)品不是功能堆砌,而是找到真正的用戶需求。姚順雨對"效用問題"的思考,本質(zhì)上就是在追問:AI到底應(yīng)該為用戶創(chuàng)造什么價值?

2025年5月,姚順雨在一次和張小郡的對談中被問到:"如果你是微信一號位,會怎么做Agent?"

他說:"我可能會不急,先觀望觀望。"

這種思考方式,恰恰是騰訊最需要的——不是盲目跟風(fēng),不是簡單模仿,而是深刻理解技術(shù)本質(zhì),找到真正有價值的應(yīng)用場景。

12月17日,騰訊官宣姚順雨的同時,還宣布了一系列組織架構(gòu)調(diào)整:升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計算平臺部。AI Infra部負(fù)責(zé)大模型訓(xùn)練和推理平臺技術(shù)能力建設(shè),聚焦分布式訓(xùn)練、高性能推理等核心技術(shù)。

這是個信號:騰訊不只是挖了個明星研究員,而是在為高強度的技術(shù)攻關(guān)補齊兵力、夯實底座。

他能給騰訊帶來什么?

短期來看,姚順雨肯定會提升混元的Agent能力。

ReAct和Tree of Thoughts已經(jīng)是AI Agent領(lǐng)域的基礎(chǔ)框架,被廣泛應(yīng)用。姚順雨對這些框架的理解和實踐經(jīng)驗,會直接提升混元在任務(wù)執(zhí)行、多步推理、工具調(diào)用等方面的能力。

中期來看,他可能會推動微信生態(tài)的AI改造。

在那次對談中,姚順雨提到,微信既承載社交關(guān)系,也承載職業(yè)交互——購物咨詢、法律服務(wù)、客服溝通等。如果能把Agent能力深度整合到微信生態(tài),讓每個用戶都能擁有自己的AI助手,想象空間會很大。

朱嘯虎說騰訊往往是"追趕者",但歷史告訴我們,騰訊追趕能力極強。微信從零起步,一年追上QQ,最終超越QQ成為移動互聯(lián)網(wǎng)時代的王者。這次騰訊要在AI領(lǐng)域重演這個故事。

姚順雨的加入,讓這個故事有了不同可能性。他不只是執(zhí)行者,更是思想者。他對"效用問題"的理解,對"AI下半場"的預(yù)判,對"評估方式"的反思,都代表著一種新的研究范式和產(chǎn)品思維。

27歲,對大多數(shù)人來說,可能還在摸索職業(yè)方向。

但姚順雨已經(jīng)參與定義了AI Agent的基本范式,參與了OpenAI的核心產(chǎn)品開發(fā),成為了騰訊AI的掌舵人。

AI的下半場,剛開始。

騰訊能不能在這場競賽中追到第一名,誰都無法預(yù)測。事實上,這也不是簡單地靠招幾個「小天才」型人物就能解決的問題。

不過你至少也借此看到騰訊的方向和決心,他們希望讓AI具備在現(xiàn)實世界現(xiàn)實場景中解決問題的能力,這是騰訊作為守位者的需要,也是姚順雨所真正擅長的。

以及,有一點可以確定的是:國內(nèi)的頭部企業(yè)也具有吸引硅谷頭部人才的能力,AI圈國內(nèi)與國外華人的競爭還在持續(xù)發(fā)生。

而這個27歲的年輕人,已經(jīng)站在了AI下半場的舞臺中央。

參考資料

  • 姚順雨個人網(wǎng)站: https://ysymyth.github.io/

  • 《AI的下半場》: https://ysymyth.github.io/The-Second-Half/

  • Latent.Space訪談: https://www.latent.space/p/shunyu

  • Tree of Thoughts論文: https://arxiv.org/abs/2305.10601

  • ReAct項目官網(wǎng): https://react-lm.github.io/

  • 騰訊新聞: https://36kr.com/p/3599367248412930

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
元宵節(jié)北京最高氣溫將達(dá)11℃ 明后天降雪降溫來襲

元宵節(jié)北京最高氣溫將達(dá)11℃ 明后天降雪降溫來襲

北青網(wǎng)-北京青年報
2026-03-03 07:41:07
堪稱最走運的提督:孫開華半夜多次腹瀉,撞見敵人夜襲,獨自操炮轟擊,意外立下大功

堪稱最走運的提督:孫開華半夜多次腹瀉,撞見敵人夜襲,獨自操炮轟擊,意外立下大功

文史明鑒
2026-01-02 20:25:09
三角洲玩家沒續(xù)艦長遭主播毀號!一億資產(chǎn)30秒清空

三角洲玩家沒續(xù)艦長遭主播毀號!一億資產(chǎn)30秒清空

游民星空
2026-03-02 15:06:24
科威特上空傳出巨大爆炸聲 原因尚不明

科威特上空傳出巨大爆炸聲 原因尚不明

環(huán)球網(wǎng)資訊
2026-03-02 19:32:08
父母決裂哥哥離家出走,她被迫接手千億資產(chǎn),如今靠收租年入30億

父母決裂哥哥離家出走,她被迫接手千億資產(chǎn),如今靠收租年入30億

大魚簡科
2026-03-01 12:20:15
美軍公布傷亡情況!伊朗向美航母發(fā)射4枚導(dǎo)彈,美軍:導(dǎo)彈甚至沒有接近航母,已擊沉一艘伊朗船只;朝鮮強烈譴責(zé)美以“流氓行徑”

美軍公布傷亡情況!伊朗向美航母發(fā)射4枚導(dǎo)彈,美軍:導(dǎo)彈甚至沒有接近航母,已擊沉一艘伊朗船只;朝鮮強烈譴責(zé)美以“流氓行徑”

每日經(jīng)濟(jì)新聞
2026-03-02 00:23:54
林書豪透露了他曾對湖人隊名宿科比·布萊恩特說過:你并不完美

林書豪透露了他曾對湖人隊名宿科比·布萊恩特說過:你并不完美

好火子
2026-03-03 06:22:05
上海入春啦?。。£幱昙磳ⅰ巴藞觥?| 天氣早知道

上海入春啦?。。£幱昙磳ⅰ巴藞觥?| 天氣早知道

上海楊浦
2026-03-03 08:06:49
美國一富豪被冷凍50年,原定2017年蘇醒,解凍時工作人員緊急叫停

美國一富豪被冷凍50年,原定2017年蘇醒,解凍時工作人員緊急叫停

蜉蝣說
2025-12-01 11:20:58
朝鮮專列進(jìn)京有多離譜?金正恩來中國為何坐火車不坐飛機(jī)?

朝鮮專列進(jìn)京有多離譜?金正恩來中國為何坐火車不坐飛機(jī)?

詩意世界
2025-09-17 13:19:48
榮耀李健這一“跳”:要跨過手機(jī)?

榮耀李健這一“跳”:要跨過手機(jī)?

虎嗅APP
2026-03-03 05:58:14
首都機(jī)場漢服上崗驚艷全網(wǎng):這才是中國國門該有的模樣

首都機(jī)場漢服上崗驚艷全網(wǎng):這才是中國國門該有的模樣

魔都姐姐雜談
2026-03-02 15:36:47
上海男主持百克力談從“迪拜”回來的感受,就四個字“劫后余生”

上海男主持百克力談從“迪拜”回來的感受,就四個字“劫后余生”

魔都姐姐雜談
2026-03-03 04:50:42
升級版的仙人跳,比戴綠帽子還憋屈

升級版的仙人跳,比戴綠帽子還憋屈

霹靂炮
2026-02-24 22:53:34
戰(zhàn)爭爆發(fā)后,多位明星被困中東,李茂徹夜未眠,蔣麗莎曬轟炸警報

戰(zhàn)爭爆發(fā)后,多位明星被困中東,李茂徹夜未眠,蔣麗莎曬轟炸警報

觀察鑒娛
2026-03-02 09:59:33
曝伊朗考慮退出世界杯 小組賽3場均在美國踢 4隊按規(guī)有望遞補參賽

曝伊朗考慮退出世界杯 小組賽3場均在美國踢 4隊按規(guī)有望遞補參賽

我愛英超
2026-03-02 22:59:13
馬斯切拉諾:梅西是足球這項運動有史以來最偉大的球員

馬斯切拉諾:梅西是足球這項運動有史以來最偉大的球員

懂球帝
2026-03-02 16:28:07
李雨桐實名控告薛之謙重婚,幕后隱情令人震驚

李雨桐實名控告薛之謙重婚,幕后隱情令人震驚

喜歡歷史的阿繁
2026-03-02 20:41:00
伊朗的阿拉菲成臨時代表,佩澤希齊揚開會坐中間,內(nèi)賈德沒被放過

伊朗的阿拉菲成臨時代表,佩澤希齊揚開會坐中間,內(nèi)賈德沒被放過

伴君終老
2026-03-02 13:45:32
真香預(yù)警 低價MacBook性價比無敵!降維打擊Windows、等等黨最終歸宿

真香預(yù)警 低價MacBook性價比無敵!降維打擊Windows、等等黨最終歸宿

快科技
2026-03-02 10:50:12
2026-03-03 10:36:49
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費榜第一的小貓補光燈app開發(fā)者
148文章數(shù) 65關(guān)注度
往期回顧 全部

科技要聞

蘋果iPhone17e發(fā)布:4499元起 升級A19芯片

頭條要聞

牛彈琴:多國對轟炸保持沉默 西班牙首相確實是條漢子

頭條要聞

牛彈琴:多國對轟炸保持沉默 西班牙首相確實是條漢子

體育要聞

伯納烏8萬人暴怒!高呼78歲老佛爺下課

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

家居
手機(jī)
藝術(shù)
公開課
軍事航空

家居要聞

萬物互聯(lián) 享科技福祉

手機(jī)要聞

蘋果2026年首款iPhone登場 iPhone 17e吃上國補:到手3999元起

藝術(shù)要聞

14個字,您能全認(rèn)嗎?探討情緒對人際關(guān)系的影響。

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國中央司令部透露對伊朗動武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版