国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

離開OpenAI后,這位27歲的首席AI科學(xué)家要帶騰訊走向AI的下半場|姚順雨

0
分享至


今年9月,姚順雨從OpenAI離職的消息傳出來的時(shí)候,就已經(jīng)有很多傳聞?wù)f他會加入騰訊,甚至有人說騰訊給出了"億元年薪"。這個(gè)新聞一直沒得到肯定,也沒否定,就這么在AI圈懸著。

在今天,騰訊的一則內(nèi)部公告終于讓這個(gè)從硅谷到中國的AI圈頂級人才流轉(zhuǎn)塵埃落定了。

27歲的姚順雨正式出任騰訊「CEO/總裁辦公室」首席AI科學(xué)家,直接向總裁劉熾平匯報(bào),同時(shí)兼任AI Infra部、大語言模型部負(fù)責(zé)人。年薪是不是這么夸張我們無人知曉,但騰訊確實(shí)動了真格——同時(shí)宣布升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺部。

朱嘯虎前段時(shí)間剛說「騰訊還沒真正發(fā)力」,評價(jià)騰訊往往等局面打明白后再加速追趕——從第五第六,追到第三第二,最后追到第一。今天騰訊就用一個(gè)27歲的年輕人回應(yīng)了。

微信就是這么干的。2011年從零起步,一年時(shí)間追上QQ,最終成為移動互聯(lián)網(wǎng)時(shí)代的王者。這次騰訊要在AI領(lǐng)域重演這個(gè)故事,姚順雨是關(guān)鍵棋子。

但問題是...為什么是他?

騰訊為什么會有信心,讓一個(gè)27歲的年輕人,掌舵騰訊AI的下半場?

姚班出來的,都不是普通人

要說姚順雨的起點(diǎn),得從2015年說起。那年他高考704分,安徽省理科探花,進(jìn)了清華姚班。

AI圈的人都知道姚班是什么概念。每年只招30人左右,出了一批又一批頂尖人才。但姚班厲害的地方,我覺得不只是招到了天才,更在于它提供了一套系統(tǒng)的訓(xùn)練體系。

這讓我想到費(fèi)曼說的第一性原理——真正重要的不是記住多少知識,而是學(xué)會如何思考。姚班從大一開始就讓學(xué)生接觸前沿研究,參與實(shí)際項(xiàng)目。培養(yǎng)的不只是編程能力,更是發(fā)現(xiàn)問題、定義問題、解決問題的能力。

姚順雨在這個(gè)環(huán)境里待了4年,建立了扎實(shí)的理論基礎(chǔ)和研究直覺。2019年畢業(yè)后,他去了普林斯頓讀博,導(dǎo)師是Karthik Narasimhan,專注語言智能體和人機(jī)交互。這個(gè)方向選擇為他后來的突破埋下了伏筆。

ReAct和Tree of Thoughts,這兩篇論文改變了什么?

普林斯頓的五年,姚順雨其實(shí)就做了一件事:把大語言模型從「對話系統(tǒng)」變成「任務(wù)執(zhí)行系統(tǒng)」。這在今天當(dāng)然算不得多新鮮的概念,畢竟今年就是所謂AI Agent的元年。我們也見證過今年年初能實(shí)際執(zhí)行操作,幫用戶解決問題的Manus的誕生。

但回到兩年前,也就是2023月的時(shí)候,這還是鮮被討論的一個(gè)概念,姚順雨發(fā)表了ReAct論文《ReAct: Synergizing Reasoning and Acting in Language Models》。核心想法很簡單:讓大語言模型不只能"想"(推理),還能"做"(行動),而且兩者交替進(jìn)行。

傳統(tǒng)的Chain of Thought(思維鏈)只讓模型"想",但不讓它"做"。ReAct的突破在于,讓模型在推理的同時(shí),可以調(diào)用工具、查詢信息、執(zhí)行操作,再根據(jù)反饋繼續(xù)推理。這種"想-做-想-做"的循環(huán),讓AI從"回答問題的系統(tǒng)"變成了"解決問題的助手"。

這篇論文在2023年的ICLR大會上被評為Oral(頂會中只有不到5%的論文能拿到的榮譽(yù))。更重要的是,ReAct成了整個(gè)AI Agent領(lǐng)域的基礎(chǔ)框架,至今已被引用超過4300次。

2023年5月,姚順雨又發(fā)了Tree of Thoughts(思維樹)。如果說ReAct是讓AI學(xué)會"邊想邊做",那Tree of Thoughts就是讓AI學(xué)會"深思熟慮"。

有個(gè)數(shù)據(jù)很能說明問題:在Game of 24這個(gè)經(jīng)典游戲里,GPT-4用傳統(tǒng)思維鏈方法,成功率只有4%。用了Tree of Thoughts后,成功率直接飆到74%。這不是漸進(jìn)式改進(jìn),是范式級的跨越。

Tree of Thoughts的核心想法是:讓AI解決問題時(shí),不只是線性思考,而是像人類一樣,探索多個(gè)可能的推理路徑,評估每條路徑的可行性,必要時(shí)回溯重來。這種"搜索式思考"讓大語言模型真正有了規(guī)劃和決策能力。

這篇論文也在2023年的NeurIPS大會上拿了Oral。

到2024年5月答辯的時(shí)候,姚順雨的博士論文題目是《Language Agents: From Next-Token Prediction to Digital Automation》(語言智能體:從下一個(gè)詞預(yù)測到數(shù)字自動化)。這個(gè)標(biāo)題其實(shí)很精準(zhǔn)地概括了他五年的研究成果:讓大語言模型從"預(yù)測文字"變成"執(zhí)行任務(wù)"。

現(xiàn)在的Google Scholar顯示,姚順雨論文的總引用次數(shù)達(dá)到19977次,h-index為27。這個(gè)數(shù)據(jù)在27歲這個(gè)年齡段,還真挺夸張的。


去OpenAI的8個(gè)月,他干了什么?

2024年8月,剛從普林斯頓畢業(yè)的姚順雨加入了OpenAI。

這是個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。此前的姚順雨是純學(xué)術(shù)派——理論框架、基準(zhǔn)測試、論文發(fā)表。但在OpenAI的8個(gè)月,他完成了從"學(xué)術(shù)派"到"產(chǎn)品派"的轉(zhuǎn)變,而且速度快得有點(diǎn)驚人。

他深度參與了OpenAI在2024年底推出的三個(gè)重要產(chǎn)品:

  • Computer-Using Agent:讓AI像人類一樣操作電腦,移動鼠標(biāo)、點(diǎn)擊按鈕、瀏覽網(wǎng)頁

  • Deep Research:讓AI在互聯(lián)網(wǎng)上自主研究,整理信息,生成報(bào)告

  • Operator:OpenAI首個(gè)正式發(fā)布的Agent產(chǎn)品

這些產(chǎn)品背后,都能看到ReAct和Tree of Thoughts的影子。姚順雨在學(xué)術(shù)上提出的"推理與行動結(jié)合"框架,在這里變成了真實(shí)可用的產(chǎn)品功能。

8個(gè)月時(shí)間,參與3個(gè)核心產(chǎn)品的開發(fā)——這個(gè)速度在OpenAI這樣的頂尖公司也很罕見。說明姚順雨不只會寫論文,還有快速落地、快速迭代的產(chǎn)品能力。

不過,真正讓他變得被大眾所熟知的,其實(shí)是他在今年4月份發(fā)表的《AI的下半場》的文章。


這篇文章在AI圈引起了很多討論,因?yàn)樗岢隽艘粋(gè)在當(dāng)時(shí)看來很大膽的判斷:

"AI正處在中場休息。"

過去幾十年,AI的主要精力都在開發(fā)新的訓(xùn)練方法和模型。從DeepBlue、AlphaGo,到GPT-4、o-series,歷史性的突破都來自"如何訓(xùn)練出更好的模型"。但現(xiàn)在,游戲規(guī)則在變。

他總結(jié)了一個(gè)"配方":大規(guī)模語言預(yù)訓(xùn)練 + 數(shù)據(jù)和算力擴(kuò)展 + "推理與行動"理念。這個(gè)配方已經(jīng)基本標(biāo)準(zhǔn)化、產(chǎn)業(yè)化了,能解決各種各樣的任務(wù)——軟件開發(fā)、創(chuàng)意寫作、IMO級別的數(shù)學(xué)題、鍵鼠操作,甚至長篇問答。

那么,AI的下半場要做什么?

"下半場將把重心從'解決問題'轉(zhuǎn)向'定義問題'。我們不再只問'能不能訓(xùn)練出一個(gè)模型解決X問題?',而是要問'我們究竟應(yīng)該讓AI去做什么?又該如何衡量真正的進(jìn)展?'"

姚順雨提出了一個(gè)關(guān)鍵概念:效用問題(Utility Problem)。

"AI已經(jīng)在國際象棋和圍棋上擊敗了世界冠軍,在SAT和律師資格考試中超過了大多數(shù)人類,甚至在IOI和IMO上拿下了金牌?墒澜绮]有發(fā)生太大改變——至少從經(jīng)濟(jì)和GDP的角度來看如此。"

問題出在哪?他認(rèn)為,根源在于我們的評估方式跟現(xiàn)實(shí)世界不一致。

比如,在評估中,任務(wù)"應(yīng)該"自動運(yùn)行:智能體接收輸入,自主執(zhí)行,得到獎勵(lì)。但現(xiàn)實(shí)中,智能體必須在任務(wù)過程中持續(xù)跟人類互動——你不會只給客服發(fā)一段超長文字,等上10分鐘,就指望對方給你一份完整回復(fù)。

再比如,評估"應(yīng)該"是i.i.d.(獨(dú)立同分布)的。如果有500個(gè)任務(wù)的測試集,就會獨(dú)立運(yùn)行每個(gè)任務(wù),最后取平均?稍诂F(xiàn)實(shí)中,我們解決問題往往是順序進(jìn)行的,不是并行。一個(gè)Google工程師處理代碼庫問題時(shí),隨著對代碼越來越熟悉,效率會越來越高;但一個(gè)AI Agent在同一個(gè)代碼庫中解決了很多問題,卻無法獲得這種"熟悉度"。

所以,下半場的新玩法是:

"開發(fā)新的評估方式或任務(wù),以衡量真實(shí)世界的效用。用現(xiàn)有配方去解決它們,或在配方上加入新的組件。"

這需要什么?產(chǎn)品經(jīng)理的思維方式。

騰訊為什么選他?

騰訊不缺技術(shù),也不缺人才。過去一年,騰訊混元發(fā)布了超過30個(gè)新模型,混元2.0在復(fù)雜推理和文本生成場景國內(nèi)領(lǐng)先,混元3D模型保持全球領(lǐng)先水準(zhǔn)。

但騰訊缺的,可能是一個(gè)能帶他們走向AI下半場的人。

姚順雨的價(jià)值,我覺得不只在學(xué)術(shù)成就,而在于他對"AI應(yīng)該解決什么問題"的理解。

學(xué)術(shù)貢獻(xiàn):他定義了AI Agent的基本范式——ReAct讓AI學(xué)會"邊想邊做",Tree of Thoughts讓AI學(xué)會"深思熟慮"。這些不是漸進(jìn)式改進(jìn),而是范式級創(chuàng)新。

產(chǎn)品能力:他在OpenAI的8個(gè)月,證明了不只會寫論文,還能把理論快速轉(zhuǎn)化為產(chǎn)品。Computer-Using Agent、Deep Research、Operator——都是真實(shí)可用的產(chǎn)品,不是實(shí)驗(yàn)室demo。

思想深度:《AI的下半場》不是簡單的行業(yè)預(yù)測,而是對整個(gè)AI研究方法論的深刻反思。他看到了AI從"刷榜"到"創(chuàng)造價(jià)值"的轉(zhuǎn)折點(diǎn),這是騰訊需要的戰(zhàn)略視野。

這讓我想到張小龍說的產(chǎn)品哲學(xué)——好的產(chǎn)品不是功能堆砌,而是找到真正的用戶需求。姚順雨對"效用問題"的思考,本質(zhì)上就是在追問:AI到底應(yīng)該為用戶創(chuàng)造什么價(jià)值?

2025年5月,姚順雨在一次和張小郡的對談中被問到:"如果你是微信一號位,會怎么做Agent?"

他說:"我可能會不急,先觀望觀望。"

這種思考方式,恰恰是騰訊最需要的——不是盲目跟風(fēng),不是簡單模仿,而是深刻理解技術(shù)本質(zhì),找到真正有價(jià)值的應(yīng)用場景。

12月17日,騰訊官宣姚順雨的同時(shí),還宣布了一系列組織架構(gòu)調(diào)整:升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部、數(shù)據(jù)計(jì)算平臺部。AI Infra部負(fù)責(zé)大模型訓(xùn)練和推理平臺技術(shù)能力建設(shè),聚焦分布式訓(xùn)練、高性能推理等核心技術(shù)。

這是個(gè)信號:騰訊不只是挖了個(gè)明星研究員,而是在為高強(qiáng)度的技術(shù)攻關(guān)補(bǔ)齊兵力、夯實(shí)底座。

他能給騰訊帶來什么?

短期來看,姚順雨肯定會提升混元的Agent能力。

ReAct和Tree of Thoughts已經(jīng)是AI Agent領(lǐng)域的基礎(chǔ)框架,被廣泛應(yīng)用。姚順雨對這些框架的理解和實(shí)踐經(jīng)驗(yàn),會直接提升混元在任務(wù)執(zhí)行、多步推理、工具調(diào)用等方面的能力。

中期來看,他可能會推動微信生態(tài)的AI改造。

在那次對談中,姚順雨提到,微信既承載社交關(guān)系,也承載職業(yè)交互——購物咨詢、法律服務(wù)、客服溝通等。如果能把Agent能力深度整合到微信生態(tài),讓每個(gè)用戶都能擁有自己的AI助手,想象空間會很大。

朱嘯虎說騰訊往往是"追趕者",但歷史告訴我們,騰訊追趕能力極強(qiáng)。微信從零起步,一年追上QQ,最終超越QQ成為移動互聯(lián)網(wǎng)時(shí)代的王者。這次騰訊要在AI領(lǐng)域重演這個(gè)故事。

姚順雨的加入,讓這個(gè)故事有了不同可能性。他不只是執(zhí)行者,更是思想者。他對"效用問題"的理解,對"AI下半場"的預(yù)判,對"評估方式"的反思,都代表著一種新的研究范式和產(chǎn)品思維。

27歲,對大多數(shù)人來說,可能還在摸索職業(yè)方向。

但姚順雨已經(jīng)參與定義了AI Agent的基本范式,參與了OpenAI的核心產(chǎn)品開發(fā),成為了騰訊AI的掌舵人。

AI的下半場,剛開始。

騰訊能不能在這場競賽中追到第一名,誰都無法預(yù)測。事實(shí)上,這也不是簡單地靠招幾個(gè)「小天才」型人物就能解決的問題。

不過你至少也借此看到騰訊的方向和決心,他們希望讓AI具備在現(xiàn)實(shí)世界現(xiàn)實(shí)場景中解決問題的能力,這是騰訊作為守位者的需要,也是姚順雨所真正擅長的。

以及,有一點(diǎn)可以確定的是:國內(nèi)的頭部企業(yè)也具有吸引硅谷頭部人才的能力,AI圈國內(nèi)與國外華人的競爭還在持續(xù)發(fā)生。

而這個(gè)27歲的年輕人,已經(jīng)站在了AI下半場的舞臺中央。

參考資料

  • 姚順雨個(gè)人網(wǎng)站: https://ysymyth.github.io/

  • 《AI的下半場》: https://ysymyth.github.io/The-Second-Half/

  • Latent.Space訪談: https://www.latent.space/p/shunyu

  • Tree of Thoughts論文: https://arxiv.org/abs/2305.10601

  • ReAct項(xiàng)目官網(wǎng): https://react-lm.github.io/

  • 騰訊新聞: https://36kr.com/p/3599367248412930

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
來聚餐還補(bǔ)工資!東莞一工廠年底聚餐,當(dāng)晚按工時(shí)3.5小時(shí)核工資

來聚餐還補(bǔ)工資!東莞一工廠年底聚餐,當(dāng)晚按工時(shí)3.5小時(shí)核工資

火山詩話
2025-12-28 11:03:19
內(nèi)訌了?洛夫頓發(fā)文:都不相信我,我要回母校,網(wǎng)友: 趕緊滾吧!

內(nèi)訌了?洛夫頓發(fā)文:都不相信我,我要回母校,網(wǎng)友: 趕緊滾吧!

南海浪花
2025-12-28 12:32:59
女子分享10年前火車上偶遇的唱歌小男孩,竟被當(dāng)事人刷到:互聯(lián)網(wǎng)讓10年前的“一面之緣”有了續(xù)集

女子分享10年前火車上偶遇的唱歌小男孩,竟被當(dāng)事人刷到:互聯(lián)網(wǎng)讓10年前的“一面之緣”有了續(xù)集

環(huán)球網(wǎng)資訊
2025-12-28 10:11:35
民族英雄從課本移除,“民族英雄”卻受到吹捧,這事該反思嗎

民族英雄從課本移除,“民族英雄”卻受到吹捧,這事該反思嗎

何氽簡史
2025-12-27 13:45:11
美國經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日報(bào)》

美國經(jīng)濟(jì)難于擺脫嚴(yán)重衰退 1975年11月19日《人民日報(bào)》

那些看得見的老照片
2025-12-17 17:13:44
董明珠零下三十度蹲守黑瞎子島,盯著空調(diào)連續(xù)燒了一百小時(shí)

董明珠零下三十度蹲守黑瞎子島,盯著空調(diào)連續(xù)燒了一百小時(shí)

百態(tài)人間
2025-12-28 05:20:05
中國不跟美國談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

中國不跟美國談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

議紀(jì)史
2025-12-27 17:25:02
極品領(lǐng)導(dǎo)人高市早苗,創(chuàng)下十年最快紀(jì)錄

極品領(lǐng)導(dǎo)人高市早苗,創(chuàng)下十年最快紀(jì)錄

陸棄
2025-11-12 08:55:03
攤牌了!72歲唐國強(qiáng)終于承認(rèn)與劉曉慶的真實(shí)關(guān)系,曾志偉當(dāng)場傻眼

攤牌了!72歲唐國強(qiáng)終于承認(rèn)與劉曉慶的真實(shí)關(guān)系,曾志偉當(dāng)場傻眼

觀察鑒娛
2025-12-28 09:51:57
掃地機(jī)器人巨頭給全員發(fā)金子,或共超37斤

掃地機(jī)器人巨頭給全員發(fā)金子,或共超37斤

21世紀(jì)經(jīng)濟(jì)報(bào)道
2025-12-28 17:13:20
俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

俄國防部前副部長薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

43歲男保姆哭訴:大媽每月給我10000工資,卻讓我每天做這樣的事

孢木情感
2025-11-25 07:55:53
腦!捌珢邸敝袊耍80%患者都缺一種維生素!

腦!捌珢邸敝袊耍80%患者都缺一種維生素!

孟大夫之家1
2025-12-02 19:46:07
俱樂部對主帥失控,邱彪對球員失控,球隊(duì)對輿論失控,山東隊(duì)真亂

俱樂部對主帥失控,邱彪對球員失控,球隊(duì)對輿論失控,山東隊(duì)真亂

姜大叔侃球
2025-12-27 19:46:34
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

混沌錄
2025-12-27 21:33:28
分手后“60后”男子起訴“90后”女友,開庭前在法院門口捅刺女方致重傷二級,法院判了

分手后“60后”男子起訴“90后”女友,開庭前在法院門口捅刺女方致重傷二級,法院判了

大象新聞
2025-12-28 16:53:04
馬斯克語出驚人:“日本若繼續(xù)這樣下去,遲早會從世界上消失!”

馬斯克語出驚人:“日本若繼續(xù)這樣下去,遲早會從世界上消失!”

忠于法紀(jì)
2025-11-29 22:02:53
1977 年李敏見親姐楊月花,姐姐提特殊要求,舅舅嘆如母性格

1977 年李敏見親姐楊月花,姐姐提特殊要求,舅舅嘆如母性格

嘮叨說歷史
2025-12-24 09:40:23
河北:降雪時(shí)間確定!

河北:降雪時(shí)間確定!

掌中邯鄲
2025-12-28 11:07:50
1952 年鄭洞國進(jìn)京任職,妻嫌薪低改嫁,20 年后哭著找上門

1952 年鄭洞國進(jìn)京任職,妻嫌薪低改嫁,20 年后哭著找上門

嘮叨說歷史
2025-12-24 14:47:32
2025-12-28 19:07:00
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
102文章數(shù) 46關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當(dāng)過2年幼兒園老師

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當(dāng)過2年幼兒園老師

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財(cái)經(jīng)要聞

英偉達(dá)的收購史

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

家居
本地
教育
旅游
房產(chǎn)

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

教育要聞

于潔:教師怎樣走出這10個(gè)認(rèn)知誤區(qū)

旅游要聞

【直播】元旦游上海,黃浦普陀專場:黃浦新年三重奏?普陀“半馬蘇河”,靈!

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

無障礙瀏覽 進(jìn)入關(guān)懷版