国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

姚順雨“露臉”,和唐杰楊植麟探討AGI之路

0
分享至



“我相信今年可能是AI for Science的一個爆發(fā)年,因為很多能力大大提升,我們可以做更多的事情?!?/strong>在昨日舉行的AGI-Next前沿峰會上,清華大學(xué)教授、智譜首席科學(xué)家唐杰這樣說道。

據(jù)了解,該峰會由清華大學(xué)基礎(chǔ)模型北京重點實驗室發(fā)起,旨在探討全球AGI發(fā)展的新范式與面臨的挑戰(zhàn)。

活動還邀請了Kimi創(chuàng)始人、CEO楊植麟,阿里Qwen技術(shù)負責人林俊旸,加拿大皇家學(xué)院院士、香港科技大學(xué)榮休教授楊強,以及此前被騰訊高調(diào)官宣的CEO首席科學(xué)家姚順雨參與了報告和分享,中國“開源四杰”一次聚齊了三家。

“開源四杰”是DeepLearning.AI創(chuàng)始人、斯坦福大學(xué)兼職教授吳恩達給出的定義,他曾在社媒上表示,盡管美國在頂尖閉源模型上保持優(yōu)勢,但在開源領(lǐng)域,中國的DeepSeek R1、Kimi K2、Qwen3和GLM-4.5等模型已經(jīng)領(lǐng)先于美國最好的開源產(chǎn)品。

最近一段時間,中國大模型企業(yè)也在資本市場上動作不斷。就在本場峰會舉辦的前三天,智譜剛剛在港交所敲鐘上市。本周,智譜股價已上揚至158港元,市值來到700億港元。

而在幾周前,月之暗面方面宣布剛剛完成了一輪5億美元規(guī)模融資,投后估值來到43億美元。

“開源四杰”中未能在本次活動現(xiàn)身的DeepSeek,也在近期傳出將在今年2月中旬推出DeepSeek V4的傳聞,外媒報道稱其將具備更強的編碼能力。

2026剛剛開年,中國大模型圍場已經(jīng)熱鬧起來。

01

“大模型應(yīng)對GDP產(chǎn)生

5%-10%的影響”

在圓桌座談環(huán)節(jié),姚順雨并未現(xiàn)身活動現(xiàn)場,而是遠程加入了這場關(guān)于AGI新范式的討論。



“對于ToC來說,大部分人不需要用到這么強的智能。今天用ChatGPT和去年相比,寫交換代數(shù)和伽羅瓦理論的能力變強了,但是大部分人基本感受不到?!痹谡劶皩δP吐肪€分化的看法時,姚順雨表示,大模型在ToC和ToB,以及模型和應(yīng)用分層兩個維度上,都發(fā)生了明顯的分化。

“AI Coding夸張一點來講,已經(jīng)在重塑整個計算機行業(yè)做事的方式,人不再是寫代碼,而是用自然語言和電腦去交流?!痹谝樣昕磥?,ToB行業(yè)正呈現(xiàn)一個模型分化趨勢,即大部分用戶其實更傾向于用最強的模型。“最好的模型是200美元/月,第二強或者差一些的模型是50美元/月、20美元/月。我們發(fā)現(xiàn)像很多美國人愿意溢價用最好的模型?!?/strong>

在姚順雨看來,AI在ToC應(yīng)用上的垂直整合已經(jīng)看到效果,無論是ChatGPT還是豆包,模型和產(chǎn)品是強耦合、緊密迭代的,“但對于ToB而言,這個趨勢似乎是相反的,模型在變得越來越強、越來越好,但同樣會有很多應(yīng)用層的東西,應(yīng)用好的模型在不同的生產(chǎn)力環(huán)節(jié)?!?/p>

“這一仗從DeepSeek出來之后,已經(jīng)結(jié)束了。”說起模型分化,唐杰坦言,DeepSeek在2025年初的橫空出世,已經(jīng)終結(jié)了大模型排隊做對話和搜索的時代,讓他開始思考下一階段一定要“讓AI做一件事情”。他表示,在和團隊爭論很久后,才決定把重心放在Coding上。

而在談到當下RL(強化學(xué)習(xí))正成為行業(yè)主流訓(xùn)練方式時,尤其是RLVR(編者注:可驗證獎勵強化學(xué)習(xí),一種在既定標準下的機器自主學(xué)習(xí)),姚順雨給出了他的觀察。

“現(xiàn)在自主學(xué)習(xí)是一個非常熱門的詞,在硅谷的大街小巷,甚至路邊的咖啡館里,大家都在談?wù)??!闭劶澳P妥灾鲗W(xué)習(xí)的技術(shù)路線,姚順雨表示,自主學(xué)習(xí)會面臨“在什么場景下,基于什么獎勵函數(shù)做”的問題,比如掌握某一業(yè)務(wù)場景的代碼能力,和學(xué)習(xí)某一種自然科學(xué),是完全不同的自主學(xué)習(xí)方法論。

“這個事情其實已經(jīng)發(fā)生了?!币樣晏岬?,OpenAI就在利用用戶數(shù)據(jù)不斷彌合人聊天的風(fēng)格,Claude已經(jīng)為自身這個項目完成了95%的代碼,這都可以算是一種自主學(xué)習(xí)。

在姚順雨看來,自主學(xué)習(xí)在過去一年中已出現(xiàn)清晰信號。他提到,Cursor團隊已在真實環(huán)境中,實現(xiàn)按小時級別用最新用戶數(shù)據(jù)持續(xù)學(xué)習(xí)與迭代,盡管受限于預(yù)訓(xùn)練能力,整體效果仍不及OpenAI,但路徑的可行性已被證明。

“我對今年會有非常大的范式革新有信心,在持續(xù)學(xué)習(xí)、模型記憶能力,甚至多模態(tài)領(lǐng)域,都有可能出現(xiàn)新的范式變革?!痹谔平艿谋硎鲋校@份信心來源于在大模型研發(fā)領(lǐng)域,學(xué)術(shù)界正在跟上工業(yè)界的腳步。

“兩年前,一些高校老師手上都沒有卡(算力),如今很多高校都有了算力配置,也開始進行大模型架構(gòu)、持續(xù)學(xué)習(xí)的相關(guān)研究?!痹谔平芸磥?,學(xué)術(shù)界已經(jīng)加速鋪開AI研究的土壤,有望孵化出新的創(chuàng)新種子。

“一個創(chuàng)新的出現(xiàn),一定是某個事情有大量的投入,并且它的Efficiency(這里指模型訓(xùn)練的投入產(chǎn)出比)到了瓶頸。”唐杰進一步解釋這一觀點。他表示,如果AI行業(yè)繼續(xù)Scaling,盡管這樣做仍會有收益,但當成本到達某一個數(shù)量級,就需要訓(xùn)練范式的創(chuàng)新。

“一方面既然要Scaling up,Scaling肯定會帶來智能上界的提升;但同時應(yīng)該定義Intelligence Efficiency,即智能的效率,用更少的投入獲得智能的增量。”唐杰這樣總結(jié)他對未來模型訓(xùn)練范式的觀察。

另一邊,作為Agent領(lǐng)域的知名研究學(xué)者,姚順雨也分享了他對Agent迭代的前瞻。

“目前看來,ToB或者說生產(chǎn)力Agent才剛剛開始?!?strong>姚順雨表示,即使今天開始,世界上所有的模型訓(xùn)練全部停止,但是把這些模型部署到企業(yè)中,已經(jīng)能帶來10倍甚至100倍的收益?!按竽P蛻?yīng)對GDP產(chǎn)生5%-10%的影響,但是今天它對GDP的影響還不到1%?!?/strong>

而在唐杰看來,判斷一個Agent的功能邏輯是否成立,首先要看它是否真正解決了對人有價值的問題。早期不少Agent看似復(fù)雜,但最終發(fā)現(xiàn)通過更好的Prompt或基礎(chǔ)能力即可完成,獨立Agent的存在價值隨之消失。

“基座的應(yīng)用永遠是矛盾。”唐杰表示,如果實現(xiàn)成本過高,而調(diào)用現(xiàn)成API就能解決,Agent的合理性就會被削弱;但一旦需求價值足夠大,基座模型又可能把能力直接吸收進來。

對于Agent的演進,加拿大皇家學(xué)院院士、香港科技大學(xué)榮休教授楊強將其劃分為四個階段:從目標與規(guī)劃均由人定義,到逐步由模型參與,再到完全由大模型內(nèi)生完成。他指出,當前階段的Agent仍高度依賴人工設(shè)定,本質(zhì)是工具化系統(tǒng);真正的拐點在于模型開始觀察人類工作并利用真實數(shù)據(jù),進而自主生成目標與行動路徑。

對于Agent的未來,楊強給出了他的定義:“Agent應(yīng)該是由大模型內(nèi)生的一個native系統(tǒng)。”

“很多時候不是說人類替代了人類工作,而是會使用這些工具的人,在替代那些不會使用工具的人。”姚順雨的另一個觀察,來自AI時代大眾對大模型認知的參差。

“今天中國能做到一個很有意義的事情,是更好的教育,教育大家怎么更好地使用大模型產(chǎn)品?!币樣耆缡钦f道。

02

Scaling仍在繼續(xù),

但訓(xùn)練范式在變

“今年是RLVR(可驗證獎勵強化學(xué)習(xí))爆發(fā)年。”談及Scaling模式的進化,唐杰表示,在RLVR爆發(fā)之前,行業(yè)內(nèi)只能通過人類反饋數(shù)據(jù)來做,但人類反饋的數(shù)據(jù)中“噪音”也非常多,而且場景也非常單一。“但如果我們有一個可驗證的環(huán)境,就可以讓機器自己去探索、去發(fā)現(xiàn)反饋數(shù)據(jù),實現(xiàn)自我成長?!?/strong>



唐杰所說的RLVR,是指在推理訓(xùn)練中,只對模型最終是否完成目標給反饋,而不評判表達方式或推理風(fēng)格。系統(tǒng)會依據(jù)預(yù)設(shè)規(guī)則自動判斷結(jié)果:如數(shù)學(xué)是否得到唯一正確解、代碼是否通過測試。模型在多次嘗試中,僅當結(jié)果被驗證成功時才獲得獎勵,失敗則不獎勵,從而調(diào)整其推理策略。

RLVR的反饋可自動生成、標準一致,因此同一套推理任務(wù)可以被反復(fù)、大規(guī)模(scaling)用于訓(xùn)練。

“大家可能會問,是不是智能越來越強,我們直接把模型不停地訓(xùn)就行了?”在報告環(huán)節(jié),唐杰拋出了這樣一個問題。他表示,2025年初,DeepSeek的橫空出世給了業(yè)內(nèi)很多“震撼”,標志著大模型已經(jīng)基本解決了Chat(對話)和搜索部分,“這個范式可能基本上快到頭了,剩下更多的反而是工程和技術(shù)上的問題?!?/p>

“今天(行業(yè)內(nèi))訓(xùn)練的范式發(fā)生了很大變化。過往我們不管做什么事情,都會由人工將輸入和輸出標注出來?!痹诎l(fā)言中,阿里Qwen大模型負責人林俊旸同樣提及了模型的訓(xùn)練范式。他表示,早期訓(xùn)模型時,只要有標注的數(shù)據(jù),有“輸入”和“輸出”就可以進行訓(xùn)練,“現(xiàn)在則是要把更多的數(shù)據(jù),放到實驗中去訓(xùn)練?!?/strong>

林俊旸以xAI為例進一步解釋了這一觀點。xAI團隊此前在直播中透露,Grok 4在RL(強化學(xué)習(xí))階段投入的算力,是市面上其他任何模型的10倍以上。

“如此大規(guī)模的RL的數(shù)據(jù),我雖然覺得他們有點浪費,但另一方面也意味著RL有很多的想象空間?!绷挚D說道。



“我們發(fā)現(xiàn)可能基于MUON二階優(yōu)化器,它的效果會非常好,體現(xiàn)在它有兩倍的Token Efficiency的提升?!痹谠轮得鍯EO楊植麟的分享中,他反復(fù)提到Token Efficiency這個概念,“你的Token Efficiency越高,意味著你可以用盡可能少的Token得到一樣的效果?!?/strong>

楊植麟提到的Muon,是一種用于大模型訓(xùn)練的優(yōu)化器。在訓(xùn)練過程中,模型會不斷計算預(yù)測結(jié)果與正確答案之間的誤差,優(yōu)化器的任務(wù)就是根據(jù)這個誤差,計算參數(shù)該如何更新。優(yōu)化器不決定模型上限,但會直接影響訓(xùn)練所需的Token數(shù)量和算力成本。

“我認為基于先驗實現(xiàn)AGI,可能會更早發(fā)生。”總結(jié)個人觀察時,楊植麟表示,Agent訓(xùn)練本質(zhì)是一個搜索問題:在大量可能的行動與推理路徑中,找到有效解。更強的基礎(chǔ)模型和預(yù)訓(xùn)練,相當于提供更好的先驗(Prior,已有知識與約束),能提前排除大量無意義或錯誤的嘗試,從而減少搜索空間、提升Token Efficiency。



“什么是Agent最基礎(chǔ)的能力?是編程,(任何)計算機完成編程動作,就可以執(zhí)行?!碧平苓@樣解構(gòu)Agent的技術(shù)邏輯。他在現(xiàn)場舉例說明,不管是Claude的Computer Use,還是幾周前剛剛發(fā)布的豆包手機助手,抑或是名聲大噪的Manus,“異步”執(zhí)行都是一個關(guān)鍵屬性。

“幫我搜集一下,今天關(guān)于清華大學(xué)在小紅書上所有的討論,然后將關(guān)于某某的全部整理出來,生成相關(guān)的文檔?!碧平芘e例說明,像這樣一個任務(wù),往往要經(jīng)歷幾十步,甚至上百步流程。AI必須在后臺自動運行、持續(xù)判斷與執(zhí)行。換言之,大模型在Agent和Coding上的能力,將是一個映射在Device Use(設(shè)備端側(cè)使用)上的命題。

在總結(jié)環(huán)節(jié),唐杰進一步闡釋了他的理念,“在我看來計算機有三個能力:第一,計算機的表示和計算;第二,編程;第三,本質(zhì)上是搜索。”他認為,正是這三種能力的疊加,使計算機具備了走向“超級智能”的潛力。

回到訓(xùn)練層面上,唐杰坦言,他認為Scaling仍將繼續(xù),但重點正在發(fā)生變化,“已知的是我們不斷加數(shù)據(jù)、不斷探索上限。還有Scaling未知,就是我們不知道的新的范式是什么。”

03

做大模型要敢于冒險,

走出榜單的束縛

展望下一個AGI的范式和行業(yè)未來,唐杰毫不掩飾作為AI研究學(xué)者的審視態(tài)度:“我們做了一些開源的成功,可能有些人會覺得很興奮,覺得中國的大模型好像已經(jīng)超過美國了,但可能真正的答案是,我們的差距目前并未縮小。”

正視挑戰(zhàn)和差距的同時,唐杰也分享了他眼中的國產(chǎn)模型發(fā)展方向。在他看來,2025年只是多模態(tài)適應(yīng)的適應(yīng)期。未來關(guān)鍵在于,模型能否像人類一樣,把視覺、聲音、觸覺等信息統(tǒng)一整合,形成原生、多源協(xié)同的整體感知能力,這是多模態(tài)能力躍遷的核心難題。

唐杰進一步指出,大模型在記憶、持續(xù)學(xué)習(xí)與自我認知上仍明顯不足。當前模型缺乏分層記憶結(jié)構(gòu),如何把個人記憶擴展為可長期保存的人類集體知識,并在此基礎(chǔ)上探索反思與自我認知能力,將是下一階段最具挑戰(zhàn)、也最值得投入的方向。

“目前的模型已經(jīng)有一定的反思能力,但如何形成自我認知還是很難的問題。”唐杰表示,對于大模型是否能有自我認知,在基礎(chǔ)模型研究領(lǐng)域一直都存在爭議,“我覺得模型的自我認識是有可能的,這個領(lǐng)域值得我們探索?!?/strong>

“在國內(nèi),大家對于刷榜或者數(shù)字看得更重一些?!痹趯υ捴?,姚順雨對當下的AI研究文化也給出了個人視角的觀察。他以DeepSeek為例闡述這一觀點:“他們(DeepSeek)就沒有那么關(guān)注榜單的數(shù)字,反而會更注重:第一,什么是正確的事情;第二,什么是你自己能體驗出好或者不好的。”



他進一步舉例,Claude可能在編程或者軟件工程的榜單上并非排名最高,但卻獲得了業(yè)內(nèi)公認的好評。“這需要大家能夠走出榜單的束縛,在體驗上去感受是不是正確的過程?!?/p>

“我們到底能不能引領(lǐng)新的范式,這可能是今天中國AI產(chǎn)業(yè)唯一要解決的問題?!币樣晏寡裕捌渌凶龅氖虑?,無論是商業(yè)、產(chǎn)業(yè)設(shè)計還是做工程,我們某種程度上已經(jīng)比美國做得更好?!?/p>

“我還是挺樂觀的?!边@位1998年出生的AI頂尖學(xué)者表示,任何一個新業(yè)態(tài)一旦被發(fā)現(xiàn),在中國就能夠很快復(fù)現(xiàn),甚至局部做得更好,“在制造業(yè)、新能源車領(lǐng)域,這樣的例子已經(jīng)不斷發(fā)生。”

在唐杰看來,中國AI產(chǎn)業(yè)的機會,在于聰明且敢冒險的年輕人,在于持續(xù)改善的營商環(huán)境;而在產(chǎn)業(yè)中的每個人身上,“就是我們能不能堅持,能不能在一條路上敢做、敢冒險?!?/p>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
我用三個真實的病例告訴你:為啥我總建議重癥病人去一線城市看病

我用三個真實的病例告訴你:為啥我總建議重癥病人去一線城市看病

千秋文化
2026-02-24 20:25:25
斯諾克賽程:決出16強,3場冠軍PK,趙心童領(lǐng)銜,中國9人披掛上陣

斯諾克賽程:決出16強,3場冠軍PK,趙心童領(lǐng)銜,中國9人披掛上陣

劉姚堯的文字城堡
2026-02-25 08:33:55
曝成毅和歡瑞正式解約,前老板發(fā)聲祝福,歡瑞官網(wǎng)已今非昔比!

曝成毅和歡瑞正式解約,前老板發(fā)聲祝福,歡瑞官網(wǎng)已今非昔比!

古希臘掌管月桂的神
2026-01-18 15:40:24
如果不差錢,退休后首選這3座城市久居,物價低,還舒服

如果不差錢,退休后首選這3座城市久居,物價低,還舒服

蜉蝣說
2026-02-14 16:06:23
票房不好,自己反思,別賣慘別賴觀眾

票房不好,自己反思,別賣慘別賴觀眾

閑人電影
2026-02-24 19:29:17
突發(fā)!黃金直線拉升突破5200美元,白銀站上90美元

突發(fā)!黃金直線拉升突破5200美元,白銀站上90美元

每日經(jīng)濟新聞
2026-02-25 15:36:12
這你敢信?C羅罷賽的效果出來了!

這你敢信?C羅罷賽的效果出來了!

田先生籃球
2026-02-25 11:28:10
小S被曝住進了大S豪宅,黃春梅終于盼來了救星,具俊曄指望不上

小S被曝住進了大S豪宅,黃春梅終于盼來了救星,具俊曄指望不上

可樂談情感
2026-02-25 13:29:42
宏大敘事是窮人最后的“精神鴉片”

宏大敘事是窮人最后的“精神鴉片”

浪子說
2026-02-24 22:08:10
“全屋定制”漸漸退出中國家庭?學(xué)學(xué)浙江人的做法,美觀無甲醛!

“全屋定制”漸漸退出中國家庭?學(xué)學(xué)浙江人的做法,美觀無甲醛!

家居設(shè)計師蘇哥
2026-02-25 13:36:32
女子乘坐動車上廁所時 不慎沖走50g金手鏈 鐵路人員回應(yīng)

女子乘坐動車上廁所時 不慎沖走50g金手鏈 鐵路人員回應(yīng)

閃電新聞
2026-02-24 15:53:21
她在非誠勿擾上站五年,爆燈無數(shù)卻不牽手,最終被主持人趕下臺

她在非誠勿擾上站五年,爆燈無數(shù)卻不牽手,最終被主持人趕下臺

琴聲飛揚
2026-02-22 15:21:45
克努佩爾21分布利澤斯空砍32+7 黃蜂送公牛10連敗

克努佩爾21分布利澤斯空砍32+7 黃蜂送公牛10連敗

北青網(wǎng)-北京青年報
2026-02-25 15:24:56
54歲楊鈺瑩近況曝光:定居深圳,每天打理菜園子,生活平淡

54歲楊鈺瑩近況曝光:定居深圳,每天打理菜園子,生活平淡

小徐講八卦
2025-11-17 07:29:28
小臥室不要再放“雙人床”了,學(xué)年輕人的做法,美觀又實用!

小臥室不要再放“雙人床”了,學(xué)年輕人的做法,美觀又實用!

室內(nèi)設(shè)計師有料兒
2026-02-24 21:03:27
BBA春節(jié)檔掀史上最猛降價潮,寶馬7系狂降27萬,新能源車企卻換了一種打法

BBA春節(jié)檔掀史上最猛降價潮,寶馬7系狂降27萬,新能源車企卻換了一種打法

金融界
2026-02-24 18:07:07
55歲主持人李靜自曝絕經(jīng)過程,很快失去性魅力,連男人也沒興趣了

55歲主持人李靜自曝絕經(jīng)過程,很快失去性魅力,連男人也沒興趣了

林輕吟
2026-02-23 07:16:08
他們兩個不會偷偷的在一起了吧,確實他們挺合適的男才女貌

他們兩個不會偷偷的在一起了吧,確實他們挺合適的男才女貌

老吳教育課堂
2026-02-24 06:25:10
上海發(fā)布樓市“新七條”!專家:帶動置換鏈條的良性循環(huán)

上海發(fā)布樓市“新七條”!專家:帶動置換鏈條的良性循環(huán)

南方都市報
2026-02-25 14:59:09
100萬賭一個未來:從中乙替補到中超首發(fā),那個被罵水貨的大男孩

100萬賭一個未來:從中乙替補到中超首發(fā),那個被罵水貨的大男孩

林子說事
2026-02-25 11:57:01
2026-02-25 16:12:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2246文章數(shù) 8043關(guān)注度
往期回顧 全部

科技要聞

“機器人只跳舞,沒什么用”

頭條要聞

中方就涉烏克蘭問題的決議草案投棄權(quán)票 中國代表發(fā)聲

頭條要聞

中方就涉烏克蘭問題的決議草案投棄權(quán)票 中國代表發(fā)聲

體育要聞

曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

撒貝寧到沈陽跑親戚 老婆李白模特身材

財經(jīng)要聞

GEO亂象:誰為AI營銷的泡沫買單?

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

藝術(shù)
教育
旅游
健康
本地

藝術(shù)要聞

這位藝術(shù)家的馬賽克畫讓人驚嘆不已!

教育要聞

【調(diào)劑專區(qū)】26考研調(diào)劑信息第二彈

旅游要聞

櫻桃花開了!來烏當赴一場春暖花開之約

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

本地新聞

津南好·四時總相宜

無障礙瀏覽 進入關(guān)懷版