国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

前阿里千問負(fù)責(zé)人林俊旸離職后首發(fā)長文,探討AI未來的發(fā)展方向:從訓(xùn)練模型轉(zhuǎn)向訓(xùn)練智能體

0
分享至

3月26日,原阿里通義千問(Qwen)技術(shù)負(fù)責(zé)人林俊旸(Justin Lin)在社交平臺上發(fā)布了一篇題為“From ‘Reasoning’ Thinking to‘Agentic’ Thinking(從推理式思考到智能體思考)的文章長文。這是他自本月初從阿里辭職之后發(fā)布的第一篇長文。在這篇文章中,林俊旸系統(tǒng)性地復(fù)盤了推理模型階段的特征,并探討了AI未來的發(fā)展方向:從訓(xùn)練模型轉(zhuǎn)向訓(xùn)練智能體。

林俊旸表示,過去兩年重塑了行業(yè)對大模型的評估方式與核心期待。OpenAI 的 o1 表明,"思考"可以成為一種被訓(xùn)練出來的能力。DeepSeek-R1 緊隨其后,證明推理式的后訓(xùn)練可以在原始實(shí)驗(yàn)室之外被復(fù)現(xiàn)、被擴(kuò)展。這一階段至關(guān)重要。但 2025 年上半年,行業(yè)焦點(diǎn)主要停留在"推理式思考"本身:如何讓模型在推理的時候多想一會兒?,F(xiàn)在該問下一步了。他的判斷是智能體式思考:為了行動而思考,在與環(huán)境交互的過程中,并根據(jù)來自世界的反饋持續(xù)更新計劃。

他提到,2025 年初,千問團(tuán)隊有一個很大的野心:做一個統(tǒng)一的系統(tǒng),讓思考模式和指令模式合二為一,支持可調(diào)節(jié)的推理努力程度(類似于低/中/高推理設(shè)置),甚至能根據(jù)提示詞和上下文自動推斷合適的推理量,讓模型自主決定何時直接回答、何時稍作思考、何時為真正困難的問題投入大量計算。概念上,這是正確的方向。但"合并"說起來容易,做好卻極難。

真正的難點(diǎn)在于數(shù)據(jù)。當(dāng)人們談?wù)摵喜⑺伎寂c指令時,往往首先想到模型側(cè)的兼容性,更深層的問題是,兩種模式的數(shù)據(jù)分布和行為目標(biāo)存在顯著差異。在嘗試平衡模型合并與提升后訓(xùn)練數(shù)據(jù)質(zhì)量和多樣性的過程中,團(tuán)隊并未把所有事情都做對,結(jié)果往往是在兩個方向上都表現(xiàn)平庸:"思考"行為變得嘈雜、冗余或不夠果斷,而"指令"行為則變得不夠清晰、不夠可靠,且比商業(yè)用戶實(shí)際想要的成本更高。

分開做在實(shí)踐中仍然有吸引力。2025 年下半年,Qwen 的 2507 版本就發(fā)了獨(dú)立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最終思考是,真正成功的合并需要一個平滑的推理力度光譜,模型能自己判斷該花多少力氣去想。

推理鏈更長,不等于模型更聰明。很多時候,推理鏈越長,反而說明模型在亂花算力?!绷挚D在文中表示,他提到,千問團(tuán)隊意識到,行業(yè)正在從訓(xùn)練模型的時代,走向訓(xùn)練智能體的時代,它的定義特征是跟真實(shí)世界的閉環(huán)交互。

智能體式思考和推理式思考,意味著不同的優(yōu)化目標(biāo),推理式思考通常以最終答案前的內(nèi)部思辨質(zhì)量來評判:模型能否解出定理、寫出證明、生成正確代碼或通過基準(zhǔn)測試。而智能體思維關(guān)注的是:模型能否在與環(huán)境交互的過程中持續(xù)取得進(jìn)展。

這意味著,核心問題從“模型能否思考得足夠久?”轉(zhuǎn)變?yōu)椤澳P湍懿荒苡靡环N撐得起有效行動的方式來思考?”模型訓(xùn)練的核心對象也隨之變了,變成了模型加環(huán)境的整個系統(tǒng)。

在這之中,模型架構(gòu)和訓(xùn)練數(shù)據(jù)當(dāng)然還重要,但環(huán)境設(shè)計、rollout 基礎(chǔ)設(shè)施、評估器的穩(wěn)健程度、多個 Agent 之間怎么協(xié)調(diào),這些都進(jìn)了核心圈?!昂玫乃伎肌钡亩x也變了:在真實(shí)約束下最能撐起行動的那條軌跡,而非最長或最顯眼的那條。

林俊旸預(yù)測,智能體式思考會成為主流。

《科創(chuàng)板日報》3月4日訊,《科創(chuàng)板日報》記者注意到,3月4日下午,阿里千問大模型核心負(fù)責(zé)人林俊旸新發(fā)朋友圈表示:抱歉各位朋友,今天不回復(fù)消息和電話了,我真的需要休息。qwen 的兄弟們,按照原來安排繼續(xù)干,沒問題的。而就在昨日凌晨,林俊旸在社交媒體發(fā)文稱:me stepping down. bye my beloved qwen.(我卸任了。再見了,我親愛的千問。)



3月4日凌晨,阿里Qwen技術(shù)負(fù)責(zé)人林俊旸在社交平臺上與千問道別,稱“我退出了”。隨后,阿里巴巴通義實(shí)驗(yàn)室科學(xué)家惠彬原(Binyuan Hui)轉(zhuǎn)發(fā)該條博文并表示自己也退出了千問。南都N視頻記者就此向阿里云方面求證,截至發(fā)稿尚無回復(fù)。


林俊旸在社交平臺上與千問道別。


惠彬原稱自己也退出了。

林俊旸系阿里千問模型的重要負(fù)責(zé)人。公開資料顯示,林俊旸1993年出生,畢業(yè)于北京大學(xué),系阿里巴巴達(dá)摩院高級算法專家、阿里通義千問系列大模型技術(shù)負(fù)責(zé)人,主導(dǎo)開發(fā)了全球領(lǐng)先的開源大模型。他的研究領(lǐng)域包括自然語言處理和多模態(tài)表示學(xué)習(xí),研究興趣集中于大規(guī)模語言模型和多模態(tài)大模型,曾在多個頂級會議發(fā)表多篇論文。公開信息顯示,林俊旸對通義千問的技術(shù)貢獻(xiàn)突出,如他主導(dǎo)開發(fā)Qwen3.0等模型性能超越Llama2-70B、首創(chuàng)多模態(tài)Agent框架,增強(qiáng)視覺/語音理解能力、推動構(gòu)建中文社區(qū)最大開源模型生態(tài)體系等。

有業(yè)內(nèi)人士猜測,林俊旸的離開或由于其考核目標(biāo)變成了日活躍用戶數(shù)。對于林俊旸離開后誰會接任其位置,該業(yè)內(nèi)人士也提到或是一位來自谷歌Gemini團(tuán)隊、以日活躍用戶數(shù)(DAU)指標(biāo)為導(dǎo)向的非核心人才。南都記者就此向阿里云方面求證,截至發(fā)稿尚無回復(fù)。

林俊旸與月之暗面創(chuàng)始人兼CEO楊植麟、騰訊首席AI科學(xué)家姚順雨和清華大學(xué)教授、智譜創(chuàng)始人兼首席科學(xué)家唐杰被在業(yè)內(nèi)并稱“基模四杰”,其他幾位均為月之暗面、騰訊、智譜等企業(yè)的模型掌門人。

今年1月在中關(guān)村,林俊旸還提到,自己2021年做模型的時候,阿里芯片團(tuán)隊的人來問自己三年后模型主流架構(gòu)是不是Transformer和多模態(tài),因?yàn)槿旰竽P筒拍芰髌K硎?,“三年之后,我在不在阿里巴巴,我都不知道。但最后我今天還在阿里巴巴,然后他果然還是Transformer,還是多模態(tài),我就非常懊悔為什么當(dāng)時沒有去催他去做?!?/p>

模型進(jìn)展方面,3月3日,阿里巴巴再度開源4款小尺寸千問3.5系列模型。其中最小的0.8B和2B兩款,體積極小,推理速度極快,適合移動設(shè)備、IoT 邊緣設(shè)備部署,以及低延時的實(shí)時交互場景。據(jù)悉,四款Qwen3.5新模型雖是小尺寸,但均擁有原生多模態(tài)能力,以極小的參數(shù)量實(shí)現(xiàn)了極大的性能提升。模型發(fā)布后還迅速引來馬斯克在社交媒體上點(diǎn)贊評論,稱阿里千問模型“智能密度令人印象深刻”。

來源:澎湃新聞、第一財經(jīng)、界面新聞、財聯(lián)社、南方都市報

【來源:瀟湘晨報】

報料、維權(quán)通道:應(yīng)用市場下載“晨視頻”客戶端,搜索“報料”一鍵直達(dá),或撥打熱線0731-85571188;如需內(nèi)容合作,請撥打政企服務(wù)專席19176699651,商務(wù)合作聯(lián)系0731-85572288。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
67年毛主席離開武漢,空軍竟不放行,楊成武:不認(rèn)我這個代總長?

67年毛主席離開武漢,空軍竟不放行,楊成武:不認(rèn)我這個代總長?

史之銘
2026-03-28 16:48:50
對肝特別好的四大食物,輪流著吃,第三種你可能想不到

對肝特別好的四大食物,輪流著吃,第三種你可能想不到

距離距離
2026-03-28 17:23:37
全紅嬋首次回應(yīng)是否重返國家隊:想留在隊中 因?yàn)橛泻芏嘞胍姷娜?>
    </a>
        <h3>
      <a href=念洲
2026-03-28 15:11:44
2026嚴(yán)查違規(guī)雙薪!機(jī)關(guān)退休人員兼職務(wù)必守紅線

2026嚴(yán)查違規(guī)雙薪!機(jī)關(guān)退休人員兼職務(wù)必守紅線

小鹿姐姐情感說
2026-03-27 00:20:23
現(xiàn)貨黃金漲超3%

現(xiàn)貨黃金漲超3%

證券時報
2026-03-28 01:19:04
隊記談焦泊喬:他想要個官方通報,但球隊不想出,球迷:無法調(diào)和

隊記談焦泊喬:他想要個官方通報,但球隊不想出,球迷:無法調(diào)和

南海浪花
2026-03-28 11:44:31
英國一男子乘公交,付車費(fèi)用一枚神秘硬幣,經(jīng)鑒定該硬幣已有2000年歷史

英國一男子乘公交,付車費(fèi)用一枚神秘硬幣,經(jīng)鑒定該硬幣已有2000年歷史

小鹿姐姐情感說
2026-03-28 10:36:38
心源性猝死人數(shù)逐漸增多,醫(yī)生建議:少吃雞肉,多喝這幾樣增免疫

心源性猝死人數(shù)逐漸增多,醫(yī)生建議:少吃雞肉,多喝這幾樣增免疫

健康科普365
2026-03-28 19:20:03
云南省發(fā)展和改革委員會享受一級調(diào)研員待遇退休干部許建平接受審查調(diào)查

云南省發(fā)展和改革委員會享受一級調(diào)研員待遇退休干部許建平接受審查調(diào)查

界面新聞
2026-03-28 15:06:35
金溥聰深夜發(fā)聲明“正面宣戰(zhàn)” 劍指鄭麗文 國民黨內(nèi)斗公開化

金溥聰深夜發(fā)聲明“正面宣戰(zhàn)” 劍指鄭麗文 國民黨內(nèi)斗公開化

觀星賞月
2026-03-28 12:11:40
馬斯克賭對了?全球首個數(shù)字生命問世,人類或?qū)⒚撾x肉體實(shí)現(xiàn)永生

馬斯克賭對了?全球首個數(shù)字生命問世,人類或?qū)⒚撾x肉體實(shí)現(xiàn)永生

思思夜話
2026-03-27 13:26:40
新賽季首金!中國泳壇王牌之師奪冠,男女混合團(tuán)體不敵俄羅斯隊

新賽季首金!中國泳壇王牌之師奪冠,男女混合團(tuán)體不敵俄羅斯隊

羅掌柜體育
2026-03-28 15:54:04
張雪峰離世后,老對手杜子建含淚解釋:節(jié)目上的對抗是為了收視率

張雪峰離世后,老對手杜子建含淚解釋:節(jié)目上的對抗是為了收視率

云景侃記
2026-03-26 15:13:16
官宣《浪姐7》遭全網(wǎng)抵制,49歲的范瑋琪,終于迎來了“報應(yīng)”!

官宣《浪姐7》遭全網(wǎng)抵制,49歲的范瑋琪,終于迎來了“報應(yīng)”!

阿纂看事
2026-03-26 20:49:43
越扒越有!張雪峰去世早有預(yù)兆,他的2個不良愛好,或成催命符

越扒越有!張雪峰去世早有預(yù)兆,他的2個不良愛好,或成催命符

孤城落日
2026-03-28 03:41:07
半年飆漲420%,A股又誕生大牛股,本周最熊股卻連吃3個跌停

半年飆漲420%,A股又誕生大牛股,本周最熊股卻連吃3個跌停

21世紀(jì)經(jīng)濟(jì)報道
2026-03-28 17:41:51
江西女碩士失蹤,被發(fā)現(xiàn)時已在教授實(shí)驗(yàn)室待6年,魔鬼真的存在

江西女碩士失蹤,被發(fā)現(xiàn)時已在教授實(shí)驗(yàn)室待6年,魔鬼真的存在

燦爛夏天
2025-02-10 20:20:13
維爾茨:那腳世界波是蒙的;世界杯冠軍無疑是我們的目標(biāo)

維爾茨:那腳世界波是蒙的;世界杯冠軍無疑是我們的目標(biāo)

懂球帝
2026-03-28 06:38:44
山姆被低估的6款“冷門王”!90%人都錯過,最后一款性價比天花板

山姆被低估的6款“冷門王”!90%人都錯過,最后一款性價比天花板

阿萊美食匯
2026-03-28 16:13:05
她們四個終于合體了!

她們四個終于合體了!

奮斗在韓國
2026-03-26 19:37:15
2026-03-28 21:19:00
瀟湘晨報 incentive-icons
瀟湘晨報
瀟湘晨報,影響湖南
123559文章數(shù) 338071關(guān)注度
往期回顧 全部

科技要聞

華為盤古大模型負(fù)責(zé)人王云鶴確認(rèn)離職

頭條要聞

媒體:伊朗戰(zhàn)事未了美以卻已開撕 萬斯甩鍋內(nèi)塔尼亞胡

頭條要聞

媒體:伊朗戰(zhàn)事未了美以卻已開撕 萬斯甩鍋內(nèi)塔尼亞胡

體育要聞

“我是全家最差勁的運(yùn)動員”

娛樂要聞

王一博改名上熱搜!個人時代正式開啟!

財經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車要聞

置換補(bǔ)貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

親子
手機(jī)
本地
公開課
軍事航空

親子要聞

愛玩沙子是孩子的天性,這套#太空沙玩具 在家就能實(shí)現(xiàn)玩沙子的快樂,關(guān)鍵比去游樂場玩干凈衛(wèi)生。#兒童玩...

手機(jī)要聞

華為鴻蒙6.0.0.328已推送:通透質(zhì)感、靈動粒子、氣態(tài)動效!

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍中東基地?fù)p失最新披露

無障礙瀏覽 進(jìn)入關(guān)懷版