国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

美團(tuán)悄悄開源重度推理模型!8個(gè)腦子并行思考,有點(diǎn)東西。

0
分享至

大家好,我是袋鼠帝。

2026年剛開年,AI圈子終于開始稍微安靜一點(diǎn)了,不過各家似乎都在憋大招。

前兩天我刷X的時(shí)候,發(fā)現(xiàn)美團(tuán)居然悄悄咪咪又開源了一個(gè)新模型:LongCat-Flash-Thinking-2601。


不得不說,美團(tuán)這個(gè)更新節(jié)奏是真滴卷。

我回憶了下,從去年9月發(fā)布Chat版本,到后來的Thinking版本,再到Omni全能版,他們的模型路走得非常穩(wěn)。

這次的2601版本,更是全面提升了Agent和Thinking能力。

不過真正吸引我去深入研究的,其實(shí)是 X 上的一條評(píng)論:它居然有8位思考者并行推理。


這一下子就勾起了我的好奇心,我們之前用的深度推理模式,大多是單線程的,就像一個(gè)人在走路,哪怕走得再快,也就是那一條路。

美團(tuán)這個(gè)設(shè)計(jì),像是直接開了一個(gè)AI專家團(tuán)

趁著上周末去北京參加AIGC開發(fā)者大會(huì)的間隙,我把這個(gè)新模型好好研究了一下。

這一試,我發(fā)現(xiàn)它還真有點(diǎn)東西。

先給大家總結(jié)一下這次新模型更新的核心亮點(diǎn)(省流版):

1.泛化能力極強(qiáng),在那種混亂的真實(shí)環(huán)境里表現(xiàn)很穩(wěn),在復(fù)雜隨機(jī)任務(wù)中甚至優(yōu)于Claude。

2.自動(dòng)構(gòu)建多個(gè)高質(zhì)量環(huán)境;密集依賴關(guān)系圖

3.多環(huán)境強(qiáng)化學(xué)習(xí):擴(kuò)展的DORA(我們的強(qiáng)化學(xué)習(xí)基礎(chǔ)設(shè)施),支持大規(guī)模多環(huán)境智能體訓(xùn)練

4.核心創(chuàng)新叫Heavy Thinking Mode,也就是深度思考模式:

平行思維:通過多個(gè)獨(dú)立的推理路徑擴(kuò)展思維廣度

迭代式摘要:通過使用摘要模型來綜合輸出,增強(qiáng)深度,支持迭代推理循環(huán)。

在這個(gè)模式下,模型會(huì)啟動(dòng)并行思考,相當(dāng)于你有多個(gè)不同領(lǐng)域的大腦在同時(shí)幫你琢磨同一件事。

另外,據(jù)說1M(100萬)token的上下文版本也快來了。


光看參數(shù)也沒意思,咱們直接上實(shí)測(cè)。

目前,深度推理模式可在LongCat AI平臺(tái)免費(fèi)體驗(yàn)

https://longcat.chat/

讓美團(tuán)AI團(tuán)隊(duì)解決問題

以后遇到問題不用焦慮了,可以試試美團(tuán)這個(gè)AI團(tuán)隊(duì),團(tuán)隊(duì)8人,效率極高,還有第9人是個(gè)小領(lǐng)導(dǎo),總結(jié)發(fā)言,是個(gè)全方位思考的智囊團(tuán)。



團(tuán)建聚餐,專治眾口難調(diào)

來個(gè)美團(tuán)的拿手好戲,點(diǎn)餐

不過有點(diǎn)刁鉆:

prompt:我們?cè)谏钲?,?個(gè)同事要聚餐,預(yù)算只有300元。小張不吃辣,小李對(duì)麩質(zhì)過敏,小王必須喝冰美式,老板想吃地道的本地菜,剩下的4個(gè)人里有人在減肥,有人想吃重口味。請(qǐng)尋找最優(yōu)性價(jià)比方案,并給出具體的點(diǎn)單組合和湊單攻略。

這要是讓人來想,估計(jì)頭發(fā)都得掉一把。

當(dāng)時(shí)打開深度思考后,嚇我一跳,原來這就是重度思考嗎

屏幕上直接冒出來8條并行的思維鏈!直接多出來8個(gè)腦子


有一種從單行道突然變成8車道的開闊感

來看看 LongCat 的 8 位 Thinker 是怎么應(yīng)對(duì)的。


它們分別給出了不同的策略:有的建議分開點(diǎn)外賣,有的推薦了性價(jià)比極高的潮汕套餐,還有的另辟蹊徑建議去吃早茶。

這8個(gè)大腦并行工作完之后,還會(huì)有一個(gè)裁判角色的模型出來做總結(jié),把各個(gè)方向的精華提煉出來,形成最終的答案。

俗話說三個(gè)臭皮匠頂個(gè)諸葛亮,美團(tuán)這是直接給我安排了三個(gè)諸葛亮啊。

最后的綜合方案很不錯(cuò),模型經(jīng)過權(quán)衡后發(fā)現(xiàn),在深圳 300 塊錢滿足這么多人的堂食需求幾乎是不可能的,所以最優(yōu)解是點(diǎn)外賣,并且給出了具體的分店鋪湊滿減攻略。


最讓我驚訝的是細(xì)節(jié):它甚至提醒我,醬油里可能含有麩質(zhì),一定要給商家備注小李的過敏情況。

這種細(xì)致程度,單靠一條思維鏈?zhǔn)呛苋菀走z漏的。這也體現(xiàn)了并行思考的優(yōu)勢(shì):既有廣度,又有深度。

而且速度依然很快,這也是我一直比較喜歡美團(tuán)模型的一點(diǎn),干活講究效率


假如明天AGI到來?

前端時(shí)間,馬斯克的訪談提到,AGI可能很快就會(huì)實(shí)現(xiàn)

所以我又問了一個(gè)稍微宏大一點(diǎn)的問題:假如明天AGI突然到來,世界會(huì)變成什么樣?

這回的思維鏈就像是一場(chǎng)高質(zhì)量的圓桌論壇,類似上周六我參與分享的圓桌會(huì)議

有的Thinker在分析對(duì)就業(yè)市場(chǎng)的沖擊,有的在預(yù)測(cè)經(jīng)濟(jì)結(jié)構(gòu)的重組,還有的在探討人類認(rèn)知的顛覆。


看著這 8 個(gè)大腦在屏幕上互搏,非常有意思。

它們各有各的觀點(diǎn),但最后又能達(dá)成某種共識(shí)。這和我們?nèi)祟惿鐣?huì)其實(shí)很像,真理往往就是在不斷的辯論和碰撞中產(chǎn)生的。



法律智囊團(tuán):隨身攜帶的律師天團(tuán)

這個(gè)場(chǎng)景非常實(shí)用,假設(shè)我不小心在商場(chǎng)碰碎了一個(gè)標(biāo)價(jià)8.8萬的藝術(shù)品,商場(chǎng)態(tài)度強(qiáng)硬要我全額賠償,那不是完?duì)僮恿耍?/p>

我把情況描述給LongCat,讓它做我的辯護(hù)律師。

prompt:我在商場(chǎng)行走時(shí),背包不慎剮蹭到了擺放在轉(zhuǎn)角處的一個(gè)藝術(shù)品展架,導(dǎo)致一件標(biāo)價(jià) 8.8 萬元的藝術(shù)瓷器摔碎。商場(chǎng)方目前態(tài)度強(qiáng)硬,拒絕任何調(diào)解,要求我按照標(biāo)價(jià)全額賠償。作為被告,我的抗辯點(diǎn)在于:展架位于人流量大的轉(zhuǎn)角處,且沒有任何物理防護(hù)(如玻璃罩);展架底座極輕,明顯不符合擺放易碎重物的安全標(biāo)準(zhǔn);我只是正常行走,并無跑跳等過激行為。請(qǐng)你作為我的專業(yè)辯護(hù)律師。

反應(yīng)速度非??欤瑤讉€(gè) Thinker 迅速從不同角度切入。

有的負(fù)責(zé)分析商場(chǎng)的過錯(cuò),有的提到一些案例參考,還有的側(cè)重風(fēng)險(xiǎn)評(píng)估和緊急措施。


它給出的一些答案,我怕是幻覺,還特地去核實(shí)了以下思維鏈中提到民法典1198條、1165條、1173條,也是正確的。


有點(diǎn)可惜的是重度思考暫時(shí)還沒接入聯(lián)網(wǎng)搜索,所以這塊大家還是要謹(jǐn)慎,出的條款最好都去印證一下,畢竟思考模型普遍都會(huì)有幻覺,有出錯(cuò)的概率。把它當(dāng)做輔助律師團(tuán)即可。

最終回答:


不過對(duì)于我們普通人來說,遇到這種突發(fā)狀況,能有這么一個(gè)智囊團(tuán),可以第一時(shí)間快速了解一些信息,心里真的會(huì)踏實(shí)很多。


中西結(jié)合的身心健康指導(dǎo)

有一些朋友和我聊起最近莫名不太好入睡,想起來下個(gè)月就過年了,

是丙午馬年,丙火和午火雙火疊加,六十年一遇,

部分朋友可能會(huì)有水火交戰(zhàn)的情況,明明沒有什么心煩的事情,卻睡不著,趕緊來試試Longcat怎么說。

還有,我從小到大基本上午覺就沒睡著過,可能是過度焦慮的原因?

很好玩的是,居然得到了中西結(jié)合的回答,還是那句話,集百家之所長,取其精華,去其糟粕,很好用。

如果是其他大模型,被我引導(dǎo)提問,就只會(huì)從中醫(yī)的角度回答了。

下面豆包的回答,被我提問之后,只會(huì)從中醫(yī)角度回答問題:


但 LongCat的 8 個(gè)Thinker 里,有的Thinker提供中醫(yī)視角,有的提供現(xiàn)代醫(yī)學(xué)視角,有的提供改善睡眠建議,真的是面面俱到,中西結(jié)合,完美!


以下是正文回答,有需要的朋友可以參考一下,也可以點(diǎn)贊轉(zhuǎn)發(fā),說不定你就有朋友也遇到了。



風(fēng)格化寫作,絕了

我讓它用最強(qiáng)烈的文學(xué)風(fēng)格描寫一碗螺螄粉,并且讓它自己選擇流派。

prompt:我現(xiàn)在手里端著一碗熱騰騰的、聞起來臭吃起來香的螺螄粉。 我希望看到風(fēng)格極度強(qiáng)烈的文學(xué)描寫。請(qǐng)選擇一個(gè)你認(rèn)為最有趣的文學(xué)流派(例如:魯迅的冷峻諷刺、古龍的簡潔蕭殺、王家衛(wèi)的曖昧破碎、張愛玲的華麗蒼涼等等)。

8 位大作家開始吭哧吭哧寫作。最后的評(píng)判環(huán)節(jié)非常有意思。有 5 位 Thinker 選擇了張愛玲風(fēng)格,2 位選了古龍,1 位選了王家衛(wèi)。


按理說,少數(shù)服從多數(shù),最后應(yīng)該是張愛玲風(fēng)格勝出。因?yàn)橐呀?jīng)有5位部下都選了張愛玲風(fēng)格,

畢竟作為領(lǐng)導(dǎo),最輕松最不用擔(dān)責(zé)的決策才是最經(jīng)濟(jì)的。

但那個(gè)負(fù)責(zé)總結(jié)的裁判模型展現(xiàn)出了驚人的批判性思維,它認(rèn)為古龍那種簡潔蕭殺的風(fēng)格,反而更能突出一碗螺螄粉的江湖氣,而且能避免答案的同質(zhì)化。

最終輸出的古龍風(fēng)描寫,文筆真的是一絕。


這也讓我突然意識(shí)到,這種多模型并行思考加裁判決策的機(jī)制,可能真的代表了未來AI決策的一種新方向。


代碼能力

Prompt:幫我設(shè)計(jì)一個(gè)貓貓狗狗掛飾網(wǎng)站的前端,要可愛風(fēng),寫在一個(gè)HTML文件里

迅速完成了代碼,購物車邏輯、結(jié)算功能都寫了,交互體驗(yàn)也很流暢。

后來我又試著讓它寫一個(gè)大魚吃小魚的游戲。

它通過聯(lián)網(wǎng)搜索參考了最佳實(shí)踐,還自動(dòng)給游戲里的魚加上了 AI 判定,大魚會(huì)追,小魚會(huì)跑,可玩性瞬間提升了一個(gè)檔次。

為什么美團(tuán)這個(gè)模型值得關(guān)注?

美團(tuán)這次的 Heavy Thinking Mode,本質(zhì)上是在解決大模型思考深度不足的問題。

以前我們覺得大模型像個(gè)百科全書,問啥知道啥,但一遇到需要推理、規(guī)劃的復(fù)雜問題就容易掉鏈子。

LongCat的思路是:既然一個(gè)腦子不夠用,那就用八個(gè)。

通過并行推理(Parallel Thinking),先讓思維發(fā)散出去,覆蓋盡可能多的可能性;再通過迭代摘要(Iterative Summarization),把這些發(fā)散的思維收斂回來,提煉出最優(yōu)解。

這就像我們?cè)诠鹃_會(huì)解決難題,先大家頭腦風(fēng)暴,各抒己見,這是廣度。然后項(xiàng)目經(jīng)理把大家的想法匯總、去重、優(yōu)化,形成方案,這是深度。

而且美團(tuán)在訓(xùn)練這個(gè)模型的時(shí)候,用了大量的合成環(huán)境和抗噪聲訓(xùn)練,這意味著什么?

意味著這個(gè)模型不是溫室里的花朵,它是真的被扔到那種充滿了不確定性、信息不完整的真實(shí)環(huán)境里去摸爬滾打過的。

所以它在面對(duì)我們現(xiàn)實(shí)生活中那些亂七八糟的任務(wù)時(shí),適應(yīng)性會(huì)特別強(qiáng)。

美團(tuán)雖然在這一波大模型浪潮里起步不算最早的,但他們追趕的速度真的讓人驚訝。

上周末我們幾個(gè)博主聊天還在感慨,像 Meta、微軟這些巨頭,有錢有卡,但在大模型上也逐漸沒啥聲音了。

這也側(cè)面反映,做大模型這事兒,門檻真的很高,不是誰都能一直在牌桌上的。

美團(tuán)能堅(jiān)持下來,并且不斷有這種高質(zhì)量的產(chǎn)出,說明他們對(duì) AI 是有自己獨(dú)立的思考和戰(zhàn)略定力的。

如果你也對(duì)AI Agent感興趣,或者在開發(fā)相關(guān)的應(yīng)用,可以去試試這個(gè)LongCat-Flash-Thinking-2601。

可能會(huì)給你帶來一些意想不到的驚喜。

點(diǎn)擊關(guān)注下方賬號(hào),你將感受到一個(gè)朋克的靈魂,且每篇文章都有驚喜。

能看到這里的都是鳳毛麟角的存在!

如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧~

如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?

謝謝你耐心看完我的文章~

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“10后”聽不懂家鄉(xiāng)方言,全國人大代表?xiàng)詈憧。航ㄗh小學(xué)每周1節(jié)方言課

“10后”聽不懂家鄉(xiāng)方言,全國人大代表?xiàng)詈憧。航ㄗh小學(xué)每周1節(jié)方言課

極目新聞
2026-03-10 11:19:58
西名記:若梅西證實(shí)哈維所言屬實(shí),巴薩根基將為之震顫

西名記:若梅西證實(shí)哈維所言屬實(shí),巴薩根基將為之震顫

星耀國際足壇
2026-03-09 23:14:07
陳昌浩回國后默默無聞,前妻任副部長,兒子卻是萬人敬仰的大人物

陳昌浩回國后默默無聞,前妻任副部長,兒子卻是萬人敬仰的大人物

比利
2026-03-04 10:59:11
隨著烏茲別克斯坦4-0,中國2-1朝鮮,2026女足亞洲杯最新積分榜出爐

隨著烏茲別克斯坦4-0,中國2-1朝鮮,2026女足亞洲杯最新積分榜出爐

側(cè)身凌空斬
2026-03-09 19:03:26
TVB前“咪神”大婚驚艷四座,這胸圍是真實(shí)存在的嗎?

TVB前“咪神”大婚驚艷四座,這胸圍是真實(shí)存在的嗎?

娛樂領(lǐng)航家
2026-03-09 21:30:03
博納影業(yè)回應(yīng)董事長于冬欠賭債傳聞,于冬所持多家公司股權(quán)已被凍結(jié)

博納影業(yè)回應(yīng)董事長于冬欠賭債傳聞,于冬所持多家公司股權(quán)已被凍結(jié)

紅星新聞
2026-03-10 12:17:17
敞開天窗說亮話!對(duì)于特朗普月底訪華,中方終于給出了正式回應(yīng)!

敞開天窗說亮話!對(duì)于特朗普月底訪華,中方終于給出了正式回應(yīng)!

娛樂圈的筆娛君
2026-03-10 07:34:46
值得珍藏:電力+衛(wèi)星互聯(lián)網(wǎng)+光刻機(jī)+商業(yè)航天+英偉達(dá)+硅+半導(dǎo)體等

值得珍藏:電力+衛(wèi)星互聯(lián)網(wǎng)+光刻機(jī)+商業(yè)航天+英偉達(dá)+硅+半導(dǎo)體等

Thurman在昆明
2026-03-10 00:16:42
德國人日常三餐曝光!6個(gè)習(xí)慣讓人不去醫(yī)院,國人看完沉默了?

德國人日常三餐曝光!6個(gè)習(xí)慣讓人不去醫(yī)院,國人看完沉默了?

路醫(yī)生健康科普
2026-03-04 12:30:03
謝敬遠(yuǎn)身為四川國企原副總經(jīng)理,年薪90萬,卻與不法商人勾肩搭背

謝敬遠(yuǎn)身為四川國企原副總經(jīng)理,年薪90萬,卻與不法商人勾肩搭背

妙知
2026-03-10 09:25:21
為什么全世界最瘦的是日本人?評(píng)論區(qū)的回答笑暈了,簡直一針見血

為什么全世界最瘦的是日本人?評(píng)論區(qū)的回答笑暈了,簡直一針見血

另子維愛讀史
2026-03-06 20:14:42
中國專家早預(yù)言!美國必打伊朗,原因不止石油,下一目標(biāo)也已鎖定

中國專家早預(yù)言!美國必打伊朗,原因不止石油,下一目標(biāo)也已鎖定

阿雹娛樂
2026-03-08 21:28:13
尼泊爾或迎最年輕總理,由巴倫德拉·沙阿領(lǐng)導(dǎo)的民族獨(dú)立黨表現(xiàn)突出,他出生于1990年,曾是說唱歌手

尼泊爾或迎最年輕總理,由巴倫德拉·沙阿領(lǐng)導(dǎo)的民族獨(dú)立黨表現(xiàn)突出,他出生于1990年,曾是說唱歌手

大風(fēng)新聞
2026-03-10 08:35:03
小時(shí)候挨過的打沒有一頓是白挨的!網(wǎng)友:俺不中了,笑的肚子疼

小時(shí)候挨過的打沒有一頓是白挨的!網(wǎng)友:俺不中了,笑的肚子疼

帶你感受人間冷暖
2026-03-07 22:36:06
火箭湖人129-126勝,詹姆斯35+9+15無MVP

火箭湖人129-126勝,詹姆斯35+9+15無MVP

范動(dòng)舍長
2026-03-10 11:23:24
全球追殺開始了!美國,更大的噩夢(mèng)來了!

全球追殺開始了!美國,更大的噩夢(mèng)來了!

大嘴說天下
2026-03-09 22:28:27
山東三地最新人事任免

山東三地最新人事任免

中國山東網(wǎng)
2026-03-10 09:29:13
孟良崮戰(zhàn)役到底有多慘烈?據(jù)當(dāng)?shù)匕傩罩v,他們事后兩年都沒敢上山

孟良崮戰(zhàn)役到底有多慘烈?據(jù)當(dāng)?shù)匕傩罩v,他們事后兩年都沒敢上山

史之銘
2026-03-09 17:41:17
謝杏芳的冷漠,揭開林丹的婚姻真相,10年才看懂她的這盤大棋

謝杏芳的冷漠,揭開林丹的婚姻真相,10年才看懂她的這盤大棋

以茶帶書
2026-03-09 19:08:24
老板娘說她腿粗,我該怎么回答?

老板娘說她腿粗,我該怎么回答?

太急張三瘋
2026-03-10 12:55:07
2026-03-10 13:36:49
袋鼠帝 incentive-icons
袋鼠帝
持續(xù)分享AI實(shí)踐干貨,走超級(jí)個(gè)體崛起之路
56文章數(shù) 65關(guān)注度
往期回顧 全部

科技要聞

“龍蝦”狂歡 賣“飼料”先掙錢了?

頭條要聞

媒體:伊各方誓言贏得戰(zhàn)爭 美國現(xiàn)在即使想退出也很難

頭條要聞

媒體:伊各方誓言贏得戰(zhàn)爭 美國現(xiàn)在即使想退出也很難

體育要聞

韓國女足羨慕的奢侈品,為何選擇中國女足

娛樂要聞

肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

財(cái)經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮現(xiàn)

汽車要聞

蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

態(tài)度原創(chuàng)

藝術(shù)
本地
游戲
家居
公開課

藝術(shù)要聞

30000畝杏花開了,新疆的春天這么美!

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

《羊蹄山之魂》奇譚模式大量細(xì)節(jié)曝光 明日正式上線!

家居要聞

自然肌理 溫度質(zhì)感婚房

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版