国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude強到不敢發(fā)的Mythos,被質(zhì)疑用了字節(jié)Seed技術(shù)

0
分享至

夢晨 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI


Claude最強“神話”模型,可能用到來自字節(jié)的技術(shù)?

這條猜測直接沖上熱搜榜。



這款“強到不敢公開發(fā)布”的Mythos模型,確實刺激了人們對下一代LLM架構(gòu)的想象。

社區(qū)正在熱烈討論它是否采用了循環(huán)語言模型(Looped Language Model)架構(gòu)。

這個概念來自字節(jié)Seed團隊與多個高校合作的一篇論文,Yoshua Bengio也參與其中。



關(guān)鍵線索在于Anthropic公布的一組測試數(shù)據(jù)。

字節(jié)論文指出,圖搜索是循環(huán)算法相比標準RLVR具有巨大理論優(yōu)勢的領(lǐng)域之一。

再看Mythos,正是在廣度搜索優(yōu)先的圖搜索測試GraphWalks BFS中,超越對手GPT5.4最多。



80%對21.4%,接近4倍的差距。

在其他類型的任務(wù)上,并沒有出現(xiàn)如此異常的分差。

說明這種進步很可能不是來自通用的Scaling Law,而是架構(gòu)創(chuàng)新。

循環(huán)語言模型:同一層”多轉(zhuǎn)幾圈”,小模型碾壓大模型

GraphWalks BFS測試,就是給模型一個復(fù)雜的圖結(jié)構(gòu),讓它做廣度優(yōu)先搜索,從起點出發(fā),一層一層地訪問所有相鄰節(jié)點。

標準Transformer處理這類問題只能一次前向傳播,從頭走到尾,輸出結(jié)果,沒有“迭代”這個概念。

Mythos在圖遍歷上拿到了80%的分數(shù),表明它內(nèi)部很可能在“”反復(fù)計算”,對同一組信息來回處理了好幾遍。

那么什么樣的架構(gòu)能實現(xiàn)“反復(fù)計算”?

字節(jié)Seed團隊在論文中提出LoopLM循環(huán)語言模型。



簡單總結(jié)LoopLM有三個特點。

1、不寫長文思考,在模型內(nèi)部潛空間迭代,不額外輸出更多token。

2、簡單題少想幾步,難題多想幾步,自動調(diào)節(jié)。

3、預(yù)訓(xùn)練時就學(xué) “怎么在潛空間思考”,而不是只學(xué) “怎么預(yù)測下一個token”。

在實驗中,團隊訓(xùn)練了Ouro系列循環(huán)語言模型,內(nèi)置了循環(huán)思考。



測試結(jié)果,1.4B的Ouro模型性能對標約4B的傳統(tǒng)模型。2.8B的Ouro模型相當于8B–12B的傳統(tǒng)模型。



至于循環(huán)模型的能力提升來自何處,論文詳細分析了知識存儲vs知識操作的區(qū)別。

知識存儲(Knowledge Storage)的容量是有限的,大約每個參數(shù)2bits,不管用什么架構(gòu),這個數(shù)字基本不變。

循環(huán)也不會讓你“記住”更多東西。

但知識操作(Knowledge Manipulation)不一樣,把已知事實組合起來做多跳推理、執(zhí)行程序、搜索圖結(jié)構(gòu),這類能力隨循環(huán)步數(shù)和訓(xùn)練tokens指數(shù)級增長。

換句話說,循環(huán)模型沒有給AI一個更大的知識庫,但它讓AI在知識庫庫里的搜索和組合能力提升了一個量級。

那么Mythos究竟是不是循環(huán)模型架構(gòu),有人總結(jié)出除了GraphWalks之外的更多線索。



三條線索指向循環(huán)模型架構(gòu)

第一條線索,也就是廣度優(yōu)先圖搜索測試結(jié)果。

Mythos除了分數(shù)是GPT5.4的4倍,比上一代Opus提升幅度也異常大。



第二條線索,Anthropic報告Mythos每個任務(wù)使用的token數(shù)量是Opus4.6的1/5,但速度更慢。

(價格也貴5倍!)

這在標準Transformer框架下很難說得通,token少,生成步驟就少,應(yīng)該更快才對。

但循環(huán)模型剛好解釋了這個矛盾:推理不發(fā)生在token層面,而是發(fā)生在潛空間,計算量花在了看不見的地方。

線索三,Mythos在網(wǎng)絡(luò)安全方面非常突出。

Mythos在CyberGym測試上拿到83.1%,Opus4.6是66.6%,領(lǐng)先近17個百分點。

以及找到上千個零日漏洞,主流操作系統(tǒng)和瀏覽器全都沒逃過。

漏洞發(fā)現(xiàn)的本質(zhì)就是對控制流圖做遍歷。找到一條從輸入到危險函數(shù)的路徑,也就是圖的可達性問題。

又是圖遍歷。又是循環(huán)架構(gòu)的天生強項。

說了這么多,終歸只是大家的猜測,Anthropic沒有公開任何關(guān)于Mythos架構(gòu)的信息,很可能以后也不會公開。

但有一句話值得思考:

Scaling Law改善一切,相對均勻,架構(gòu)創(chuàng)新在匹配其歸納偏置的任務(wù)上創(chuàng)造異常尖峰值。



循環(huán)Transformer的歸納偏置就是迭代圖算法。Mythos的異常尖峰,恰好出現(xiàn)在圖遍歷任務(wù)上。

Anthropic不說,但測試數(shù)據(jù)已經(jīng)替它說了。

字節(jié)論文:
https://arxiv.org/abs/2510.25741

參考鏈接:
[1]
https://x.com/ChrisHayduk/status/2042711699413926262
[2]
https://aiia.ro/blog/claude-mythos-looped-language-model-theory

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
6.8萬紫貂被扯壞后續(xù):女子丟工作后道歉,黑歷史被扒,全網(wǎng)社死

6.8萬紫貂被扯壞后續(xù):女子丟工作后道歉,黑歷史被扒,全網(wǎng)社死

小徐講八卦
2026-04-12 15:43:13
鄭麗文剛回到臺灣,民進黨就發(fā)難,民眾黨攤牌,侯友宜不裝了

鄭麗文剛回到臺灣,民進黨就發(fā)難,民眾黨攤牌,侯友宜不裝了

流史歲月
2026-04-13 17:00:08
國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

比利
2026-01-23 12:41:53
小米汽車市場危機,開始公開化

小米汽車市場危機,開始公開化

浙江車網(wǎng)
2026-04-13 09:15:19
夢龍雪糕廣告被吐槽“戀足癖”,奇葩創(chuàng)意豈能”消費“消費者

夢龍雪糕廣告被吐槽“戀足癖”,奇葩創(chuàng)意豈能”消費“消費者

極目新聞
2026-04-13 12:07:04
文章新開面館口味評分3.6分,網(wǎng)友:30多元一碗面有點貴

文章新開面館口味評分3.6分,網(wǎng)友:30多元一碗面有點貴

紅星新聞
2026-04-13 17:22:41
歐爾班落選!特朗普:封鎖霍爾木茲海峽,大家都別過了 | 狼叔看世界

歐爾班落選!特朗普:封鎖霍爾木茲海峽,大家都別過了 | 狼叔看世界

狼叔看世界
2026-04-13 13:48:15
嫣然天使兒童醫(yī)院確定搬遷,拖欠租金已和房東達成一致;院方:12月前所有業(yè)務(wù)原址正常開展

嫣然天使兒童醫(yī)院確定搬遷,拖欠租金已和房東達成一致;院方:12月前所有業(yè)務(wù)原址正常開展

大風新聞
2026-04-13 18:07:34
上海地鐵9號線上,男子攜帶拉桿箱咋有“血”滲出來? 地鐵回應(yīng):裝有冷凍食品鴨血,時間長融化了

上海地鐵9號線上,男子攜帶拉桿箱咋有“血”滲出來? 地鐵回應(yīng):裝有冷凍食品鴨血,時間長融化了

大風新聞
2026-04-13 19:00:06
我叫賈淺淺,看你能把我怎么樣?

我叫賈淺淺,看你能把我怎么樣?

布衣亂彈
2026-04-12 11:59:05
反映66盞路燈不亮,卻被威脅“先拘留15天”:湖南男子的真實遭遇

反映66盞路燈不亮,卻被威脅“先拘留15天”:湖南男子的真實遭遇

聽心堂
2026-04-12 14:50:13
歐爾班:澤連斯基笑到了最后

歐爾班:澤連斯基笑到了最后

史政先鋒
2026-04-13 16:03:44
人生不止一個回合!箱包女王破產(chǎn)后賣包子重啟人生

人生不止一個回合!箱包女王破產(chǎn)后賣包子重啟人生

大象新聞
2026-04-13 09:21:09
31歲美女張筱雨去世,剛生完孩子僅1個月,媽媽悲痛透露原因

31歲美女張筱雨去世,剛生完孩子僅1個月,媽媽悲痛透露原因

180視角
2026-04-13 11:01:45
連續(xù)四年全球第一,添可洗地機靠什么撐起銷量神話?

連續(xù)四年全球第一,添可洗地機靠什么撐起銷量神話?

一點財經(jīng)
2026-04-13 18:36:34
“立即轉(zhuǎn)向,否則開火” 伊朗披露64秒“驅(qū)退”美軍艦視頻

“立即轉(zhuǎn)向,否則開火” 伊朗披露64秒“驅(qū)退”美軍艦視頻

環(huán)球網(wǎng)資訊
2026-04-13 15:06:31
緊急!即日起中小學(xué)全面嚴查!教師、家長、學(xué)生三類人紅線碰不得

緊急!即日起中小學(xué)全面嚴查!教師、家長、學(xué)生三類人紅線碰不得

糖逗在娛樂
2026-04-13 16:35:12
鄭麗文回臺后,收到三個壞消息,馬英九表態(tài):蕭旭岑案會一查到底

鄭麗文回臺后,收到三個壞消息,馬英九表態(tài):蕭旭岑案會一查到底

原來仙女不講理
2026-04-13 16:58:29
歐爾班時代結(jié)束,匈牙利選出新總理,對華態(tài)度曝光,最大贏家浮現(xiàn)

歐爾班時代結(jié)束,匈牙利選出新總理,對華態(tài)度曝光,最大贏家浮現(xiàn)

軍機Talk
2026-04-13 13:51:25
鬧大了!“你不想畢業(yè)了,敢威脅我”,導(dǎo)師與學(xué)生的聊天炸開鍋了

鬧大了!“你不想畢業(yè)了,敢威脅我”,導(dǎo)師與學(xué)生的聊天炸開鍋了

火山詩話
2026-04-11 08:55:49
2026-04-13 20:23:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12466文章數(shù) 176449關(guān)注度
往期回顧 全部

科技要聞

"抄作業(yè)"近四年,馬斯克版微信周五上線

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

頭條要聞

媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關(guān)系

體育要聞

一支球隊不夠爛,也是一種悲哀

娛樂要聞

賈玲減重后現(xiàn)身馮鞏生日宴 身材未反彈

財經(jīng)要聞

起底AI"造黃"灰產(chǎn):19.9元"一鍵脫衣"

汽車要聞

不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

態(tài)度原創(chuàng)

健康
游戲
時尚
藝術(shù)
教育

干細胞抗衰4大誤區(qū),90%的人都中招

索尼重量級大作來了!頑皮狗全新IP首曝 2027年時間定了

這些才是普通人借鑒的穿搭!上短下長、上窄下寬,顯瘦又舒適

藝術(shù)要聞

22位中國當代名家油畫作品

教育要聞

6000余份offer!鄭州健康學(xué)院舉行2026屆畢業(yè)生春季線下雙選會

無障礙瀏覽 進入關(guān)懷版