国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

13人干翻Transformer!新架構(gòu)SSA算力暴減千倍,成本僅Opus 5%

0
分享至


新智元報(bào)道

編輯:桃子

【新智元導(dǎo)讀】Transformer統(tǒng)治地位懸了!一款SubQ模型帶著SAA架構(gòu)橫空出世,1200萬(wàn)上下文成本僅Opus的5%,計(jì)算量暴減千倍。

Transformer,王座不保?!

今天,一款A(yù)I模型SubQ橫空出世,震撼了全世界。

這是全球首個(gè)基于完全亞二次方稀疏注意力架構(gòu)(SSA)的模型,上下文高達(dá)1200萬(wàn)Token。


SubQ的核心優(yōu)勢(shì)在于,其SSA架構(gòu)會(huì)根據(jù)內(nèi)容「動(dòng)態(tài)選擇」關(guān)注點(diǎn),不會(huì)盲目計(jì)算所有Token間的關(guān)聯(lián)。

相較于Transformer,它的計(jì)算量直接暴減1000倍。

實(shí)驗(yàn)結(jié)果顯示,100萬(wàn)token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。


而打造出這款架構(gòu)的背后這家公司,叫Subquadratic,坐標(biāo)邁阿密,全公司僅13人。

AI大佬Bindu Reddy辣評(píng)道,「若這一切都是真的,Anthropic和OpenAI的估值直接歸0」!


還有人表示,這才是LLM接下來(lái)真正Scaling的方式。


Transformer「原罪」,九年未解

2017年,谷歌那篇「Attention is All You Need」奠定了Transformer架構(gòu)的統(tǒng)治地位。

此后九年,從GPT到Claude到Gemini,所有前沿大模型都建立在同一個(gè)基礎(chǔ)上:密集注意力機(jī)制。


長(zhǎng)期以來(lái),Transformer的工作方式非常暴力,即每個(gè)token都要和序列中所有其他token做一次比較。

這種機(jī)制讓它深陷「二次方復(fù)雜度」的泥潭,上下文每增加一倍,計(jì)算成本飆升四倍。

這意味著,輸入越長(zhǎng),模型越貴、越慢、越容易崩。

這就解釋了幾乎所有LLM的上下文卡在100萬(wàn)token左右,不是技術(shù)做不到更長(zhǎng),是做到了也用不起。

這一次,SubQ的誕生,從根本上改變了這個(gè)等式。


SSA架構(gòu)出世

不要「更快」只要「更少」

SubQ的核心突破叫做SSA——亞二次方稀疏注意力(Subquadratic Sparse Attention)。

它的思路出奇地簡(jiǎn)單,不再讓每個(gè)token和所有token做比較。

既然訓(xùn)練好的模型中,絕大多數(shù)注意力權(quán)重都接近零0,那為什么還要算它們?

SSA的做法是,對(duì)每一個(gè)query,基于「內(nèi)容」選擇序列中真正值得關(guān)注的位置,然后只在這些位置上精確計(jì)算注意力。

它只計(jì)算那些真正有意義的交互,跳過(guò)其余99%以上的無(wú)用計(jì)算。


以下是SSA的三大關(guān)鍵特性——

  • 線性擴(kuò)展

計(jì)算量隨選中的位置數(shù)量增長(zhǎng),而不是隨整個(gè)序列長(zhǎng)度增長(zhǎng)。上下文翻倍,成本只翻倍,不再是翻四倍。

  • 內(nèi)容依賴(lài)路由

模型根據(jù)語(yǔ)義決定看哪里,而不是根據(jù)位置。關(guān)鍵信息在序列第3個(gè)token還是第1100萬(wàn)個(gè)token,都能被找到。

  • 精確檢索

不像循環(huán)模型那樣把信息壓縮成固定狀態(tài),SSA保留了從任意位置精確取回信息的能力。

說(shuō)白了,SSA不是「把密集注意力算得更快」,而是「讓模型做更少的注意力計(jì)算」。


減少的計(jì)算量,直接轉(zhuǎn)化為速度。

速度狂飆52.5倍,成本不到Opus 5%

SubQ放出的數(shù)據(jù),每一條都在暴擊:

在100萬(wàn)token長(zhǎng)度上,SSA比標(biāo)準(zhǔn)密集注意力+FlashAttention-2快52.2倍。


在12.8萬(wàn)token上快7.2倍,25.6萬(wàn)token快13.2倍,51.2萬(wàn)token快23倍。

顯而易見(jiàn),上下文越長(zhǎng),優(yōu)勢(shì)越碾壓。

這正是SSA線性擴(kuò)展的直接體現(xiàn)——密集注意力越長(zhǎng)越慢,SSA越長(zhǎng)越劃算。


再來(lái)看算力消耗,在100萬(wàn)token下,注意力FLOP減少了62.5倍。在1200萬(wàn)token下,這個(gè)數(shù)字飆升到接近1000倍。


至于成本,Subquadratic給了一個(gè)非常直觀的對(duì)比——

在RULER 128K基準(zhǔn)測(cè)試上,SubQ花費(fèi)8美元,Opus為2600美元,直接拉出了300倍的成本差距。

最關(guān)鍵的是,這些速度和成本優(yōu)勢(shì),并沒(méi)有以犧牲準(zhǔn)確率為代價(jià)。

RULER 128K基準(zhǔn)測(cè)試: SubQ拿下95%,Opus 4.6是94.8%;


SWE-Bench Verified(代碼工程): SubQ得分81.8,超過(guò)Opus 4.6的80.8。

MRCR v2(長(zhǎng)上下文檢索): SubQ拿到65.9%,雖然低于Opus 4.6的78%,但遠(yuǎn)超GPT 5.4(39%)和Gemini 3.1 Pro(23%)。


這組數(shù)字放在一起看,細(xì)思極恐——

一家種子輪公司,用不到Opus 5%的成本,在多項(xiàng)核心基準(zhǔn)測(cè)試上打平甚至超過(guò)了Anthropic和OpenAI的旗艦?zāi)P汀?/p>


一個(gè)提示詞,SubQ即可處理1200萬(wàn)Token的超長(zhǎng)信息:

無(wú)論是整個(gè)代碼庫(kù)、數(shù)月的 PR 記錄,還是長(zhǎng)期運(yùn)行的 AI 智能體狀態(tài),全都游刃有余,而且成本僅需原來(lái)的五分之一。


不得不說(shuō),若這一切成真,這將是Transformer問(wèn)世以來(lái)最重要的架構(gòu)級(jí)突破。

13人初創(chuàng)公司,要顛覆Transformer

Subquadratic成立于2024年,拿下2900萬(wàn)美元種子輪,估值5億美元。

它有兩位聯(lián)合創(chuàng)始人:CEO Justin Dangel,CTO Alexander Whedon。


研究團(tuán)隊(duì)11人,全部是博士,來(lái)自Meta、谷歌、牛津大學(xué)、劍橋大學(xué)、Adobe。

值得一提的是,這家公司之前叫Aldea,做的是語(yǔ)音模型,后來(lái)轉(zhuǎn)型到了注意力架構(gòu)研究。

這一次,產(chǎn)品線三條同時(shí)上線:

  • SubQ API:12M token全量上下文接口

  • SubQ Code:命令行編碼Agent,整個(gè)代碼庫(kù)一次性塞進(jìn)去

  • SubQ Search:深度研究工具,初期免費(fèi)

全網(wǎng)炸鍋:是終結(jié)者,還是AI版Theranos?

SubQ發(fā)布后數(shù)小時(shí)內(nèi),AI社區(qū)就分裂成了兩個(gè)陣營(yíng)。

AI大佬Dan McAteer一句話,概括了所有人的心態(tài):

SubQ要么是Transformer以來(lái)最大的突破……

要么就是AI界的Theranos。


支持者一方陣容不小。

有人表示,這是2026年最瘋狂的AI發(fā)布之一。

Subquadratic可能找到了奧特曼所言的另一個(gè)架構(gòu)的重大突破。




但懷疑派也毫不留情,有人直言這就是一個(gè)「騙子公司」,尤其是看完創(chuàng)始人領(lǐng)英介紹后。



OpenAI前研究員Will Depue更是連發(fā)多條,第一時(shí)間指出,「SubQ幾乎可以確定是基于Kimi或DeepSeek的稀疏注意力微調(diào)」。




AI圈見(jiàn)過(guò)太多「發(fā)布即巔峰」的故事,發(fā)布會(huì)上的PPT和真實(shí)世界的部署之間,隔著一整條死亡谷。

但話說(shuō)回來(lái),也正因?yàn)檫@個(gè)賭注太大,整個(gè)行業(yè)才不敢不認(rèn)真對(duì)待。

答案,也許只有等技術(shù)報(bào)告公開(kāi)、獨(dú)立benchmark復(fù)現(xiàn)之后,才會(huì)真正揭曉。

參考資料:

https://x.com/alex_whedon/status/2051663268704636937?s=20

https://subq.ai/how-ssa-makes-long-context-practical

https://x.com/daniel_mac8/status/2051710659822305661?s=20

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
對(duì)越反擊戰(zhàn)中爬回國(guó)的戰(zhàn)士,未殺一敵,卻被國(guó)家副主席親授一等功

對(duì)越反擊戰(zhàn)中爬回國(guó)的戰(zhàn)士,未殺一敵,卻被國(guó)家副主席親授一等功

興趣知識(shí)
2026-04-24 15:09:50
望奎倆女孩失聯(lián)多日已被殺!兇手用不同方式殺害倆女孩,非常殘忍

望奎倆女孩失聯(lián)多日已被殺!兇手用不同方式殺害倆女孩,非常殘忍

胡侃社會(huì)百態(tài)
2026-05-06 13:56:32
遍地倒閉、批量合并!央企國(guó)企扎堆成立的數(shù)科公司,為啥死了大半

遍地倒閉、批量合并!央企國(guó)企扎堆成立的數(shù)科公司,為啥死了大半

細(xì)說(shuō)職場(chǎng)
2026-05-03 20:11:19
16歲女孩景區(qū)墜亡:運(yùn)營(yíng)49天、實(shí)繳資本1萬(wàn),過(guò)程和賠償金額曝光

16歲女孩景區(qū)墜亡:運(yùn)營(yíng)49天、實(shí)繳資本1萬(wàn),過(guò)程和賠償金額曝光

溫柔看世界
2026-05-06 14:47:25
孟庭葦遭家暴與張志鵬離婚,現(xiàn)與兒子相依為命

孟庭葦遭家暴與張志鵬離婚,現(xiàn)與兒子相依為命

蕭狡科普解說(shuō)
2026-05-05 22:34:36
完全脫臼!骨頭刺穿皮膚!湖人遭受沉重打擊

完全脫臼!骨頭刺穿皮膚!湖人遭受沉重打擊

籃球教學(xué)論壇
2026-05-06 14:57:15
湖人3將身價(jià)打沒(méi)了!里弗斯狂鐵,肯納德原形畢露,拉拉維亞辣眼

湖人3將身價(jià)打沒(méi)了!里弗斯狂鐵,肯納德原形畢露,拉拉維亞辣眼

籃球資訊達(dá)人
2026-05-06 11:47:23
醫(yī)生忠告:不想得腦梗,吃完晚飯后,一定不要馬上去做這幾件事!

醫(yī)生忠告:不想得腦梗,吃完晚飯后,一定不要馬上去做這幾件事!

橘子約定
2026-05-05 20:53:32
97年,我買(mǎi)下倒閉精神病院,在地下室發(fā)現(xiàn)一個(gè)被關(guān)了5年的正常人

97年,我買(mǎi)下倒閉精神病院,在地下室發(fā)現(xiàn)一個(gè)被關(guān)了5年的正常人

千秋文化
2026-04-26 20:12:44
16中3僅得8分!湖人慘負(fù)雷霆,里夫斯G1拉胯遭全網(wǎng)群嘲

16中3僅得8分!湖人慘負(fù)雷霆,里夫斯G1拉胯遭全網(wǎng)群嘲

仰臥撐FTUer
2026-05-06 20:32:02
伊朗必?cái)。簽槭裁础皠倮摗敝皇亲云燮廴说幕糜X(jué)

伊朗必?cái)。簽槭裁础皠倮摗敝皇亲云燮廴说幕糜X(jué)

民間胡扯老哥
2026-05-05 06:46:18
扎克伯格和華裔老婆去Metgala了!老婆穿大紅裙,這次把人美到了

扎克伯格和華裔老婆去Metgala了!老婆穿大紅裙,這次把人美到了

鄉(xiāng)野小珥
2026-05-06 18:27:28
俄想截胡?烏總理急訪華游說(shuō):圖們江教訓(xùn)慘痛,中國(guó)不能輕易點(diǎn)頭

俄想截胡?烏總理急訪華游說(shuō):圖們江教訓(xùn)慘痛,中國(guó)不能輕易點(diǎn)頭

有范又有料
2026-05-05 11:26:19
被快手砸了5.7億的A站,成了沉默的“賽博墳場(chǎng)”。

被快手砸了5.7億的A站,成了沉默的“賽博墳場(chǎng)”。

差評(píng)XPIN
2026-05-06 00:07:34
遼寧主帥:上海會(huì)奪得新賽季總冠軍 7局4勝制很難有球隊(duì)贏他們4場(chǎng)

遼寧主帥:上海會(huì)奪得新賽季總冠軍 7局4勝制很難有球隊(duì)贏他們4場(chǎng)

狼叔評(píng)論
2026-05-06 18:18:13
樓市,跌不動(dòng)了

樓市,跌不動(dòng)了

城市財(cái)經(jīng)
2026-05-06 11:53:15
76歲王薇薇把裙子穿成項(xiàng)鏈:一場(chǎng)紅毯上的結(jié)構(gòu)實(shí)驗(yàn)

76歲王薇薇把裙子穿成項(xiàng)鏈:一場(chǎng)紅毯上的結(jié)構(gòu)實(shí)驗(yàn)

娛圈觀察員
2026-05-06 02:03:32
10個(gè)月建成人民大會(huì)堂,毛主席參觀時(shí)一直盯著穹頂,笑問(wèn):誰(shuí)想的

10個(gè)月建成人民大會(huì)堂,毛主席參觀時(shí)一直盯著穹頂,笑問(wèn):誰(shuí)想的

浩渺青史
2026-05-06 16:57:17
疑似小米首款全尺寸增程SUV低偽裝諜照曝光 下半年發(fā)布

疑似小米首款全尺寸增程SUV低偽裝諜照曝光 下半年發(fā)布

TechWeb
2026-05-06 11:11:15
記者:中國(guó)車(chē)企比亞迪加入爭(zhēng)奪戰(zhàn),將贊助承擔(dān)德佩薪資的50%

記者:中國(guó)車(chē)企比亞迪加入爭(zhēng)奪戰(zhàn),將贊助承擔(dān)德佩薪資的50%

懂球帝
2026-05-06 16:00:06
2026-05-06 21:08:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15145文章數(shù) 66838關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

知情人士:伊朗將同意將鈾濃縮材料運(yùn)出伊朗

頭條要聞

知情人士:伊朗將同意將鈾濃縮材料運(yùn)出伊朗

體育要聞

活塞1比0騎士:坎寧安不再是一個(gè)人了

娛樂(lè)要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財(cái)經(jīng)要聞

最新GDP!全國(guó)30強(qiáng)城市,又變了

汽車(chē)要聞

領(lǐng)克10/領(lǐng)克10+ 無(wú)論能源形式 領(lǐng)克都要快樂(lè)

態(tài)度原創(chuàng)

游戲
房產(chǎn)
旅游
手機(jī)
公開(kāi)課

曝《GTA6》首周銷(xiāo)量或達(dá)4500萬(wàn)!吞下PS5半壁江山

房產(chǎn)要聞

遙遙領(lǐng)先!這個(gè)澄邁頂流紅盤(pán),憑什么持續(xù)霸榜

旅游要聞

從“門(mén)票經(jīng)濟(jì)”到“沉浸共創(chuàng)”,廣元市利州區(qū)“五一”文旅市場(chǎng)的破圈之路

手機(jī)要聞

徹底放棄!小米暫停小折疊產(chǎn)品線,MIX Flip 2 成絕唱,華為無(wú)天敵了

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版