国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌論文炸場(chǎng)!AI內(nèi)存砍6倍,存儲(chǔ)巨頭股價(jià)集體跳水

0
分享至



2026年3月25日,美股開盤即上演“黑色星期三”——存儲(chǔ)芯片板塊集體重挫,美光、西部數(shù)據(jù)、希捷、閃迪等巨頭股價(jià)全線飄綠,最大跌幅超6%。這場(chǎng)突如其來的市場(chǎng)震蕩,導(dǎo)火索并非芯片產(chǎn)能、需求數(shù)據(jù)等傳統(tǒng)因素,而是谷歌一篇尚未正式發(fā)表的論文:TurboQuant。

這篇即將亮相ICLR2026的技術(shù)成果,用一套“暴力”壓縮方案,將大模型推理的核心瓶頸——KV緩存,在幾乎零精度損耗的前提下壓縮至3-bit,內(nèi)存開銷驟降6倍,推理速度飆升8倍。消息一出,市場(chǎng)瞬間炸鍋:AI服務(wù)器的“內(nèi)存剛需”邏輯被直接動(dòng)搖,萬億存儲(chǔ)芯片市場(chǎng)的底層邏輯遭遇前所未有的沖擊。

一、KV緩存:大模型的“內(nèi)存吞金獸”

要理解TurboQuant的顛覆性,得先搞懂它瞄準(zhǔn)的靶心——KV緩存到底有多“吃內(nèi)存”。

大模型生成每一個(gè)新Token時(shí),都要“回看”之前所有對(duì)話內(nèi)容,避免重復(fù)計(jì)算。為了提速,模型會(huì)把每一層注意力機(jī)制生成的Key(鍵)和Value(值)向量全部緩存起來,形成一張高速“速查表”,這就是KV緩存。

問題在于,這張表會(huì)隨對(duì)話長度線性膨脹:

上下文從4K擴(kuò)展到128K,甚至百萬級(jí)別時(shí),KV緩存占用的顯存往往反超模型參數(shù)本身,成為推理階段最大的內(nèi)存瓶頸。

傳統(tǒng)量化方案(如16-bit轉(zhuǎn)4-bit)雖能壓縮,但需額外存儲(chǔ)歸一化參數(shù),每塊數(shù)據(jù)多占1-2bit,實(shí)際壓縮效果大打折扣。

簡單說,KV緩存就是大模型的“短期記憶”,越長對(duì)話越占內(nèi)存,直接決定了AI服務(wù)器的硬件門檻和推理成本。過去兩年,AI大模型的爆發(fā)式增長,讓“高帶寬、大容量內(nèi)存”成了存儲(chǔ)芯片廠商的核心增長邏輯,美光、SK海力士等企業(yè)的估值,幾乎都建立在“AI單機(jī)內(nèi)存需求只增不減”的預(yù)期之上。





二、TurboQuant:用數(shù)學(xué)暴力破解內(nèi)存瓶頸

谷歌TurboQuant的厲害之處,在于它用一套極簡的數(shù)學(xué)方案,徹底解決了傳統(tǒng)壓縮的“附加開銷”問題,實(shí)現(xiàn)了近乎無損的極致壓縮。

1.兩步“絕殺”:極坐標(biāo)+1-bit校正

TurboQuant的核心是兩階段壓縮流程,沒有復(fù)雜的模型重訓(xùn),全靠數(shù)學(xué)變換:

第一步:PolarQuant極坐標(biāo)變換

傳統(tǒng)量化在笛卡爾坐標(biāo)系下操作,需額外存儲(chǔ)“比例尺”(歸一化參數(shù)),占內(nèi)存。TurboQuant先對(duì)高維向量做隨機(jī)旋轉(zhuǎn),再切換到極坐標(biāo)系描述——旋轉(zhuǎn)后向量分量收斂到統(tǒng)一分布,無需存儲(chǔ)任何歸一化常數(shù),直接把這部分內(nèi)存開銷“歸零”。



第二步:1-bit誤差校正

壓縮必然帶來偏差,TurboQuant僅用1-bit額外空間,加入數(shù)學(xué)“校正器”,精準(zhǔn)抹平系統(tǒng)性誤差,確保模型推理表現(xiàn)幾乎零損耗。

2.實(shí)戰(zhàn)效果:碾壓傳統(tǒng)方案,性能拉滿

谷歌在LongBench、NeedleInAHaystack等五大長上下文基準(zhǔn)測(cè)試中,對(duì)Gemma、Mistral、Llama-3.1-8B等模型做了嚴(yán)格驗(yàn)證,結(jié)果堪稱“暴力”:

壓縮能力:3-bit配置下,KV緩存開銷直接降6倍,2.5-bit也能實(shí)現(xiàn)4.9倍壓縮,且精度逼近全精度模型。



速度提升:在H100GPU上,4-bitTurboQuant的注意力計(jì)算速度,比32-bit基線快8倍,且運(yùn)行時(shí)開銷幾乎可忽略。



極限測(cè)試:“大海撈針”任務(wù)中,6倍壓縮后,模型在10萬Token文本里精準(zhǔn)檢索信息,與全精度版本完全一致。



更關(guān)鍵的是,論文發(fā)布不到24小時(shí),獨(dú)立開發(fā)者就基于PyTorch和Tritonkernel完成復(fù)現(xiàn)——在RTX4090上用2-bit跑Gemma34B,輸出與未壓縮版本逐字符相同,用代碼驗(yàn)證了“零損耗”的真實(shí)性。









三、市場(chǎng)震蕩:存儲(chǔ)巨頭的“底層邏輯地震”

TurboQuant的出現(xiàn),對(duì)存儲(chǔ)芯片行業(yè)而言,是一場(chǎng)不折不扣的底層邏輯大地震。

1.直接沖擊:AI硬件邏輯被改寫

過去兩年,存儲(chǔ)廠商的估值核心是“AI服務(wù)器單機(jī)容量紅利”——大模型越長、越復(fù)雜,需要的高端內(nèi)存就越多,“量價(jià)齊升”成了行業(yè)共識(shí)。

但TurboQuant直接打破了這個(gè)邏輯:

同樣的內(nèi)存,能跑更長上下文、更多并發(fā)、更大模型;

每臺(tái)服務(wù)器所需的高端內(nèi)存芯片,理論上可能大幅減少;

推理成本的“地板價(jià)”被直接改寫,3-bit能做過去16-bit的事。

這也是為什么消息一出,美股存儲(chǔ)板塊瞬間崩盤——市場(chǎng)開始重新評(píng)估:如果AI內(nèi)存需求能靠軟件算法“砍半”,那些押注硬件剛需的資金,自然要緊急避險(xiǎn)。CloudflareCEO甚至將其形容為“谷歌的DeepSeek時(shí)刻”,直指這項(xiàng)技術(shù)徹底動(dòng)搖了“高內(nèi)存=高性能”的行業(yè)迷信。

2.行業(yè)連鎖反應(yīng):從實(shí)驗(yàn)室到產(chǎn)業(yè)的沖擊波

TurboQuant的影響遠(yuǎn)不止股價(jià):

對(duì)AI公司:推理成本大幅下降,端側(cè)部署門檻降低——16GBMacmini都能跑大模型,中小團(tuán)隊(duì)也能低成本落地AI服務(wù)。

對(duì)存儲(chǔ)廠商:壓力陡增。過去靠“堆容量”賺錢的模式受到挑戰(zhàn),必須轉(zhuǎn)向更高帶寬、更低功耗、更適配AI算法的產(chǎn)品創(chuàng)新,否則將被淘汰。

對(duì)技術(shù)生態(tài):核心思想開源后,全行業(yè)都能跟進(jìn)優(yōu)化,KV緩存壓縮將從“實(shí)驗(yàn)室技術(shù)”快速走向規(guī)?;涞兀厮蹵I算力的成本結(jié)構(gòu)。











四、天沒塌:杰文斯悖論下的行業(yè)新邏輯

很多人驚呼“存儲(chǔ)芯片的天塌了”,但真相是:天沒塌,只是邏輯變了。

科技行業(yè)有一條反復(fù)驗(yàn)證的鐵律——杰文斯悖論:資源使用效率越高,總消耗量反而越大。就像蒸汽機(jī)效率提升后,英國煤炭消耗量不降反增;AI算力效率年增30%,但數(shù)據(jù)中心耗電卻持續(xù)飆升。

放到TurboQuant身上,邏輯同樣成立:

內(nèi)存壓縮6倍,不是“少買內(nèi)存”,而是用同樣內(nèi)存做更多事——更長上下文、更多并發(fā)、更大模型,最終推動(dòng)AI應(yīng)用更廣泛落地,反而刺激總內(nèi)存需求增長。

目前TurboQuant僅在8B參數(shù)模型上驗(yàn)證,70B以上大模型、MoE架構(gòu)、百萬級(jí)上下文的表現(xiàn)尚未證實(shí),距離大規(guī)模商用仍有距離。

存儲(chǔ)行業(yè)正處于供應(yīng)極度緊張階段,短期需求不會(huì)因一項(xiàng)技術(shù)而驟降,股價(jià)下跌更多是市場(chǎng)情緒的“獲利了結(jié)”。



五、算力競賽的新戰(zhàn)場(chǎng):數(shù)學(xué)比芯片更鋒利

TurboQuant事件,給整個(gè)科技行業(yè)上了一課:在算力軍備競賽里,最鋒利的武器未必是更大的芯片,而是更聰明的數(shù)學(xué)。

過去幾年,行業(yè)陷入“堆硬件”的誤區(qū)——大模型越大、顯存越高、算力越強(qiáng),就越有競爭力。但TurboQuant證明,軟件算法的優(yōu)化,能直接撬動(dòng)硬件的效率天花板,用更低成本實(shí)現(xiàn)同等甚至更好的性能。

未來,AI行業(yè)的競爭將從“單純拼硬件”,轉(zhuǎn)向硬件+算法的協(xié)同創(chuàng)新:

芯片廠商需要設(shè)計(jì)更適配壓縮算法、稀疏計(jì)算的硬件;

算法團(tuán)隊(duì)需要持續(xù)突破內(nèi)存、算力的效率邊界;

整個(gè)行業(yè)將在“降本增效”的驅(qū)動(dòng)下,走向更健康、更普惠的發(fā)展路徑。

谷歌一篇論文引發(fā)的存儲(chǔ)地震,本質(zhì)是AI行業(yè)從“野蠻生長”走向“精耕細(xì)作”的縮影。TurboQuant沒有摧毀存儲(chǔ)市場(chǎng),而是重塑了市場(chǎng)的底層邏輯——效率優(yōu)先、算法驅(qū)動(dòng)、普惠落地,將成為AI算力發(fā)展的新主線。

對(duì)存儲(chǔ)廠商而言,這是挑戰(zhàn),更是機(jī)遇;對(duì)整個(gè)行業(yè)而言,這是一次關(guān)鍵的“糾偏”——真正的AI革命,從來不是堆硬件,而是用技術(shù)讓算力更高效、更普惠。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
姐不僅圓又大,還是個(gè)肉墩,就在家自拍,不讓別人看

姐不僅圓又大,還是個(gè)肉墩,就在家自拍,不讓別人看

飛娛日記
2026-03-19 07:26:09
17人缺席!掘金大勝雷霆11連勝創(chuàng)約基奇時(shí)代紀(jì)錄 瓦蘭23+17

17人缺席!掘金大勝雷霆11連勝創(chuàng)約基奇時(shí)代紀(jì)錄 瓦蘭23+17

醉臥浮生
2026-04-11 11:11:22
巴基斯坦大批預(yù)警機(jī)升空,給以色列上了一課:中方顯然背后指點(diǎn)了

巴基斯坦大批預(yù)警機(jī)升空,給以色列上了一課:中方顯然背后指點(diǎn)了

安安說
2026-04-11 11:30:55
“窮到吃豆豉,還生呢?”農(nóng)村家長曬5兒3女,大兒子眼神好可怕

“窮到吃豆豉,還生呢?”農(nóng)村家長曬5兒3女,大兒子眼神好可怕

妍妍教育日記
2026-04-11 07:30:06
開拓者116-97掀翻快船,升至西部第8!楊瀚森正負(fù)值+1 領(lǐng)先克林根

開拓者116-97掀翻快船,升至西部第8!楊瀚森正負(fù)值+1 領(lǐng)先克林根

球場(chǎng)沒跑道
2026-04-11 12:44:09
看了一天!終于理清特朗普老婆和愛潑斯坦的瓜!

看了一天!終于理清特朗普老婆和愛潑斯坦的瓜!

啃金融
2026-04-10 22:47:23
美軍不敢對(duì)伊朗發(fā)動(dòng)地面戰(zhàn) 4大“致命傷”卡死白宮

美軍不敢對(duì)伊朗發(fā)動(dòng)地面戰(zhàn) 4大“致命傷”卡死白宮

米師傅安裝
2026-04-11 09:32:23
中東停戰(zhàn)不到48小時(shí),高市突然調(diào)轉(zhuǎn)槍口對(duì)準(zhǔn)中國,30國大使將訪日

中東停戰(zhàn)不到48小時(shí),高市突然調(diào)轉(zhuǎn)槍口對(duì)準(zhǔn)中國,30國大使將訪日

書紀(jì)文譚
2026-04-10 19:04:38
“危山”之下 丨400余名村民“裂縫”求生

“危山”之下 丨400余名村民“裂縫”求生

大象新聞
2026-04-11 10:28:07
德國“大神”來華手術(shù),被「中國病歷」嚇到:“我的天...”。中國醫(yī)生卻要天天扛著

德國“大神”來華手術(shù),被「中國病歷」嚇到:“我的天...”。中國醫(yī)生卻要天天扛著

醫(yī)護(hù)健康科普
2026-04-11 09:08:37
遼寧一車牌號(hào)帶8888的奔馳S450L疑似作為陪葬品下葬,當(dāng)?shù)孛裾郑阂蚜私?,正在核?shí)

遼寧一車牌號(hào)帶8888的奔馳S450L疑似作為陪葬品下葬,當(dāng)?shù)孛裾郑阂蚜私?,正在核?shí)

臺(tái)州交通廣播
2026-04-10 14:45:26
伊朗媒體公布伊朗談判代表團(tuán)人員組成

伊朗媒體公布伊朗談判代表團(tuán)人員組成

財(cái)聯(lián)社
2026-04-11 12:10:05
寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

寶馬“炮轟”比亞迪:不是我們做不到閃充,是不愿犧牲電池耐用性

混沌錄
2026-04-10 22:53:05
阿耳忒彌斯2號(hào)最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來大考

阿耳忒彌斯2號(hào)最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來大考

三體引力波
2026-04-11 01:02:06
伊朗新領(lǐng)袖果然好猛,3句話一錘定音!美高層對(duì)中國說出肺腑之言

伊朗新領(lǐng)袖果然好猛,3句話一錘定音!美高層對(duì)中國說出肺腑之言

阿豐聊娛
2026-04-11 03:35:15
為何說新西蘭沒幾個(gè)中國人待得???網(wǎng)友:待了幾個(gè)月,都快瘋了

為何說新西蘭沒幾個(gè)中國人待得???網(wǎng)友:待了幾個(gè)月,都快瘋了

詩酒趁的年華
2026-04-11 08:58:19
深圳一男子誤吞150片藥,混著白酒!凌晨被發(fā)現(xiàn)癱在床上!醫(yī)生:常規(guī)洗胃沒用,得“拆毒”

深圳一男子誤吞150片藥,混著白酒!凌晨被發(fā)現(xiàn)癱在床上!醫(yī)生:常規(guī)洗胃沒用,得“拆毒”

環(huán)球網(wǎng)資訊
2026-04-11 14:04:10
門店腰斬2萬家!一線撤離、雜牌泛濫,國民快餐巨頭徹底扛不住了

門店腰斬2萬家!一線撤離、雜牌泛濫,國民快餐巨頭徹底扛不住了

毒sir財(cái)經(jīng)
2026-04-09 16:14:36
沒執(zhí)政權(quán)全是空談!鄭麗文在北京交底了

沒執(zhí)政權(quán)全是空談!鄭麗文在北京交底了

牛鍋巴小釩
2026-04-11 12:37:17
演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂”

演員趙達(dá)官宣結(jié)婚,周也發(fā)文祝賀:“恭喜舅舅,新婚快樂”

韓小娛
2026-04-11 11:46:56
2026-04-11 14:56:49
魏家東 incentive-icons
魏家東
一個(gè)人的營銷商學(xué)院!
2626文章數(shù) 12233關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國尷尬發(fā)現(xiàn)"又要求助中國"

頭條要聞

媒體:多套雷達(dá)系統(tǒng)受損 美國尷尬發(fā)現(xiàn)"又要求助中國"

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財(cái)經(jīng)要聞

從日本翻身看:這次誰能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

游戲
藝術(shù)
手機(jī)
健康
親子

打架還會(huì)爆衣!國產(chǎn)大尺度新游登陸Steam 首發(fā)打85折

藝術(shù)要聞

17位當(dāng)代青年畫家油畫欣賞

手機(jī)要聞

行業(yè)首款橫向擴(kuò)折疊!華為新機(jī)命名Pura X Max:4月20日見

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

親子要聞

碳板跑鞋又貴,又有害健康,但為什么小孩哥都這么喜歡?

無障礙瀏覽 進(jìn)入關(guān)懷版