国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

截?fù)粲ミ_(dá)!OpenClaw狂吞Token,北大系芯片黑馬劍指2000 Tokens/s

0
分享至


新智元報道

編輯:桃子 好困

【新智元導(dǎo)讀】英偉達(dá)200億美元「招安」Groq,推理芯片賽道一夜變天。但在大洋彼岸,一家北大系創(chuàng)業(yè)公司剛剛交出了自己的流片答卷。

NVIDIA GTC 2026前夕,AI推理賽道大雨欲來。

國內(nèi)死磕「超大帶寬流式推理」路線的北大系黑馬——寒序科技,今日宣布完成數(shù)千萬元融資。

蟄伏兩年,寒序直接亮出硬貨:

  • 首顆樣片回片測試全面跑通,單位面積帶寬飆至100 GB/s/mm2;

  • 下一代「MRAM+SRAM」混合架構(gòu)直指2000 Tokens/s極限。

這場破除「內(nèi)存墻」的國產(chǎn)算力突圍戰(zhàn),正從紙面躍向流片。



GTC 2026前夜的「路線倒戈」

大模型硬件的下半場,正迎來一場底層路線的劇烈「倒戈」。

下周,NVIDIA GTC 2026即將開幕。

作為全球AI算力的風(fēng)向標(biāo),業(yè)內(nèi)普遍預(yù)測:隨著Agent(智能體)與具身智能的大規(guī)模落地,算力焦點的天平已徹底向「推理(Inference)」傾斜。

而在此前,業(yè)界盛傳英偉達(dá)已通過約200億美元的驚人估值級別,以技術(shù)授權(quán)與核心團(tuán)隊吸納的方式,實質(zhì)性綁定了北美明星推理芯片公司Groq。巨頭為何對一家初創(chuàng)公司擲出天價?


核心邏輯在于:傳統(tǒng)GPU在應(yīng)對流式大模型推理時,正撞上難以逾越的「內(nèi)存墻(Memory Wall)」與動態(tài)調(diào)度延遲。在實時生成的戰(zhàn)場上,原本為并行計算而生的GPU,正顯得有些「尾大不掉」。

就在英偉達(dá)試圖在北美完成技術(shù)壟斷、構(gòu)筑推理算力護(hù)城河的當(dāng)下,新智元獨家獲悉:國內(nèi)專注超快流式推理芯片的創(chuàng)業(yè)黑馬——「寒序科技」今日正式宣布完成數(shù)千萬元融資。本輪投資方為啟高資本、賽意產(chǎn)業(yè)基金,源合資本擔(dān)任獨家財務(wù)顧問。

在蟄伏兩年后,這家源自北大的硬核團(tuán)隊直接交出了流片答卷,向業(yè)界證明:在「確定性流式處理」這條非共識的道路上,中國團(tuán)隊不僅跟得上,而且打得通。



GPU的「原罪」與推理時代的「陽謀」

要理解寒序科技的技術(shù)護(hù)城河,必須先拆解為何連英偉達(dá)都要焦慮。

現(xiàn)代GPU(如H100/Blackwell)是為并行計算而生的藝術(shù)品。為了兼容通用計算,它支持復(fù)雜的軟件生態(tài)和多類型算子,內(nèi)部包含極其復(fù)雜的動態(tài)調(diào)度、亂序執(zhí)行、多級Cache層級以及Warp調(diào)度機(jī)制。

在「訓(xùn)練階段(Training)」,這種吞吐量優(yōu)先的架構(gòu)通過大規(guī)模數(shù)據(jù)并行,展現(xiàn)了統(tǒng)治級的實力。

但在「推理階段(Inference)」,風(fēng)向變了。

大模型生成Token的過程是串行的、流式的。每生成一個Token,本質(zhì)上都需要執(zhí)行一次矩陣向量乘(GEMV):

y = Wx

其中W為權(quán)重矩陣(Weight Matrix),x為激活向量(Activation Vector)。

這意味著推理階段并不是「算力受限」問題,而是典型的「帶寬受限計算(Bandwidth-bound Computing)」。在Decode(生成)階段,GPU龐大的浮點運算單元(ALU)大部分時間都在空轉(zhuǎn),苦苦等待從顯存中搬運權(quán)重的指令。這種「高射炮打蚊子」的錯配,導(dǎo)致了極大的算力閑置與延遲波動。

英偉達(dá)的「陽謀」昭然若揭既然GPU架構(gòu)在小Batch推理上存在天生缺陷,那就通過資本手段「收編」像Groq這樣走LPU(Language Processing Unit)路線的公司,從而在黑盒內(nèi)部完成對推理架構(gòu)的補(bǔ)完。



叫板Groq

寒序科技的「極致斷舍離」

寒序科技(SpinPU-E Series)走的是一條與GPU截然不同、卻與Groq核心理念高度共鳴的道路:片上存儲權(quán)重的流式高帶寬架構(gòu)徹底摒棄硬件調(diào)度,采用片上存儲權(quán)重的流式高帶寬架構(gòu)。

參照張量流式處理器(TSP)的底層原則,寒序科技在產(chǎn)品定義上實現(xiàn)了極致的重構(gòu)。這種架構(gòu)在內(nèi)部被形象地稱為「生產(chǎn)線模式」,而非GPU的「計件工廠模式」。

1. 算法指導(dǎo)的流式「確定性」

傳統(tǒng)處理器依賴多級緩存和復(fù)雜的調(diào)度邏輯來處理不規(guī)則任務(wù),這在大模型看來是多余的負(fù)擔(dān)。寒序通過神經(jīng)網(wǎng)絡(luò)前向傳播算法指導(dǎo)的Decode專用性、確定性數(shù)據(jù)流動規(guī)劃,實現(xiàn)了超高吞吐的精確調(diào)度與處理。

這意味著,數(shù)據(jù)在芯片內(nèi)部每一納秒的位置都是預(yù)先確定的,消除了任何因動態(tài)爭搶資源帶來的延遲抖動。

2. 面向算子的數(shù)據(jù)通路

寒序?qū)⑿酒瑑?nèi)部空間劃分為針對Transformer模型優(yōu)化的特定功能塊:片上權(quán)重存儲、GEMV計算單元、向量運算單元。這種設(shè)計讓權(quán)重讀取與計算形成完美流水線,真正做到了「數(shù)據(jù)到達(dá)即計算」。

3. 帶寬即生命線

在大模型推理中,決定吞吐量的不是FLOPS,而是帶寬利用率。公式如下:


寒序科技的核心競爭力,就在于將這個公式的分子(帶寬)推向了物理極限。



100 GB/s/mm2

跨越「死亡之谷」的硬核指標(biāo)

對于芯片初創(chuàng)公司而言,從PPT架構(gòu)圖到硅片回片,中間橫亙著被稱為「死亡之谷」的流片驗證期。

知情人士向新智元透露,寒序科技首顆芯片樣片的「回片測試」結(jié)果遠(yuǎn)超預(yù)期,核心功能與技術(shù)邏輯被全面驗證。其中最關(guān)鍵的一項硬指標(biāo):其「單位面積帶寬」達(dá)到了100 GB/s/mm2。

這是一個足以讓業(yè)界側(cè)目的數(shù)字。在流式推理架構(gòu)中,這一指標(biāo)幾乎可以直接映射為推理速度。

  • 對比傳統(tǒng)架構(gòu):即使是頂級的HBM3e顯存方案,其單位面積能提供的有效讀取帶寬也受限于顯存控制器和物理封裝。

  • 對比Groq:寒序在單位面積上提供了更高密度的權(quán)重存取能力,這意味著同樣的芯片尺寸下,寒序能以更短的時間處理更多的權(quán)重參數(shù)。

在「得帶寬者得天下」的推理賽道,這不僅是一個數(shù)據(jù),更是一道分水嶺。它使得大模型在高吞吐流式輸出時,能夠真正滿足未來AI Agent對低延遲的苛刻要求。

終極殺招

「MRAM+SRAM」混合架構(gòu)

Groq雖然快,但它有一個致命的弱點:存不下。

Groq采用純SRAM方案,雖然速度極致,但SRAM的密度極低。要運行一個70B規(guī)模的模型,往往需要數(shù)百張卡集群,其成本和功耗讓許多中小企業(yè)望而卻步。

寒序科技的野心不止于復(fù)刻Groq,而是要進(jìn)化它。

據(jù)悉,寒序科技在即將流片的下一代芯片中,首創(chuàng)了「片上MRAM + SRAM」的混合存儲架構(gòu)。

  • SRAM(靜態(tài)隨機(jī)存儲器)負(fù)責(zé)最高速的緩存與中間變量計算,保持極低延遲。

  • MRAM(磁性隨機(jī)存儲器)這種新型非易失性存儲器擁有接近SRAM的速度,但密度卻遠(yuǎn)高于SRAM,且功耗極低

這種「北大系」擅長的底層技術(shù)融合,讓寒序在保持「確定性流式架構(gòu)」優(yōu)勢的同時,大幅提升了單片的模型容量存儲密度。其目標(biāo)性能直指2000 Tokens/s的極限。

這是什么概念?

目前市面上最快的對話模型推理速度通常在30-50 Tokens/s。如果寒序的2000 Tokens/s方案量產(chǎn),意味著:

  1. 具身智能:機(jī)器人可以在毫秒級完成視覺輸入到動作指令的推理閉環(huán)。

  2. 實時同傳:翻譯將不再有「滯后感」,實現(xiàn)真正意義上的同步。

  3. 多智能體(小龍蝦):復(fù)雜的智能體規(guī)劃任務(wù)可以在瞬間完成多次自我博弈與修正。



北大基因與國產(chǎn)算力的新變量

資料顯示,寒序科技成立于2023年8月,核心創(chuàng)始團(tuán)隊源自「北京大學(xué)磁學(xué)中心」。

這是一個典型的「科學(xué)家+工程師」組合。他們在底層新型存儲器(MRAM)與存算架構(gòu)融合領(lǐng)域,擁有深厚的學(xué)術(shù)積累和工程落地經(jīng)驗。這解釋了為什么他們能駕馭這種極其考驗硬件底層控制邏輯的異構(gòu)設(shè)計。

有接近本輪融資的投資人對新智元表示:我們看好寒序,是因為他們沒有在GPU的舊地圖上尋找新大陸,而是直接重構(gòu)了推理時代的『底層指令集』。

寒序選擇在GTC 2026前夕釋放融資與技術(shù)進(jìn)展信息,顯然有著更深層的考量。在算力霸權(quán)日益集中的今天,國內(nèi)需要一種不依賴海外高端HBM供應(yīng)、能夠通過架構(gòu)創(chuàng)新實現(xiàn)性能彎道超車的方案。



算力霸權(quán)的終局之戰(zhàn)

回看GTC的歷史,每一代架構(gòu)都在定義一個時代:

  • 2017年,Volta GPU標(biāo)志著訓(xùn)練時代的全面爆發(fā);

  • 2022年,Hopper H100引入Transformer Engine,定鼎LLM基石;

  • 2026年,這場關(guān)于「推理」的戰(zhàn)爭,將決定AI能否真正走進(jìn)各行各業(yè)。

英偉達(dá)雖然強(qiáng)大,但沒有任何一個王朝能通過一種架構(gòu)統(tǒng)治所有場景。在大模型從「博學(xué)」走向「行動(Agentic AI)」的過程中,對速度、能效比和實時性的要求,正在為像寒序科技這樣的垂直創(chuàng)新者留出巨大的窗口。

寒序科技的這筆融資,只是一個開始。隨著Agent系統(tǒng)、多模態(tài)模型和具身智能的爆發(fā),AI不再只是單輪對話,而是需要持續(xù)的規(guī)劃與環(huán)境反饋。

推理,才是AGI的「最后一公里」。

寒序科技已經(jīng)在這一硬核戰(zhàn)場上落下了關(guān)鍵的一子。

下周的圣何塞,老黃或許會拿出更強(qiáng)的Blackwell變體,但在大洋彼岸,國產(chǎn)算力的黑馬們,正在用全新的架構(gòu)邏輯,截?fù)艟揞^的陽謀。

您認(rèn)為在推理芯片賽道,國內(nèi)企業(yè)通過「非通用架構(gòu)」能否實現(xiàn)對NVIDIA的突圍?歡迎在評論區(qū)留下您的洞見。

關(guān)于寒序科技:成立于2023年,致力于開發(fā)超大帶寬、確定性流式大模型推理芯片,目前已完成四輪融資。其核心技術(shù)路徑旨在解決大模型推理中的「內(nèi)存墻」難題,為實時AI應(yīng)用提供顛覆性基礎(chǔ)設(shè)施。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
熱議女足勝朝鮮:有好中鋒是教練的福氣,可以踏踏實實進(jìn)四強(qiáng)

熱議女足勝朝鮮:有好中鋒是教練的福氣,可以踏踏實實進(jìn)四強(qiáng)

懂球帝
2026-03-09 20:16:26
IT通信業(yè)祖師爺?shù)?種創(chuàng)造性思維:遇到難題先砍掉90%細(xì)枝末節(jié),從答案往回推往往更容易

IT通信業(yè)祖師爺?shù)?種創(chuàng)造性思維:遇到難題先砍掉90%細(xì)枝末節(jié),從答案往回推往往更容易

知識圈
2026-03-09 07:59:54
女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

特約前排觀眾
2026-02-09 00:05:05
廣東“最富”縣城,一座賺錢超級猛的城市!

廣東“最富”縣城,一座賺錢超級猛的城市!

阿離家居
2026-03-10 00:20:06
趴在中國仁愛礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

趴在中國仁愛礁9000多天的菲律賓軍艦,如今已經(jīng)再也拖不走了

小小科普員
2025-11-21 20:23:24
CBA全明星太太團(tuán)亮相,徐杰女友再度宣示主權(quán)大方回應(yīng)網(wǎng)友評論

CBA全明星太太團(tuán)亮相,徐杰女友再度宣示主權(quán)大方回應(yīng)網(wǎng)友評論

阿嚼影視評論
2026-03-09 18:35:57
24小時戰(zhàn)局突變!伊朗導(dǎo)彈斷崖式下降,美彈藥庫告急耗空家底

24小時戰(zhàn)局突變!伊朗導(dǎo)彈斷崖式下降,美彈藥庫告急耗空家底

命運自認(rèn)幽默
2026-03-09 16:01:07
一次,易中天問董宇輝:“你知道霍去病為什么死的那么早嗎?

一次,易中天問董宇輝:“你知道霍去病為什么死的那么早嗎?

忠于法紀(jì)
2026-01-29 09:18:52
全國人大代表關(guān)注“養(yǎng)龍蝦” 提醒服務(wù)平臺履行安全責(zé)任

全國人大代表關(guān)注“養(yǎng)龍蝦” 提醒服務(wù)平臺履行安全責(zé)任

極目新聞
2026-03-10 10:16:11
網(wǎng)友曝張藝興多個活動被取消,疑被國家話劇院開除,本人發(fā)聲明!

網(wǎng)友曝張藝興多個活動被取消,疑被國家話劇院開除,本人發(fā)聲明!

小椰的奶奶
2026-03-10 11:20:57
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
民政局離婚人數(shù)暴漲!核心原因只有一個:婚姻不再將就

民政局離婚人數(shù)暴漲!核心原因只有一個:婚姻不再將就

好賢觀史記
2025-12-29 23:45:05
對肝最好的“3種食物”,建議:春天要多吃,養(yǎng)肝排毒強(qiáng)免疫

對肝最好的“3種食物”,建議:春天要多吃,養(yǎng)肝排毒強(qiáng)免疫

阿龍美食記
2026-03-09 13:28:40
同居過三年,打過一次胎!網(wǎng)傳山東一男生果斷放棄相親美女引爭議

同居過三年,打過一次胎!網(wǎng)傳山東一男生果斷放棄相親美女引爭議

火山詩話
2026-03-09 06:19:58
1937年出獄的陳獨秀想來延安,毛主席表態(tài):可以,但有3個條件

1937年出獄的陳獨秀想來延安,毛主席表態(tài):可以,但有3個條件

近史談
2026-02-26 11:56:02
1966年,毛主席秘密回到韶山,獨自住在滴水洞11天,一張罕見留影

1966年,毛主席秘密回到韶山,獨自住在滴水洞11天,一張罕見留影

搜史君
2026-03-09 13:10:10
氣質(zhì)女神,大波浪

氣質(zhì)女神,大波浪

動物奇奇怪怪
2026-03-10 14:28:27
“白宮所有男士都有一雙”:特朗普癡迷于一款145美元的皮鞋,不送人一雙就不讓走

“白宮所有男士都有一雙”:特朗普癡迷于一款145美元的皮鞋,不送人一雙就不讓走

娛樂小可愛蛙
2026-03-10 08:43:46
美軍前高官發(fā)出警告:以色列可不是中美俄,打急眼了它真敢丟核彈

美軍前高官發(fā)出警告:以色列可不是中美俄,打急眼了它真敢丟核彈

Ck的蜜糖
2026-03-08 04:32:39
國家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

國家下狠手了!體制內(nèi)大地震,少爺、公主們的“天”,要塌了

霹靂炮
2026-01-19 22:24:13
2026-03-10 15:07:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14685文章數(shù) 66674關(guān)注度
往期回顧 全部

科技要聞

“龍蝦”狂歡 賣“飼料”先掙錢了?

頭條要聞

牛彈琴:特朗普放風(fēng)要停戰(zhàn) 伊朗稱正為美國準(zhǔn)備"驚喜"

頭條要聞

牛彈琴:特朗普放風(fēng)要停戰(zhàn) 伊朗稱正為美國準(zhǔn)備"驚喜"

體育要聞

韓國女足羨慕的奢侈品,為何選擇中國女足

娛樂要聞

肖戰(zhàn)首奪SMG視帝,孫儷四封視后創(chuàng)歷史

財經(jīng)要聞

全民"養(yǎng)龍蝦"背后 第一批受害者浮現(xiàn)

汽車要聞

蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

態(tài)度原創(chuàng)

家居
本地
游戲
手機(jī)
藝術(shù)

家居要聞

自然肌理 溫度質(zhì)感婚房

本地新聞

云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

《精靈皮可》被多位插畫家質(zhì)疑抄襲 致敬寶可夢帕魯

手機(jī)要聞

iPhone 17等用戶反饋蘋果iOS 26.3.1更新BUG:斷網(wǎng)、變慢等

藝術(shù)要聞

30000畝杏花開了,新疆的春天這么美!

無障礙瀏覽 進(jìn)入關(guān)懷版