国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

清微智能、Groq與改變GPU單行道的可能性

0
分享至

21世紀(jì)什么最貴?大多數(shù)公司始料未及,最貴的原來是算力,是數(shù)萬美元也“一芯難求”的GPU。

OpenAI創(chuàng)始人Sam Altman曾經(jīng)預(yù)言,算力將成為一種新的貨幣。去年,Gartner預(yù)測(cè)2026年的全球AI支出預(yù)計(jì)將達(dá)到2.52萬億美元,其中光是基礎(chǔ)設(shè)施就需要增加4010億美元的投入,相當(dāng)于英偉達(dá)三年多的營收。

算力的花費(fèi)可以分為兩部分,訓(xùn)練曾經(jīng)是最昂貴的支出。但隨著大模型嵌進(jìn)搜索、廣告、推薦、客服、游戲等高頻場(chǎng)景,推理逐漸取代訓(xùn)練,占據(jù)更大的成本。IDC預(yù)計(jì),2026年,推理算力的消耗占比將會(huì)提升到62.2%,訓(xùn)練算力則降低到37.8%。

AI需要商業(yè)化,企業(yè)便需要更高性價(jià)比的算力,否則辛苦開拓的商業(yè)模式,最后全喂飽了英偉達(dá)。然而,GPU遵循的傳統(tǒng)架構(gòu)在執(zhí)行運(yùn)算時(shí)有不小的數(shù)據(jù)搬運(yùn)成本,在大規(guī)模實(shí)時(shí)生成任務(wù)中會(huì)產(chǎn)生更多花費(fèi),并且制造成本也在不斷上升。



于是,挑戰(zhàn)者不斷出現(xiàn),并拋出新的想法:如果,我們不用GPU的架構(gòu)呢?

一、尋找GPU之外的可能性

GPU誕生于圖形渲染年代,并行運(yùn)算能力突出,通用能力強(qiáng)。但這種多功能性用來支持AI,就成了歷史包袱,難以滿足Token邊際成本持續(xù)降低的需求。

這是索羅斯“反身性”理論在算力領(lǐng)域的兌現(xiàn):GPU“意外”適應(yīng)了AI的需求,早期AI依賴GPU并助推后者市場(chǎng)擴(kuò)大乃至絕對(duì)占有,然而當(dāng)算力需求發(fā)展到一定階段,GPU架構(gòu)又限制了AI效率的提高。早期的選擇也許只是那個(gè)時(shí)代的認(rèn)知偏差,但它又造成了后來的因果循環(huán),直到有新的架構(gòu)能打破這種怪圈。

相比之下,非GPU路線能更好地針對(duì)AI需求做定制化,ASIC(專用集成電路)因此崛起。這條路上的知名企業(yè)數(shù)不勝數(shù),華為、谷歌、博通、百度、寒武紀(jì)……無論采取何種架構(gòu)、打造何種產(chǎn)品,都是為了AI的降本增效。



2025年11月,谷歌發(fā)布Gemini 3,性能跑贏了OpenAI被市場(chǎng)寄予厚望的GPT 5.1。Gemini 3基于谷歌自研芯片TPU訓(xùn)練,高盛推算其單位token推理成本下降約70%,在后發(fā)條件下追平了英偉達(dá)GB200 NVL72的成本。

去年,Anthropic便宣布要采用最多100萬張TPU,11月又有消息稱Meta考慮將部分AI基礎(chǔ)設(shè)施遷移至谷歌TPU。就連英偉達(dá)股價(jià),也因此受到影響。

但ASIC有一個(gè)天然短板:既然是定制,那么就難以匹配還在持續(xù)更新的AI算法和架構(gòu)需求,而設(shè)計(jì)一個(gè)架構(gòu)需要很長(zhǎng)的周期,一旦算法變更,芯片就有可能過時(shí)?!靶灸f(xié)同”,對(duì)于AI生態(tài)的構(gòu)建意義重大。

去年的上海世界人工智能大會(huì)上,就有不少國產(chǎn)芯片廠商格外強(qiáng)調(diào)這一點(diǎn)。DeepSeek作為開源之光,也得到了國產(chǎn)芯片廠商的大力適配。其V4版本發(fā)布在即,很快又要接近適配節(jié)點(diǎn)。

既要高性能,又要強(qiáng)適配,有沒有一種辦法,能讓芯片和數(shù)據(jù)算法更好地協(xié)同,高效適應(yīng)模型的進(jìn)化?

不僅有,而且還得到了英偉達(dá)的變相認(rèn)可。

去年末,英偉達(dá)意外斥資約200億美元,獲得Groq知識(shí)產(chǎn)權(quán)的非獨(dú)家授權(quán),并將其主要人物一舉收入囊中。



Groq由谷歌TPU早期團(tuán)隊(duì)成員創(chuàng)立,他們基于可重構(gòu)數(shù)據(jù)流方法打造了LPU(Language Processing Unit,語言處理單元)產(chǎn)品,適配開源模型后展現(xiàn)的推理成本遠(yuǎn)低于GPU。

而幾乎同一時(shí)間,“北京四大明星芯片公司”之一的清微智能,也基于可重構(gòu)芯片(RPU)優(yōu)勢(shì)拿下超20億元C輪融資,國家大基金二期、京能集團(tuán)、京國瑞等多層級(jí)國資密集入場(chǎng)。我們從行業(yè)了解到,清微智能過去一年估值翻了三倍有余,接近190億元,目前正在籌備Pre-IPO輪融資,為最終上市做準(zhǔn)備。



“可重構(gòu)數(shù)據(jù)流”為什么這么獨(dú)特,能在大洋兩岸同時(shí)受到超級(jí)資本們的認(rèn)可甚至追捧?答案是架構(gòu)——它不再以上下指令的通用處理器為中心,而是先看要處理的數(shù)據(jù)流長(zhǎng)什么樣,再讓硬件圍繞數(shù)據(jù)流去重構(gòu)自己的電路拓?fù)?。?jiǎn)單來說,軟件定義硬件:

傳統(tǒng)GPU存在“內(nèi)存墻、效率墻、互聯(lián)墻”問題,因?yàn)橹笓]數(shù)據(jù)的“旗手”和搬運(yùn)數(shù)據(jù)的“員工”要不斷地交流信息,徒增成本。ASIC方案把搬運(yùn)流程變成了固定流水線,效率提高了,不過每次需求一改就要重新定制流水線。而RPU方案是根據(jù)數(shù)據(jù)算法的需求定義流水線,想要什么傳送方式,便可以朝那個(gè)方向重構(gòu)。

用清微智能創(chuàng)始人王博的比喻,這是在芯片里搭了一張充滿“電子道岔”的鐵路網(wǎng)。傳統(tǒng)芯片是一條單線鐵路,火車只能沿既定軌道跑;可重構(gòu)數(shù)據(jù)流芯片則在每個(gè)節(jié)點(diǎn)都埋了道岔,今天把這些“小計(jì)算器”連成卷積流水線,明天又重連成注意力模塊專用路徑,執(zhí)行完一段網(wǎng)絡(luò)就擦除配置,十幾納秒內(nèi)切成另一種拓?fù)洹?/p>

本質(zhì)上,它把程序驅(qū)動(dòng)硬件變成數(shù)據(jù)驅(qū)動(dòng)硬件,讓數(shù)據(jù)在芯片內(nèi)部節(jié)點(diǎn)之間直接流動(dòng),盡量少繞回顯存排隊(duì)。這對(duì)參數(shù)海量、訪問模式高度規(guī)則的大模型尤其友好——每少繞一次路,背后都是成本曲線被向下拉了一段。

于是,算力產(chǎn)業(yè)擁有了一個(gè)具備差異化特征的“第二陣營”,嘗試在蠻力堆砌GPU之外找出路。以清微智能為代表的創(chuàng)業(yè)公司,正在給大模型算力問題寫出“第二解”。

二、太平洋兩岸的可重構(gòu)競(jìng)賽:清微智能領(lǐng)銜中國式創(chuàng)新

可重構(gòu)的概念并不新鮮,重要的是它有了產(chǎn)業(yè)化的能力。Groq把語言推理抽象成LPU,適配開源模型后的推理效率一鳴驚人,SambaNova也在用RDU與整機(jī)方案做企業(yè)市場(chǎng)。

在這股潮流中,清微智能作為稀缺的新架構(gòu)算力芯片企業(yè),自然而然扮演了一個(gè)新角色:中國并非只能在GPU主線上做追隨者,在剛剛打開的第二條算力支流上,我們擁有一支能拿得出手的本土隊(duì)伍。它脫胎于清華大學(xué)微電子學(xué)院研究成果,如今正在為中國的芯模協(xié)同貢獻(xiàn)力量。

在端側(cè),清微早期用TX5系列產(chǎn)品驗(yàn)證了這條路并非紙上談兵。一顆工作功耗不到2毫瓦的語音芯片,讓門鎖、音箱、手機(jī)保持常年待機(jī)聆聽狀態(tài);多款視覺與語音終端芯片被裝進(jìn)攝像頭、手機(jī)、IoT設(shè)備里,累計(jì)出貨超三千萬顆。這些看似不起眼的產(chǎn)品,在較長(zhǎng)的鏈路中完成了可重構(gòu)架構(gòu)的可靠性和工具鏈壓力測(cè)試。

而真正讓清微智能具備“爆棚”潛力的,是面向云端市場(chǎng)的TX8高算力芯片。它把“數(shù)據(jù)流+可重構(gòu)”直接做到大面積裸片上,并配上一種不同于GPU的互聯(lián)方式——C2C算力網(wǎng)格。

傳統(tǒng)GPU集群的路徑是“PCIe—網(wǎng)卡—交換機(jī)—網(wǎng)卡—PCIe”,每加一層節(jié)點(diǎn)就多一層延遲和擁塞。清微選擇在芯片之間直接織網(wǎng),讓多卡互聯(lián)更接近板上直連。這樣一來,在千卡規(guī)模內(nèi)可以削減大量昂貴交換機(jī)投資,同時(shí)把大模型訓(xùn)練/推理中最容易觸頂?shù)摹盎ヂ?lián)墻”壓薄一層。

搭載TX81的REX1032訓(xùn)推一體服務(wù)器,在同等功耗下可以承載萬億參數(shù)模型部署,單機(jī)跑DeepSeekR1/V3級(jí)別模型無需“縮水版”;整機(jī)方案測(cè)算下來,比同類GPU產(chǎn)品綜合成本低約一半,能效比提升約三倍。



IDC統(tǒng)計(jì)顯示,2025年上半年,清微在國產(chǎn)非GPU(含可重構(gòu)、ASIC)加速卡銷量中位列第六,進(jìn)入本土算力第一梯隊(duì)。



目前,清微智能已經(jīng)為多地智算中心打造了“實(shí)戰(zhàn)裝備”。黑龍江、浙江、安徽、北京等地陸續(xù)上線千卡規(guī)模集群,新疆雙河的中樹云智算中心則在首期工程中直接采用可重構(gòu)架構(gòu),成為“東數(shù)西算”和算力出海的重要節(jié)點(diǎn)之一。

在軟件與生態(tài)上,清微一方面在眾智FlagOS上做到卓越適配,與寒武紀(jì)、昆侖芯、摩爾線程、昇騰、中科海光并列為領(lǐng)域內(nèi)的“六脈神劍”;另一方面采用“三層兼容”策略——上層CUDA API級(jí)兼容,中層深度押注OpenAI主推的Triton編譯器并與智源共建生態(tài),底層用RISC?V替代PTX,為開發(fā)者預(yù)留足夠“壓榨性能”的空間。

這些看似瑣碎的工程選擇,針對(duì)的是新架構(gòu)影響的客戶遷移成本、交付與支持可靠性等問題。太多AI芯片創(chuàng)業(yè)公司倒在這一關(guān),而清微智能在可重構(gòu)數(shù)據(jù)流這條支流上,率先完成了從可用到可規(guī)模部署的躍遷,為中國算力產(chǎn)業(yè)探得了一方獨(dú)立、有潛力的天地。

三、從“補(bǔ)課生”到“解題人”:高階國產(chǎn)替代的第二條路

王博曾經(jīng)表示,“相比短平快的仿制路線,選擇新架構(gòu)實(shí)現(xiàn)‘換道超車’才是真正的高階國產(chǎn)替代?!鼻逦⒅悄苎鹤⑽磥?到5年的算力革命,實(shí)施“研發(fā)一代、儲(chǔ)備一代、釋放一代”的技術(shù)戰(zhàn)略。

在這個(gè)過程中,清微智能扭轉(zhuǎn)了算力問題的維度:不做英偉達(dá)的“補(bǔ)課生”,而是在另一條技術(shù)主線上,成為“解題人”。

這條路的難度一點(diǎn)不低,它意味著幾件事要同時(shí)發(fā)生:

第一,要接受長(zhǎng)時(shí)間的生態(tài)劣勢(shì),只能靠性能、能效、成本上的顯著優(yōu)勢(shì)來抵消遷移成本。王博給客戶的下一階段承諾是“5倍性價(jià)比”:把采購、運(yùn)維和性能整體算進(jìn)來,讓不轉(zhuǎn)平臺(tái)顯得更虧。這會(huì)提高對(duì)架構(gòu)、互聯(lián)、存儲(chǔ)、系統(tǒng)設(shè)計(jì)每一層的要求,但也會(huì)提高中國算力發(fā)展的天花板。

第二,要在非GPU賽道上盡快走完從“單點(diǎn)突破”到“系統(tǒng)方案”的閉環(huán)??芍貥?gòu)不是一顆孤立芯片,它要和3D存儲(chǔ)、Chiplet、晶圓級(jí)架構(gòu)等前沿方向咬合,形成一棵有延展性的技術(shù)樹。清微規(guī)劃中的TX83,就嘗試把可重構(gòu)算力網(wǎng)格與晶圓級(jí)芯片結(jié)合,為“后GPU時(shí)代”的大規(guī)模集群預(yù)留試驗(yàn)場(chǎng)。

第三,要承認(rèn)算力問題已從芯片問題升級(jí)為系統(tǒng)問題。在大規(guī)模推理場(chǎng)景下,算力產(chǎn)業(yè)需要可長(zhǎng)期演進(jìn)的整體,支撐應(yīng)用。此時(shí),如果基座完全由海外產(chǎn)品來搭建,我們的應(yīng)用將進(jìn)一步形成依賴。而清微智能則在押一條未來十年中國算力不再完全鎖死在GPU帝國里的技術(shù)路線。

這條路當(dāng)然不保證成功,GPU也不會(huì)被“第二陣營”顛覆。但從產(chǎn)業(yè)角度,它至少已留下兩個(gè)里程碑:

一是把中國在新一代算力架構(gòu)上的時(shí)間點(diǎn),第一次對(duì)齊到全球同一批玩家。

王博曾經(jīng)總結(jié)過,芯片技術(shù)發(fā)展有一個(gè)“類摩爾定律”:20年,架構(gòu)更新一次。過去在CPU、GPU、存儲(chǔ)、接口標(biāo)準(zhǔn)上,我們幾乎總是在別人定完方向后才開始追;這一次,在TPU、LPU剛剛從論文走向產(chǎn)品的時(shí)間窗口,RPU也由中國工程師以同樣節(jié)奏做成了可出貨的工業(yè)品。



二是讓國家層面在算力上多了一條真正可選之路。當(dāng)GPU供應(yīng)出現(xiàn)風(fēng)險(xiǎn)、單一生態(tài)的議價(jià)能力高得離譜時(shí),已經(jīng)被初步跑通的新架構(gòu),會(huì)成為“火種”。

把視角再拉遠(yuǎn)一點(diǎn),如果未來十年AI真能避開上一輪“寒冬”的命運(yùn),很可能不是因?yàn)槟P偷穆斆黝嵏擦巳祟愊胂?,而是低成本大?guī)模應(yīng)用改變了人類的生產(chǎn)方式。在如此宏大的時(shí)代旋律中,站在中國產(chǎn)業(yè)的支流上,機(jī)會(huì)也是無限的。清微智能被時(shí)代賦予的稀缺性,最終將以算力紅利的形式,反哺于中國產(chǎn)業(yè)。

來源:松果財(cái)經(jīng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
隨著波爾圖3-1,葡萄牙體育3-0,葡超積分榜:穆帥率隊(duì)差榜首10分

隨著波爾圖3-1,葡萄牙體育3-0,葡超積分榜:穆帥率隊(duì)差榜首10分

側(cè)身凌空斬
2026-02-28 07:04:46
白馬會(huì)所一夜覆滅

白馬會(huì)所一夜覆滅

來科點(diǎn)譜
2026-02-28 07:45:18
“七十不添衣,八十不祝壽”,這句話指的是啥?看完后漲知識(shí)了

“七十不添衣,八十不祝壽”,這句話指的是啥?看完后漲知識(shí)了

阿龍美食記
2026-02-26 14:30:14
亞歷山大談多爾特被驅(qū)逐:我沒看到發(fā)生了什么,但他只是想贏

亞歷山大談多爾特被驅(qū)逐:我沒看到發(fā)生了什么,但他只是想贏

懂球帝
2026-02-28 21:46:40
卡塔爾航空、阿聯(lián)酋航空:因多地空域關(guān)閉,已臨時(shí)暫停所有往返多哈、迪拜的航班

卡塔爾航空、阿聯(lián)酋航空:因多地空域關(guān)閉,已臨時(shí)暫停所有往返多哈、迪拜的航班

澎湃新聞
2026-02-28 20:45:55
以色列突襲伊朗30連炸!伊朗兩千枚導(dǎo)彈反制,稱毀滅性報(bào)復(fù)將臨

以色列突襲伊朗30連炸!伊朗兩千枚導(dǎo)彈反制,稱毀滅性報(bào)復(fù)將臨

阿芒娛樂說
2026-02-28 17:04:09
什葉派領(lǐng)袖放話:若美軍打伊朗,將號(hào)召圣戰(zhàn)

什葉派領(lǐng)袖放話:若美軍打伊朗,將號(hào)召圣戰(zhàn)

桂系007
2026-02-23 23:48:28
那條救了中國人餐桌的魚,你可能根本不知道它的故事

那條救了中國人餐桌的魚,你可能根本不知道它的故事

富貴說
2026-02-26 20:49:42
還是工資問題?媒體人:四川已全部裁掉隊(duì)里僅有的兩名外援

還是工資問題?媒體人:四川已全部裁掉隊(duì)里僅有的兩名外援

懂球帝
2026-02-28 17:29:07
梅婷大年初九在北京別墅宴客,和德華劉琳同框,吃海鮮大口喝酒

梅婷大年初九在北京別墅宴客,和德華劉琳同框,吃海鮮大口喝酒

林雁飛
2026-02-27 16:36:10
2100枚核彈24小時(shí)待命,張召忠曾發(fā)出警告:一旦開戰(zhàn),將無處可逃

2100枚核彈24小時(shí)待命,張召忠曾發(fā)出警告:一旦開戰(zhàn),將無處可逃

近史博覽
2026-01-22 12:52:47
楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

楊紫真的已經(jīng)瘦到天賦上限了,這也太牛了…

手工制作阿殲
2026-02-22 13:25:34
德國總理默茨訪華回國后演講:每周四天工作制無法維持德國的繁榮,需要更加努力

德國總理默茨訪華回國后演講:每周四天工作制無法維持德國的繁榮,需要更加努力

大象新聞
2026-02-28 18:49:14
隆多慶40歲生日,退役轉(zhuǎn)型當(dāng)教練,二婚妻子很美,已財(cái)富自由

隆多慶40歲生日,退役轉(zhuǎn)型當(dāng)教練,二婚妻子很美,已財(cái)富自由

大西體育
2026-02-27 23:31:17
新華社快訊:以色列政府已設(shè)立地下指揮中心

新華社快訊:以色列政府已設(shè)立地下指揮中心

新華社
2026-02-28 15:53:19
一個(gè)很奇怪的現(xiàn)象:凡是和睦的家庭,夫妻倆至少有一個(gè)是“傻子”

一個(gè)很奇怪的現(xiàn)象:凡是和睦的家庭,夫妻倆至少有一個(gè)是“傻子”

千秋文化
2026-02-28 19:15:41
哈梅內(nèi)伊的頂級(jí)智慧:不再求中俄出手,不怕赴死,不怕手下們?cè)旆?>
    </a>
        <h3>
      <a href=墨蘭史書
2026-02-25 23:19:27
國外媒體稱:一旦戰(zhàn)火爆發(fā),中國將會(huì)到達(dá)無人知曉的地步

國外媒體稱:一旦戰(zhàn)火爆發(fā),中國將會(huì)到達(dá)無人知曉的地步

古事尋蹤記
2025-12-10 07:11:27
強(qiáng)勢(shì)換血!鄭欽文教練團(tuán)隊(duì)完成調(diào)整,紅土名帥阿雷塞正式加盟

強(qiáng)勢(shì)換血!鄭欽文教練團(tuán)隊(duì)完成調(diào)整,紅土名帥阿雷塞正式加盟

卿子書
2026-02-28 09:53:11
最新!衛(wèi)星圖像顯示美國11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列!美軍最大航母前往中東!伊朗拒絕向國外轉(zhuǎn)移濃縮鈾

最新!衛(wèi)星圖像顯示美國11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列!美軍最大航母前往中東!伊朗拒絕向國外轉(zhuǎn)移濃縮鈾

每日經(jīng)濟(jì)新聞
2026-02-27 07:08:08
2026-02-28 23:00:49
松果財(cái)經(jīng) incentive-icons
松果財(cái)經(jīng)
專注商業(yè)研究,挖掘新商業(yè)機(jī)會(huì)
5099文章數(shù) 4897關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

美以襲擊伊朗 華人緊急逃離德黑蘭:沒想到來得這么快

頭條要聞

美以襲擊伊朗 華人緊急逃離德黑蘭:沒想到來得這么快

體育要聞

球隊(duì)主力全報(bào)銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財(cái)經(jīng)要聞

沖突爆發(fā) 市場(chǎng)變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

教育
藝術(shù)
房產(chǎn)
本地
公開課

教育要聞

這件事不做對(duì),將來孩子會(huì)恨你!

藝術(shù)要聞

就是這個(gè)畫風(fēng),美的我有點(diǎn)兒接受不了!

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

本地新聞

津南好·四時(shí)總相宜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版