国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

挑戰(zhàn)英偉達(dá)算力霸權(quán)?多倫多一家創(chuàng)企將大模型“刻進(jìn)”芯片

0
分享至



翼言商業(yè)觀察

是破局突圍,還是刻舟求劍?

在硅谷當(dāng)下的宏大敘事中,算力即權(quán)力。

英偉達(dá)的 GPU 似乎成了通往AGI唯一且昂貴的門(mén)票。當(dāng)整個(gè)行業(yè)都在狂熱地堆疊“更大、更貴、更耗電”的 GPU 集群時(shí),一種極具顛覆性的底層技術(shù)叛逆卻在暗處悄然發(fā)生。


近日,一家成立不到三年、位于多倫多的初創(chuàng)公司 Taalas 拋出了一個(gè)讓半導(dǎo)體與 AI 業(yè)界側(cè)目的方案:他們將 Meta 的 Llama 大模型直接“硬連線”(Hardwired)進(jìn)了 ASIC(專(zhuān)用集成電路)芯片。 這并非一次常規(guī)的硬件制程升級(jí),而是一場(chǎng)物理層面的暴力重構(gòu)。

由Tenstorrent前聯(lián)合創(chuàng)始人Ljubisa Bajic帶隊(duì)的這群工程師,不再依賴(lài)昂貴的HBM顯存,拋棄了液冷:模型不再是以軟件代碼的形式運(yùn)行在通用硬件上,也不再需要頻繁地從高帶寬顯存(HBM)中吞吐成百上千 GB 的權(quán)重?cái)?shù)據(jù)。Llama 龐大的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)十億參數(shù),被直接固化進(jìn)物理電路,成為了芯片本身——芯片即模型,模型即芯片。

在這塊采用臺(tái)積電6納米工藝、面積達(dá)815平方毫米的芯片上,單用戶(hù)運(yùn)行Llama 3.1 8B的推理吞吐達(dá)到了令人瞠目的17,000 tokens/秒。作為對(duì)比,這個(gè)速度是英偉達(dá)最頂尖GPU的數(shù)十倍,是人類(lèi)閱讀或思考速度的成百上千倍。生成一部詳盡的二戰(zhàn)逐月編年史,僅需0.138秒。

這一反常識(shí)的技術(shù)路線,究竟是打破算力瓶頸的終極突破,還是無(wú)視模型迭代規(guī)律的“刻舟求劍”?

一、歷史的鐘擺

天下苦“內(nèi)存墻”久矣

Taalas 之所以做如此激進(jìn)的嘗試,是因?yàn)楫?dāng)前 AI 產(chǎn)業(yè)有一個(gè)隱疾:內(nèi)存墻(Memory Wall)。

自計(jì)算機(jī)誕生以來(lái),統(tǒng)治整個(gè)行業(yè)的基石是“馮·諾依曼架構(gòu)”,其設(shè)計(jì)中就存在計(jì)算與存儲(chǔ)分離的特點(diǎn):需要計(jì)算時(shí),就從后臺(tái)把數(shù)據(jù)搬運(yùn)到舞臺(tái)上,算完再搬回去。


在模型只有幾兆、幾十兆的時(shí)代,這個(gè)架構(gòu)運(yùn)轉(zhuǎn)良好。但是,當(dāng)大語(yǔ)言模型膨脹到幾百億、上千億參數(shù)時(shí),這一經(jīng)典架構(gòu)正在成為最大的絆腳石。GPU 運(yùn)行大模型進(jìn)行推理時(shí),它并沒(méi)有把大部分精力花在計(jì)算上,而是被迫變成了一個(gè)疲于奔命的“搬運(yùn)工”——海量的模型權(quán)重?cái)?shù)據(jù)需要在顯存和計(jì)算單元之間來(lái)回穿梭,高達(dá) 80% 的功耗和延遲都浪費(fèi)在了這種數(shù)據(jù)的物理搬運(yùn)上。這不僅造就了英偉達(dá)龐大的護(hù)城河,也直接捧紅了價(jià)格極其昂貴的 HBM 存儲(chǔ)芯片。AI行業(yè)苦“內(nèi)存墻”久矣,它讓 AI 推理的成本居高不下,讓數(shù)據(jù)中心變成了吞噬電力的巨獸。

Taalas 的 ASIC 路線,本質(zhì)上是對(duì)這筆“算力稅”的徹底逃避。當(dāng)模型權(quán)重不再是以數(shù)據(jù)的形式存在于內(nèi)存中,而是變成了固化的晶體管開(kāi)閉狀態(tài),數(shù)據(jù)搬運(yùn)的動(dòng)作就在物理層面上被抹除了。

二、絕對(duì)速度與“電子牛馬”

商業(yè)落地的場(chǎng)景價(jià)值

Taalas打破內(nèi)存墻帶來(lái)的最直接后果,是成本和能效比的恐怖斷層。


傳統(tǒng)的GPU數(shù)據(jù)中心是名副其實(shí)的“電老虎”,動(dòng)輒需要液冷伺候。而Taalas的HC1芯片,單顆功耗僅約250W。即使部署10顆芯片,總功耗不過(guò)2.5千瓦,僅靠常規(guī)的空氣冷卻就能穩(wěn)定運(yùn)行。根據(jù)Taalas官方及業(yè)界測(cè)算,其百萬(wàn)Token的推理成本僅為0.0075美元左右,是傳統(tǒng)GPU方案的二十分之一甚至更低。在“唯快不破”和“降本增效”成為行業(yè)鐵律的今天,這組數(shù)據(jù)的沖擊力毋庸多言。

從工程學(xué)的角度來(lái)看,這顯然是一次驚人的效率躍升;而在模型快速迭代的今天,一個(gè)不能更新、不能運(yùn)行其他模型的芯片,聽(tīng)起來(lái)顯然又像個(gè)笑話(huà)。但是,如果我們跳出“打造全知全能AGI”的宏大敘事,將目光投向海量的商業(yè)垂直場(chǎng)景,也許會(huì)發(fā)現(xiàn),這種“固化”非但不是缺陷,反而可能是某些場(chǎng)景下的最優(yōu)解。

在真實(shí)的商業(yè)世界里,并非所有場(chǎng)景都需要一個(gè)通曉量子力學(xué)、能寫(xiě)莎士比亞十四行詩(shī)的GPT5甚至更新的模型。大部分場(chǎng)景需要的,是一個(gè)極其穩(wěn)定、便宜、速度極快且不需要休息的“電子牛馬”。


想象一下工業(yè)流水線上的毫秒級(jí)殘次品視覺(jué)識(shí)別、智能汽車(chē)?yán)镄枰^對(duì)零延遲響應(yīng)的端側(cè)語(yǔ)音中樞、數(shù)以?xún)|計(jì)的家用陪伴機(jī)器人或兒童玩偶……在這些場(chǎng)景中,企業(yè)根本不在乎你能否兼容最新的大模型框架,他們?cè)诤醯氖牵耗懿荒苡脦酌婪值某杀?,把手頭這件特定的任務(wù)做到光速?

Taalas的HC1,正好可以解決這種“規(guī)?;瘑我蝗蝿?wù)”。當(dāng)17,000 tokens/秒的速度應(yīng)用在語(yǔ)音助手上,AI的回答將比人類(lèi)的神經(jīng)反射還要快,“等待LLM思考”的轉(zhuǎn)圈動(dòng)畫(huà)將徹底成為歷史。一個(gè)原本需要幾百瓦功率、必須插在液冷服務(wù)器上的大模型,未來(lái)也許只需幾瓦的電量,就能被輕易塞進(jìn)一臺(tái)掃地機(jī)器人、一部智能手機(jī),甚至是一副輕薄的AI眼鏡中。真正的“萬(wàn)物皆 AI”,也只有在算力和功耗被極度壓縮后才可能實(shí)現(xiàn)。

三、刻舟求劍的隱憂(yōu)

被“凍結(jié)”在芯片里的智慧

盡管如此,鑒于當(dāng)前 AI 算法一日千里的演進(jìn)速度,Taalas 的路線極具風(fēng)險(xiǎn)的另一面也是不容忽視的。將流動(dòng)的軟件代碼固化為冰冷的物理電路,意味著犧牲了靈活性。這里有兩個(gè)極其尖銳的現(xiàn)實(shí)錯(cuò)位。

首先是迭代周期的錯(cuò)位。如今,開(kāi)源大模型的進(jìn)化是以“月”甚至“周”為單位的。但一顆先進(jìn)制程的芯片,從架構(gòu)設(shè)計(jì)、流片到最終量產(chǎn),通常需要 18 到 24 個(gè)月。而當(dāng)它走下產(chǎn)線時(shí),它所“凍結(jié)”的 Llama 模型,在日新月異的算法世界里,是否已經(jīng)淪為一個(gè)落后的“古董”?

再者是容錯(cuò)率的錯(cuò)位。大模型如果出現(xiàn)嚴(yán)重的幻覺(jué)或安全漏洞,可以通過(guò)微調(diào)或推送 OTA 補(bǔ)丁來(lái)迅速修復(fù)。但是,一塊已經(jīng)刻好物理電路的芯片該怎么打補(bǔ)丁呢?一旦芯片內(nèi)固化的模型存在致命缺陷,整批昂貴的芯片大概率只能淪為硅垃圾。

對(duì)于這些致命的商業(yè)風(fēng)險(xiǎn),Taalas也給出了他們的防守策略。首先是微調(diào)的保留, HC1雖然鎖死了基礎(chǔ)權(quán)重,但依然保留了對(duì)低秩自適應(yīng)(LoRA)微調(diào)的支持。這意味著企業(yè)可以在物理大模型的外部,外掛小型的“知識(shí)補(bǔ)丁”來(lái)調(diào)整特定任務(wù)的表現(xiàn)。其次是極速的物理迭代,Taalas CEO 透露,改變模型并不需要重新設(shè)計(jì)整個(gè)底層硅片,而只需更改芯片最上層的兩層金屬層。這種制造工藝的創(chuàng)新,將新模型的硬件化周期壓縮到了驚人的兩個(gè)月,從而幫助模型實(shí)現(xiàn)小幅迭代。

縱然如此,這依然是一場(chǎng)與時(shí)間賽跑的豪賭。在這場(chǎng)博弈中,Taalas試圖用硬件的極致靜態(tài),去捕捉 AI 算法的極致動(dòng)態(tài),不可避免地帶有一些“刻舟求劍”的悲壯色彩。

四、蝴蝶效應(yīng)

誰(shuí)在戰(zhàn)栗,誰(shuí)在狂歡?

盡管局限性很明顯,但Taalas這種“模型即芯片”的路線的面世,依然撕開(kāi)了英偉達(dá)絕對(duì)壟斷帝國(guó)的一道裂痕。

英偉達(dá)的地位,很大程度上歸功于其CUDA軟件生態(tài)。全世界的開(kāi)發(fā)者都在用CUDA寫(xiě)程序,這使得硬件的壁壘變成了堅(jiān)不可摧的軟件生態(tài)壁壘。但是,如果AI的盡頭不再需要軟件呢?


Taalas的路線意味著,在推理這個(gè)占據(jù)未來(lái)AI算力90%以上份額的市場(chǎng)中,CUDA的護(hù)城河被徹底繞過(guò)了。模型訓(xùn)練依然離不開(kāi)英偉達(dá)的GPU,但在最終落地應(yīng)用的端側(cè)和專(zhuān)業(yè)推理數(shù)據(jù)中心,ASIC專(zhuān)有芯片正在掀起一場(chǎng)“去英偉達(dá)化”的起義。

另外,隨著生成式AI加速進(jìn)入商業(yè)落地,Taalas之外,Groq、Cerebras、Etched等公司也分別在極速響應(yīng)、海量吞吐、特定算法加速方面進(jìn)行著不同的探索,都有可能一點(diǎn)點(diǎn)蠶食推理市場(chǎng),撼動(dòng)曾經(jīng)固若金湯的英偉達(dá)帝國(guó)。

同時(shí),存儲(chǔ)巨頭的狂歡也極可能降溫。目前,HBM芯片是存儲(chǔ)行業(yè)的超級(jí)印鈔機(jī)。但如果模型權(quán)重被內(nèi)化于電路,對(duì)龐大顯存的依賴(lài)將大幅降低。無(wú)存算分離架構(gòu)一旦普及,存儲(chǔ)廠商在 AI 時(shí)代的暴利預(yù)期將被大幅擠壓。

正因如此,Taalas將大模型刻進(jìn)硅片,絕不是AI算力的終點(diǎn),在不遠(yuǎn)的未來(lái),我們也許會(huì)看到算力市場(chǎng)的明顯分化:

云端與訓(xùn)練場(chǎng)依然是英偉達(dá)GPU和通用加速器的天下,用于探索AGI的智力邊界,處理那些最復(fù)雜、最多變的未知任務(wù)。

端側(cè)與流水線則是Taalas這類(lèi)“物理硬化”芯片的汪洋大海,它們?nèi)缟匙影惚阋耍绻馑侔忝艚?,滲透進(jìn)每一個(gè)路燈、每一臺(tái)家電、每一個(gè)工業(yè)機(jī)器人中。

甚至,當(dāng)我們把目光放得更長(zhǎng)遠(yuǎn)一些,當(dāng)量子計(jì)算真正走向?qū)嵱?,或者?lèi)腦計(jì)算實(shí)現(xiàn)突破時(shí),今天我們?yōu)榱送黄岂T·諾依曼架構(gòu)所做的所有努力,可能都會(huì)成為技術(shù)史上一次次充滿(mǎn)勇氣而又略顯笨拙的嘗試。

結(jié)語(yǔ)

從“全能大腦”到“硬件本能”

計(jì)算架構(gòu)的演進(jìn)從來(lái)不是單向的直線,而是螺旋上升的復(fù)調(diào)。從早期的專(zhuān)用打孔機(jī),到通用CPU,到專(zhuān)為圖形處理誕生的GPU,再到如今的AI ASIC,計(jì)算的歷史,就是在“通用靈活性”與“專(zhuān)用極致效率”之間不斷搖擺的過(guò)程。

Taalas的探索,或許在今天看來(lái)略顯激進(jìn),甚至面臨“出廠即落后”的窘境,但它向我們拋出了一個(gè)極具哲學(xué)意味的產(chǎn)業(yè)命題:

AI的終極演化形態(tài)究竟是什么?

它是否必須永遠(yuǎn)保持像水一樣可以隨意重塑的“通用軟件大腦”?

還是說(shuō),就像生物歷經(jīng)億萬(wàn)年進(jìn)化一樣,AI 也會(huì)將其最基礎(chǔ)、最成熟的智能(比如基礎(chǔ)的視覺(jué)識(shí)別、語(yǔ)言邏輯解析),內(nèi)化為無(wú)需思考、極低功耗運(yùn)行的“硅基硬件本能”?


回望科技史,任何偉大的范式轉(zhuǎn)換,往往都在非議與豪賭中誕生。

也許,未來(lái)的 AI 計(jì)算基座并不是非此即彼。云端依然是算力磅礴的通用 GPU 集群,而在萬(wàn)物互聯(lián)的終端,則是無(wú)數(shù)顆被固化了“本能”的低功耗 AI 芯片。

當(dāng)大模型不再是云端的高嶺之花,而是變成像電阻、電容一樣廉價(jià)且隨處可見(jiàn)的電子元器件時(shí),AI 真正的大爆發(fā),才算真的拉開(kāi)大幕。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被滲透?中國(guó)軍工出現(xiàn)內(nèi)鬼,被抓時(shí)人贓并獲,作案全過(guò)程曝光

被滲透?中國(guó)軍工出現(xiàn)內(nèi)鬼,被抓時(shí)人贓并獲,作案全過(guò)程曝光

霽寒飄雪
2026-04-17 09:54:28
爆冷!終結(jié)15連勝,郭士強(qiáng)見(jiàn)證:山東男籃止5連敗,高詩(shī)巖太尷尬

爆冷!終結(jié)15連勝,郭士強(qiáng)見(jiàn)證:山東男籃止5連敗,高詩(shī)巖太尷尬

話(huà)體壇
2026-04-19 22:20:17
旅游路上怎么全是大媽?zhuān)看鬆敹既ツ膬毫??網(wǎng)友分析讓人爆笑到飆淚

旅游路上怎么全是大媽?zhuān)看鬆敹既ツ膬毫??網(wǎng)友分析讓人爆笑到飆淚

西樓知趣雜談
2026-04-18 15:31:29
確認(rèn)不打了!CBA內(nèi)線大殺器被放棄,廣東隊(duì)將撿漏簽下?

確認(rèn)不打了!CBA內(nèi)線大殺器被放棄,廣東隊(duì)將撿漏簽下?

緋雨兒
2026-04-20 09:45:07
鄭麗文之后,洪秀柱也抵達(dá)北京,曾喊:兩岸必須統(tǒng)一,也必然統(tǒng)一

鄭麗文之后,洪秀柱也抵達(dá)北京,曾喊:兩岸必須統(tǒng)一,也必然統(tǒng)一

軒逸阿II
2026-04-20 11:23:05
美伊協(xié)議在即,伊朗人卻自曝:相比轟炸,我們更怕達(dá)成和平!

美伊協(xié)議在即,伊朗人卻自曝:相比轟炸,我們更怕達(dá)成和平!

補(bǔ)懂事的孩紙
2026-04-20 11:27:45
醫(yī)院開(kāi)藥終于不“一刀切”了?醫(yī)保局最新通知來(lái)了

醫(yī)院開(kāi)藥終于不“一刀切”了?醫(yī)保局最新通知來(lái)了

鬼菜生活
2026-04-20 10:18:49
60多歲大爺相親,只要年輕漂亮的,只要夠漂亮,錢(qián)還可以再加!

60多歲大爺相親,只要年輕漂亮的,只要夠漂亮,錢(qián)還可以再加!

哄動(dòng)一時(shí)啊
2026-04-19 11:42:21
繼德國(guó)之后,英國(guó)也開(kāi)始貼出“中文標(biāo)語(yǔ)”?中國(guó)游客:不能夠接受

繼德國(guó)之后,英國(guó)也開(kāi)始貼出“中文標(biāo)語(yǔ)”?中國(guó)游客:不能夠接受

潮鹿逐夢(mèng)
2026-04-02 12:31:48
29分鐘大定破萬(wàn) 極氪8X為什么這么多人買(mǎi)?

29分鐘大定破萬(wàn) 極氪8X為什么這么多人買(mǎi)?

正在說(shuō)車(chē)
2026-04-19 07:29:06
1947華野一夜暴富,粟裕看戰(zhàn)場(chǎng)繳獲當(dāng)場(chǎng)驚呆

1947華野一夜暴富,粟裕看戰(zhàn)場(chǎng)繳獲當(dāng)場(chǎng)驚呆

瘋狂的小歷史
2026-04-20 11:39:25
性?xún)r(jià)比高!曼聯(lián)左后衛(wèi)補(bǔ)強(qiáng)首選浮現(xiàn),僅1400萬(wàn),實(shí)力堪比豪門(mén)標(biāo)王

性?xún)r(jià)比高!曼聯(lián)左后衛(wèi)補(bǔ)強(qiáng)首選浮現(xiàn),僅1400萬(wàn),實(shí)力堪比豪門(mén)標(biāo)王

體壇鑒春秋
2026-04-20 12:00:51
迎來(lái)復(fù)興曙光 全新奔馳S級(jí)轎跑車(chē)假想圖曝光

迎來(lái)復(fù)興曙光 全新奔馳S級(jí)轎跑車(chē)假想圖曝光

車(chē)質(zhì)網(wǎng)
2026-04-20 09:11:48
官方:前國(guó)腳彭偉國(guó)正式出任廣西恒宸足球俱樂(lè)部總經(jīng)理

官方:前國(guó)腳彭偉國(guó)正式出任廣西恒宸足球俱樂(lè)部總經(jīng)理

懂球帝
2026-04-20 11:20:05
馬刺輕取開(kāi)拓者1-0 文班35分 楊瀚森登場(chǎng) 阿夫迪亞28+10

馬刺輕取開(kāi)拓者1-0 文班35分 楊瀚森登場(chǎng) 阿夫迪亞28+10

硯底沉香
2026-04-20 11:51:05
大事不妙,特朗普癡呆已晚期?對(duì)伊朗開(kāi)戰(zhàn),是內(nèi)塔尼亞胡的圈套

大事不妙,特朗普癡呆已晚期?對(duì)伊朗開(kāi)戰(zhàn),是內(nèi)塔尼亞胡的圈套

車(chē)窗起霧q
2026-04-20 11:27:03
麥當(dāng)勞變 "老字號(hào)粵菜館",廣州牡丹樓開(kāi)業(yè)半天就被拆

麥當(dāng)勞變 "老字號(hào)粵菜館",廣州牡丹樓開(kāi)業(yè)半天就被拆

極目新聞
2026-04-19 22:48:07
你做初一,我做十五!日艦過(guò)航臺(tái)海三天后,052D沖向橫當(dāng)水道

你做初一,我做十五!日艦過(guò)航臺(tái)海三天后,052D沖向橫當(dāng)水道

看過(guò)人間的月色
2026-04-20 10:07:32
7歲沈騰攜妻聚餐!王琦近照曝光引熱議:沈騰這是偷偷給老婆“投喂”了多少?

7歲沈騰攜妻聚餐!王琦近照曝光引熱議:沈騰這是偷偷給老婆“投喂”了多少?

今古深日?qǐng)?bào)
2026-04-20 10:12:42
男女之間:你故意觸碰一下女人,她要有這2個(gè)反應(yīng),說(shuō)明心里有你

男女之間:你故意觸碰一下女人,她要有這2個(gè)反應(yīng),說(shuō)明心里有你

新時(shí)代的兩性情感
2026-04-20 11:18:16
2026-04-20 12:39:00
翼言商業(yè)觀察 incentive-icons
翼言商業(yè)觀察
新科技,新產(chǎn)業(yè),新消費(fèi)。
110文章數(shù) 3關(guān)注度
往期回顧 全部

科技要聞

藍(lán)色起源一級(jí)火箭完美回收 客戶(hù)衛(wèi)星未入軌

頭條要聞

媒體:伊朗剛說(shuō)不談 美國(guó)立即開(kāi)打

頭條要聞

媒體:伊朗剛說(shuō)不談 美國(guó)立即開(kāi)打

體育要聞

七大獎(jiǎng)項(xiàng)候選官宣!文班或全票DPOY

娛樂(lè)要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財(cái)經(jīng)要聞

月之暗面IPO迷局

汽車(chē)要聞

把天門(mén)山搬進(jìn)廠?開(kāi)仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
數(shù)碼
游戲
公開(kāi)課

藝術(shù)要聞

王羲之《換鵝帖》尚在人間,驚艷無(wú)比!

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘?,突然殺入神秘房企!

數(shù)碼要聞

華為全新鴻蒙電腦搭載云晰柔光屏,硬件級(jí)低藍(lán)光,今日下午發(fā)布

異世界自動(dòng)化模擬經(jīng)營(yíng)游戲《退休勇者當(dāng)廠長(zhǎng)》現(xiàn)已正式上架Steam

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版