国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

“邪修”AI芯片的Taalas,成色如何?|AGI焦點(diǎn)

0
分享至


圖片來自Taalas官網(wǎng)

打著“顛覆英偉達(dá)”的旗號(hào)的公司,總是會(huì)接二連三涌現(xiàn)。

最近,一家來自加拿大多倫多的芯片“小廠”Taalas引起了AI圈關(guān)注。有聲音認(rèn)為,它很可能撬動(dòng)英偉達(dá)主宰了多年的AI芯片市場(chǎng)。

當(dāng)?shù)貢r(shí)間2月20日,成立于2023年的初創(chuàng)公司Taalas發(fā)布了首款產(chǎn)品Taalas HC1芯片,專為L(zhǎng)lama 3.1 8B模型優(yōu)化,采用30芯片集群時(shí)實(shí)現(xiàn)每秒12000 tokens的推理速度,較傳統(tǒng)GPU方案提升50倍能效。

Taalas稱,公司通過結(jié)構(gòu)化ASIC技術(shù)將芯片定制周期縮短至兩個(gè)月,已累計(jì)融資2.19億美元。24名敬業(yè)的員工的努力,投入3000萬美元,打造出了這款擁有“極致的專業(yè)化、速度和能源效率”的產(chǎn)品。

Taalas創(chuàng)始人兼CEO是曾任AMD架構(gòu)師的業(yè)界傳奇人物柳比沙·巴伊奇(Ljubi?a Baji?)。

在公司官網(wǎng)的介紹文章中,巴伊奇稱,這款芯片選擇了Meta公司2024年7月推出的開源大模型Llama 3.1 8B作為運(yùn)行平臺(tái),峰值推理速度接近17000 tokens/秒,比目前市場(chǎng)中最先進(jìn)的技術(shù)快近10倍,構(gòu)建成本降低到原來的1/20,功耗降低至原來的1/10。


截圖來自社交平臺(tái)X

巴伊奇給出了一組測(cè)試數(shù)據(jù),Taalas自己在Llama 3.1 8B上測(cè)試了英偉達(dá)的主力產(chǎn)品H200和B200,結(jié)果為230 tokens/秒和353 tokens/秒,而Taalas的HC1性能是它們的48倍。

此前這一數(shù)據(jù),是由獨(dú)立分析平臺(tái)Artificial Analysis測(cè)出的最高值,來自剛剛完成H輪融資、估值230億美元的Cerebras,為1981 tokens/秒,也僅為HC1的11%。

在實(shí)測(cè)演示中,大模型對(duì)用戶問題的詳細(xì)解答,達(dá)到甚至超越了“秒回”的水平。

不過,AI在大量回復(fù)的一瞬間,人類對(duì)話者也產(chǎn)生了撲面而來的壓迫感。


圖片來自Taalas官網(wǎng)

這一堪稱“突破極限”的表現(xiàn),果不其然引起了大量的討論。大呼“顛覆將至”者有之,質(zhì)疑其言過其實(shí)、過度營(yíng)銷者亦有之。

令我們好奇的是,在喧囂背后,Taalas的技術(shù)和產(chǎn)品究竟有何特殊之處?又是否當(dāng)?shù)闷鹌渥苑Q的“世界上速度最快、成本和功耗最低的推理平臺(tái)”呢?

將模型直接“刻”在芯片上

在研究了其首款產(chǎn)品HC1的相關(guān)公開信息之后,我們發(fā)現(xiàn),Taalas的技術(shù)路線,與目前市場(chǎng)主流的ASIC路線相比,極具顛覆性,堪稱“邪修版”ASIC。

與英偉達(dá)和AMD代表的業(yè)界主流GPU通用計(jì)算技術(shù)路線不同,Taalas更接近ASIC(專用集成電路)路線。

這一技術(shù)路線通過為特定應(yīng)用場(chǎng)景定制硬件設(shè)計(jì),以追求極致能效和成本效益。雖然它的適用性、功能豐富度、可互換性,遠(yuǎn)低于能覆蓋多場(chǎng)景的GPU,但自去年以來,以谷歌TPU為首,ASIC技術(shù)擁有成本(TCO)低、打造大模型能力毫不遜色等特點(diǎn),得到了市場(chǎng)認(rèn)可,出貨量大幅提升。

野村證券預(yù)測(cè),2026年,ASIC芯片的總出貨量可能會(huì)首次超過GPU。而在GPU市場(chǎng)處于兩巨頭壟斷的情況下,大多數(shù)芯片初創(chuàng)也都選擇了ASIC路線,包括市場(chǎng)知名度較高的Cerebras、SambaNova,以及,此前剛剛被英偉達(dá)將核心團(tuán)隊(duì)納入囊中的Groq。

巴伊奇在AMD和英偉達(dá)都有任職經(jīng)歷,之前還創(chuàng)立了一家專注于AI芯片研發(fā)的獨(dú)角獸Tenstorrent公司。Tenstorrent通過開源RISC-V架構(gòu)和軟硬件協(xié)同設(shè)計(jì),降低AI計(jì)算成本。

而“挑戰(zhàn)英偉達(dá)壟斷地位”,一直是巴伊奇所宣揚(yáng)的核心理念,也是Tenstorrent公司備受關(guān)注的“招牌”標(biāo)簽。

不過,英偉達(dá)的發(fā)展,要遠(yuǎn)好于AMD及各類AI芯片初創(chuàng)公司,巴伊奇也在探索中有了更“極端”的設(shè)想。

2022年至2023年間,巴伊奇逐漸脫離了此前工作,開始籌劃創(chuàng)辦Taalas。他與他的妻子、曾在AMD任系統(tǒng)工程高級(jí)經(jīng)理萊拉·巴伊奇(Lejla Bajic),以及,曾任AMD高級(jí)設(shè)計(jì)工程師并在Tenstorrent擔(dān)任過ASIC設(shè)計(jì)總監(jiān)的德拉貢·伊格納托維奇(Drago Ignjatovic)成為了Taalas聯(lián)合創(chuàng)始人。

Taalas公司20余人的核心工程師團(tuán)隊(duì),多數(shù)來自AMD、蘋果、谷歌、英偉達(dá)和TensorRent。

2024年,Taalas公司完成5000萬美元的首輪融資,并正式出現(xiàn)在公眾視野。

巴伊奇強(qiáng)調(diào),Taalas致力于解決AI發(fā)展面臨的兩大障礙——“高延遲”和“天文數(shù)字般的算力成本”,并提出“單芯片性能超越小型GPU數(shù)據(jù)中心”這一極具野心,甚至顯得有些“狂妄”的目標(biāo)。

資本市場(chǎng)為巴伊奇的野心投票。截至目前,Taalas目前已完成三輪融資,總額超過2億美元。

Taalas奉行“The Model is The Computer”(這句話也是公司的slogan),可以理解為,將傳統(tǒng)“在計(jì)算設(shè)備上運(yùn)行模型”的范式,轉(zhuǎn)變?yōu)椤澳P捅旧沓蔀橛?jì)算設(shè)備”。

技術(shù)實(shí)現(xiàn)路徑上,Taalas提出“無需軟件,直接將模型刻在芯片上”,這與傳統(tǒng)的ASIC芯片仍需使用軟件,通過編譯過程將軟件代碼轉(zhuǎn)化為芯片指令不同。

Taalas通過EDA(電子設(shè)計(jì)自動(dòng)化)流程,將特定大模型直接轉(zhuǎn)化為定制芯片。

也就是說,每款使用Taalas的大模型,都會(huì)擁有專屬于自身的定制芯片,實(shí)現(xiàn)巴伊奇所說的“完全專業(yè)化”(Total specialization)。

與此同時(shí),算力也擺脫了軟件束縛和編譯過程,數(shù)據(jù)幾乎不需要在內(nèi)存和計(jì)算單元之間移動(dòng),“內(nèi)存墻”由此消失,推理成本隨之大幅降低,推理速度則顯著提升。


截圖來自社交平臺(tái)X

目前來看,Taalas的主要業(yè)務(wù)操作流程也比較簡(jiǎn)單。大致是客戶向Taalas提供自身所需的模型,Taalas在一周內(nèi)將其轉(zhuǎn)化為電路設(shè)計(jì),通過臺(tái)積電代工在兩個(gè)月內(nèi)交付專屬芯片。

可想而知,如果Taalas能為每個(gè)主流模型,都提供出類似HC1在Llama 3.1 8B上那樣的性能飛躍,那么,各大廠商很可能會(huì)對(duì)其產(chǎn)品趨之若鶩。

實(shí)際上,包括獨(dú)立人工智能研究員本杰明·馬里(Benjamin Marie)、Devtools創(chuàng)業(yè)顧問肖恩·王(swyx)等產(chǎn)業(yè)界人士和The Next Platform記者蒂莫西·普里克特·摩根(Timothy Prickett Morgan)等媒體人士,都已在積極介紹Taalas的新產(chǎn)品,看好其前景者不在少數(shù)。

Taalas的死穴在哪?

不過,在輿論熱度落地到商用市場(chǎng)之前,Taalas還有很多問題需要被看到。

首先,Taalas需要面對(duì)的是,其產(chǎn)品能否適用更先進(jìn)、大規(guī)模的模型。

2024年,Meta推出Llama 3.1時(shí),發(fā)布了8B、70B和405B三種參數(shù)規(guī)模版本,Taalas選用的是最小的8B。

很顯然,在目前大模型進(jìn)化速度極快、規(guī)模越來越大的背景下,Taalas的產(chǎn)品能否匹配,是否面臨明顯“天花板”,都是必須解決的問題。

巴伊奇稱,公司將在今年春季推出一款適用中等規(guī)模推理模型的產(chǎn)品,屆時(shí)表現(xiàn)如何,值得關(guān)注。

與此相關(guān)的,目前測(cè)評(píng)體驗(yàn)中,不少質(zhì)疑聲音集中在,Taalas讓本已不算聰明的Llama變得“更笨了”。

一些用戶發(fā)帖稱,HC1“幻覺嚴(yán)重”“答案明顯錯(cuò)誤,質(zhì)量遠(yuǎn)低于同參數(shù)GPU版”,“回答速度快但錯(cuò)得也快”,其實(shí)用性不佳。


截圖來自社交平臺(tái)X

實(shí)際上,對(duì)于如何理解Taalas給出的測(cè)試數(shù)據(jù),也有較多質(zhì)疑聲音。

一位關(guān)注芯片產(chǎn)業(yè)的愛好者對(duì)作者表示,Taalas相當(dāng)于內(nèi)置了問題的答案,所以,計(jì)算速度“秒殺”英偉達(dá)等一眾業(yè)界翹楚,但是,將”1+1=2”的問題換為“2*2=?”,它的表現(xiàn)可能就會(huì)“掉鏈子”。

Taalas能在極其有限的特定場(chǎng)景下“秒殺英偉達(dá)”,但目前其他英偉達(dá)能做的事,對(duì)于Taalas來說可能更難。

更為關(guān)鍵的問題是,Taalas能否跟得上大模型的迭代周期。

一位半導(dǎo)體行業(yè)從業(yè)者對(duì)作者表示,Taalas的芯片“表現(xiàn)很牛,但目前可能沒啥大的用處”,因?yàn)榇竽P瓦€在不停迭代,而Taalas的迭代能力和速度成疑。

該行業(yè)人士認(rèn)為,“要等以后大模型達(dá)到某個(gè)層級(jí)不再大規(guī)模、快速迭代了,這種芯片才能有更大舞臺(tái)”。

而在社交平臺(tái)上的討論中,不少質(zhì)疑集中在HC1“模型鎖定”的“只讀”模式導(dǎo)致的“過時(shí)”和“廢棄”風(fēng)險(xiǎn),并認(rèn)為這是其商業(yè)化、規(guī)模化的重大阻礙。

目前,一款頂尖大模型能保持領(lǐng)先優(yōu)勢(shì)的時(shí)間窗口不過月余,而Taalas交付芯片(而非量產(chǎn))即使已經(jīng)很快,但也需要至少兩個(gè)月。

改寫AI芯片規(guī)則的未來已來

支持HC1進(jìn)步性的聲音也不在少數(shù)。

在知乎的相關(guān)討論中,中國(guó)科學(xué)院計(jì)算技術(shù)研究所副研究員趙永威指出,雖然Taalas“目前的狀況還沒有應(yīng)用價(jià)值”,但不妨礙它會(huì)成為“一顆有歷史意義的芯片”。

他認(rèn)為,這種“硬連線”的模式,是未來芯片發(fā)展的一大趨勢(shì),目前的質(zhì)疑由Taalas來扛,后來者在推廣相關(guān)概念時(shí)就會(huì)更加輕松。他也透露,自己所在單位也在研究類似技術(shù)路線,并提到,降低經(jīng)濟(jì)成本,既是相關(guān)路線的研究目標(biāo),也應(yīng)該是宣傳發(fā)力點(diǎn)所在。

知名科技記者蒂莫西·普里克特·摩根(Timothy Prickett Morgan)在文章中提到,Taalas確實(shí)需要模型的每一次更新中重新設(shè)計(jì)芯片,但其在推理引擎上蝕刻新模型,只需要更改設(shè)計(jì)中的兩層金屬,而不是完全廢棄??紤]到訓(xùn)練模型的成本高達(dá)數(shù)十億美元,Taalas芯片的更新成本微不足道。

摩根認(rèn)為,在主要模型發(fā)布間隔時(shí)間延長(zhǎng),人們對(duì)成熟模型依賴度增加時(shí),Taalas芯片有望贏得更廣泛的市場(chǎng)認(rèn)可。

也有一些分析稱,得益于低延遲、低功耗的特性,Taalas真正的用武之地或在于邊緣推理場(chǎng)景,比如,機(jī)器人、自動(dòng)駕駛汽車,甚至高端智能手機(jī)等設(shè)備中。這些設(shè)備不需要運(yùn)行所有模型,只需要穩(wěn)定運(yùn)行定制化的模型,而更快的速度和更低的消耗,顯然更有利于產(chǎn)業(yè)普及AI大模型。

不過,即便是相關(guān)產(chǎn)品能真正規(guī)模化地進(jìn)入市場(chǎng)并大展拳腳,新的狀況和問題也會(huì)隨之浮現(xiàn)。

比如,大模型的底層架構(gòu)(Transformer)是否會(huì)遭遇另一場(chǎng)“革命”?這似乎決定著“模型即芯片”技術(shù)路線的命運(yùn)。還有,生態(tài)系統(tǒng)建設(shè)的問題,英偉達(dá)雖然是硬件公司,但CUDA軟件生態(tài)和開發(fā)者的重度依賴,才是其真正的護(hù)城河,而這也是Taalas看中且有意顛覆的。

但這些都是后話了,至少目前來看,Taalas距離英偉達(dá)還很遙遠(yuǎn),更遑論“顛覆英偉達(dá)”了。然而,巴伊奇在這條路上依舊步履不停,Taalas宣布,計(jì)劃在今年冬季推出第二代HC2產(chǎn)品,將具備更快的執(zhí)行速度和更強(qiáng)的性能。

屆時(shí),一代產(chǎn)品的市場(chǎng)反饋和二代產(chǎn)品的迭代效果,將進(jìn)一步驗(yàn)證今天各方對(duì)這股橫空出世的新勢(shì)力的判斷。(作者|胡珈萌,編輯|李程程)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廣東簽第5外援!比薩林杰要強(qiáng),CBA官宣裁2外援,山東小外援2選1

廣東簽第5外援!比薩林杰要強(qiáng),CBA官宣裁2外援,山東小外援2選1

老吳說體育
2026-02-26 00:03:25
皮耶羅:尤文需保持住今晚展現(xiàn)出的戰(zhàn)斗精神;后防線仍不穩(wěn)定

皮耶羅:尤文需保持住今晚展現(xiàn)出的戰(zhàn)斗精神;后防線仍不穩(wěn)定

懂球帝
2026-02-26 08:53:05
1972年,何香凝臨終懇求不火化遺體,周恩來含淚答應(yīng):不燒,不燒

1972年,何香凝臨終懇求不火化遺體,周恩來含淚答應(yīng):不燒,不燒

大運(yùn)河時(shí)空
2026-02-25 09:05:03
年薪比索博還高!利物浦這尊 “高薪水貨”,今夏必須套現(xiàn)

年薪比索博還高!利物浦這尊 “高薪水貨”,今夏必須套現(xiàn)

瀾歸序
2026-02-26 06:38:50
最可惜的十位革命先烈,每一位都足以改變歷史

最可惜的十位革命先烈,每一位都足以改變歷史

【歷史客棧】
2026-02-25 10:00:31
遼寧錦州“康華醫(yī)院”安樂死膠囊30秒離世?當(dāng)?shù)乇僦{

遼寧錦州“康華醫(yī)院”安樂死膠囊30秒離世?當(dāng)?shù)乇僦{

極目新聞
2026-02-25 12:38:58
打臉了?2015年專家預(yù)測(cè):一旦開放二胎,中國(guó)新生人口將會(huì)激增

打臉了?2015年專家預(yù)測(cè):一旦開放二胎,中國(guó)新生人口將會(huì)激增

知鑒明史
2025-10-04 18:55:52
朝鮮不為人知的5條規(guī)定,若不遵守后果嚴(yán)重,女性朋友千萬要注意

朝鮮不為人知的5條規(guī)定,若不遵守后果嚴(yán)重,女性朋友千萬要注意

番外行
2026-02-25 19:58:08
2.26股市早8點(diǎn)丨尋找馬年能翻10倍的牛股

2.26股市早8點(diǎn)丨尋找馬年能翻10倍的牛股

沙黽農(nóng)
2026-02-26 06:27:49
美訪華確定24小時(shí)內(nèi)王牌失效,英媒:中國(guó)發(fā)現(xiàn)美弱點(diǎn)

美訪華確定24小時(shí)內(nèi)王牌失效,英媒:中國(guó)發(fā)現(xiàn)美弱點(diǎn)

瓦倫西亞月亮
2026-02-26 06:53:05
“考研出分”沖上熱搜第一!官網(wǎng)披露,引關(guān)注……

“考研出分”沖上熱搜第一!官網(wǎng)披露,引關(guān)注……

環(huán)球網(wǎng)資訊
2026-02-24 14:53:15
重慶烤全羊宰客后續(xù)!央視發(fā)聲,老板“底褲”被扒,結(jié)局大快人心

重慶烤全羊宰客后續(xù)!央視發(fā)聲,老板“底褲”被扒,結(jié)局大快人心

角落的隱藏美景
2026-02-25 14:18:50
美菲軍演突發(fā)意外

美菲軍演突發(fā)意外

陸棄
2026-02-26 08:30:03
默茨訪華全程無閑筆,對(duì)比英國(guó)首相的熱鬧,德式務(wù)實(shí)藏著求生欲

默茨訪華全程無閑筆,對(duì)比英國(guó)首相的熱鬧,德式務(wù)實(shí)藏著求生欲

娛樂小可愛蛙
2026-02-26 07:32:59
Anthropic一條推文,引發(fā)了全球AI圈同仇敵愾的群嘲。

Anthropic一條推文,引發(fā)了全球AI圈同仇敵愾的群嘲。

數(shù)字生命卡茲克
2026-02-25 10:39:57
斯諾克威爾士公開賽:趙心童&張安達(dá)&周躍龍&吳宜澤均晉級(jí)16強(qiáng)

斯諾克威爾士公開賽:趙心童&張安達(dá)&周躍龍&吳宜澤均晉級(jí)16強(qiáng)

懂球帝
2026-02-26 07:48:09
陳天龍接受審查調(diào)查

陳天龍接受審查調(diào)查

吉刻新聞
2026-02-25 09:23:20
利好突襲,全線上漲!英偉達(dá),最新公布!

利好突襲,全線上漲!英偉達(dá),最新公布!

證券時(shí)報(bào)e公司
2026-02-26 07:58:59
一場(chǎng)高速堵車,戳穿了3700萬新能源車主“謊言”,差距一目了然

一場(chǎng)高速堵車,戳穿了3700萬新能源車主“謊言”,差距一目了然

芭比衣櫥
2026-02-24 09:41:49
阿爾茨海默病者逐漸增多,醫(yī)生提醒:55歲后,盡量改掉6個(gè)壞習(xí)慣

阿爾茨海默病者逐漸增多,醫(yī)生提醒:55歲后,盡量改掉6個(gè)壞習(xí)慣

39健康網(wǎng)
2026-02-17 18:31:37
2026-02-26 09:11:00
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
129847文章數(shù) 861815關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

中方對(duì)日方出口管制措施落地后 高市早苗表態(tài)了

頭條要聞

中方對(duì)日方出口管制措施落地后 高市早苗表態(tài)了

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

短劇市場(chǎng)風(fēng)云突變!有人投百萬賠得精光

汽車要聞

750km超長(zhǎng)續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

數(shù)碼
游戲
健康
教育
公開課

數(shù)碼要聞

Steam客戶端獲Beta測(cè)試版更新,改善硬件調(diào)查對(duì)多顯卡系統(tǒng)識(shí)別

《FF7重制版》NS2版克勞德頭發(fā)有鋸齒 官方回應(yīng)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

最后2天!2026山東單招綜招志愿填報(bào)操作手冊(cè)來了!最低錄取分僅15分!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版