国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

1000 倍效率神話,Taalas如何用 “模型即芯片” 暴打英偉達(dá)

0
分享至

文 | 山自

2026年2月,AI 算力行業(yè)的平靜被一家加拿大初創(chuàng)公司徹底打破。

由前 AMD、英偉達(dá)架構(gòu)師柳比薩?巴伊奇(Ljubisa Bajic)創(chuàng)立的 Taalas,帶著其 “Model Based” 芯片架構(gòu)與累計(jì)超 2.19 億美元的融資浮出水面。這家公司喊出了 “將 AI 模型效率提升 1000 倍” 的激進(jìn)口號(hào),宣稱其首款產(chǎn)品 HC1 能以 17,000 Token / 秒的推理速度,將 Llama 3.1 8B 模型的推理成本降至 0.75 美分 / 百萬 token—— 這一數(shù)字是傳統(tǒng) GPU 云服務(wù)的 1/266。


在英偉達(dá)通過 200 億美元推理技術(shù)許可協(xié)議 “收編” Groq、全行業(yè)陷入通用算力內(nèi)卷的當(dāng)下,Taalas 的 “硬核模型” 路線不僅是對(duì)摩爾定律的重新詮釋,更預(yù)示著 AI 算力市場(chǎng)正從 “通用主導(dǎo)” 走向 “通用與專用并存” 的分裂格局。本文將深度解析 Taalas 的技術(shù)革命、商業(yè)化困境,以及這場(chǎng)架構(gòu)之爭(zhēng)對(duì)全球 AI 產(chǎn)業(yè)的長(zhǎng)遠(yuǎn)影響。

一場(chǎng)“反通用” 豪賭正秘密進(jìn)行

Taalas 的誕生,源于巴伊奇對(duì) AI 算力現(xiàn)狀的深刻不滿。這位曾主導(dǎo) Tenstorrent 可擴(kuò)展 AI 加速器研發(fā)的芯片老兵,在 2023 年 3 月離開 Tenstorrent 后,與工程師 Drago Ignjatovic、Lejla Bajic 共同創(chuàng)立了 Taalas,核心使命是 “將人工智能商品化”。

“人工智能就像電力一樣 —— 這是一種不可或缺的必需品,必須向所有人提供! 巴伊奇在公司亮相時(shí)表示,“將人工智能商品化需要對(duì)計(jì)算能力和效率進(jìn)行 1000 倍的提升,而這一目標(biāo)通過當(dāng)前漸進(jìn)式的手段是無法實(shí)現(xiàn)的!

這種 “非漸進(jìn)式” 的思路,讓 Taalas 從一開始就走上了與英偉達(dá)對(duì)立的道路。公司在 2023 年 8 月至 2024 年 3 月間完成兩輪融資,首輪 5000 萬美元由皮埃爾?拉蒙德和 Quiet Capital 牽頭,后續(xù)融資使其總估值達(dá)到 2.19 億美元。值得注意的是,投資人皮埃爾?拉蒙德對(duì)團(tuán)隊(duì)的評(píng)價(jià)極為直接:“他們做芯片的經(jīng)驗(yàn)業(yè)內(nèi)頂級(jí),這個(gè)方向能實(shí)現(xiàn) 1000 倍的成本改善,推動(dòng) AI 成為基礎(chǔ)設(shè)施級(jí)能力。”

Taalas 的研發(fā)效率同樣令人驚嘆。這款被命名為 HC1 的首款產(chǎn)品,由 24 人團(tuán)隊(duì)僅用 3000 萬美元研發(fā)成本就完成設(shè)計(jì),并與臺(tái)積電達(dá)成合作,實(shí)現(xiàn)了 “2 個(gè)月從模型權(quán)重到可部署硬件” 的極速生產(chǎn)周期。按照原計(jì)劃,HC1 應(yīng)在 2025 年第一季度向客戶供貨,而最新消息顯示,這款芯片已進(jìn)入技術(shù)驗(yàn)證階段,其極端的性能表現(xiàn)正在重塑行業(yè)對(duì)推理算力的認(rèn)知。

Model Based 架構(gòu):把大模型 “寫死” 在硅片上

Taalas 的 1000 倍效率神話,并非來自玄學(xué)突破,而是源于對(duì)傳統(tǒng) AI 芯片架構(gòu)的徹底重構(gòu)。與通用 GPU“內(nèi)存加載模型、軟件調(diào)度運(yùn)行” 的模式不同,Taalas 采用了 “Model Based” 架構(gòu),將特定大模型的訓(xùn)練結(jié)果直接固化在晶體管層面,實(shí)現(xiàn)物理意義上的 “硬核模型”。


傳統(tǒng) GPU 為了兼容多模型、多任務(wù),預(yù)留了大量運(yùn)算單元與調(diào)度邏輯,導(dǎo)致硬件冗余度極高。而 Taalas 的架構(gòu)創(chuàng)新,本質(zhì)上是一場(chǎng) “效率與靈活性的極致取舍”:

1、硬件固化權(quán)重

采用 mask ROM recall fabric + SRAM 架構(gòu),將 Llama 3.1 8B 等模型的權(quán)重直接寫入硬件,徹底繞開了高帶寬內(nèi)存(HBM)這一成本與功耗瓶頸。這種 “硬連線” 設(shè)計(jì)讓模型推理不再依賴外部?jī)?nèi)存讀寫,從根本上降低了延遲與能耗。

2、單模型專用設(shè)計(jì)

每塊 HC1 芯片僅支持單一模型,通過犧牲靈活性換取極致性能。在實(shí)測(cè)中,其推理速度達(dá)到 17,000 Token / 秒,是英偉達(dá) H200 GPU(230 Token / 秒)的 50 倍,遠(yuǎn)超 Cerebras WSE(2,000 Token / 秒)等專用加速器。

3、成本與功耗優(yōu)化

得益于架構(gòu)簡(jiǎn)化,HC1 的硬件成本比傳統(tǒng)方案降低 20 倍,功耗減少 10 倍。對(duì)于數(shù)據(jù)中心而言,這意味著 “以 10% 功耗運(yùn)行同等規(guī)模模型”,將徹底改寫 AI 投資回報(bào)曲線。

中國(guó)科學(xué)院計(jì)算技術(shù)研究所副研究員趙永威對(duì)這一技術(shù)路線給予了高度評(píng)價(jià):“雖然 Taalas 目前的狀況還沒有應(yīng)用價(jià)值,但不妨礙它會(huì)成為一顆有歷史意義的芯片。這種硬連線模式是未來芯片發(fā)展的一大趨勢(shì),目前的質(zhì)疑由 Taalas 來扛,后來者在推廣相關(guān)概念時(shí)會(huì)更加輕松!

極致的速度背后,是初代產(chǎn)品難以回避的短板。在實(shí)際測(cè)試中,HC1 雖然能實(shí)現(xiàn) “2000 字回復(fù)秒出” 的驚人表現(xiàn),但回復(fù)質(zhì)量卻存在明顯缺陷 —— 不僅簡(jiǎn)單運(yùn)算會(huì)出現(xiàn)錯(cuò)誤,復(fù)雜問題下還會(huì)出現(xiàn) “胡編亂造” 的情況。

這一問題的核心原因,在于 HC1 初代產(chǎn)品采用的定點(diǎn)數(shù)格式無法滿足復(fù)雜推理的精度需求。為了對(duì)沖這一風(fēng)險(xiǎn),Taalas 已明確規(guī)劃第二代產(chǎn)品 HC2,將改用標(biāo)準(zhǔn) 4-bit 浮點(diǎn)格式改善精度問題,同時(shí)將模型支持規(guī)模提升至 200 億參數(shù),計(jì)劃在 2026 年底前覆蓋 GPT-5 級(jí)別系統(tǒng)。

“感覺像作弊一樣快!盉asecamp 創(chuàng)始人 DHH 的試用評(píng)價(jià),精準(zhǔn)概括了 HC1 的用戶體驗(yàn)。而 Cambrian-AI 首席分析師 Karl Freund 則用 “insane(瘋狂)” 來形容其性能表現(xiàn)。這種 “速度與精度的矛盾”,也成為 Taalas 商業(yè)化落地的核心挑戰(zhàn)。

“一模型一芯片” 的生存邏輯

在巴伊奇的設(shè)想中,Taalas 并非要取代英偉達(dá) GPU,而是要填補(bǔ) “通用算力與極致效率之間的市場(chǎng)空白”。目前,公司已探索出三條商業(yè)化路徑:自建 API、直接出售芯片、與模型開發(fā)者合作定制芯片,其核心邏輯是 “鎖定高粘性垂直場(chǎng)景”,推動(dòng) “一模型一芯片” 的定制化趨勢(shì)。

Taalas 的產(chǎn)品定位,精準(zhǔn)命中了三類對(duì)延遲敏感、模型版本穩(wěn)定的應(yīng)用場(chǎng)景:

  • 企業(yè)專用模型場(chǎng)景

金融、醫(yī)療、法律等行業(yè)的企業(yè),往往長(zhǎng)期使用固定版本的私有化模型。對(duì)于這類客戶,HC1 的成本優(yōu)勢(shì)極為明顯 —— 推理成本降至傳統(tǒng)方案的 1/266,足以讓許多此前不可行的 AI 應(yīng)用變得具備商業(yè)價(jià)值。

  • 邊緣推理場(chǎng)景

人形機(jī)器人、自動(dòng)駕駛汽車、高端智能手機(jī)等設(shè)備,對(duì)實(shí)時(shí)性要求極高,且無需運(yùn)行多模型。

  • 大規(guī)模客服場(chǎng)景

電商、運(yùn)營(yíng)商的智能客服系統(tǒng),常年運(yùn)行標(biāo)準(zhǔn)化對(duì)話模型,對(duì)響應(yīng)速度的要求遠(yuǎn)高于復(fù)雜推理能力。HC1 的 “秒級(jí)響應(yīng)” 能顯著提升用戶體驗(yàn),同時(shí)將運(yùn)營(yíng)成本削減 90% 以上。

Taalas 產(chǎn)品副總裁 Paresh Kharya 明確表示:“為模型定制的最優(yōu)硅片不會(huì)取代滿是 GPU 的大型數(shù)據(jù)中心,但它會(huì)適配特定的應(yīng)用場(chǎng)景! 這種 “互補(bǔ)而非替代” 的定位,為 Taalas 在英偉達(dá)的陰影下找到了生存空間。

盡管場(chǎng)景定位清晰,但 Taalas 的商業(yè)模式仍面臨兩大核心不確定性:

首先是模型迭代風(fēng)險(xiǎn)!耙荒P鸵恍酒 的模式,意味著客戶必須對(duì)特定模型做出長(zhǎng)期承諾。在大模型架構(gòu)快速演進(jìn)的當(dāng)下,一旦行業(yè)轉(zhuǎn)向全新架構(gòu)(如超越 Transformer 的革命性設(shè)計(jì)),現(xiàn)有專用硬件將快速貶值。Taalas 的應(yīng)對(duì)策略,是押注 Llama 等開源架構(gòu)的長(zhǎng)期主導(dǎo)地位,同時(shí)通過 LoRA 微調(diào)技術(shù)優(yōu)化芯片固化模型的適應(yīng)性。

其次是生態(tài)系統(tǒng)短板。英偉達(dá)的真正護(hù)城河并非硬件,而是 CUDA 軟件生態(tài)和開發(fā)者的重度依賴。相比之下,Taalas 的專用芯片缺乏配套的開發(fā)工具鏈,開發(fā)者需要重新適配,這無疑提高了客戶的遷移成本。如何在短時(shí)間內(nèi)構(gòu)建起自己的生態(tài),成為 Taalas 能否規(guī);涞氐年P(guān)鍵。

Taalas 的崛起,并非孤立的行業(yè)現(xiàn)象。2025 年底,英偉達(dá)以 200 億美元的價(jià)格與 Groq 達(dá)成推理技術(shù)許可協(xié)議,這一交易被業(yè)內(nèi)視為 “通用算力巨頭向?qū)S猛评碣惖劳讌f(xié)” 的信號(hào)。

作為谷歌 TPU 核心開發(fā)者 Jonathan Ross 創(chuàng)立的公司,Groq 的 LPU 推理芯片同樣采用專用架構(gòu),憑借確定性設(shè)計(jì)和片上 SRAM 內(nèi)存實(shí)現(xiàn)了超低延遲。英偉達(dá)通過 “非獨(dú)占技術(shù)許可 + 核心人才吸納” 的方式,快速補(bǔ)全推理短板,同時(shí)降低收購(gòu)風(fēng)險(xiǎn)。有消息稱,英偉達(dá)下一代 Feynman GPU 可能在 2028 年集成 Groq 的 LPU 單元,形成 “通用 + 專用” 的混合架構(gòu)。

這場(chǎng)路線之爭(zhēng)的本質(zhì),是 AI 產(chǎn)業(yè)從 “模型訓(xùn)練階段” 向 “規(guī)模化推理落地階段” 轉(zhuǎn)型的必然結(jié)果。隨著大模型發(fā)布間隔時(shí)間延長(zhǎng),企業(yè)對(duì)成熟模型的依賴度不斷增加,專用推理芯片的市場(chǎng)空間正在快速擴(kuò)大。

未來的 AI 算力市場(chǎng)將呈現(xiàn) “三分天下” 的格局:英偉達(dá) GPU 主導(dǎo)訓(xùn)練場(chǎng)景和通用推理場(chǎng)景,Taalas 等 “模型即芯片” 企業(yè)占據(jù)高粘性垂直場(chǎng)景,而谷歌 TPU、微軟 Azure Maia 等云廠商自研芯片則深耕云原生推理市場(chǎng)。這種分化,將徹底打破英偉達(dá)的壟斷地位,推動(dòng) AI 算力進(jìn)入 “專業(yè)化分工” 時(shí)代。

對(duì)于 Taalas 而言,2026 年將是決定其命運(yùn)的關(guān)鍵一年。第二代產(chǎn)品 HC2 的推出,將驗(yàn)證其技術(shù)路線的可擴(kuò)展性;而商業(yè)化落地的成效,將決定資本對(duì) “模型即芯片” 路線的信心。要真正實(shí)現(xiàn)巴伊奇 “將 AI 商品化” 的愿景,Taalas 還需要跨越三道門檻:

第一,精度與速度的平衡。HC2 能否在采用 4-bit 浮點(diǎn)格式后,保持 HC1 的極致速度優(yōu)勢(shì),同時(shí)顯著提升推理正確率,將直接決定其能否進(jìn)入金融、醫(yī)療等高精度要求場(chǎng)景。

第二,成本與規(guī);耐黄。目前 HC1 仍處于技術(shù)驗(yàn)證階段,未公開定價(jià)。要實(shí)現(xiàn) “推理成本降至 1/266” 的承諾,Taalas 需要通過大規(guī)模量產(chǎn)降低制造成本,同時(shí)優(yōu)化供應(yīng)鏈管理。

第三,生態(tài)與合作伙伴的積累。與模型廠商、云服務(wù)商、垂直行業(yè)客戶建立深度合作,構(gòu)建起 “模型定制 - 芯片設(shè)計(jì) - 場(chǎng)景落地” 的完整閉環(huán),才能擺脫 “小眾技術(shù)” 的標(biāo)簽,成為行業(yè)標(biāo)準(zhǔn)的制定者。


從更長(zhǎng)遠(yuǎn)的視角看,Taalas 的探索不僅關(guān)乎一家初創(chuàng)公司的生死,更關(guān)乎 AI 產(chǎn)業(yè)的未來走向。如果 “模型即芯片” 路線被證明可行,將推動(dòng) AI 算力從 “追求通用” 轉(zhuǎn)向 “追求極致效率”,讓 AI 技術(shù)真正滲透到千行百業(yè),實(shí)現(xiàn)巴伊奇 “讓 AI 像電力一樣無處不在” 的愿景。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
高市沒想到,對(duì)華關(guān)系降級(jí)當(dāng)天,中方反應(yīng)迅速,53條航線全取消

高市沒想到,對(duì)華關(guān)系降級(jí)當(dāng)天,中方反應(yīng)迅速,53條航線全取消

共工之錨
2026-04-11 00:54:51
黃景瑜王玉雯戀情風(fēng)波升級(jí),雙方辟謠后惹爭(zhēng)議,完全符合對(duì)方審美

黃景瑜王玉雯戀情風(fēng)波升級(jí),雙方辟謠后惹爭(zhēng)議,完全符合對(duì)方審美

古希臘掌管松餅的神
2026-04-10 12:12:58
禽獸不如!武漢4歲女童被親生父親殺害拋江,曾買60元意外保險(xiǎn)

禽獸不如!武漢4歲女童被親生父親殺害拋江,曾買60元意外保險(xiǎn)

派大星紀(jì)錄片
2026-04-10 17:31:01
1997年,英國(guó)歸還了香港,為何拒絕歸還沒什么經(jīng)濟(jì)價(jià)值的馬島?

1997年,英國(guó)歸還了香港,為何拒絕歸還沒什么經(jīng)濟(jì)價(jià)值的馬島?

鶴羽說個(gè)事
2026-04-10 22:29:55
陪睡陪玩算什么?繼人體盛宴、舔手指后,千萬網(wǎng)紅再曝娛樂圈內(nèi)幕

陪睡陪玩算什么?繼人體盛宴、舔手指后,千萬網(wǎng)紅再曝娛樂圈內(nèi)幕

徐云流浪中國(guó)
2026-04-10 00:31:22
暴跌95%!一代神車退場(chǎng)了,比燃油車賣不掉更可怕的事正在發(fā)生

暴跌95%!一代神車退場(chǎng)了,比燃油車賣不掉更可怕的事正在發(fā)生

毒sir財(cái)經(jīng)
2026-04-10 16:25:00
賈平凹之女賈淺淺被調(diào)查,連米芾的芾字都不認(rèn)識(shí),引起書法界震怒

賈平凹之女賈淺淺被調(diào)查,連米芾的芾字都不認(rèn)識(shí),引起書法界震怒

潮鹿逐夢(mèng)
2026-04-10 12:43:59
張雪奪冠賽車復(fù)刻版1分鐘拍出!500萬元將捐給嫣然天使基金,張雪:標(biāo)哥捐了,我不捐不好意思

張雪奪冠賽車復(fù)刻版1分鐘拍出!500萬元將捐給嫣然天使基金,張雪:標(biāo)哥捐了,我不捐不好意思

極目新聞
2026-04-10 20:58:02
大外交|王毅訪朝延續(xù)高層互動(dòng)勢(shì)頭,中朝多領(lǐng)域交流回暖

大外交|王毅訪朝延續(xù)高層互動(dòng)勢(shì)頭,中朝多領(lǐng)域交流回暖

澎湃新聞
2026-04-10 20:02:30
山西一局長(zhǎng)在辦公室突發(fā)疾病不幸去世,單位正申報(bào)因公殉職,生前曾獲省五一勞動(dòng)獎(jiǎng)?wù)?>
    </a>
        <h3>
      <a href=大風(fēng)新聞
2026-04-10 11:26:15
巴基斯坦被激怒!出動(dòng)大量中械裝備,以色列若膽敢妄動(dòng),一律擊落

巴基斯坦被激怒!出動(dòng)大量中械裝備,以色列若膽敢妄動(dòng),一律擊落

面包夾知識(shí)
2026-04-11 00:23:27
現(xiàn)在才明白,全紅嬋被網(wǎng)暴三年多,一直沒人敢報(bào),原來央視記者就是那282人里的一個(gè)

現(xiàn)在才明白,全紅嬋被網(wǎng)暴三年多,一直沒人敢報(bào),原來央視記者就是那282人里的一個(gè)

娛樂洞察點(diǎn)點(diǎn)
2026-04-11 03:16:04
突發(fā)!特斯拉新款 Model Y 發(fā)布,有點(diǎn)離譜

突發(fā)!特斯拉新款 Model Y 發(fā)布,有點(diǎn)離譜

新浪財(cái)經(jīng)
2026-04-11 04:45:06
天助巴塞羅那:1-1大冷門,皇馬遭西甲第12逼平,2輪不勝距榜首6分

天助巴塞羅那:1-1大冷門,皇馬遭西甲第12逼平,2輪不勝距榜首6分

側(cè)身凌空斬
2026-04-11 04:56:28
催收巨頭倒塌,金華分公司被端,上百人被抓,無數(shù)人深受其害!

催收巨頭倒塌,金華分公司被端,上百人被抓,無數(shù)人深受其害!

保德全
2026-04-10 23:00:03
姐不僅圓又大,還是個(gè)肉墩,就在家自拍,不讓別人看

姐不僅圓又大,還是個(gè)肉墩,就在家自拍,不讓別人看

飛娛日記
2026-03-19 07:26:09
霍爾木茲海峽開了,又關(guān)了

霍爾木茲海峽開了,又關(guān)了

中國(guó)新聞周刊
2026-04-10 18:41:40
大批巴基斯坦戰(zhàn)機(jī)挺進(jìn)伊朗!防止以軍偷襲!使用大批中方制造裝備

大批巴基斯坦戰(zhàn)機(jī)挺進(jìn)伊朗!防止以軍偷襲!使用大批中方制造裝備

泠泠說史
2026-04-10 21:50:05
41歲男子威脅女鄰居發(fā)生關(guān)系,事后女子為自證清白,讓他再來一次

41歲男子威脅女鄰居發(fā)生關(guān)系,事后女子為自證清白,讓他再來一次

丫頭舫
2026-04-10 21:54:02
曝愛爾眼科醫(yī)院院長(zhǎng)猥褻女經(jīng)理,強(qiáng)行摟抱,細(xì)節(jié)曝光,已被停職

曝愛爾眼科醫(yī)院院長(zhǎng)猥褻女經(jīng)理,強(qiáng)行摟抱,細(xì)節(jié)曝光,已被停職

180視角
2026-04-10 14:27:07
2026-04-11 06:56:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
132079文章數(shù) 862083關(guān)注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

73歲騎友抄近路摔倒身亡 女兒:賠償問題無法達(dá)成共識(shí)

頭條要聞

73歲騎友抄近路摔倒身亡 女兒:賠償問題無法達(dá)成共識(shí)

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

財(cái)經(jīng)要聞

李強(qiáng)主持召開經(jīng)濟(jì)形勢(shì)專家和企業(yè)家座談會(huì)

汽車要聞

搭載第二代刀片電池及閃充技術(shù) 騰勢(shì)N8L閃充版預(yù)售35萬起

態(tài)度原創(chuàng)

時(shí)尚
數(shù)碼
親子
旅游
軍事航空

今日熱點(diǎn):陳添祥長(zhǎng)文道歉;夏克立曾給前經(jīng)紀(jì)人傳上廁所照片……

數(shù)碼要聞

聯(lián)想推出2026款來酷斗戰(zhàn)者“戰(zhàn)7000”筆記本,7699元起

親子要聞

時(shí)間會(huì)融化所有尖銳,只剩平靜

旅游要聞

周末來這里!足不出滬體驗(yàn)首爾韓屋風(fēng)情

軍事要聞

特朗普:對(duì)美國(guó)與伊朗達(dá)成和平協(xié)議“非常樂觀”

無障礙瀏覽 進(jìn)入關(guān)懷版