国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

人形機(jī)器人有了“真大腦”? Taalas把大模型直接寫進(jìn)芯片里

0
分享至


近日,加拿大初創(chuàng)公司Taalas 推出了一款 AI 推理芯片 HC1,這家成立尚不足三年的企業(yè),憑借將 8B 輕量化大模型直接 “刻” 在芯片上的創(chuàng)新設(shè)計(jì),讓 HC1 的運(yùn)行速度在行業(yè)中脫穎而出,在輸出速度和極致的成本和功耗控制上直接甩開了英偉達(dá)的GPU產(chǎn)品。


很多人對(duì)Taalas 或許并不熟悉,這家公司成立于 2023 年,創(chuàng)始人 Ljubisa Bajic 同時(shí)也是加拿大知名AI芯片公司 Tenstorrent 的創(chuàng)始人,他曾先后在英偉達(dá)、AMD 擔(dān)任高級(jí)架構(gòu)師,一手打造過(guò) CPU-GPU 混合芯片。

而Taalas的核心團(tuán)隊(duì)更是堪稱芯片圈的 “夢(mèng)之隊(duì)”,25 名員工大多來(lái)自 AMD、蘋果、谷歌等科技大廠,擁有從芯片設(shè)計(jì)到系統(tǒng)落地的全流程實(shí)戰(zhàn)經(jīng)驗(yàn)。背靠這樣的技術(shù)團(tuán)隊(duì),Taalas 僅投入 3000 萬(wàn)美元研發(fā)成本,耗時(shí) 60 天就完成了 HC1 的生產(chǎn)落地,推出了這款足以挑戰(zhàn)行業(yè)現(xiàn)有規(guī)則的產(chǎn)品。

截至目前,Taalas 累計(jì)融資已超 2 億美元,賬上仍有 1.7 億美元現(xiàn)金儲(chǔ)備,為后續(xù)發(fā)展奠定了充足的資金基礎(chǔ)

最快AI芯片?

HC1 最令人驚嘆的,莫過(guò)于其極致的推理速度。

這款采用臺(tái)積電6nm 工藝的芯片,在單用戶場(chǎng)景下推理速度高達(dá) 17000 token/秒。作為對(duì)比,英偉達(dá) H200 芯片推理速度為 230 token/秒,其最新 Blackwell 架構(gòu)的 B200 也不過(guò) 2000 token/秒。有測(cè)試者在 Taalas 的體驗(yàn)網(wǎng)站 chatjimmy.ai 實(shí)際操作后表示,該模型的回復(fù)速度極快,基本在敲下回車的瞬間,答案就能出現(xiàn)在對(duì)話框中。


HC1 能實(shí)現(xiàn)如此快的推理反應(yīng),核心源于 Taalas 獨(dú)樹一幟的技術(shù)思路。

研發(fā)團(tuán)隊(duì)拋棄了傳統(tǒng) GPU “計(jì)算與存儲(chǔ)分離” 的經(jīng)典架構(gòu),采用了存算一體式的設(shè)計(jì)方案,通過(guò) Mask ROM 工藝將 Llama 3.1 8B 的模型權(quán)重直接編碼在芯片的金屬互連層中,讓模型權(quán)重與計(jì)算邏輯共存于同一塊硅片。這種設(shè)計(jì)徹底消除了數(shù)據(jù)搬運(yùn)過(guò)程中的延遲與能耗損耗,芯片也無(wú)需搭配外部 DRAM 或 HBM,僅保留一小塊 SRAM 以提供最基礎(chǔ)的靈活性。

傳統(tǒng)GPU 進(jìn)行運(yùn)算時(shí),需要從 HBM 顯存中反復(fù)搬運(yùn)數(shù)據(jù),這一過(guò)程會(huì)消耗大量能耗和時(shí)間,也是行業(yè)普遍面臨的 “內(nèi)存墻” 問(wèn)題;而 HC1 無(wú)需數(shù)據(jù)搬運(yùn),只需讓數(shù)據(jù)流過(guò)電路就能完成推理,運(yùn)算效率自然實(shí)現(xiàn)了質(zhì)的飛躍。

為了實(shí)現(xiàn)芯片的快速定制,Taalas 還借鑒了 2000 年代結(jié)構(gòu)化 ASIC 的設(shè)計(jì)思路,將芯片定制周期從原本的六個(gè)月壓縮至兩個(gè)月。

在針對(duì)新模型進(jìn)行芯片定制時(shí),僅需更換兩層掩模,從拿到新模型到生成描述文件僅需一周的工程工作量,這種高效的定制能力,是Taalas 未來(lái)更新節(jié)奏的核心支撐。

除了速度優(yōu)勢(shì),HC1 的成本和功耗表現(xiàn)同樣亮眼:?jiǎn)纹酒闹圃斐杀緝H 300-400 美元,量產(chǎn)后的零售價(jià)預(yù)估在 600-700 美元,采用該芯片的推理綜合成本僅為傳統(tǒng) GPU 方案的 1/20;芯片功耗僅 2.5 千瓦,十顆芯片組成的服務(wù)器僅需普通風(fēng)冷就能實(shí)現(xiàn)散熱,無(wú)需搭建復(fù)雜的液冷系統(tǒng),相較 GPU 方案功耗降低了 90%,而未來(lái)的量產(chǎn)款芯片,速度還將進(jìn)一步提升。

發(fā)布即落后?

為了追求極致效率放棄了硬件通用性,HC1的設(shè)計(jì)也帶來(lái)了致命缺陷:一顆 HC1 芯片只能運(yùn)行一個(gè)特定模型,若要更換模型,就必須重新設(shè)計(jì)并制造芯片。在 AI 模型以月為單位快速迭代的當(dāng)下,這種 “專芯專?!?的模式面臨著極高的技術(shù)過(guò)時(shí)風(fēng)險(xiǎn)。

值得注意的是,HC1 正式公布時(shí),Llama 3.1 模型已經(jīng)發(fā)布了近兩年,而同期 OpenAI、Anthropic 等頭部企業(yè)的大模型已迭代至 GPT-5.2、Claude 4.6 版本。盡管 Taalas 承諾從拿到新模型到完成芯片定制僅需兩個(gè)月周期,但市場(chǎng)仍對(duì)其提出質(zhì)疑,為何不選擇更前沿的 DeepSeek R1 模型進(jìn)行產(chǎn)品演示。

除了難以跟上大模型的更新速度,HC1 自身還存在諸多局限性。為了將 8B 參數(shù)的模型完整塞進(jìn)單顆芯片,HC1 采用了自定義的 3-bit 基礎(chǔ)數(shù)據(jù)類型,并結(jié)合 3-bit 和 6-bit 的混合精度量化技術(shù)。

Taalas 官方也承認(rèn),這種技術(shù)方案會(huì)導(dǎo)致模型在質(zhì)量基準(zhǔn)測(cè)試中出現(xiàn)性能退化,在復(fù)雜數(shù)學(xué)運(yùn)算、專業(yè)論文解讀等需要深層邏輯推理的場(chǎng)景中,HC1 的表現(xiàn)明顯遜于英偉達(dá) GPU。

盡管公司已計(jì)劃在第二代產(chǎn)品 HC2 中,改用標(biāo)準(zhǔn) 4-bit 浮點(diǎn)格式來(lái)改善這一問(wèn)題,但第一代 HC1 在推理正確率上的短板已是既定事實(shí)。

不少用戶在測(cè)試時(shí)發(fā)現(xiàn),這款芯片不僅連簡(jiǎn)單的運(yùn)算都會(huì)出現(xiàn)錯(cuò)誤,面對(duì)一些復(fù)雜問(wèn)題時(shí),更是會(huì)出現(xiàn)胡編亂造的情況。

此外,受硅片面積的限制,單顆HC1 能容納的模型參數(shù)規(guī)模有限,面對(duì)萬(wàn)億參數(shù)級(jí)的前沿大模型,必須采用多芯片協(xié)同的方案才能運(yùn)行。

以DeepSeek R1 671B 模型為例,想要實(shí)現(xiàn)其推理運(yùn)算,需要 30 顆 HC1 協(xié)同工作,這不僅會(huì)帶來(lái)一系列互聯(lián)上的設(shè)計(jì)難題,流片的成本和時(shí)間也會(huì)同時(shí)增加。對(duì)于追求技術(shù)快速迭代的互聯(lián)網(wǎng)企業(yè)和 AI 創(chuàng)業(yè)公司而言,這樣的效率反倒不如多加一塊 GPU來(lái)得靠譜。

最后就是Taalas的商業(yè)模式的不確定性,目前 Taalas 探索了三種商業(yè)落地路徑,分別是“自建 API”、“直接出售芯片”、“與模型開發(fā)者合作定制芯片”,但這三種路徑均依賴于客戶對(duì)特定模型的需求。

而在當(dāng)前快速變化的AI 市場(chǎng)中,即便是科技大廠,也不敢輕易做出這樣的長(zhǎng)期承諾。歷史上比特幣挖礦 ASIC 的軍備競(jìng)賽早已證明,在技術(shù)快速迭代的領(lǐng)域,專用硬件極易陷入 “發(fā)布即過(guò)時(shí)” 的發(fā)展困境。

結(jié)語(yǔ)

從行業(yè)發(fā)展格局來(lái)看,HC1 的出現(xiàn)并非為了取代 GPU,而是填補(bǔ)了通用算力與極致效率之間的市場(chǎng)空白,也為大模型的落地提供一個(gè)全新思路。

Taalas 產(chǎn)品副總裁 Paresh Kharya 曾明確表示:“為模型定制的最優(yōu)硅片不會(huì)取代滿是 GPU 的大型數(shù)據(jù)中心,但它會(huì)適配特定的應(yīng)用場(chǎng)景?!?在智能客服、人形機(jī)器人等對(duì)響應(yīng)延遲敏感、模型版本相對(duì)穩(wěn)定的場(chǎng)景中,HC1 的性能與成本優(yōu)勢(shì)就會(huì)體現(xiàn)出來(lái)。

目前,Taalas 已制定了明確的產(chǎn)品規(guī)劃,計(jì)劃在 2026 年推出支持 70B 大模型的芯片,同時(shí)還在探索通過(guò) LoRA 微調(diào)技術(shù)優(yōu)化固化在芯片中的模型。

若能在后續(xù)發(fā)展中突破現(xiàn)有架構(gòu)的限制,Taalas 或許真的能推動(dòng)行業(yè)進(jìn)入新的發(fā)展階段。

記得星標(biāo)微信公眾號(hào):鎂客網(wǎng)(im2maker),更多干貨在等你

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人社部:職稱評(píng)審將重大調(diào)整?。?>
    </a>
        <h3>
      <a href=新浪財(cái)經(jīng)
2026-03-25 21:42:36
保利尼奧:1-7輸?shù)聡?guó)責(zé)任全在我們自身;巴西需要內(nèi)馬爾但他得更努力

保利尼奧:1-7輸?shù)聡?guó)責(zé)任全在我們自身;巴西需要內(nèi)馬爾但他得更努力

懂球帝
2026-03-28 14:26:19
谷歌翻譯耳機(jī)實(shí)時(shí)翻譯功能正式登陸 iOS 平臺(tái),支持超 70 種語(yǔ)言

谷歌翻譯耳機(jī)實(shí)時(shí)翻譯功能正式登陸 iOS 平臺(tái),支持超 70 種語(yǔ)言

龍劍秀南
2026-03-27 07:23:23
醫(yī)生:心梗最危險(xiǎn)信號(hào),不是胸痛,而是頻繁出現(xiàn)這4種異常

醫(yī)生:心梗最危險(xiǎn)信號(hào),不是胸痛,而是頻繁出現(xiàn)這4種異常

蜉蝣說(shuō)
2026-03-28 18:17:02
小菲筱梅為汪寶過(guò)滿月,滿月禮盒高檔又豐盛!親朋好友都參加!

小菲筱梅為汪寶過(guò)滿月,滿月禮盒高檔又豐盛!親朋好友都參加!

阿策聊實(shí)事
2026-03-27 23:26:32
調(diào)查發(fā)現(xiàn):堅(jiān)持走路鍛煉的老人,過(guò)不了半個(gè)月,會(huì)迎來(lái)5大改善

調(diào)查發(fā)現(xiàn):堅(jiān)持走路鍛煉的老人,過(guò)不了半個(gè)月,會(huì)迎來(lái)5大改善

醫(yī)學(xué)科普匯
2026-03-28 19:55:06
伊朗封鎖海峽,川普拿捏能源買家和賣家達(dá)到頂點(diǎn),差不多才會(huì)解決

伊朗封鎖海峽,川普拿捏能源買家和賣家達(dá)到頂點(diǎn),差不多才會(huì)解決

邵旭峰域
2026-03-28 16:00:03
人民網(wǎng)征集給AI取中文名,評(píng)論區(qū)“硅頭”遙遙領(lǐng)先

人民網(wǎng)征集給AI取中文名,評(píng)論區(qū)“硅頭”遙遙領(lǐng)先

正版徐叫獸
2026-03-26 14:48:45
張靚穎“零透光”裙驚爆熱搜,性感曲線令全場(chǎng)屏息,時(shí)尚女王?

張靚穎“零透光”裙驚爆熱搜,性感曲線令全場(chǎng)屏息,時(shí)尚女王?

娛樂(lè)領(lǐng)航家
2025-10-28 22:00:07
找一次貓狗最高收8000元?揭秘“尋寵師”的世界:這個(gè)行業(yè)比想象中復(fù)雜

找一次貓狗最高收8000元?揭秘“尋寵師”的世界:這個(gè)行業(yè)比想象中復(fù)雜

封面新聞
2026-03-28 09:29:03
18分+20分+21分!CBA又一國(guó)產(chǎn)頂級(jí)得分手誕生,郭士強(qiáng)會(huì)給機(jī)會(huì)嗎

18分+20分+21分!CBA又一國(guó)產(chǎn)頂級(jí)得分手誕生,郭士強(qiáng)會(huì)給機(jī)會(huì)嗎

老葉評(píng)球
2026-03-28 10:28:11
伊朗轟炸奏效,以色列遭遇自己曾用加沙戰(zhàn)術(shù)

伊朗轟炸奏效,以色列遭遇自己曾用加沙戰(zhàn)術(shù)

讓我的世界更加精彩
2026-03-27 23:02:25
剛從瑞士回來(lái),說(shuō)點(diǎn)不中聽的:瑞士的真實(shí)面目,可能讓你很意外

剛從瑞士回來(lái),說(shuō)點(diǎn)不中聽的:瑞士的真實(shí)面目,可能讓你很意外

復(fù)轉(zhuǎn)這些年
2026-03-28 10:26:10
想拿中國(guó)尿素救春耕,先還錢!中國(guó)鎖定俄油巨單,印度徹底出局

想拿中國(guó)尿素救春耕,先還錢!中國(guó)鎖定俄油巨單,印度徹底出局

小蔑談事
2026-03-28 01:32:42
CarPlay 史詩(shī)級(jí)加強(qiáng),痛點(diǎn)終于解決!

CarPlay 史詩(shī)級(jí)加強(qiáng),痛點(diǎn)終于解決!

黑貓科技迷
2026-03-26 23:53:32
女子吐槽老公養(yǎng)的盆栽:巨丑像大蟲子!網(wǎng)友怒懟:不識(shí)貨,別說(shuō)話

女子吐槽老公養(yǎng)的盆栽:巨丑像大蟲子!網(wǎng)友怒懟:不識(shí)貨,別說(shuō)話

三農(nóng)老歷
2026-03-27 11:32:51
關(guān)于伊朗的十大虛假敘事——你是如何被網(wǎng)軍欺騙的?

關(guān)于伊朗的十大虛假敘事——你是如何被網(wǎng)軍欺騙的?

楓嶺社
2026-03-27 10:49:09
撿漏了!全球純電SUV續(xù)航650km,從近20萬(wàn)降到13萬(wàn)多,放棄比亞迪

撿漏了!全球純電SUV續(xù)航650km,從近20萬(wàn)降到13萬(wàn)多,放棄比亞迪

隔壁說(shuō)車?yán)贤?/span>
2026-03-27 07:39:17
阿夫迪亞:輸?shù)暨@樣的比賽感覺很失望,那些失誤我要承擔(dān)責(zé)任

阿夫迪亞:輸?shù)暨@樣的比賽感覺很失望,那些失誤我要承擔(dān)責(zé)任

懂球帝
2026-03-28 16:00:23
若西方像制裁俄羅斯那樣制裁中國(guó),會(huì)發(fā)生什么?有人進(jìn)行了推演

若西方像制裁俄羅斯那樣制裁中國(guó),會(huì)發(fā)生什么?有人進(jìn)行了推演

遁走的兩輪
2026-03-26 20:41:28
2026-03-29 04:04:49
鎂客網(wǎng) incentive-icons
鎂客網(wǎng)
硬科技第一產(chǎn)業(yè)媒體,提供最有價(jià)值的行業(yè)觀察。
5931文章數(shù) 9355關(guān)注度
往期回顧 全部

科技要聞

華為盤古大模型負(fù)責(zé)人王云鶴確認(rèn)離職

頭條要聞

美媒:和歐盟"外長(zhǎng)"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

頭條要聞

美媒:和歐盟"外長(zhǎng)"發(fā)生激烈交鋒 魯比奧"顯然很惱火"

體育要聞

“我是全家最差勁的運(yùn)動(dòng)員”

娛樂(lè)要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財(cái)經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車要聞

置換補(bǔ)貼價(jià)4.28萬(wàn)起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

教育
游戲
健康
家居
本地

教育要聞

嚴(yán)絲合縫的教材閱讀法?????

《異替》現(xiàn)已登陸Steam

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

曲線華爾茲 現(xiàn)代簡(jiǎn)約

本地新聞

在濰坊待了三天,沒遇到一個(gè)“濰坊人”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版