国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

又一大算力AI芯片發(fā)布!比B200快3倍,剛?cè)谫Y24億元

0
分享至


芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影

芯東西2月25日報道,2月24日,英特爾宣布向美國AI芯片獨角獸SambaNova的超過3.5億美元(約合人民幣24億元)E輪戰(zhàn)略融資注資,具體金額未披露。

同時,SambaNova推出其第五代AI芯片SN50,號稱這是“唯一一款能夠提供智能體AI所需速度和吞吐量的芯片”,最高速度達同類芯片的5倍,經(jīng)多芯互連可支持的單模型參數(shù)規(guī)模達10萬億、上下文長度達1000萬個token。


據(jù)SambaNova披露,與Blackwell B200 GPU相比,SN50的最大速度是其5倍,智能體推理的吞吐量是其3倍以上,這在Meta的Llama 3.3 70B等一系列模型上得到充分體現(xiàn)。


據(jù)外媒報道,在此之前,英特爾曾討論過以約16億美元(約合人民幣110億元)收購SambaNova,但談判最終破裂。不過雙方均未回應(yīng)過此事。

SambaNova由多位斯坦福大學(xué)教授在2017年創(chuàng)立,在2021年融資后估值達到50億美元(約合人民幣344億元)。其董事長是英特爾CEO陳立武。英特爾曾多次投資SambaNova。


在最新公告中,SambaNova與英特爾宣布達成了一項多年戰(zhàn)略合作計劃,旨在提供高性能、高性價比的AI推理解決方案,打造下一代異構(gòu)AI數(shù)據(jù)中心,整合英特爾至強處理器、英特爾GPU、英特爾網(wǎng)絡(luò)和存儲及SambaNova系統(tǒng),以釋放數(shù)十億美元的推理市場機遇。

消息公布后,英特爾在美東時間周二股價漲超5%。

一、5倍算力、4倍網(wǎng)絡(luò)帶寬,能支撐10萬億參數(shù)大模型

SN50芯片基于SambaNova的可重構(gòu)數(shù)據(jù)流單元(RDU)架構(gòu),超低延遲可提供實時響應(yīng),能支持數(shù)千個并發(fā)AI會話,并通過更高的硬件利用率降低了每個token的成本。

每塊芯片的算力提高到第四代SN40L的5倍,網(wǎng)絡(luò)帶寬提高至4倍

SambaRack SN50將16塊SN50芯片組合在一起,可運行多達10萬億個參數(shù)1000萬個token的超大模型。


互連的SambaRack可通過每秒數(shù)TB的互連速度連接多達256塊芯片,從而縮短首次token生成時間,并支持更大的批處理規(guī)模,因此可以部署具有更高吞吐量和響應(yīng)速度的模型。

SambaRack的功耗平均僅需20kW,可在現(xiàn)有的風(fēng)冷數(shù)據(jù)中心中運行。這為運行g(shù)pt-oss等模型的推理服務(wù)提供商帶來了總擁有成本(TCO)優(yōu)勢,其節(jié)能效果是B200 GPU的8倍。


SN50將于2026年下半年開始發(fā)貨。軟銀集團將成為首家在日本下一代AI數(shù)據(jù)中心部署SN50的客戶。


二、基于數(shù)據(jù)流、三層內(nèi)存架構(gòu),跑大模型時更快更高能效

SambaNova團隊認為,智能體需要智能、預(yù)測性和彈性的基礎(chǔ)架構(gòu),要實現(xiàn)可行智能體,硬件必須能夠即時適應(yīng)突發(fā)性工作負載,在專家模型之間無延遲切換。


GPU擅長AI模型訓(xùn)練,但AI推理是數(shù)據(jù)移動和內(nèi)存優(yōu)化方面的挑戰(zhàn),需要不同的架構(gòu)方法。

為了執(zhí)行AI推理,GPU必須多次冗余地調(diào)用片外內(nèi)存,每次內(nèi)存調(diào)用都會增加處理延遲并消耗能量,會導(dǎo)致高功耗問題。

在GPU上部署多個模型的標(biāo)準方法是將模型加載到高帶寬內(nèi)存(HBM)中,但GPU HBM資源稀缺且成本高昂。

當(dāng)工作負載需要一個未加載的模型時,系統(tǒng)必須卸載當(dāng)前模型并獲取新模型,這個過程通常以秒為單位。即便使用vLLM的1級睡眠模式,喚醒一個小型模型也需要0.1到0.8秒。

對于智能體所需的大型推理模型而言,這種喚醒時間會造成3到6秒的延遲。對于執(zhí)行涉及5個不同模型的10步推理過程的AI智能體來說,這些延遲累積起來會達到30秒,導(dǎo)致實時智能體工作流程無法使用。

SambaNova的RDU正是為解決這一問題而設(shè)計的。

RDU將給定AI模型的計算圖映射到處理器上數(shù)據(jù)傳輸?shù)淖钣行窂健_@種方法消除了冗余的內(nèi)存調(diào)用,可顯著降低延遲和功耗。


與受限于單卡HBM容量的GPU不同,SN50 RDU采用獨特的三層內(nèi)存架構(gòu),結(jié)合了片上SRAM、海量HBM和超高速SRAM

這種分層結(jié)構(gòu)使芯片能承載最大的模型,支持在毫秒級時間內(nèi)運行和切換多個模型。

此外,借助SN50,輸入token可緩存在內(nèi)存中,從而減少預(yù)填充處理時間和請求的首token獲取時間(TTFT)。


結(jié)合這些優(yōu)勢,其內(nèi)存架構(gòu)非常適合作為智能體的緩存,能夠更高效地處理任務(wù)。

SambaNova還在SambaStack上推出了由RDU支持的可配置模型包,與傳統(tǒng)的GPU架構(gòu)和vLLM等推理框架相比,這些模型包的切換速度更快。

三、與英特爾聯(lián)手,加速推出AI云平臺

作為多年戰(zhàn)略合作的一部分,英特爾計劃對SambaNova進行戰(zhàn)略投資,以加速推出基于英特爾技術(shù)的AI云平臺。

此次合作預(yù)計將涵蓋三個關(guān)鍵領(lǐng)域:

(1)AI云擴展:SambaNova正在擴展其垂直整合的AI云平臺,該平臺基于英特爾至強處理器構(gòu)建,并針對大語言模型和多模態(tài)模型進行了優(yōu)化。該平臺將提供低延遲、高吞吐量的AI服務(wù),并由參考架構(gòu)、部署藍圖以及與系統(tǒng)集成商和軟件供應(yīng)商的合作關(guān)系提供支持。

(2)集成AI基礎(chǔ)設(shè)施:將SambaNova的系統(tǒng)與英特爾的CPU、加速器和網(wǎng)絡(luò)技術(shù)相結(jié)合,為推理、代碼生成、多模態(tài)應(yīng)用和智能體工作流提供可擴展的、可用于生產(chǎn)的推理能力。

(3)市場推廣執(zhí)行:通過英特爾的全球企業(yè)、云和合作伙伴渠道進行聯(lián)合銷售和聯(lián)合營銷,以加速AI生態(tài)系統(tǒng)的普及。

據(jù)英特爾披露,此次合作是對英特爾現(xiàn)有數(shù)據(jù)中心GPU投入的補充,并不會改變其在AI領(lǐng)域的競爭戰(zhàn)略,英特爾將繼續(xù)加大對GPU知識產(chǎn)權(quán)、架構(gòu)、產(chǎn)品、軟件和系統(tǒng)的投資,并強化其從邊緣到云端AI戰(zhàn)略路線圖。

結(jié)語:AI推理市場迎來新組合

隨著AI推理蓬勃發(fā)展,科技公司們都在尋求更高速度和效率、更低企業(yè)級AI部署成本的AI硬件基礎(chǔ)設(shè)施方案。

許多云端AI芯片創(chuàng)企都將自家產(chǎn)品的賣點放在了高能效上,既順應(yīng)AI推理需求旺盛的趨勢,又能避開英偉達強于AI訓(xùn)練的鋒芒。

通過合作,SambaNova可以借助英特爾的全球影響力擴大其AI處理器的規(guī)模,英特爾也增強了在AI推理領(lǐng)域的綜合實力。這將為日趨多元化的AI推理市場提供一個有競爭力的選擇。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
醪糟再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
尷尬!董宇輝被吐槽:喜歡支教,一天沒去;不喜歡帶貨,一天沒停

尷尬!董宇輝被吐槽:喜歡支教,一天沒去;不喜歡帶貨,一天沒停

火山詩話
2026-04-21 06:59:47
周亮,被免職

周亮,被免職

新京報政事兒
2026-04-21 10:28:07
保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

保密期限終到期,中央首長透露:毛岸英真相,可以向外界公開了

歷史點行
2026-03-29 13:38:28
不比不知道,一比嚇一跳!蘇林回國后很焦慮:原來我們落后這么多

不比不知道,一比嚇一跳!蘇林回國后很焦慮:原來我們落后這么多

小俎娛樂
2026-04-21 03:08:17
壽命與大便次數(shù)有關(guān)?壽命長的人,每天排便在這個次數(shù),真的嗎?

壽命與大便次數(shù)有關(guān)?壽命長的人,每天排便在這個次數(shù),真的嗎?

荷蘭豆愛健康
2026-04-21 14:57:39
美方稱在霍爾木茲海峽扣押的船只是從中國開往伊朗的,被用于運輸導(dǎo)彈化工原料,外交部:中方反對在霍爾木茲海峽問題上的惡意關(guān)聯(lián)和炒作

美方稱在霍爾木茲海峽扣押的船只是從中國開往伊朗的,被用于運輸導(dǎo)彈化工原料,外交部:中方反對在霍爾木茲海峽問題上的惡意關(guān)聯(lián)和炒作

瀟湘晨報
2026-04-21 16:34:11
神仙拼圖!本賽季的迪溫琴佐,什么水平?

神仙拼圖!本賽季的迪溫琴佐,什么水平?

籃球?qū)嶄?/span>
2026-04-21 15:35:23
強闖臺海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門口

強闖臺海后,高市再惹大禍,中朝聯(lián)合亮劍,解放軍現(xiàn)身日本家門口

基斯默默
2026-04-20 15:41:02
美伊?;饏f(xié)議明天到期,外交部:中方支持繼續(xù)保持?;鸷驼勁袆蓊^

美伊?;饏f(xié)議明天到期,外交部:中方支持繼續(xù)保持?;鸷驼勁袆蓊^

環(huán)球網(wǎng)資訊
2026-04-21 15:40:19
“葉祖新的臉怎么了”沖上熱搜,當(dāng)事人深夜發(fā)文:春天易敏,已無大礙,此前李現(xiàn)也中招

“葉祖新的臉怎么了”沖上熱搜,當(dāng)事人深夜發(fā)文:春天易敏,已無大礙,此前李現(xiàn)也中招

極目新聞
2026-04-21 09:09:59
趙心童VS丁俊暉,比賽時間敲定+央視全程直播,進8強能拿多少獎金

趙心童VS丁俊暉,比賽時間敲定+央視全程直播,進8強能拿多少獎金

體育大學(xué)僧
2026-04-21 09:47:46
俄羅斯梁贊州向各單位下達征兵命令,翻譯成中文很親切

俄羅斯梁贊州向各單位下達征兵命令,翻譯成中文很親切

李未熟擒話2
2026-04-20 10:47:19
4320線!禾賽發(fā)布6D全彩激光雷達:可干掉攝像頭了

4320線!禾賽發(fā)布6D全彩激光雷達:可干掉攝像頭了

快科技
2026-04-20 14:55:21
6月1日起全國工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標(biāo)準

6月1日起全國工地統(tǒng)一用工新規(guī),明確60歲以上農(nóng)民工上崗標(biāo)準

阿嚼影視評論
2026-04-20 21:02:56
千億市值的大瓜:當(dāng)“金絲雀”遇上“正宮團”!

千億市值的大瓜:當(dāng)“金絲雀”遇上“正宮團”!

挖掘機007
2026-04-21 11:31:00
34歲韋東奕官宣喜訊,恭喜!

34歲韋東奕官宣喜訊,恭喜!

二胡的歲月如歌
2026-04-21 15:37:16
何剛掏出麒麟X90時,臺下安靜了三秒

何剛掏出麒麟X90時,臺下安靜了三秒

爬蟲飼養(yǎng)員
2026-04-20 17:30:46
全球最貴電車來了

全球最貴電車來了

大象新聞
2026-04-20 10:35:05
最后48小時,賴清德將登機離臺,大陸斬釘截鐵,鄭麗文判斷準確

最后48小時,賴清德將登機離臺,大陸斬釘截鐵,鄭麗文判斷準確

聞識
2026-04-20 11:25:39
2026-04-21 18:55:00
芯東西 incentive-icons
芯東西
專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2287文章數(shù) 8153關(guān)注度
往期回顧 全部

財經(jīng)要聞

現(xiàn)實是最大的荒誕:千億平臺的沖突始末

頭條要聞

男子買"隨用隨取"保險后得知百歲才能取本金 法院判了

頭條要聞

男子買"隨用隨取"保險后得知百歲才能取本金 法院判了

體育要聞

62歲,成為中國足壇最火的人

娛樂要聞

周潤發(fā)時隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態(tài)度原創(chuàng)

游戲
本地
健康
時尚
公開課

萬代大作擺爛放棄D加密?剛被破解三周

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

干細胞抗衰4大誤區(qū),90%的人都中招

今年春夏最流行的4組通勤穿搭,誰穿誰時髦!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版