国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

最高384GB顯存,英特爾銳炫多卡方案給AI部署來(lái)點(diǎn)猛料

0
分享至

前段時(shí)間Computex 2025,英特爾推出了英特爾銳炫Pro B系列GPU,包括英特爾銳炫Pro B60、銳炫Pro B50兩款產(chǎn)品,憑借著高性價(jià)比,在短時(shí)間內(nèi)就獲得了不少OEM和客戶的支持。就在這周英特爾銳炫多卡方案正是上線,覆蓋邊緣計(jì)算到數(shù)據(jù)中心,給全場(chǎng)景AI部署提供了更多可能性,特別最多16塊銳炫Pro B60 24GB組成的Battlematrix(戰(zhàn)斗陣列)推理工作站平臺(tái),一舉將顯存容量提升到了384GB,做到200并發(fā)和2000 token/s。



向智能體AI與物理AI進(jìn)發(fā)

自從2012年AlexNet推動(dòng)卷積神經(jīng)網(wǎng)絡(luò)圖像識(shí)別,AI推動(dòng)多模態(tài)圖像、視頻、聲音感知應(yīng)用已經(jīng)開(kāi)始變得愈發(fā)普遍。特別是隨著算法、硬件的井噴式升級(jí),以ChatGPT和Stable Diffusion、Sora開(kāi)始出圈的生成式AI則在過(guò)去三年中蓬勃發(fā)展,極大提升了工作和學(xué)習(xí)效率。

顯然技術(shù)不會(huì)就此停歇,Token消耗的本質(zhì)就是告知AI一個(gè)最終目的,讓AI自己進(jìn)行推理、規(guī)劃、調(diào)用不同模型、應(yīng)用、AI來(lái)完成任務(wù)。這是僅僅依靠感知AI、生成式AI所無(wú)法做到的,而是需要調(diào)用多種大模型共同實(shí)現(xiàn),最終匯聚成智能體AI。



舉個(gè)簡(jiǎn)單的例子,現(xiàn)在我們使用專業(yè)軟件進(jìn)行圖片、視頻編輯,同時(shí)需要文字軟件進(jìn)行文案工作,這意味著我們即需要掌握具體軟件的特效使用或者剪輯操作邏輯,也需要用辦公軟件對(duì)文本進(jìn)行創(chuàng)作,雖然每個(gè)領(lǐng)域都有專門的AI提供加速,但是他們之間是不互通的。智能體AI則可以略過(guò)這些學(xué)習(xí)和經(jīng)驗(yàn)成本,幫助用戶直接略過(guò)繁瑣的操作過(guò)程,直達(dá)目標(biāo)。

智能體AI是一個(gè)新的開(kāi)始,目前已經(jīng)有多家創(chuàng)業(yè)公司展開(kāi)投入。更龐大的AI算力需求也意味著AI硬件仍然等待新一輪的指數(shù)級(jí)井噴,AI算法、硬件在當(dāng)下仍然非常重要。

而智能體AI的終極方向,英特爾中國(guó)區(qū)顯卡和AI高級(jí)產(chǎn)品總監(jiān)徐金平給出的預(yù)測(cè)是物理AI,通過(guò)機(jī)器人等形式與人類物理世界產(chǎn)生互動(dòng),最終直接解決物理問(wèn)題。



英特爾中國(guó)區(qū)顯卡和AI高級(jí)產(chǎn)品總監(jiān)徐金平發(fā)表演講

無(wú)論智能體AI還是物理AI,模型發(fā)展在其中已經(jīng)扮演了非常重要的作用。數(shù)年前,顛覆大家對(duì)AI認(rèn)知的AlexNet其實(shí)只有6000萬(wàn)個(gè)參數(shù),而自從谷歌開(kāi)創(chuàng)Transformer模型,BERT是3.4億參數(shù),GPT-3是1000多億哥參數(shù),Kimi K2參數(shù)更是達(dá)到了1萬(wàn)億以上,同樣,沒(méi)有公開(kāi)信息的Sora 2和GPT-5也必然是1萬(wàn)億以上參數(shù)的模型。這時(shí)候,AI算力的重要性得以凸顯。



Battlematrix戰(zhàn)斗陣列

今年Computex2025上的英特爾銳炫Pro B60、銳炫Pro B50兩款產(chǎn)品實(shí)際上就是解決個(gè)人工作站、數(shù)據(jù)中心AI算力而生的。其中銳炫Pro B50面向工作站,提供16GB顯存、170 TOPS算力,功耗僅為70W。更高階的銳炫Pro B60則面向推理工作站,24GB顯存,197 TOPS算力,200W功耗。



銳炫Pro B60單卡運(yùn)行下其實(shí)已經(jīng)表現(xiàn)出了不錯(cuò)的戰(zhàn)斗力,如果對(duì)比競(jìng)爭(zhēng)對(duì)手的RTX 2000、GeForce RTX 5060 Ti,在14B-int4模型上,銳炫Pro B60都有著不錯(cuò)的戰(zhàn)斗力,甚至而在Qwen 2.5,QwQ,Phi4,Llama3上,銳炫Pro B60表現(xiàn)更為突出。

這是因?yàn)槟P驮谶M(jìn)行量化的Data Type中,都需要更大的顯存容量才能流暢運(yùn)行,如果GPU剛好滿足16GB的及格線,算上計(jì)算消耗,實(shí)際上還是會(huì)有性能限制。這時(shí)候24GB顯存在其中就起到了更好的作用。



只有一塊GPU是無(wú)法滿足更大規(guī)模的AI推理的。銳炫多卡方案為此而生,進(jìn)而誕生出了Battlematrix(戰(zhàn)斗陣列)項(xiàng)目,即將服務(wù)器與GPU進(jìn)行了整合,并通過(guò)各項(xiàng)硬件和軟件認(rèn)證。比如2個(gè)銳炫Pro B60 GPU實(shí)際上可以并成一張顯卡,共享一個(gè)PCIe 5.0 x8接口,從而獲得單卡48GB顯存。按照這個(gè)擴(kuò)展方式,在一個(gè)工作站中插入8張雙GPU的銳炫Pro B60,就能獲得384GB顯存,從而可以滿足100B甚至200B的FP8大語(yǔ)言模型。

重點(diǎn)是,這并不是一套硬件堆疊的設(shè)想。在過(guò)去數(shù)個(gè)月中,英特爾已經(jīng)針對(duì)服務(wù)器、Linux工作站、AI推理工作站完成了全棧驗(yàn)證,幫助客戶加速部署這套全新的AI應(yīng)用方案。



深耕應(yīng)用場(chǎng)景

企業(yè)用戶對(duì)AI的需求五花八門,比如是否運(yùn)行在公有云、私有云上,如何進(jìn)行集中化AI處理,還是分散給每一臺(tái)工作站、AI PC都是問(wèn)題。因此英特爾在企業(yè)部署AI分層架構(gòu)的考量中,分成了企業(yè)中央級(jí)、企業(yè)部門級(jí)/邊緣級(jí)、企業(yè)個(gè)人員工級(jí)幾個(gè)方向,這也正好與英特爾銳炫 Pro B60多應(yīng)用場(chǎng)景契合。比如空間受限的AI PC中,一張雙GPU的英特爾銳炫 Pro B60就能實(shí)現(xiàn)48GB顯存和用滿PCIe 5.0 x16通道,進(jìn)而提升計(jì)算密度。

不僅如此,英特爾銳炫經(jīng)過(guò)了50多項(xiàng)專業(yè)設(shè)計(jì)類軟件性能優(yōu)化和認(rèn)證,包括Linux的全棧驗(yàn)證,vLLM專門優(yōu)化支持,以遠(yuǎn)程管理等等。

同時(shí),多卡方案還包括了同一個(gè)服務(wù)器中GPU的GPU Direct P2P(GPU Direct Peer-to-Peer)通信技術(shù),GPU可以相互方位顯存,不必通過(guò)CPU,進(jìn)而高效的利用顯存容量,完成多卡互聯(lián)。同時(shí),服務(wù)器與服務(wù)器之間的通訊,而也準(zhǔn)備了GDR實(shí)現(xiàn),訪問(wèn)效率同樣也獲得了很好的提升。



由于英特爾銳炫配置的靈活性,無(wú)論是個(gè)人工作站,2U服務(wù)器,甚至4U服務(wù)器。都能找到英特爾銳炫的適配方案,前面提到的16個(gè)B60 GPU聯(lián)合就是應(yīng)用在4U服務(wù)器中,從而實(shí)現(xiàn)最高200并發(fā),2000TOPS的AI算力表現(xiàn),已經(jīng)能夠滿足100人以上的用戶同時(shí)使用。



最后:做企業(yè)級(jí)甜點(diǎn)GPU

在NVIDIA與AMD的強(qiáng)勢(shì)拓展下,錯(cuò)位競(jìng)爭(zhēng)必然是一個(gè)不錯(cuò)的市場(chǎng)策略,英特爾銳炫Pro B60、銳炫Pro B50正是在這樣的需求下誕生,通過(guò)更大顯存、優(yōu)秀的軟件匹配以及不錯(cuò)的功耗表現(xiàn),能夠幫助企業(yè)很好的降低TCO,方便邊緣計(jì)算、部門級(jí)AI部署,進(jìn)而完成與高端AI GPU之間的錯(cuò)位競(jìng)爭(zhēng)。



憑借著銳炫Pro B60顯卡和Battlematrix項(xiàng)目的融合,英特爾為企業(yè)邊緣AI部署打造了一套大顯存、多卡擴(kuò)展、軟件棧成熟、容器化部署的甜點(diǎn)方案,也進(jìn)而滿足包括教、物流、智慧公園、智能工廠在內(nèi)的多種AI應(yīng)用場(chǎng)景,進(jìn)一步幫助企業(yè)控制TCO成本,提升效率。

與消費(fèi)級(jí)銳炫一樣,銳炫Pro系列在意可見(jiàn)的速度快速成長(zhǎng),特別是在市場(chǎng)環(huán)境快速變化的當(dāng)下,可靠、高效的AI應(yīng)用方案自然也更容易受到青睞,因此我們也有更多的理由期待銳炫Pro進(jìn)一步的表現(xiàn)。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗換上了一個(gè)“極端狠人”

伊朗換上了一個(gè)“極端狠人”

兩岸觀點(diǎn)
2026-03-27 08:41:07
歐預(yù)賽附加賽太殘酷了:隨著意大利2-0,歐洲8大勁旅宣告無(wú)緣世界杯

歐預(yù)賽附加賽太殘酷了:隨著意大利2-0,歐洲8大勁旅宣告無(wú)緣世界杯

側(cè)身凌空斬
2026-03-27 06:52:33
張本智和回?fù)糁袊?guó)網(wǎng)友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

張本智和回?fù)糁袊?guó)網(wǎng)友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

乒乓網(wǎng)國(guó)球匯
2026-03-27 00:03:40
伊朗進(jìn)入伊拉克模式

伊朗進(jìn)入伊拉克模式

墨心人
2026-03-26 21:47:55
伊朗官媒發(fā)布《為眾人復(fù)仇》AI短片:一枚伊朗導(dǎo)彈在哈梅內(nèi)伊等人注視下,精準(zhǔn)炸毀幻化成羊頭惡魔的美國(guó)自由女神像

伊朗官媒發(fā)布《為眾人復(fù)仇》AI短片:一枚伊朗導(dǎo)彈在哈梅內(nèi)伊等人注視下,精準(zhǔn)炸毀幻化成羊頭惡魔的美國(guó)自由女神像

大象新聞
2026-03-26 09:45:03
翻到張雪峰2016年婚紗照,瞬間看哭了!

翻到張雪峰2016年婚紗照,瞬間看哭了!

魔都姐姐雜談
2026-03-26 22:06:50
經(jīng)中共中央批準(zhǔn):黃祎任云南省委委員、常委和省紀(jì)委書記

經(jīng)中共中央批準(zhǔn):黃祎任云南省委委員、常委和省紀(jì)委書記

界面新聞
2026-03-27 10:34:03
“一降價(jià)還不是像狗一樣跑過(guò)來(lái)!”羅技廣告辱罵用戶遭全網(wǎng)聲討…

“一降價(jià)還不是像狗一樣跑過(guò)來(lái)!”羅技廣告辱罵用戶遭全網(wǎng)聲討…

柴狗夫斯基
2026-03-26 21:06:15
未被重視?張水華柳州馬拉松無(wú)官宣無(wú)出場(chǎng)費(fèi),自己報(bào)名非特邀選手

未被重視?張水華柳州馬拉松無(wú)官宣無(wú)出場(chǎng)費(fèi),自己報(bào)名非特邀選手

楊華評(píng)論
2026-03-27 01:36:21
伊朗外長(zhǎng)同聯(lián)合國(guó)秘書長(zhǎng)通話

伊朗外長(zhǎng)同聯(lián)合國(guó)秘書長(zhǎng)通話

新華社
2026-03-27 10:08:07
生死12分鐘!廣東一男子踢球時(shí)心臟驟停 一群醫(yī)生沖上前接力心肺復(fù)蘇救回一命

生死12分鐘!廣東一男子踢球時(shí)心臟驟停 一群醫(yī)生沖上前接力心肺復(fù)蘇救回一命

閃電新聞
2026-03-26 11:46:05
張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

娛樂(lè)圈圈圓
2026-03-26 21:47:07
太可恨!飛機(jī)一落地上海,女孩立馬報(bào)案!更多年輕受害人浮出水面……

太可恨!飛機(jī)一落地上海,女孩立馬報(bào)案!更多年輕受害人浮出水面……

環(huán)球網(wǎng)資訊
2026-03-26 21:48:04
2-0!托納利立大功,意大利完勝,殺入決賽,再贏一場(chǎng)=晉級(jí)世界杯

2-0!托納利立大功,意大利完勝,殺入決賽,再贏一場(chǎng)=晉級(jí)世界杯

足球狗說(shuō)
2026-03-27 05:38:22
局勢(shì)惡化!美軍7000精銳準(zhǔn)備登錄伊朗,川普15條遭拒,伊朗:海峽要收“過(guò)路費(fèi)”!

局勢(shì)惡化!美軍7000精銳準(zhǔn)備登錄伊朗,川普15條遭拒,伊朗:海峽要收“過(guò)路費(fèi)”!

留學(xué)生日?qǐng)?bào)
2026-03-27 07:29:46
裁員裁到大動(dòng)脈是啥體驗(yàn)?網(wǎng)友:我現(xiàn)在感覺(jué)我也是別人的大動(dòng)脈

裁員裁到大動(dòng)脈是啥體驗(yàn)?網(wǎng)友:我現(xiàn)在感覺(jué)我也是別人的大動(dòng)脈

解讀熱點(diǎn)事件
2026-03-27 00:05:10
張雪峰好兄弟曝內(nèi)情泣不成聲,人民日?qǐng)?bào)悼念官媒定義,衛(wèi)健委追責(zé)

張雪峰好兄弟曝內(nèi)情泣不成聲,人民日?qǐng)?bào)悼念官媒定義,衛(wèi)健委追責(zé)

潮鹿逐夢(mèng)
2026-03-26 10:55:41
黃蜂刮中絕世彩票!探花郎狂飆250記三分創(chuàng)NBA最年輕紀(jì)錄

黃蜂刮中絕世彩票!探花郎狂飆250記三分創(chuàng)NBA最年輕紀(jì)錄

仰臥撐FTUer
2026-03-27 12:02:07
Sand.ai開(kāi)源MagiCompiler:突破局部編譯界限,定義訓(xùn)推性能上限

Sand.ai開(kāi)源MagiCompiler:突破局部編譯界限,定義訓(xùn)推性能上限

機(jī)器之心Pro
2026-03-25 14:13:25
王興用234億虧損證明了一件事

王興用234億虧損證明了一件事

智遠(yuǎn)同學(xué)
2026-03-27 09:15:53
2026-03-27 12:20:49
愛(ài)極物 incentive-icons
愛(ài)極物
關(guān)注數(shù)碼新科技~!
348文章數(shù) 36關(guān)注度
往期回顧 全部

數(shù)碼要聞

飛傲推出翡聲JN3頭戴式藍(lán)牙耳機(jī),首發(fā)價(jià)169元

頭條要聞

男孩被搶走17年后找到生母 對(duì)"命好"的弟弟感情微妙

頭條要聞

男孩被搶走17年后找到生母 對(duì)"命好"的弟弟感情微妙

體育要聞

近29戰(zhàn)23勝!這支黃蜂有多強(qiáng)?

娛樂(lè)要聞

張雪峰靈堂內(nèi)景曝光,四周擺滿了鮮花

財(cái)經(jīng)要聞

很反常!油價(jià)向上,黃金向下

科技要聞

OpenAI果斷砍掉"成人模式",死磕生產(chǎn)力

汽車要聞

與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

態(tài)度原創(chuàng)

房產(chǎn)
家居
數(shù)碼
手機(jī)
公開(kāi)課

房產(chǎn)要聞

剛剛,海南樓市,官方數(shù)據(jù)發(fā)布!

家居要聞

傍海而居 靜觀蝴蝶海

數(shù)碼要聞

口袋里的135英寸HDR巨幕!雷鳥(niǎo)Air 4 Pro蝙蝠俠圖賞

手機(jī)要聞

MIUI正式落幕,盧偉冰親自回應(yīng),下一個(gè)目標(biāo)見(jiàn)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版