国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

安謀科技發(fā)了一枚 NPU,要把 AIGC 算力提升 10 倍

0
分享至



打造 AI 時(shí)代計(jì)算效率的新標(biāo)桿。


作者|靖宇

去年一本講述周朝滅商的歷史學(xué)著作《翦商》,讓不少人對(duì)于商朝這個(gè)傳說(shuō)中的朝代,有了完全不同于《封神榜》中神仙妖怪的認(rèn)知。

作者李碩認(rèn)為,周文王作為邊緣民族的頭領(lǐng),被商王囚禁在地牢里自己弄出的「周易」,本質(zhì)是私下利用了當(dāng)時(shí)流行的占卜技術(shù),來(lái)預(yù)測(cè)未來(lái)推翻商朝可能性大小。

文王的兒子武王,成功推翻商朝后,在周公旦的努力下,「周易」變成了之后知名的《易經(jīng)》,變身成中國(guó)文化中神秘科技的代表。

其實(shí),如果擴(kuò)大一些視角,《易經(jīng)》代表的幾千年前的科技巔峰,和當(dāng)下最流行的大模型技術(shù)引領(lǐng)的 AI 多少有些相似之處——都是利用算力來(lái)預(yù)測(cè)未來(lái)。關(guān)鍵在于,幾千年前人們用的是木棍和腦力,現(xiàn)在,用的則是芯片,此事在劉慈欣的《三體》中亦有記載。


隨著 AI 大模型技術(shù)從云端向邊緣側(cè)、端側(cè)設(shè)備下沉,一場(chǎng)圍繞端側(cè) AI 算力的「軍備競(jìng)賽」已經(jīng)打響。從智能手機(jī)、AI PC 到智能汽車,消費(fèi)者對(duì)設(shè)備本地運(yùn)行 AIGC 的需求正迎來(lái)爆發(fā)性增長(zhǎng)。然而,要在功耗、散熱和成本都受到嚴(yán)格限制的端側(cè)設(shè)備上,高效運(yùn)行動(dòng)輒數(shù)十億參數(shù)的大模型,整個(gè)行業(yè)都面臨著算力受限、能效要求嚴(yán)苛、帶寬瓶明等一系列嚴(yán)峻挑戰(zhàn)。

正是在這一行業(yè)背景下,11 月 13 日,安謀科技(Arm China)在上海正式發(fā)布了「周易」X3 NPU IP。這不僅是安謀科技 Arm China 明確「All in AI」產(chǎn)品戰(zhàn)略后推出的首款重磅產(chǎn)品,也被視為其「AI Arm CHINA」戰(zhàn)略發(fā)展的關(guān)鍵實(shí)踐。安謀科技 Arm China 毫不掩飾其目標(biāo),即直面端側(cè) AI 大模型運(yùn)行的難題,打造計(jì)算效率的新標(biāo)桿。

01

為 Transformer 和浮點(diǎn)計(jì)算而生

半導(dǎo)體 IP 行業(yè)的一個(gè)共識(shí)是,產(chǎn)品研發(fā)必須「面向未來(lái) 5 年進(jìn)行前瞻布局」。安謀科技 Arm China 產(chǎn)品研發(fā)副總裁劉浩在發(fā)布會(huì)上也強(qiáng)調(diào)了這一點(diǎn),他表示公司將持續(xù)加大投入,以「前瞻性視野整合頂尖研發(fā)資源」,并秉持「開(kāi)放合作理念」,為伙伴提供從硬件到軟件的端到端解決方案。

「周易」X3 正是這一前瞻性布局的產(chǎn)物。安謀科技 Arm China NPU 產(chǎn)品線負(fù)責(zé)人兼首席架構(gòu)師舒浩博士指出,X3 的產(chǎn)品優(yōu)勢(shì)源于其「通用、靈活、高效且軟硬協(xié)同的系統(tǒng)架構(gòu)設(shè)計(jì)」。

這種前瞻性首先體現(xiàn)在架構(gòu)上?!钢芤住筙3 采用了一種專為大模型而生的最新 DSP+DSA 架構(gòu)。它在設(shè)計(jì)之初就深刻理解了 AI 模型的演進(jìn)趨勢(shì)——即從傳統(tǒng)的 CNN(卷積神經(jīng)網(wǎng)絡(luò))全面轉(zhuǎn)向 Transformer(大模型的基礎(chǔ)架構(gòu))。


因此,X3 采用了「兼顧 CNN 與 Transformer 的通用架構(gòu)設(shè)計(jì)」 ,使其既能高效處理傳統(tǒng)的 AI 任務(wù),也能從容應(yīng)對(duì)未來(lái)幾年的 Gen AI(生成式 AI)、Agentic AI(代理 AI)與 Physical AI(具身智能)的端側(cè)落地需求。

這種新架構(gòu)帶來(lái)的另一個(gè)關(guān)鍵轉(zhuǎn)變,是對(duì)浮點(diǎn)運(yùn)算的強(qiáng)力支持。傳統(tǒng) AI 運(yùn)算(如安防)大多使用定點(diǎn)計(jì)算,而大模型推理則高度依賴浮點(diǎn)(FP)運(yùn)算。X3 全面增強(qiáng)了浮點(diǎn)運(yùn)算(FLOPS)能力,支持從定點(diǎn)到浮點(diǎn)計(jì)算的關(guān)鍵轉(zhuǎn)變,為承載大模型奠定了技術(shù)基石。

02

解碼 10 倍 AIGC 算力

如果說(shuō)架構(gòu)是藍(lán)圖,那么性能數(shù)據(jù)就是最直觀的成果。相較于上一代產(chǎn)品,「周易」X3 在 AIGC 大模型能力上實(shí)現(xiàn)了高達(dá) 10 倍的增長(zhǎng)。這一驚人的躍升并非單一因素造就,而是由 16 倍的 FP16 TFLOPS(每秒萬(wàn)億次半精度浮點(diǎn)運(yùn)算)、4 倍的計(jì)算核心帶寬,以及超過(guò) 10 倍的 Softmax 和 LayerNorm(均為大模型關(guān)鍵算子)性能提升共同驅(qū)動(dòng)的。

在具體規(guī)格上,「周易」X3 的單 Cluster(集群)最高支持 4 個(gè) Core(核心),可提供 8 至 80 FP8 TFLOPS(每秒萬(wàn)億次 8 位浮點(diǎn)運(yùn)算)的算力,并且支持靈活配置。其單核帶寬高達(dá) 256GB/s。即使在傳統(tǒng)的 CNN 模型上,其性能也比 X2 提升了 30%~50%。

但對(duì)于大模型而言,峰值算力(TFLOPS)只是「入場(chǎng)券」,如何真正在運(yùn)行中把算力用起來(lái),即「算力利用率」,才是核心難題。


周易 X3 NPU IP 發(fā)布會(huì)現(xiàn)場(chǎng)|圖片來(lái)源:安謀科技

安謀科技 Arm China 給出了一組基于 Llama2 7B(70 億參數(shù))大模型的實(shí)測(cè)數(shù)據(jù):「周易」X3 在 Prefill(處理提示詞)階段的算力利用率高達(dá) 72%。這是一個(gè)遠(yuǎn)超行業(yè)平均水平的數(shù)字,意味著 NPU 在處理用戶輸入時(shí)沒(méi)有「出工不出力」。

更令人矚目的是 Decode(生成 token)階段的數(shù)據(jù)。安謀科技 Arm China 宣稱,在自研解壓硬件 WDC 的加持下,X3 實(shí)現(xiàn)了「Decode 階段有效帶寬利用率超 100%」。

「有效帶寬超 100%」聽(tīng)起來(lái)有悖常理,但這背后是安謀科技 Arm China 解決端側(cè)帶寬瓶頸的「獨(dú)門武器」。這個(gè)名為 WDC 的自研解壓硬件 ,允許大模型的權(quán)重(Weights)以軟件無(wú)損壓縮的形式存儲(chǔ)。在 NPU 運(yùn)算需要調(diào)用這些權(quán)重時(shí),WDC 硬件會(huì)實(shí)時(shí)進(jìn)行解壓。這一過(guò)程對(duì)軟件透明,卻能帶來(lái) 15%~20% 的等效帶寬提升。換言之,它讓有限的物理帶寬「跑」出了遠(yuǎn)超其物理限制的數(shù)據(jù)量,從而極大滿足了大模型解碼階段對(duì)高吞吐量的渴求。

為了讓云端大模型能高效遷移到端側(cè),「周易」X3 還在架構(gòu)上集成了多項(xiàng)關(guān)鍵創(chuàng)新。它新增了 W4A8/W4A16(4 位權(quán)重、8/16 位激活)計(jì)算加速模式,這種低比特量化技術(shù)能大幅降低模型對(duì)帶寬的消耗。同時(shí),它提供了極其廣泛的多精度融合計(jì)算支持,涵蓋 int4, int8, int16, int32, fp4, fp8, fp16, bf16, fp32 等幾乎所有主流數(shù)據(jù)類型,使其能靈活平衡性能與能效,適配從傳統(tǒng) CNN 到前沿大模型的各種需求。

此外,X3 還集成了一個(gè) AI 專屬硬件引擎 AIFF(AI Fixed-Function)和一個(gè)專用硬化調(diào)度器。在智能座艙或 ADAS 這類需要多任務(wù)并行和高優(yōu)先級(jí)響應(yīng)的場(chǎng)景中,這一設(shè)計(jì)至關(guān)重要。它能將 AI 任務(wù)調(diào)度對(duì) CPU 的負(fù)載降低至 0.5% ,讓寶貴的 CPU 資源去處理其他系統(tǒng)任務(wù),同時(shí)確保高優(yōu)先級(jí) AI 任務(wù)(如碰撞預(yù)警)獲得即時(shí)響應(yīng)。

03

讓 AI 開(kāi)發(fā)從「好用」到「用好」

「周易」X3 不僅僅是一塊高性能的硬件 IP,它還配套了一個(gè)名為「Compass AI」的軟件平臺(tái)。安謀科技 Arm China 產(chǎn)品總監(jiān)鮑敏祺指出,X3 遵循「軟硬協(xié)同、全周期服務(wù)與成就客戶」的準(zhǔn)則,旨在提供從硬件、軟件到售后服務(wù)的全鏈路支持。

在 AI 落地過(guò)程中,軟件開(kāi)發(fā)的「適配難、周期長(zhǎng)、門檻高」是長(zhǎng)期存在的痛點(diǎn)。「Compass AI」平臺(tái)的目標(biāo),就是通過(guò)「軟硬一體」的協(xié)同設(shè)計(jì),讓開(kāi)發(fā)者從「好用」進(jìn)階到「用好」。


「Compass AI」的軟件平臺(tái)|圖片來(lái)源:安謀科技

該平臺(tái)的核心是 NN Compiler(神經(jīng)網(wǎng)絡(luò)編譯器)。它支持 TensorFlow、ONNX、PyTorch 等主流 AI 框架,兼容超過(guò) 160 種算子和 270 種模型。

對(duì)于當(dāng)前火熱的大模型生態(tài),「Compass AI」平臺(tái)提供了一個(gè)極具吸引力的功能:通過(guò)其 AIPULLM 工具鏈,可直接支持 Hugging Face 格式模型,實(shí)現(xiàn)「一站式」轉(zhuǎn)化與部署。Hugging Face 是全球最大的 AI 模型集散地,這一功能意味著開(kāi)發(fā)者可以極低門檻地將社區(qū)的前沿模型快速部署到「周易」X3 上。

該平臺(tái)還具備先進(jìn)的模型推理優(yōu)化能力,包括業(yè)界領(lǐng)先的大模型動(dòng)態(tài) shape 支持(能高效處理任意長(zhǎng)度的輸入序列),并支持 GPTQ 等主流量化方案,以及對(duì) LLM(大語(yǔ)言模型)、VLM(視覺(jué)語(yǔ)言模型)和 MoE(混合專家模型)的高性能支持。

更重要的是,安謀科技 Arm China 選擇了「開(kāi)放生態(tài)」路線。Compass 平臺(tái)中的 Parser(模型解析)、Optimizer(優(yōu)化器)、Linux Driver(驅(qū)動(dòng))等核心組件已相繼開(kāi)源。這為開(kāi)發(fā)者提供了「白盒」部署的可能,他們可以利用豐富的調(diào)試工具和 Bit 精度軟件仿真平臺(tái)進(jìn)行深度性能調(diào)優(yōu)。有能力的客戶甚至可以利用平臺(tái)提供的工具和接口,開(kāi)發(fā)自定義算子,乃至打造出「屬于自己的模型編譯器」,從而實(shí)現(xiàn)產(chǎn)品差異化。

這種「軟硬協(xié)同」貫穿了 X3 的設(shè)計(jì)始終。例如 AIFF 模塊,硬件團(tuán)隊(duì)通過(guò)增大總線帶寬、增加 DMA(直接內(nèi)存訪問(wèn))的 outstanding 等方式提升數(shù)據(jù)搬運(yùn)效率;軟件團(tuán)隊(duì)則針對(duì)性設(shè)計(jì)專屬使用模式,如對(duì)模型進(jìn)行合理切分,以充分發(fā)揮多核并行優(yōu)勢(shì)。在系統(tǒng)兼容性上,Compass 平臺(tái)也做到了全面覆蓋,支持 Android、Linux、RTOS、QNX 等多種操作系統(tǒng),并通過(guò) TVM/ONNX 實(shí)現(xiàn) SoC 異構(gòu)計(jì)算。

04

從無(wú)形 IP 到 AI 萬(wàn)象

「周易」X3 的發(fā)布,清晰地勾勒出了安謀科技 Arm China 面向的四大核心領(lǐng)域:基礎(chǔ)設(shè)施、智能汽車、移動(dòng)終端和智能物聯(lián)網(wǎng)。

在發(fā)布會(huì)現(xiàn)場(chǎng)的 demo 展示區(qū),安謀科技 Arm China 展示了「周易」IP 家族的演進(jìn):從 Z1 賦能 AIoT 的人臉識(shí)別 ,到 Z2/Z3 進(jìn)入入門級(jí)座艙和輔助駕駛 ,再到 X1/X2 運(yùn)行自動(dòng)泊車、Stable Diffusion 文生圖。


安謀科技當(dāng)天的 IP 應(yīng)用展區(qū)|圖片來(lái)源:安謀科技

而新旗艦「周易」X3 則全面展示了其作為「端側(cè)大模型殺手」的實(shí)力,現(xiàn)場(chǎng)演示了運(yùn)行 DeepSeek-R1-Distill-Qwen-1.5B 模型的流暢 AI 對(duì)話,以及運(yùn)行 Stable Diffusion v1.5 的文生圖和 MiniCPM v2.6 的多模態(tài)圖文理解。

這一演進(jìn)路徑,清晰地表明端側(cè) AI 已從單一的功能感知,邁向了融合多種模型的「復(fù)雜認(rèn)知」新階段。

具體到應(yīng)用中:

智能汽車領(lǐng)域:這是 X3 的重點(diǎn)目標(biāo)。它將同時(shí)賦能智能駕駛與智能座艙,在 ADAS 系統(tǒng)中為自動(dòng)泊車等功能提供 AI 算力;在 IVI(車載信息娛樂(lè)系統(tǒng))中,則支持基于語(yǔ)音和車內(nèi)外視頻的智能互動(dòng)。

移動(dòng)終端領(lǐng)域:在 AI PC 和 AI 手機(jī)上,X3 可用于超分渲染(提升顯示效果),并為基于大模型的 AI Agent 應(yīng)用提供澎湃算力。

基礎(chǔ)設(shè)施與物聯(lián)網(wǎng):在加速卡、智能 IPC(網(wǎng)絡(luò)攝像機(jī))、智能網(wǎng)關(guān)等設(shè)備中,X3 的本地 AI 推理能力將帶來(lái)更快的響應(yīng)速度和更好的隱私保護(hù)。

「周易」X3 的發(fā)布,標(biāo)志著安謀科技 Arm China「All in AI」產(chǎn)品戰(zhàn)略的正式啟動(dòng)。在「AI Arm CHINA」的戰(zhàn)略發(fā)展方向下,安謀科技 Arm China 正攜手生態(tài)伙伴,試圖加快構(gòu)建國(guó)內(nèi)「AI+」產(chǎn)業(yè)升級(jí)的智能計(jì)算基石,為千行百業(yè)的智能化轉(zhuǎn)型提供更強(qiáng)的 IP「核芯」動(dòng)力。

*頭圖來(lái)源:安謀科技

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO

極客一問(wèn)

你如何看待「周易」X3?



360 集團(tuán)創(chuàng)始人周鴻祎:人類的數(shù)據(jù)用的差不多了, AGI 可能沒(méi)那么快到來(lái)

點(diǎn)贊關(guān)注極客公園視頻號(hào),



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我寧愿看朱孝天在那里一言不發(fā),也不要看阿信在那里指揮交通

我寧愿看朱孝天在那里一言不發(fā),也不要看阿信在那里指揮交通

郁郁乎文
2025-12-21 13:44:30
深圳前市長(zhǎng)8年卷走20億,花天酒地包養(yǎng)女星,落馬時(shí)只剩三千塊

深圳前市長(zhǎng)8年卷走20億,花天酒地包養(yǎng)女星,落馬時(shí)只剩三千塊

文史旺旺旺
2024-12-24 20:42:21
得道高僧建議:一般人盡量不要去寺廟

得道高僧建議:一般人盡量不要去寺廟

郁郁乎文
2025-12-22 09:26:13
官方:廣州地鐵第四期建設(shè)規(guī)劃正式定調(diào)

官方:廣州地鐵第四期建設(shè)規(guī)劃正式定調(diào)

世界軌道交通
2025-12-23 17:15:35
柿子立大功?武大研究發(fā)現(xiàn):柿子可在32小時(shí)清除20%有害菌群?

柿子立大功?武大研究發(fā)現(xiàn):柿子可在32小時(shí)清除20%有害菌群?

看世界的人
2025-11-29 13:55:27
被告人崔路路搶劫案一審宣判:潛入朋友家中行竊并殺害3人,被判死刑

被告人崔路路搶劫案一審宣判:潛入朋友家中行竊并殺害3人,被判死刑

新京報(bào)
2025-12-23 13:16:07
浙江公示:瑞安市委書記李堅(jiān),擬任新職

浙江公示:瑞安市委書記李堅(jiān),擬任新職

溫百君
2025-12-22 20:52:10
東南大學(xué)附屬南通醫(yī)院,來(lái)了!

東南大學(xué)附屬南通醫(yī)院,來(lái)了!

南通樓市新觀察
2025-12-23 17:32:34
最近,美國(guó)連續(xù)扣押多艘中國(guó)商船,中國(guó)是如何反擊的?

最近,美國(guó)連續(xù)扣押多艘中國(guó)商船,中國(guó)是如何反擊的?

阿胡
2025-12-23 17:56:32
何穗曬2個(gè)月寶寶會(huì)抬頭,頭發(fā)稀耳朵大有福,對(duì)陳偉霆稱呼顯親昵

何穗曬2個(gè)月寶寶會(huì)抬頭,頭發(fā)稀耳朵大有福,對(duì)陳偉霆稱呼顯親昵

阿纂看事
2025-12-23 17:45:34
北京阿姨20年守茅臺(tái)股票:90萬(wàn)本金,分紅326萬(wàn),成本歸零!

北京阿姨20年守茅臺(tái)股票:90萬(wàn)本金,分紅326萬(wàn),成本歸零!

趣文說(shuō)娛
2025-12-20 18:29:20
特朗普闖下大禍!五角大樓報(bào)告:中國(guó)100枚洲際彈道導(dǎo)彈或已裝載

特朗普闖下大禍!五角大樓報(bào)告:中國(guó)100枚洲際彈道導(dǎo)彈或已裝載

頭條爆料007
2025-12-23 10:02:13
爸把18套房全給私生子,宣讀遺囑時(shí)媽竟在笑,半年后我才知真相

爸把18套房全給私生子,宣讀遺囑時(shí)媽竟在笑,半年后我才知真相

溫情郵局
2025-12-08 11:29:02
新華社快訊:據(jù)日本媒體報(bào)道,日本正在報(bào)廢施工的核反應(yīng)堆“普賢”發(fā)生含放射性水泄漏事件,可能有數(shù)人遭輻射

新華社快訊:據(jù)日本媒體報(bào)道,日本正在報(bào)廢施工的核反應(yīng)堆“普賢”發(fā)生含放射性水泄漏事件,可能有數(shù)人遭輻射

新華社
2025-12-23 17:58:14
退休人員留意!12月31日前務(wù)必辦3件事,不然1月養(yǎng)老金或?qū)⑼0l(fā)

退休人員留意!12月31日前務(wù)必辦3件事,不然1月養(yǎng)老金或?qū)⑼0l(fā)

李博世財(cái)經(jīng)
2025-12-23 10:17:00
上海市大學(xué)排名“重新洗牌”!上海交大斷崖式領(lǐng)先,華東理工第五

上海市大學(xué)排名“重新洗牌”!上海交大斷崖式領(lǐng)先,華東理工第五

Delete丨CC
2025-12-23 20:05:11
快手午夜驚魂:那4個(gè)小時(shí),發(fā)生了什么?

快手午夜驚魂:那4個(gè)小時(shí),發(fā)生了什么?

盧松松
2025-12-23 13:40:06
向太曝馬伊琍已再婚:當(dāng)年文章過(guò)不了心理那關(guān)

向太曝馬伊琍已再婚:當(dāng)年文章過(guò)不了心理那關(guān)

娛樂(lè)看阿敞
2025-12-12 15:50:00
高市挑釁中國(guó),拒不道歉的原因,終于找到了,外交部感到“震驚”

高市挑釁中國(guó),拒不道歉的原因,終于找到了,外交部感到“震驚”

小莜讀史
2025-12-22 18:50:09
火燒靖國(guó)神社的劉強(qiáng),回國(guó)后單位將他開(kāi)除,妻子離婚,如今怎樣?

火燒靖國(guó)神社的劉強(qiáng),回國(guó)后單位將他開(kāi)除,妻子離婚,如今怎樣?

老呶侃史
2025-09-01 13:27:06
2025-12-24 04:35:00
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11693文章數(shù) 78744關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

體育要聞

楊瀚森連續(xù)5場(chǎng)DNP!開(kāi)拓者遭活塞雙殺

娛樂(lè)要聞

朱孝天回應(yīng)阿信感謝,自曝沒(méi)再收到邀約

財(cái)經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車要聞

四款新車集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

態(tài)度原創(chuàng)

教育
親子
游戲
公開(kāi)課
軍事航空

教育要聞

2025山東高考公安政法類錄取分?jǐn)?shù)線

親子要聞

嚴(yán)禁引入第三方,管住幼兒園亂收費(fèi) | 新京報(bào)快評(píng)

任天堂獨(dú)占!Bloober恐怖新作即將揭曉:生化粉肯定愛(ài)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄烏沖突關(guān)鍵人物在莫斯科被炸死 烏方尚未公開(kāi)認(rèn)領(lǐng)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版