国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

手機(jī)AI芯片走過(guò)8年,潛力為何仍被白白浪費(fèi)?

0
分享至

八年前,我們第一次見(jiàn)識(shí)到了手機(jī)里的神經(jīng)網(wǎng)絡(luò)處理器(NPU),你還記得2017年華為Mate10的麒麟970吧,它比上不足(蘋(píng)果A11、驍龍835),比下有余(驍龍660、聯(lián)發(fā)科P60),卻是世界上第一款集成NPU的移動(dòng)SoC。從此,“手機(jī)本地也能跑AI”成為一種可能。


老實(shí)說(shuō),這八年變化挺大的,蘋(píng)果和三星終于也開(kāi)始搞端側(cè)AI了,雖說(shuō)效果有好有壞;谷歌則將自家數(shù)據(jù)中心的張量處理器(TPU)運(yùn)用得愈發(fā)成熟,并在Tensor芯片中借鑒了TPU 的AI計(jì)算核心理念。從ARM、高通,到蘋(píng)果、三星,所有大科技公司在發(fā)布新產(chǎn)品時(shí)都要提那么一句:AI是智能手機(jī)未來(lái)的核心。

但實(shí)際應(yīng)用下來(lái),移動(dòng)AI總感覺(jué)施展不開(kāi):手機(jī)本地能用到的AI功能就那么些:基本是語(yǔ)音助手、拍照修圖、即時(shí)翻譯老三樣,應(yīng)用開(kāi)發(fā)者想搞出點(diǎn)新東西卻困難重重。這一現(xiàn)狀,NPU得承擔(dān)一部分責(zé)任,不是它不好用,而是從未真正開(kāi)放給開(kāi)發(fā)者作為平臺(tái)使用。這就讓人有些納悶了:手機(jī)里這塊叫NPU的芯片,到底能用來(lái)干什么?

先搞懂:NPU到底是什么

就像手機(jī)里負(fù)責(zé)跑APP的CPU、玩游戲時(shí)渲染畫(huà)面的GPU,還有專(zhuān)門(mén)處理拍照錄像數(shù)據(jù)的ISP一樣,NPU也是專(zhuān)用計(jì)算單元——專(zhuān)門(mén)用來(lái)跑AI任務(wù),追求既快又省電。如今不只是手機(jī)芯片,連英特爾和AMD的移動(dòng)處理器同樣集成了專(zhuān)用NPU,盡管與手機(jī)SoC的NPU功能側(cè)重不同。


具體來(lái)說(shuō),NPU擅長(zhǎng)處理小體量的數(shù)據(jù)(比如4位甚至2位的精簡(jiǎn)模型)、特殊的內(nèi)存使用模式,還有一大堆數(shù)學(xué)運(yùn)算(比如融合乘加、融合乘積累加這些)。移動(dòng)NPU之所以能流行,就是因?yàn)橛行〢I任務(wù),傳統(tǒng)處理器處理起來(lái)效率又低又費(fèi)電,它卻能更高效搞定。

當(dāng)然,早在2017年NPU初現(xiàn)時(shí)就有一種反對(duì)意見(jiàn):跑AI任務(wù)不一定非得要NPU,很多簡(jiǎn)單的小算法,就算是性能一般的CPU也能扛;而那些支撐大語(yǔ)言模型的數(shù)據(jù)中心,用的硬件更像英偉達(dá)顯卡,跟手機(jī)里的NPU不是一回事。

但有了專(zhuān)用NPU,就能流暢跑那些CPU、GPU不擅長(zhǎng)的模型,而且通常更省電。這種分工合作的計(jì)算方式,雖然會(huì)讓芯片設(shè)計(jì)更復(fù)雜、占更多空間,但能在性能和耗電之間找到平衡,這對(duì)手機(jī)太重要了,沒(méi)人想讓AI功能把電池很快耗光吧?

AI不是本應(yīng)在顯卡上跑嗎?

關(guān)注內(nèi)存漲價(jià)的朋友都知道,AI數(shù)據(jù)中心特別需要高性能的AI和GPU加速器(尤其是英偉達(dá)的),而配套顯存和內(nèi)存都是海量的:?jiǎn)闻_(tái)AI訓(xùn)練/推理服務(wù)器需配置8張H200算力卡,其整合的顯存容量可達(dá)1.2TB,同時(shí)配備最高8TB的系統(tǒng)內(nèi)存,以滿足高負(fù)載算力需求,這就是內(nèi)存不夠用、價(jià)格飛漲的主要原因。


英偉達(dá)的CUDA架構(gòu)之所以能高效跑AI和圖形任務(wù),核心在于其具備大規(guī)模并行計(jì)算和資源調(diào)度能力。它的張量核心能搞定各種數(shù)據(jù)格式的復(fù)雜數(shù)學(xué)運(yùn)算,包括現(xiàn)在AI模型常用的精簡(jiǎn)數(shù)據(jù)格式。

雖然現(xiàn)在手機(jī)里的GPU,比如ARM的Mali、高通的Adreno,也能處理16位甚至8位的數(shù)據(jù),但遇到4位及以下的超精簡(jiǎn)模型時(shí),效率就差了很多。而且手機(jī)GPU就算理論上支持這些運(yùn)算,也不是專(zhuān)門(mén)為AI設(shè)計(jì)的,AI只是它們的副業(yè)。

手機(jī)GPU首先要考慮省電,跟桌面端那些性能超強(qiáng)的顯卡不一樣。它們使用的一些技術(shù),比如瓦片渲染(Tiled Rendering)、分片執(zhí)行(Shard Execution),不太適合長(zhǎng)時(shí)間高強(qiáng)度的計(jì)算任務(wù)。手機(jī)GPU當(dāng)然能跑AI,有些場(chǎng)景下也還行,但遇到專(zhuān)門(mén)的AI運(yùn)算,還是有更省電的選擇。

軟件開(kāi)發(fā)也很關(guān)鍵。英偉達(dá)的CUDA會(huì)把芯片的核心能力開(kāi)放給開(kāi)發(fā)者,讓他們能深度優(yōu)化AI任務(wù)的運(yùn)行。但手機(jī)平臺(tái)沒(méi)有這么底層的訪問(wèn)權(quán)限,開(kāi)發(fā)者和手機(jī)廠商只能用高通神經(jīng)處理SDK、ARM計(jì)算庫(kù)這些工具,而且大多是某家廠商專(zhuān)屬的,通用性不強(qiáng)。

這就是移動(dòng)AI開(kāi)發(fā)的大難題:桌面端開(kāi)發(fā)基本都圍繞CUDA轉(zhuǎn)(雖然AMD的ROCm也在慢慢起來(lái)),但手機(jī)里的NPU五花八門(mén)——谷歌的Tensor、驍龍的Hexagon、蘋(píng)果的神經(jīng)網(wǎng)絡(luò)引擎,每種都有自己的規(guī)矩和開(kāi)發(fā)工具,開(kāi)發(fā)者很難兼顧。

NPU解決“平臺(tái)不統(tǒng)一”的麻煩

現(xiàn)在幾乎所有手機(jī)芯片都集成了NPU,設(shè)計(jì)它的初衷是高效處理小數(shù)據(jù)、復(fù)雜運(yùn)算和特殊內(nèi)存模式,還不用大改GPU的架構(gòu)。但獨(dú)立NPU也帶來(lái)了新問(wèn)題,尤其是第三方開(kāi)發(fā)者想做適配的時(shí)候。

雖然蘋(píng)果、驍龍、聯(lián)發(fā)科這些芯片都提供了開(kāi)發(fā)工具,但開(kāi)發(fā)者得為每個(gè)平臺(tái)單獨(dú)做適配優(yōu)化。就算是谷歌自己的Pixel手機(jī),也沒(méi)給開(kāi)發(fā)者提供方便的通用訪問(wèn)權(quán)限:Tensor ML SDK還在測(cè)試階段,能不能正式開(kāi)放還不一定。開(kāi)發(fā)者只能通過(guò)谷歌的ML Kit用一些高層級(jí)的Gemini Nano功能,想深入用到底層硬件,根本做不到。


更糟的是,三星已經(jīng)停止了自家Neural SDK的維護(hù)和更新,谷歌之前搞的通用Android NNAPI也充滿了局限性。這就導(dǎo)致移動(dòng)AI開(kāi)發(fā)變成了一團(tuán)亂麻,各種規(guī)格、各種廢棄的工具,第三方想高效做個(gè)移動(dòng)AI應(yīng)用太難了。每家廠商自己搞的優(yōu)化方案,根本沒(méi)法推廣開(kāi)來(lái),最后開(kāi)發(fā)者能用的,還是谷歌這些大廠掌控的云端AI或者他們自己做的精簡(jiǎn)模型。

轉(zhuǎn)機(jī):跨平臺(tái)工具LiteRT來(lái)了

還好,谷歌2024年推出了LiteRT(其實(shí)是Tensor Flow Lite框架的升級(jí)組件),它能統(tǒng)一支持CPU、GPU和各家廠商的NPU(目前支持高通、聯(lián)發(fā)科)。LiteRT的設(shè)計(jì)初衷是在運(yùn)行時(shí)最大限度地利用硬件加速,讓軟件自行選擇最合適的方法,從而解決了NNAPI的最大缺陷——NNAPI本來(lái)想讓開(kāi)發(fā)者不用顧忌不同廠商的硬件差異,結(jié)果只統(tǒng)一了接口,實(shí)際運(yùn)行效果還是看廠商的驅(qū)動(dòng);而LiteRT自己掌控運(yùn)行過(guò)程,就是想把這個(gè)漏洞補(bǔ)上。


有意思的是,LiteRT不僅能在Android、iOS上使用,嵌入式設(shè)備甚至桌面電腦都能用,全程在設(shè)備本地運(yùn)行AI推理,看得出來(lái)谷歌想把它做成通用的精簡(jiǎn)模型運(yùn)行工具。不過(guò)和桌面端的AI框架不一樣,LiteRT是提前設(shè)定好的,精度、精簡(jiǎn)方式這些都定死了,這樣才能在手機(jī)這種資源有限的設(shè)備上穩(wěn)定運(yùn)行。

雖然LiteRT解決了不同廠商N(yùn)PU不兼容的問(wèn)題,但結(jié)合現(xiàn)在的技術(shù)發(fā)展,我們?nèi)孕枰伎迹篘PU以后還能像現(xiàn)在這樣重要嗎?

比如ARM最新的C1系列CPU,增加了SME2擴(kuò)展指令,一些AI任務(wù)能提速4倍,而且很多開(kāi)發(fā)框架都支持,不用專(zhuān)門(mén)的工具。另外,手機(jī)GPU的架構(gòu)也可能會(huì)改,變得更適合跑AI任務(wù),說(shuō)不定以后就用不到專(zhuān)門(mén)的NPU了。聽(tīng)說(shuō)三星也正在搞專(zhuān)門(mén)優(yōu)化AI的GPU,未來(lái)最早可能在Galaxy S28系列上用;Imagination的E系列GPU也是針對(duì)AI加速設(shè)計(jì)的,支持FP8和INT8精度,說(shuō)不定Pixel以后也會(huì)用這款芯片。

而LiteRT正好能配合這些技術(shù)進(jìn)步,開(kāi)發(fā)者不用再操心硬件怎么變。CPU對(duì)復(fù)雜指令的支持越來(lái)越好,以后跑AI任務(wù)也會(huì)越來(lái)越高效,不再是備胎;而那些對(duì)AI優(yōu)化更好的GPU,說(shuō)不定以后會(huì)取代NPU成為默認(rèn)的AI加速器,這些變化LiteRT都能應(yīng)對(duì)。這么看,LiteRT有點(diǎn)像移動(dòng)端的“CUDA”,它不是開(kāi)放硬件,而是把不同硬件的差異抹平了,讓開(kāi)發(fā)者不用再糾結(jié)。

NPU不會(huì)消失,但AI生態(tài)終于有點(diǎn)盼頭了

專(zhuān)用的移動(dòng)NPU短期內(nèi)肯定不會(huì)消失,但最開(kāi)始那種“圍著NPU轉(zhuǎn)、被廠商限制”的端側(cè)AI模式,顯然不是最終形態(tài)。對(duì)于大多數(shù)第三方應(yīng)用來(lái)說(shuō),CPU和GPU還是會(huì)承擔(dān)大部分AI任務(wù),尤其是它們對(duì)AI運(yùn)算的支持越來(lái)越好了。

如果LiteRT能成功,開(kāi)發(fā)者就不用再依賴(lài)某家芯片廠商的路線圖,也能開(kāi)發(fā)端側(cè)AI應(yīng)用了。盡管如此,設(shè)備端AI想擁有一個(gè)充滿活力的第三方生態(tài),可能還有一段路要走,但我們現(xiàn)在總算朝著這個(gè)方向邁進(jìn)了一步。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
他曾是河北省委書(shū)記,橫行霸道,上班警車(chē)開(kāi)道,兒子仍潛逃在海外

他曾是河北省委書(shū)記,橫行霸道,上班警車(chē)開(kāi)道,兒子仍潛逃在海外

舊時(shí)樓臺(tái)月
2024-07-26 09:57:13
26年堅(jiān)定持有的十只黑馬股,預(yù)定翻倍增長(zhǎng)!(精選)

26年堅(jiān)定持有的十只黑馬股,預(yù)定翻倍增長(zhǎng)!(精選)

漲多寶
2026-03-02 14:45:51
關(guān)于伊朗局勢(shì)的一些錯(cuò)誤說(shuō)法

關(guān)于伊朗局勢(shì)的一些錯(cuò)誤說(shuō)法

寰宇大觀察
2026-03-02 16:07:48
巴方總統(tǒng)警告中國(guó)!只要中國(guó)敢出手反制,巴拿馬就動(dòng)手,后果自負(fù)

巴方總統(tǒng)警告中國(guó)!只要中國(guó)敢出手反制,巴拿馬就動(dòng)手,后果自負(fù)

一簌月光
2026-03-02 21:39:54
美伊大戰(zhàn)后果來(lái)了,石油漲價(jià)歐佩克宣布增產(chǎn),中國(guó)能源轉(zhuǎn)型很明智

美伊大戰(zhàn)后果來(lái)了,石油漲價(jià)歐佩克宣布增產(chǎn),中國(guó)能源轉(zhuǎn)型很明智

甜檸聊史
2026-03-02 16:51:07
巴鐵:多虧了中國(guó)制造!一天報(bào)銷(xiāo)115輛坦克!塔利班舉白旗求饒

巴鐵:多虧了中國(guó)制造!一天報(bào)銷(xiāo)115輛坦克!塔利班舉白旗求饒

他是她的島熊
2026-03-01 11:56:55
大批美國(guó)游客涌入中國(guó),回國(guó)后坦言:客觀對(duì)比,中國(guó)比美國(guó)強(qiáng)多了

大批美國(guó)游客涌入中國(guó),回國(guó)后坦言:客觀對(duì)比,中國(guó)比美國(guó)強(qiáng)多了

通文知史
2026-02-26 22:00:04
媒體人:不了解楊瀚森場(chǎng)下訓(xùn)練情況,但英語(yǔ)進(jìn)步速度讓人憂慮

媒體人:不了解楊瀚森場(chǎng)下訓(xùn)練情況,但英語(yǔ)進(jìn)步速度讓人憂慮

懂球帝
2026-03-02 13:29:16
明日元宵節(jié),記得:2樣不上桌,4樣端上桌,天官賜福,馬年福氣多

明日元宵節(jié),記得:2樣不上桌,4樣端上桌,天官賜福,馬年福氣多

神牛
2026-03-02 15:01:49
近期,一名中國(guó)男子去泰國(guó)玩,花6000泰銖找21歲女孩,悲劇發(fā)生了

近期,一名中國(guó)男子去泰國(guó)玩,花6000泰銖找21歲女孩,悲劇發(fā)生了

鯨探所長(zhǎng)
2026-03-01 14:38:25
史詩(shī)級(jí)封殺!2000萬(wàn)網(wǎng)紅“聽(tīng)風(fēng)的蠶”徹底涼了

史詩(shī)級(jí)封殺!2000萬(wàn)網(wǎng)紅“聽(tīng)風(fēng)的蠶”徹底涼了

互聯(lián)網(wǎng)品牌官
2026-02-12 01:17:23
又一個(gè)國(guó)家采取軍事行動(dòng)! 瑞典在厄勒海峽上空攔截了俄羅斯無(wú)人機(jī)

又一個(gè)國(guó)家采取軍事行動(dòng)! 瑞典在厄勒海峽上空攔截了俄羅斯無(wú)人機(jī)

一種觀點(diǎn)
2026-02-28 08:44:21
天啊!看到陳紅1996年新婚的閨房照,才懂陳凱歌為啥說(shuō)一見(jiàn)鐘情

天啊!看到陳紅1996年新婚的閨房照,才懂陳凱歌為啥說(shuō)一見(jiàn)鐘情

好賢觀史記
2026-03-02 16:47:20
A股,“一個(gè)利好”尾盤(pán)突襲,明天,或?qū)⒂瓉?lái)大變盤(pán)!

A股,“一個(gè)利好”尾盤(pán)突襲,明天,或?qū)⒂瓉?lái)大變盤(pán)!

夜深?lèi)?ài)雜談
2026-03-02 19:34:22
伊朗已徹底認(rèn)慫

伊朗已徹底認(rèn)慫

仰望星空的一粒沙子
2026-03-02 09:55:15
哈梅內(nèi)伊開(kāi)會(huì)時(shí)遭襲身亡,細(xì)節(jié)披露!美媒:伊朗防長(zhǎng)等約40名官員在襲擊中死亡!伊方:總統(tǒng)等將領(lǐng)導(dǎo)國(guó)家

哈梅內(nèi)伊開(kāi)會(huì)時(shí)遭襲身亡,細(xì)節(jié)披露!美媒:伊朗防長(zhǎng)等約40名官員在襲擊中死亡!伊方:總統(tǒng)等將領(lǐng)導(dǎo)國(guó)家

每日經(jīng)濟(jì)新聞
2026-03-01 12:09:04
五角大樓終于說(shuō)了大實(shí)話!不到24小時(shí),賴(lài)清德喊話大陸,太罕見(jiàn)了

五角大樓終于說(shuō)了大實(shí)話!不到24小時(shí),賴(lài)清德喊話大陸,太罕見(jiàn)了

議紀(jì)史
2026-03-01 22:05:03
真相大白!王曼昱丟冠原因曝光,是打不過(guò)莎莎嗎?張繼科早有預(yù)言

真相大白!王曼昱丟冠原因曝光,是打不過(guò)莎莎嗎?張繼科早有預(yù)言

曹說(shuō)體育
2026-03-01 22:16:15
35年前,美國(guó)科學(xué)家進(jìn)行實(shí)驗(yàn),4男4女共處一室2年,結(jié)果怎么樣?

35年前,美國(guó)科學(xué)家進(jìn)行實(shí)驗(yàn),4男4女共處一室2年,結(jié)果怎么樣?

小豫講故事
2026-03-02 06:00:03
汪小菲和張?zhí)m解除母子關(guān)系!馬筱梅在旁煽風(fēng)點(diǎn)火,大S的話沒(méi)說(shuō)錯(cuò)

汪小菲和張?zhí)m解除母子關(guān)系!馬筱梅在旁煽風(fēng)點(diǎn)火,大S的話沒(méi)說(shuō)錯(cuò)

山谷里的怒吼
2026-03-02 00:20:27
2026-03-02 22:32:49
簡(jiǎn)明科學(xué)指南 incentive-icons
簡(jiǎn)明科學(xué)指南
致力介紹科技帶給生活的新變化
1504文章數(shù) 1973關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

伊朗公布最新戰(zhàn)況 通報(bào)還披露內(nèi)塔尼亞胡行蹤

頭條要聞

伊朗公布最新戰(zhàn)況 通報(bào)還披露內(nèi)塔尼亞胡行蹤

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車(chē)要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

時(shí)尚
教育
旅游
家居
健康

推廣|| 春天第一雙鞋!暴走不累、搭遍好看小裙子

教育要聞

免費(fèi)課后 上精品課

旅游要聞

AI 復(fù)活千年文物,元宵文旅再出圈

家居要聞

萬(wàn)物互聯(lián) 享科技福祉

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版