国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

手機(jī)AI芯片走過8年,潛力為何仍被白白浪費(fèi)?

0
分享至

八年前,我們第一次見識(shí)到了手機(jī)里的神經(jīng)網(wǎng)絡(luò)處理器(NPU),你還記得2017年華為Mate10的麒麟970吧,它比上不足(蘋果A11、驍龍835),比下有余(驍龍660、聯(lián)發(fā)科P60),卻是世界上第一款集成NPU的移動(dòng)SoC。從此,“手機(jī)本地也能跑AI”成為一種可能。


老實(shí)說,這八年變化挺大的,蘋果和三星終于也開始搞端側(cè)AI了,雖說效果有好有壞;谷歌則將自家數(shù)據(jù)中心的張量處理器(TPU)運(yùn)用得愈發(fā)成熟,并在Tensor芯片中借鑒了TPU 的AI計(jì)算核心理念。從ARM、高通,到蘋果、三星,所有大科技公司在發(fā)布新產(chǎn)品時(shí)都要提那么一句:AI是智能手機(jī)未來的核心。

但實(shí)際應(yīng)用下來,移動(dòng)AI總感覺施展不開:手機(jī)本地能用到的AI功能就那么些:基本是語音助手、拍照修圖、即時(shí)翻譯老三樣,應(yīng)用開發(fā)者想搞出點(diǎn)新東西卻困難重重。這一現(xiàn)狀,NPU得承擔(dān)一部分責(zé)任,不是它不好用,而是從未真正開放給開發(fā)者作為平臺(tái)使用。這就讓人有些納悶了:手機(jī)里這塊叫NPU的芯片,到底能用來干什么?

先搞懂:NPU到底是什么?

就像手機(jī)里負(fù)責(zé)跑APP的CPU、玩游戲時(shí)渲染畫面的GPU,還有專門處理拍照錄像數(shù)據(jù)的ISP一樣,NPU也是專用計(jì)算單元——專門用來跑AI任務(wù),追求既快又省電。如今不只是手機(jī)芯片,連英特爾和AMD的移動(dòng)處理器同樣集成了專用NPU,盡管與手機(jī)SoC的NPU功能側(cè)重不同。


具體來說,NPU擅長(zhǎng)處理小體量的數(shù)據(jù)(比如4位甚至2位的精簡(jiǎn)模型)、特殊的內(nèi)存使用模式,還有一大堆數(shù)學(xué)運(yùn)算(比如融合乘加、融合乘積累加這些)。移動(dòng)NPU之所以能流行,就是因?yàn)橛行〢I任務(wù),傳統(tǒng)處理器處理起來效率又低又費(fèi)電,它卻能更高效搞定。

當(dāng)然,早在2017年NPU初現(xiàn)時(shí)就有一種反對(duì)意見:跑AI任務(wù)不一定非得要NPU,很多簡(jiǎn)單的小算法,就算是性能一般的CPU也能扛;而那些支撐大語言模型的數(shù)據(jù)中心,用的硬件更像英偉達(dá)顯卡,跟手機(jī)里的NPU不是一回事。

但有了專用NPU,就能流暢跑那些CPU、GPU不擅長(zhǎng)的模型,而且通常更省電。這種分工合作的計(jì)算方式,雖然會(huì)讓芯片設(shè)計(jì)更復(fù)雜、占更多空間,但能在性能和耗電之間找到平衡,這對(duì)手機(jī)太重要了,沒人想讓AI功能把電池很快耗光吧?

AI不是本應(yīng)在顯卡上跑嗎?

關(guān)注內(nèi)存漲價(jià)的朋友都知道,AI數(shù)據(jù)中心特別需要高性能的AI和GPU加速器(尤其是英偉達(dá)的),而配套顯存和內(nèi)存都是海量的:?jiǎn)闻_(tái)AI訓(xùn)練/推理服務(wù)器需配置8張H200算力卡,其整合的顯存容量可達(dá)1.2TB,同時(shí)配備最高8TB的系統(tǒng)內(nèi)存,以滿足高負(fù)載算力需求,這就是內(nèi)存不夠用、價(jià)格飛漲的主要原因。


英偉達(dá)的CUDA架構(gòu)之所以能高效跑AI和圖形任務(wù),核心在于其具備大規(guī)模并行計(jì)算和資源調(diào)度能力。它的張量核心能搞定各種數(shù)據(jù)格式的復(fù)雜數(shù)學(xué)運(yùn)算,包括現(xiàn)在AI模型常用的精簡(jiǎn)數(shù)據(jù)格式。

雖然現(xiàn)在手機(jī)里的GPU,比如ARM的Mali、高通的Adreno,也能處理16位甚至8位的數(shù)據(jù),但遇到4位及以下的超精簡(jiǎn)模型時(shí),效率就差了很多。而且手機(jī)GPU就算理論上支持這些運(yùn)算,也不是專門為AI設(shè)計(jì)的,AI只是它們的副業(yè)。

手機(jī)GPU首先要考慮省電,跟桌面端那些性能超強(qiáng)的顯卡不一樣。它們使用的一些技術(shù),比如瓦片渲染(Tiled Rendering)、分片執(zhí)行(Shard Execution),不太適合長(zhǎng)時(shí)間高強(qiáng)度的計(jì)算任務(wù)。手機(jī)GPU當(dāng)然能跑AI,有些場(chǎng)景下也還行,但遇到專門的AI運(yùn)算,還是有更省電的選擇。

軟件開發(fā)也很關(guān)鍵。英偉達(dá)的CUDA會(huì)把芯片的核心能力開放給開發(fā)者,讓他們能深度優(yōu)化AI任務(wù)的運(yùn)行。但手機(jī)平臺(tái)沒有這么底層的訪問權(quán)限,開發(fā)者和手機(jī)廠商只能用高通神經(jīng)處理SDK、ARM計(jì)算庫這些工具,而且大多是某家廠商專屬的,通用性不強(qiáng)。

這就是移動(dòng)AI開發(fā)的大難題:桌面端開發(fā)基本都圍繞CUDA轉(zhuǎn)(雖然AMD的ROCm也在慢慢起來),但手機(jī)里的NPU五花八門——谷歌的Tensor、驍龍的Hexagon、蘋果的神經(jīng)網(wǎng)絡(luò)引擎,每種都有自己的規(guī)矩和開發(fā)工具,開發(fā)者很難兼顧。

NPU解決“平臺(tái)不統(tǒng)一”的麻煩

現(xiàn)在幾乎所有手機(jī)芯片都集成了NPU,設(shè)計(jì)它的初衷是高效處理小數(shù)據(jù)、復(fù)雜運(yùn)算和特殊內(nèi)存模式,還不用大改GPU的架構(gòu)。但獨(dú)立NPU也帶來了新問題,尤其是第三方開發(fā)者想做適配的時(shí)候。

雖然蘋果、驍龍、聯(lián)發(fā)科這些芯片都提供了開發(fā)工具,但開發(fā)者得為每個(gè)平臺(tái)單獨(dú)做適配優(yōu)化。就算是谷歌自己的Pixel手機(jī),也沒給開發(fā)者提供方便的通用訪問權(quán)限:Tensor ML SDK還在測(cè)試階段,能不能正式開放還不一定。開發(fā)者只能通過谷歌的ML Kit用一些高層級(jí)的Gemini Nano功能,想深入用到底層硬件,根本做不到。


更糟的是,三星已經(jīng)停止了自家Neural SDK的維護(hù)和更新,谷歌之前搞的通用Android NNAPI也充滿了局限性。這就導(dǎo)致移動(dòng)AI開發(fā)變成了一團(tuán)亂麻,各種規(guī)格、各種廢棄的工具,第三方想高效做個(gè)移動(dòng)AI應(yīng)用太難了。每家廠商自己搞的優(yōu)化方案,根本沒法推廣開來,最后開發(fā)者能用的,還是谷歌這些大廠掌控的云端AI或者他們自己做的精簡(jiǎn)模型。

轉(zhuǎn)機(jī):跨平臺(tái)工具LiteRT來了

還好,谷歌2024年推出了LiteRT(其實(shí)是Tensor Flow Lite框架的升級(jí)組件),它能統(tǒng)一支持CPU、GPU和各家廠商的NPU(目前支持高通、聯(lián)發(fā)科)。LiteRT的設(shè)計(jì)初衷是在運(yùn)行時(shí)最大限度地利用硬件加速,讓軟件自行選擇最合適的方法,從而解決了NNAPI的最大缺陷——NNAPI本來想讓開發(fā)者不用顧忌不同廠商的硬件差異,結(jié)果只統(tǒng)一了接口,實(shí)際運(yùn)行效果還是看廠商的驅(qū)動(dòng);而LiteRT自己掌控運(yùn)行過程,就是想把這個(gè)漏洞補(bǔ)上。


有意思的是,LiteRT不僅能在Android、iOS上使用,嵌入式設(shè)備甚至桌面電腦都能用,全程在設(shè)備本地運(yùn)行AI推理,看得出來谷歌想把它做成通用的精簡(jiǎn)模型運(yùn)行工具。不過和桌面端的AI框架不一樣,LiteRT是提前設(shè)定好的,精度、精簡(jiǎn)方式這些都定死了,這樣才能在手機(jī)這種資源有限的設(shè)備上穩(wěn)定運(yùn)行。

雖然LiteRT解決了不同廠商N(yùn)PU不兼容的問題,但結(jié)合現(xiàn)在的技術(shù)發(fā)展,我們?nèi)孕枰伎迹篘PU以后還能像現(xiàn)在這樣重要嗎?

比如ARM最新的C1系列CPU,增加了SME2擴(kuò)展指令,一些AI任務(wù)能提速4倍,而且很多開發(fā)框架都支持,不用專門的工具。另外,手機(jī)GPU的架構(gòu)也可能會(huì)改,變得更適合跑AI任務(wù),說不定以后就用不到專門的NPU了。聽說三星也正在搞專門優(yōu)化AI的GPU,未來最早可能在Galaxy S28系列上用;Imagination的E系列GPU也是針對(duì)AI加速設(shè)計(jì)的,支持FP8和INT8精度,說不定Pixel以后也會(huì)用這款芯片。

而LiteRT正好能配合這些技術(shù)進(jìn)步,開發(fā)者不用再操心硬件怎么變。CPU對(duì)復(fù)雜指令的支持越來越好,以后跑AI任務(wù)也會(huì)越來越高效,不再是備胎;而那些對(duì)AI優(yōu)化更好的GPU,說不定以后會(huì)取代NPU成為默認(rèn)的AI加速器,這些變化LiteRT都能應(yīng)對(duì)。這么看,LiteRT有點(diǎn)像移動(dòng)端的“CUDA”,它不是開放硬件,而是把不同硬件的差異抹平了,讓開發(fā)者不用再糾結(jié)。

NPU不會(huì)消失,但AI生態(tài)終于有點(diǎn)盼頭了

專用的移動(dòng)NPU短期內(nèi)肯定不會(huì)消失,但最開始那種“圍著NPU轉(zhuǎn)、被廠商限制”的端側(cè)AI模式,顯然不是最終形態(tài)。對(duì)于大多數(shù)第三方應(yīng)用來說,CPU和GPU還是會(huì)承擔(dān)大部分AI任務(wù),尤其是它們對(duì)AI運(yùn)算的支持越來越好了。

如果LiteRT能成功,開發(fā)者就不用再依賴某家芯片廠商的路線圖,也能開發(fā)端側(cè)AI應(yīng)用了。盡管如此,設(shè)備端AI想擁有一個(gè)充滿活力的第三方生態(tài),可能還有一段路要走,但我們現(xiàn)在總算朝著這個(gè)方向邁進(jìn)了一步。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗革命衛(wèi)隊(duì):將按最高領(lǐng)袖指示重塑波斯灣管理規(guī)則

伊朗革命衛(wèi)隊(duì):將按最高領(lǐng)袖指示重塑波斯灣管理規(guī)則

財(cái)聯(lián)社
2026-05-02 04:47:19
局勢(shì)惡化,中日又爆發(fā)爭(zhēng)端,日本登上釣魚島,解放軍戰(zhàn)艦果斷合圍

局勢(shì)惡化,中日又爆發(fā)爭(zhēng)端,日本登上釣魚島,解放軍戰(zhàn)艦果斷合圍

老黯談娛
2026-05-01 11:59:01
光刻膠第一股,國(guó)資委旗下唯一芯片真龍,低估到令人窒息?

光刻膠第一股,國(guó)資委旗下唯一芯片真龍,低估到令人窒息?

財(cái)報(bào)翻譯官
2026-05-01 14:57:45
重慶:加大公積金惠民力度

重慶:加大公積金惠民力度

界面新聞
2026-05-01 16:38:19
離譜!曼聯(lián)賽季最佳引援竟被列入清洗名單,球迷集體看不懂

離譜!曼聯(lián)賽季最佳引援竟被列入清洗名單,球迷集體看不懂

奶蓋熊本熊
2026-05-02 02:23:08
荷蘭發(fā)達(dá)到什么程度了?人口僅1700萬,卻擁有12個(gè)世界五百強(qiáng)!

荷蘭發(fā)達(dá)到什么程度了?人口僅1700萬,卻擁有12個(gè)世界五百強(qiáng)!

抽象派大師
2026-04-30 00:16:18
曼聯(lián)不要的天才,阿爾特塔當(dāng)寶?阿森納鎖定紅魔 5000 萬棄將

曼聯(lián)不要的天才,阿爾特塔當(dāng)寶?阿森納鎖定紅魔 5000 萬棄將

瀾歸序
2026-05-02 02:57:25
計(jì)劃有變?22歲吳宜澤瘋狂4連鞭 半決賽6-2領(lǐng)先 英國(guó)觀眾為他歡呼

計(jì)劃有變?22歲吳宜澤瘋狂4連鞭 半決賽6-2領(lǐng)先 英國(guó)觀眾為他歡呼

風(fēng)過鄉(xiāng)
2026-05-01 05:20:57
10年麻將館老板囗述:凡是愛打麻將的,沒有一個(gè)人日子是過得好的

10年麻將館老板囗述:凡是愛打麻將的,沒有一個(gè)人日子是過得好的

小噎論事
2026-04-24 17:15:21
兩桿破百+六桿50加,10-2大勝!吳宜澤下一關(guān),是塞爾比還是奇跡

兩桿破百+六桿50加,10-2大勝!吳宜澤下一關(guān),是塞爾比還是奇跡

曹老師評(píng)球
2026-04-21 23:22:10
母親和情夫一起10年,父親默不作聲縱容,卻在他50歲生日那天反擊

母親和情夫一起10年,父親默不作聲縱容,卻在他50歲生日那天反擊

白云故事
2025-04-24 10:35:08
早年高舉雙手的鞏俐,大氣飽滿

早年高舉雙手的鞏俐,大氣飽滿

娛你同歡
2026-05-01 21:50:35
《黑袍》星光在GTA6“下?!?!街頭服務(wù)“攬客”

《黑袍》星光在GTA6“下?!?!街頭服務(wù)“攬客”

游民星空
2026-04-29 19:43:05
機(jī)器人+算力:2026年A股最強(qiáng)雙主線!這5只龍頭股被機(jī)構(gòu)集體看好

機(jī)器人+算力:2026年A股最強(qiáng)雙主線!這5只龍頭股被機(jī)構(gòu)集體看好

小白鴿財(cái)經(jīng)
2026-05-01 20:30:03
59歲歌手張宇患罕見病20年,妻子十一郎首度公開內(nèi)情:無法徹底根治,嚴(yán)重到不唱歌連說話都可能出問題

59歲歌手張宇患罕見病20年,妻子十一郎首度公開內(nèi)情:無法徹底根治,嚴(yán)重到不唱歌連說話都可能出問題

芒果都市
2026-05-01 17:45:29
三法官一致認(rèn)定無罪,卡里姆·汗下周二登臺(tái),西方國(guó)家投了反對(duì)票

三法官一致認(rèn)定無罪,卡里姆·汗下周二登臺(tái),西方國(guó)家投了反對(duì)票

老頭的傳奇色彩
2026-05-02 04:24:29
人活著,說到底就三樣?xùn)|西:生理需求居首,真正懂的人沒幾個(gè)

人活著,說到底就三樣?xùn)|西:生理需求居首,真正懂的人沒幾個(gè)

朗威談星座
2026-05-01 14:28:21
黃奇帆再預(yù)言未來房地產(chǎn),今年已基本應(yīng)驗(yàn),明年或大概率又是對(duì)的

黃奇帆再預(yù)言未來房地產(chǎn),今年已基本應(yīng)驗(yàn),明年或大概率又是對(duì)的

巢客HOME
2026-05-01 05:25:03
金靖近照大變樣!暴瘦脫相撞臉女星,網(wǎng)友:沒以前有靈氣了

金靖近照大變樣!暴瘦脫相撞臉女星,網(wǎng)友:沒以前有靈氣了

草莓解說體育
2026-05-01 14:41:01
陳慧琳演唱會(huì)穿三角褲衩,五十多了合適嗎?不愧是女神

陳慧琳演唱會(huì)穿三角褲衩,五十多了合適嗎?不愧是女神

西樓知趣雜談
2026-05-01 22:23:05
2026-05-02 05:19:00
簡(jiǎn)明科學(xué)指南 incentive-icons
簡(jiǎn)明科學(xué)指南
致力介紹科技帶給生活的新變化
1524文章數(shù) 1975關(guān)注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布多模態(tài)論文又連夜刪除

頭條要聞

伊朗未爆彈藥爆炸 致革命衛(wèi)隊(duì)14人死亡

頭條要聞

伊朗未爆彈藥爆炸 致革命衛(wèi)隊(duì)14人死亡

體育要聞

無奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

娛樂要聞

馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

財(cái)經(jīng)要聞

GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

汽車要聞

限時(shí)9.67萬起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

態(tài)度原創(chuàng)

時(shí)尚
房產(chǎn)
本地
手機(jī)
公開課

這個(gè)夏天,彩色褲子又火了!

房產(chǎn)要聞

所有戶型全賣爆!??赥OP級(jí)豪宅,景觀樣板間五一全線開放!

本地新聞

用青花瓷的方式,打開西溪濕地

手機(jī)要聞

曝iPhone18Pro相機(jī)史詩級(jí)升級(jí),這次你期待嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版