国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

誰(shuí)在決定AI手機(jī)的未來(lái):模型、系統(tǒng),還是生態(tài)?

0
分享至

手機(jī)可能是首個(gè)真正被 AI 接管的終端。全球有數(shù)十億智能手機(jī)用戶,每天生產(chǎn)著海量的數(shù)據(jù)。這些數(shù)據(jù)成為 AI 的燃料,反過(guò)來(lái),AI 讓手機(jī)更加智能。

當(dāng)蘋(píng)果還在持續(xù)評(píng)估 Siri 的底層供應(yīng)商之時(shí),安卓手機(jī)廠商已經(jīng)摩拳擦掌,在能部署 AI 功能的地方都塞上了 AI。無(wú)論是字節(jié)跳動(dòng)與手機(jī)廠商中興在操作系統(tǒng)層面合作推出的豆包 AI 手機(jī)工程樣機(jī),還是智譜開(kāi)源能夠自動(dòng)化操作手機(jī)界面的 AI Agent 模型 AutoGLM,都引起了市場(chǎng)對(duì) AI 手機(jī)或手機(jī) Agent 的高度關(guān)注。

按照業(yè)界的預(yù)期,Agent 將非常深刻地改變?cè)谥悄芙K端上的人機(jī)交互邏輯。從主動(dòng)式的 AI 響應(yīng)對(duì)話,到“次拋型”的 APP,千人千面的終端服務(wù)將成為可能。

無(wú)論是 AI 手機(jī)還是在手機(jī)中開(kāi)源 Agent 模型,對(duì)于 Agent 應(yīng)用與終端的普及、提高行業(yè)智能體體驗(yàn)的底線都有正向的影響。開(kāi)源模型也在一定程度上緩解了終端廠商的數(shù)據(jù)安全焦慮,并能夠更好地融合進(jìn)廠商原有的 Agent 助手系統(tǒng),而非必須“另起爐灶”。與此同時(shí),互聯(lián)網(wǎng)應(yīng)用也獲得了一個(gè)強(qiáng)大的基礎(chǔ),用于開(kāi)發(fā)應(yīng)用內(nèi)的自主操控智能體應(yīng)用。

在當(dāng)下的實(shí)踐中,手機(jī)應(yīng)用主要分為娛樂(lè)、查詢和工作三類。相比點(diǎn)外賣、買咖啡這些日常小事,AI 手機(jī)里的 Agent 更大的價(jià)值可能在于提升工作效率——幫用戶快速搞定那些原本復(fù)雜耗時(shí)的任務(wù),比如深度信息搜索、全網(wǎng)比價(jià)購(gòu)物、個(gè)人數(shù)據(jù)查詢管理等。這些事情以前可能要折騰半天,現(xiàn)在 Agent 能幫你幾分鐘就解決。

例如,Agent 可以通過(guò)整理手機(jī)中的聊天記錄、照片視頻、購(gòu)物歷史等數(shù)據(jù),幫你回憶某段時(shí)間的生活軌跡或重要事件。

然而,現(xiàn)在移動(dòng)終端面臨的核心問(wèn)題是:缺乏統(tǒng)一的 Agent 生態(tài)系統(tǒng),無(wú)法有效打通不同應(yīng)用之間的功能調(diào)用。加上行業(yè)內(nèi)尚未就 Agent 生態(tài)標(biāo)準(zhǔn)形成統(tǒng)一共識(shí),這些因素共同導(dǎo)致 AI 手機(jī)很難通過(guò)應(yīng)用工具調(diào)用的方式實(shí)現(xiàn)真正的智能操作。

因此,為了讓手機(jī) Agent 能夠通用地使用不同應(yīng)用,目前只能“曲線救國(guó)”——通過(guò)圖形用戶界面(GUI,Graphical User Interface)的方式,模擬人手操作來(lái)控制手機(jī)。操作邏輯其實(shí)就是多模態(tài)理解:先看懂手機(jī)當(dāng)前的屏幕截圖,然后像人一樣去點(diǎn)擊相應(yīng)的 APP 和按鈕,最后完成具體任務(wù)。

這種方式適用性很強(qiáng),理論上能操作各種 APP。但問(wèn)題是移動(dòng)設(shè)備的算力和存儲(chǔ)有限,面臨兩難選擇:7B 以下的小模型處理復(fù)雜 GUI 任務(wù)力不從心;而 7B 以上的大模型雖然功能強(qiáng)大,但體積太大、成本太高,在手機(jī)上跑起來(lái)很困難。

AI 手機(jī)的路線之爭(zhēng):云端還是端側(cè)?

目前,AI 手機(jī)(包括手機(jī) Agent)主要分為三條技術(shù)路線:純?cè)贫四P、純端?cè)模型和端云協(xié)同模型。

純?cè)贫四P投嘤糜谝苿?dòng)端(例如 AI 手機(jī)等)需要多個(gè)步驟和任務(wù)部署的復(fù)雜任務(wù)。另外,在多 APP 操作的場(chǎng)景下,由于任務(wù)相對(duì)較難,需要較強(qiáng)的推理能力和多模態(tài)理解,也會(huì)更多地使用云端模型。

盡管云端模型整體性能效果比端側(cè)模型強(qiáng),但問(wèn)題在于數(shù)據(jù)存放在云端,面臨包括照片、視頻、聊天信息、郵件等在內(nèi)的數(shù)據(jù)隱私問(wèn)題。此外,高成本和帶寬也是不容忽視的關(guān)鍵問(wèn)題。因此,在一些涉及個(gè)人數(shù)據(jù)、隱私性較強(qiáng)的場(chǎng)景則需要純端側(cè)模型。對(duì)于端云協(xié)同框架,則適用于云端和端側(cè)能力差別不顯著的場(chǎng)景。

一個(gè)關(guān)鍵的問(wèn)題付出水面:在手機(jī)這樣算力、能耗和隱私都極度受限的終端上,是否真的存在一種現(xiàn)實(shí)解法——既不過(guò)度依賴云端,又能跑得動(dòng) GUI Agent?

近期,香港大學(xué)黃超教授團(tuán)隊(duì)給出了一個(gè)平衡成本和性能的新方案,我們從這個(gè)案例中或許可以看到一些啟發(fā)。研究團(tuán)隊(duì)開(kāi)源了一個(gè)叫 OpenPhone 的項(xiàng)目(Mobile Agentic Foundation Models)[1]。在該項(xiàng)目中,不僅開(kāi)源了一個(gè)純端側(cè) 3B 尺寸的小模型,還提供了一套端云協(xié)同的方案,這樣既能在隱私敏感的場(chǎng)景下用本地模型處理,又能在隱私不敏感的復(fù)雜任務(wù)上調(diào)用云端大模型來(lái)保證完成質(zhì)量。

考慮手機(jī)的能耗限制和實(shí)際部署的可能性,研究人員基于開(kāi)源的 Qwen2.5-VL-3B 模型和自動(dòng)化生成的 GUI 數(shù)據(jù),通過(guò)監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)策略實(shí)現(xiàn)了與通用的 7B 模型相當(dāng)?shù)男阅堋?/p>


(來(lái)源:arXiv)

OpenPhone 還引入了一種類似于思維鏈(CoT,Chain of Thought)的長(zhǎng)推理機(jī)制。該機(jī)制的“巧妙之處”在于,將包括屏幕狀態(tài)、任務(wù)進(jìn)度和推理過(guò)程等在內(nèi)的每一步信息,從存儲(chǔ)原始高分辨率截圖壓縮成精簡(jiǎn)的文本描述,有效地降低了歷史上下文的存儲(chǔ)負(fù)擔(dān),從而實(shí)現(xiàn)了 Agent 的長(zhǎng)期反思以及決策能力。

在 138 項(xiàng)手機(jī)任務(wù)的測(cè)試中,OpenPhone 在性能接近 9B 模型的情況下,速度提升了 4 倍!皬亩藗(cè)測(cè)試結(jié)果來(lái)看,訓(xùn)練數(shù)據(jù)對(duì)于 GUI Agent 的表現(xiàn)至關(guān)重要,OpenPhone 提供了一套可以最大化人工標(biāo)記數(shù)據(jù)價(jià)值的數(shù)據(jù)生成管道,利用有限的數(shù)據(jù)來(lái)盡可能增強(qiáng) GUI Agent 的能力!秉S超告訴 DeepTech。

該研究證明,盡管小模型在泛化能力上不如大模型,但其在手機(jī) Agent 場(chǎng)景中,可通過(guò)長(zhǎng)推理等方式激發(fā)小模型的執(zhí)行任務(wù)能力,其在移動(dòng)端的潛力同樣不容忽視。


圖丨 OpenPhone 的總體框架(來(lái)源:arXiv)

黃超解釋道:“在 OpenPhone 項(xiàng)目中,端云協(xié)同框架不僅可節(jié)約模型本身的 token 開(kāi)銷,還能降低成本。但是,如果模型云端效果顯著好于端側(cè),則依然會(huì)采用云端模型來(lái)進(jìn)行操作!

研究團(tuán)隊(duì)坦言,該框架在實(shí)際部署過(guò)程中,可能會(huì)面臨大量工程性的優(yōu)化問(wèn)題。近期,他們也在和企業(yè)界溝通探討未來(lái)合作的方式!氨M管目前 AI 手機(jī)的大部分解決方案依賴于云端,但業(yè)界對(duì)端側(cè)突破仍寄予厚望。從我們與企業(yè)的交流來(lái)看,他們更傾向于在端側(cè)解決,云端可能只是當(dāng)前的權(quán)宜之計(jì)。”黃超表示。

可以看到,端云協(xié)同是在當(dāng)下平衡隱私和效果(成功率)的一個(gè)比較可行的方案。如果不考慮能耗和終端部署情況,端側(cè)處理最為理想,并能幫設(shè)備廠商節(jié)約云端算力。未來(lái),端云協(xié)同仍會(huì)是一個(gè)比較理想的范式。

業(yè)內(nèi)人士告訴 DeepTech,端云協(xié)同長(zhǎng)期來(lái)看是最佳選擇,不過(guò)短期內(nèi)受制于端側(cè)芯片算力和內(nèi)存限制,端上不太可能完整運(yùn)行所有 AI 手機(jī)需要的模型功能,仍需要較長(zhǎng)的時(shí)間和行業(yè)內(nèi)的軟硬協(xié)同發(fā)展。

因此,比較理想的狀態(tài)自然是簡(jiǎn)單任務(wù)能路由到端側(cè)直接運(yùn)行,復(fù)雜任務(wù)路由到云端執(zhí)行,但是實(shí)現(xiàn)這樣的目標(biāo)需要先跑通 AI 手機(jī)生態(tài)實(shí)現(xiàn)意圖理解的數(shù)據(jù)飛輪,模型才可能將來(lái)做到這一目標(biāo)。

AI 手機(jī)真正的難題:誰(shuí)來(lái)開(kāi)放操作系統(tǒng)的權(quán)限?

回到一個(gè) AI 手機(jī)繞不過(guò)的問(wèn)題:包括社交軟件、操作軟件或信息查詢軟件在內(nèi)的主流 APP,會(huì)禁止手機(jī) Agent 的訪問(wèn)權(quán)限。

從智能手機(jī)的角度來(lái)看,如果用戶通過(guò)手機(jī) Agent 來(lái)操作所有 APP,即通過(guò) GUI 方式進(jìn)行訪問(wèn),那么 APP 有可能喪失流量入口,直接導(dǎo)致 APP 賴以為生的廣告價(jià)值歸零。

有專家指出,現(xiàn)在的問(wèn)題在于,整個(gè)移動(dòng)端的 AI 手機(jī)整體生態(tài)會(huì)往哪里走,可能取決于手機(jī)廠商的戰(zhàn)略制定?傮w來(lái)看,解決這個(gè)問(wèn)題有兩種方案:一是 AI 手機(jī)廠商有一套自己的生態(tài),二是未來(lái)可能也會(huì)涉及到流量入口的合作。

在 DeepTech 與幾位業(yè)內(nèi)人士的交流中,普遍認(rèn)為 AI 手機(jī)的生態(tài)并非僅依賴某幾家企業(yè)或技術(shù)進(jìn)步的問(wèn)題,而是整個(gè)行業(yè)共同面臨的生態(tài)問(wèn)題,包括技術(shù)提供方(例如 AI 助手能力提供方、操作系統(tǒng)廠商、硬件供應(yīng)鏈模型企業(yè))、應(yīng)用與服務(wù)方(例如端硬件、互聯(lián)網(wǎng)應(yīng)用)、用戶、開(kāi)發(fā)者和監(jiān)管機(jī)構(gòu)等。

對(duì)于手機(jī)操作系統(tǒng)本身的權(quán)限開(kāi)放,業(yè)內(nèi)人士指出,需要謹(jǐn)慎但堅(jiān)定的推動(dòng),不宜操之過(guò)急但也萬(wàn)不可故步自封。其類似自動(dòng)駕駛上路的發(fā)展,可以考慮在滿足審計(jì)安全要求下,通過(guò)試點(diǎn)硬件產(chǎn)品和應(yīng)用場(chǎng)景開(kāi)放合作,逐步推動(dòng)相關(guān)場(chǎng)景落地和教育,并且同步建設(shè)起更完整的生態(tài)機(jī)制。

談及在操作系統(tǒng)層面兼顧支持高效模型調(diào)度、有效管理本地安全權(quán)限以及保障用戶隱私策略的策略,一位業(yè)內(nèi)人士告訴 DeepTech,這是一個(gè)較復(fù)雜的問(wèn)題,短期來(lái)看需要先建立 Agent 與用戶、系統(tǒng)和應(yīng)用之間的互信授權(quán)機(jī)制,同時(shí)建立起關(guān)于 Agent 的審計(jì)與安全柵欄,明確智能體“上路”的水平要求和安全底線。長(zhǎng)期來(lái)看,該方向的發(fā)展極大程度取決于 AI 和大模型本身的發(fā)展進(jìn)度,需要審時(shí)度勢(shì)地考慮實(shí)際發(fā)展情況進(jìn)行決策。

此外還需要看到的是,無(wú)論是云端還是端側(cè)模型,AI 手機(jī)任務(wù)的成功率目前尚不及人類水平,未來(lái)還需要在準(zhǔn)確率和可靠性方面同步提升。并且,純 GUI Agent 整體響應(yīng)速度還有很大的提升空間。

黃超認(rèn)為,未來(lái)模型上下文協(xié)議(MCP,Model Context Protocol)生態(tài)輔助 GUI 作為解決方案,有望提升手機(jī) Agent 的整體響應(yīng)速度和準(zhǔn)確率。“就像智能手機(jī)需要 APP Store,AI 手機(jī)也需要類似的平臺(tái),讓整個(gè)社區(qū)都活躍起來(lái)貢獻(xiàn)高質(zhì)量的 MCP,再去調(diào)用它們。從生態(tài)角度來(lái)看,APP 只有保持開(kāi)放狀態(tài)并放出自己的 MCP,構(gòu)建一套更加完善高效的合作模式,才能守住自己的流量,否則流量也有可能會(huì)被其他類似 APP 搶走。未來(lái)應(yīng)用可能會(huì)呈現(xiàn)出兩種交互模式:一種是面向智能體的交互,另一種是面向人類的交互!

可見(jiàn),AI 手機(jī)真正廣泛應(yīng)用的標(biāo)志,不在于模型多強(qiáng),而是不同 APP 應(yīng)用廠商如何共建手機(jī)智能體的環(huán)境。當(dāng)然,這同樣需要整個(gè)生態(tài)系統(tǒng)共同推動(dòng)技術(shù)的發(fā)展和落地。

參考資料:

1.https://arxiv.org/abs/2510.22009v1

排版:劉雅坤

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日本可以死心了!李在明剛到就劃紅線:中日矛盾不是韓方能介入的

日本可以死心了!李在明剛到就劃紅線:中日矛盾不是韓方能介入的

科普100克克
2026-01-13 18:09:17
2026中國(guó)已進(jìn)入財(cái)富6.0時(shí)代,很多人思維還停在1.0階段!

2026中國(guó)已進(jìn)入財(cái)富6.0時(shí)代,很多人思維還停在1.0階段!

水木然
2026-01-12 23:48:12
這下子,特朗普算是明白,為什么前任都不敢動(dòng)委內(nèi)瑞拉了

這下子,特朗普算是明白,為什么前任都不敢動(dòng)委內(nèi)瑞拉了

壹知眠羊
2026-01-12 14:25:31
深圳老太摔倒喊不訛人,司機(jī)送醫(yī)墊付費(fèi)用后,老太:都是你害的!

深圳老太摔倒喊不訛人,司機(jī)送醫(yī)墊付費(fèi)用后,老太:都是你害的!

有書(shū)
2026-01-12 21:10:22
文旅部門(mén)回應(yīng)“貴州省博老館29件套文物丟失或被盜”:有備案可查,正梳理將通報(bào)

文旅部門(mén)回應(yīng)“貴州省博老館29件套文物丟失或被盜”:有備案可查,正梳理將通報(bào)

紅星新聞
2026-01-13 12:18:08
新華社消息|古巴國(guó)家主席:古美關(guān)系要取得進(jìn)展不能建立在威脅和經(jīng)濟(jì)脅迫上

新華社消息|古巴國(guó)家主席:古美關(guān)系要取得進(jìn)展不能建立在威脅和經(jīng)濟(jì)脅迫上

新華社
2026-01-13 10:11:43
特朗普緊急發(fā)文炸全網(wǎng):美國(guó)要 “完蛋”?中國(guó)竟成他唯一救星!

特朗普緊急發(fā)文炸全網(wǎng):美國(guó)要 “完蛋”?中國(guó)竟成他唯一救星!

觸摸史跡
2026-01-13 17:41:12
3生肖1月中旬起鴻運(yùn)當(dāng)頭,苦盡甘來(lái)發(fā)橫財(cái),翻身成土豪

3生肖1月中旬起鴻運(yùn)當(dāng)頭,苦盡甘來(lái)發(fā)橫財(cái),翻身成土豪

人閒情事
2026-01-13 17:19:57
應(yīng)對(duì)AI算力浪潮,SK海力士擴(kuò)建HBM封裝產(chǎn)能

應(yīng)對(duì)AI算力浪潮,SK海力士擴(kuò)建HBM封裝產(chǎn)能

鞭牛士
2026-01-13 13:55:06
中國(guó)首例五胞胎終于長(zhǎng)大了,父親因勞累去世,母親直言后悔生下他們

中國(guó)首例五胞胎終于長(zhǎng)大了,父親因勞累去世,母親直言后悔生下他們

等風(fēng)來(lái)育兒聯(lián)盟
2025-08-01 12:21:35
呆呆與榜一伙夫哥見(jiàn)面,聊天中得知,呆呆沒(méi)火前,靠自己蓋房買車

呆呆與榜一伙夫哥見(jiàn)面,聊天中得知,呆呆沒(méi)火前,靠自己蓋房買車

有范又有料
2026-01-13 13:37:45
國(guó)乒全新教練組薪資曝光,馬琳總收入突破千萬(wàn),莎頭主管教練推測(cè)

國(guó)乒全新教練組薪資曝光,馬琳總收入突破千萬(wàn),莎頭主管教練推測(cè)

體壇白話
2026-01-13 11:09:18
很多人都患過(guò)“帶狀皰疹”,卻不知它和“老年癡呆”有關(guān)!了解下

很多人都患過(guò)“帶狀皰疹”,卻不知它和“老年癡呆”有關(guān)!了解下

岐黃傳人孫大夫
2026-01-12 13:00:07
錢再多有什么用,64歲郎平如今的現(xiàn)狀,給所有運(yùn)動(dòng)員們提了個(gè)醒

錢再多有什么用,64歲郎平如今的現(xiàn)狀,給所有運(yùn)動(dòng)員們提了個(gè)醒

削桐作琴
2025-12-10 16:53:18
浮出水面!頂級(jí)名帥有望“空降”皇馬!老弗爺或送1.7億見(jiàn)面禮

浮出水面!頂級(jí)名帥有望“空降”皇馬!老弗爺或送1.7億見(jiàn)面禮

頭狼追球
2026-01-13 11:09:48
一位老人感嘆:人沒(méi)必要活得太長(zhǎng)壽。60歲走,太年輕;70歲走,有點(diǎn)早;80歲去世,剛好合適。

一位老人感嘆:人沒(méi)必要活得太長(zhǎng)壽。60歲走,太年輕;70歲走,有點(diǎn)早;80歲去世,剛好合適。

二胡的歲月如歌
2026-01-12 18:27:06
美論壇:沒(méi)有經(jīng)過(guò)韓國(guó)的允許,中國(guó)怎么敢擅自發(fā)射那么多衛(wèi)星?

美論壇:沒(méi)有經(jīng)過(guò)韓國(guó)的允許,中國(guó)怎么敢擅自發(fā)射那么多衛(wèi)星?

近史談
2026-01-13 18:02:33
電池巨頭再暴大雷!

電池巨頭再暴大雷!

電動(dòng)知家
2026-01-12 10:25:26
明搶5000萬(wàn)桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了

明搶5000萬(wàn)桶石油后,特朗普轉(zhuǎn)頭才發(fā)現(xiàn):中國(guó)連一桶都不肯買了

現(xiàn)代小青青慕慕
2026-01-12 18:03:57
灰熊醞釀大動(dòng)作!送走莫蘭特后或繼續(xù)交易小杰克遜 建隊(duì)重心轉(zhuǎn)變

灰熊醞釀大動(dòng)作!送走莫蘭特后或繼續(xù)交易小杰克遜 建隊(duì)重心轉(zhuǎn)變

羅說(shuō)NBA
2026-01-13 08:19:50
2026-01-13 18:44:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16118文章數(shù) 514482關(guān)注度
往期回顧 全部

科技要聞

每年10億美元!谷歌大模型注入Siri

頭條要聞

距中國(guó)加強(qiáng)管制不到一周 日本派船盯上6000米深海稀土

頭條要聞

距中國(guó)加強(qiáng)管制不到一周 日本派船盯上6000米深海稀土

體育要聞

他帶出國(guó)乒世界冠軍,退休后為愛(ài)徒返場(chǎng)

娛樂(lè)要聞

周杰倫以球員身份參加澳網(wǎng),C位海報(bào)公開(kāi)

財(cái)經(jīng)要聞

"天量存款"將到期 資金會(huì)否搬入股市?

汽車要聞

限時(shí)9.99萬(wàn)元起 2026款啟辰大V DD-i虎鯨上市

態(tài)度原創(chuàng)

數(shù)碼
時(shí)尚
本地
親子
公開(kāi)課

數(shù)碼要聞

機(jī)械革命潘春節(jié)CES 對(duì)話 AMD高層:錨定全球高性能 PC 核心玩家

走過(guò)那個(gè)夏天,甜茶終于站上金球獎(jiǎng)之巔

本地新聞

云游內(nèi)蒙|到巴彥淖爾去,赴一場(chǎng)塞上江南的邀約

親子要聞

復(fù)旦兒科醫(yī)聯(lián)體體重管理聯(lián)盟來(lái)了!將重點(diǎn)加強(qiáng)兒童超重肥胖危險(xiǎn)因素的監(jiān)測(cè)與評(píng)估

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版