国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI手機(jī)的分水嶺來了:豆包、千問、Gemini走出了三條路

0
分享至

在上月底舉辦的三星 Galaxy S26 發(fā)布會(huì)上,三星和谷歌官宣將在 Galaxy S26 上首發(fā)基于 Gemini 的 Screen Automation(屏幕自動(dòng)化)的能力。

簡單來說,就是 Gemini 可以直接在手機(jī)屏幕上操作應(yīng)用:打開 APP、識(shí)別屏幕、點(diǎn)擊滑動(dòng)、輸入文字……完成一連串 UI 操作,最后再把確認(rèn)步驟交給用戶。



圖片來源:三星

沒錯(cuò),聽起來就和努比亞 M153(坊間俗稱「豆包手機(jī)」)上的豆包手機(jī)助手一樣,都是能替代人類在手機(jī)上進(jìn)行「代理」操作,實(shí)現(xiàn)一句話點(diǎn)外賣、叫車、網(wǎng)購等需求。

從海外媒體和論壇的反饋來看,這項(xiàng)功能終于在最近的測(cè)試版更新中上線了。

不過我們也發(fā)現(xiàn),谷歌并沒有全盤學(xué)習(xí)豆包手機(jī)助手的做法。雖然在技術(shù)實(shí)現(xiàn)路徑上同樣基于 GUI 的 Agent,但 Gemini 會(huì)基于 Android 開啟一個(gè)本地的虛擬沙盒,同時(shí)還主動(dòng)限制了首批開放 Gemini「操作」的 APP,僅限少數(shù)一批應(yīng)用。

這種處理方式與國內(nèi)廠商顯然不太一樣。甚至可以對(duì)比字節(jié)的豆包手機(jī)助手和阿里的千問,谷歌選擇了一條看起來既激進(jìn)、又保守的路線。

讓 AI 操作系統(tǒng),而不是接管手機(jī)

只看功能表面,Gemini 的「屏幕自動(dòng)化」很容易被理解為另一種「豆包手機(jī)助手」。它同樣可以替你點(diǎn)外賣、叫車、下單,看起來也像一個(gè)能替人操作手機(jī)的 AI 代理。

但如果把視角往下再挖一層,就會(huì)發(fā)現(xiàn)谷歌的方案其實(shí)完全不是一回事。

豆包手機(jī)助手的邏輯很簡單:AI 讀取屏幕像素,像人眼一樣識(shí)別按鈕和輸入框,然后模擬手指點(diǎn)擊。這種方式最大的優(yōu)點(diǎn)就是通用——理論上任何 APP 都能操作,因?yàn)?AI 看到的只是屏幕。

Gemini 明顯更「保守」。在實(shí)際執(zhí)行任務(wù)時(shí),Gemini 并不會(huì)直接在你的手機(jī)桌面上操作應(yīng)用,而是會(huì)在 Android 系統(tǒng)里開啟一個(gè)本地的虛擬沙盒窗口,讓 AI 在這個(gè)環(huán)境里運(yùn)行目標(biāo) APP。

整個(gè)過程是可見的,用戶可以隨時(shí)終止任務(wù),也可以在任何一步接管操作。



圖片來源:Android Central

簡單來說,Gemini「屏幕自動(dòng)化」在產(chǎn)品定位上并不是一個(gè)可以隨意操控手機(jī)的萬能代理,而是一個(gè)被系統(tǒng)嚴(yán)格約束的自動(dòng)化能力。

谷歌還主動(dòng)限制了第一批支持自動(dòng)化的應(yīng)用數(shù)量。目前開放的主要是打車、外賣和餐飲類服務(wù),僅支持 Lyft、Uber、GrubHub、DoorDash、Uber Eats 和星巴克。

也限制了「用戶范圍」。目前除了三星 Galaxy S26 系列已經(jīng)可以在測(cè)試版中體驗(yàn),谷歌也僅規(guī)劃了 Pixel 10 系列支持,同時(shí) Gemini 免費(fèi)用戶每天僅有 5 次使用額度、Plus 會(huì)員 12 次、Pro 會(huì)員 20 次、Ultra 會(huì)員 120 次。

這里既有算力的考量,也在于用戶對(duì) AI「亂動(dòng)手機(jī)」的擔(dān)憂,尤其是在歐美市場(chǎng)。所以谷歌做了權(quán)限隔離、關(guān)鍵步驟必須要用戶手動(dòng)操作、可以實(shí)時(shí)中斷 AI 操作等。

但說到底,這只是過渡階段,谷歌的野心絕不止是讓 Gemini 僅僅能夠操作幾個(gè)特定 APP。



圖片來源:谷歌

很多人注意到 Gemini 的 GUI 操作能力,卻忽略了 Android 在系統(tǒng)層面正在發(fā)生的一件事情。

就在三星 Galaxy S26 系列發(fā)布會(huì)前夕,谷歌官方發(fā)布了一篇博文名為《智能操作系統(tǒng):讓 AI 代理對(duì)安卓應(yīng)用更有幫助》,并正式推出了一套新的應(yīng)用能力接口體系——AppFunctions,允許 APP 主動(dòng)向系統(tǒng)聲明自己可以被 AI 調(diào)用的功能。

舉個(gè)例子,一個(gè)外賣 APP 可以告訴系統(tǒng):支持搜索餐廳、添加商品、提交訂單這些能力。當(dāng)用戶對(duì) Gemini 說「幫我點(diǎn)一份披薩」時(shí),AI 并不一定需要逐步點(diǎn)擊界面,它可以直接調(diào)用這些能力完成任務(wù)。

如果把這套機(jī)制理解成 AI 的「函數(shù)調(diào)用」,事情就變得非常清晰了。在谷歌的設(shè)計(jì)里,AI 代理其實(shí)有兩條路徑可以執(zhí)行任務(wù),一種是通過系統(tǒng)接口直接調(diào)用應(yīng)用能力,另一種才是通過識(shí)別屏幕界面來進(jìn)行 GUI 自動(dòng)化。

前者效率更高、穩(wěn)定性更好;后者則是為了兼容那些沒有適配新接口的應(yīng)用。

這意味著 Gemini 未來的設(shè)備自動(dòng)化能力,本質(zhì)上并不是單純的「AI 看屏幕操作手機(jī)」,而是一種系統(tǒng) API 與 GUI 混合的架構(gòu)。



AppFunctions 的應(yīng)用示例,圖片來源:雷科技

這個(gè)差異聽起來有點(diǎn)技術(shù)化,但它背后的產(chǎn)品邏輯其實(shí)非常簡單。相比豆包手機(jī)助手讓 AI 像人一樣使用手機(jī),谷歌想做的事情是讓 AI 像系統(tǒng)一樣調(diào)度應(yīng)用。

當(dāng) AI 只是讀取屏幕像素時(shí),它始終站在系統(tǒng)之外,只能模仿人的操作邏輯;但一旦 AI 被放進(jìn)操作系統(tǒng)內(nèi)部,它就可以直接協(xié)調(diào)應(yīng)用之間的能力。

從這個(gè)角度看,Gemini Screen Automation 的真正目標(biāo)或許并不是點(diǎn)外賣、叫車這些場(chǎng)景。谷歌真正想建立的,是一種新的 Android 運(yùn)行邏輯和生態(tài)。從這里出發(fā),我們也能在一定程度上明白,為什么谷歌要和高通聯(lián)手推動(dòng)「安卓電腦」(非 Chromebook)。

也解釋了為什么 Gemini 的方案看起來既激進(jìn)又保守。

激進(jìn)的地方在于,它試圖把 AI 變成 Android 的調(diào)度中心;保守在于,谷歌并不打算讓 AI 隨意接管整個(gè)手機(jī),而是通過系統(tǒng)接口、權(quán)限控制和應(yīng)用白名單,一步一步推進(jìn)這種變化。

相比「萬能 AI 代理」的想象,這種路線顯然更慢,也更克制。但對(duì)于一個(gè)擁有數(shù)十億設(shè)備的操作系統(tǒng)來說,谷歌可能也沒有太多激進(jìn)試錯(cuò)的空間。

豆包向左,千問向右,Gemini 走中間

相比谷歌在手機(jī)上的做法,去年底亮相的豆包手機(jī)助手選擇了最簡單、也最激進(jìn)的一種方式:讓 AI 像人一樣使用手機(jī)。

在這套方案里,AI 讀取屏幕像素,識(shí)別按鈕、輸入框和頁面結(jié)構(gòu),然后模擬手指點(diǎn)擊完成操作。無論是點(diǎn)外賣、比價(jià)購物還是下單支付,AI 都是在手機(jī)界面上一步步執(zhí)行。

這種方式最大的優(yōu)勢(shì)就是通用。因?yàn)?AI 看到的只是屏幕,它不需要任何 APP 的接口支持,也不需要平臺(tái)授權(quán)。理論上,只要是人能操作的應(yīng)用,AI 都可以完成同樣的操作。

這也是為什么很多人第一次體驗(yàn)豆包手機(jī)助手時(shí),會(huì)覺得它像一種「真正的 AI 手機(jī)」。



圖片來源:豆包

但問題也同樣明顯。當(dāng) AI 可以讀取整個(gè)屏幕并操作所有應(yīng)用時(shí),權(quán)限和安全問題就不可避免。同時(shí),很多互聯(lián)網(wǎng)平臺(tái)也并不歡迎這種自動(dòng)化行為,因?yàn)樗@過了平臺(tái)自身的入口和推薦體系。

簡單說,豆包的路線技術(shù)上非常直接,但也天然會(huì)和應(yīng)用生態(tài)產(chǎn)生摩擦。

相比之下,阿里的千問走的是另一條思路,利用阿里自己的服務(wù)生態(tài),讓 AI 成為一個(gè)調(diào)度中心。在這套體系里,用戶的一句話會(huì)被拆解成具體任務(wù),然后分別調(diào)用淘寶、支付寶、高德、飛豬等服務(wù)來完成。

比如搜索商品、下單支付、規(guī)劃路線,都是直接調(diào)用真實(shí)業(yè)務(wù)能力,而不是模擬界面操作。因?yàn)樗胁僮鞫及l(fā)生在生態(tài)內(nèi)部,AI 不需要繞過應(yīng)用權(quán)限,也不會(huì)觸發(fā)平臺(tái)風(fēng)控,又因?yàn)橹苯诱{(diào)用服務(wù)接口,執(zhí)行效率往往也更高。



圖片來源:雷科技

但問題同樣清晰:生態(tài)邊界。千問能夠調(diào)度的服務(wù),本質(zhì)上還是阿里系應(yīng)用。一旦用戶需求涉及其他平臺(tái),能力就會(huì)明顯下降。

從這個(gè)角度看,豆包和千問其實(shí)代表了兩種非常典型的 AI 代理路徑。前者試圖讓 AI 接管手機(jī)本身,追求的是通用能力;后者則通過生態(tài)整合,讓 AI 接管服務(wù)流程,追求的是業(yè)務(wù)深度。

而谷歌的 Gemini,某種程度上站在二者之間。在當(dāng)前階段,Gemini 依然保留了 GUI 自動(dòng)化能力,這意味著它在必要時(shí)也可以像豆包一樣,通過識(shí)別界面來操作應(yīng)用。但與此同時(shí),谷歌又在 Android 系統(tǒng)里引入了新的應(yīng)用能力接口,讓 APP 主動(dòng)向系統(tǒng)開放可以被 AI 調(diào)用的功能。

如果應(yīng)用支持這些接口,Gemini 就不需要再逐步點(diǎn)擊界面,而是可以直接調(diào)用應(yīng)用能力完成任務(wù)。換句話說,谷歌的方案其實(shí)是一種混合路徑:

系統(tǒng)接口優(yōu)先,GUI 自動(dòng)化兜底。

從短期來看,這種方式顯然沒有豆包那樣驚艷,也不像千問那樣能夠迅速整合成熟生態(tài)。但它的好處在于,既避免了和應(yīng)用生態(tài)的正面沖突,又保留了足夠的通用性。

寫在最后

把視角再拉遠(yuǎn)一點(diǎn),其實(shí)不難理解三種路線為什么會(huì)分化成現(xiàn)在這樣。

字節(jié)沒有操作系統(tǒng),也沒有本地生活生態(tài),所以只能讓 AI 直接接管手機(jī);阿里擁有龐大的服務(wù)體系,于是讓 AI 去調(diào)度自己的業(yè)務(wù)網(wǎng)絡(luò);而谷歌真正擁有的,則是 Android 這個(gè)覆蓋數(shù)十億設(shè)備的操作系統(tǒng)。

因此,Gemini 的目標(biāo)從一開始就不是做一個(gè)更強(qiáng)的手機(jī)助手,而是把 AI 變成系統(tǒng)的一部分,讓 Android 從「運(yùn)行應(yīng)用的平臺(tái)」慢慢變成「調(diào)度應(yīng)用的智能系統(tǒng)」。從這個(gè)角度看,Gemini 的克制并不是保守,而更像是一種平臺(tái)級(jí)公司的必然選擇。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全國禁賽5年!涼山隊(duì)一球員不滿判罰賽后飛踹拳擊裁判,此前已被四川省內(nèi)禁賽5年

全國禁賽5年!涼山隊(duì)一球員不滿判罰賽后飛踹拳擊裁判,此前已被四川省內(nèi)禁賽5年

紅星新聞
2026-03-25 23:19:21
“美國有意?;鹨粋€(gè)月,與伊朗達(dá)成協(xié)議”,以色列擔(dān)心特朗普為宣布勝利而妥協(xié),美國前CIA局長:特朗普現(xiàn)在正手忙腳亂,比起他我更信伊朗

“美國有意停火一個(gè)月,與伊朗達(dá)成協(xié)議”,以色列擔(dān)心特朗普為宣布勝利而妥協(xié),美國前CIA局長:特朗普現(xiàn)在正手忙腳亂,比起他我更信伊朗

每日經(jīng)濟(jì)新聞
2026-03-25 09:00:07
41歲張雪峰去世,死因曝光,他至少有3次活命機(jī)會(huì),全被耽誤了!

41歲張雪峰去世,死因曝光,他至少有3次活命機(jī)會(huì),全被耽誤了!

小舟談歷史
2026-03-25 18:56:59
僅差51助攻達(dá)成場(chǎng)均三雙!約基奇追威少神跡:又刷5紀(jì)錄獻(xiàn)準(zhǔn)絕殺

僅差51助攻達(dá)成場(chǎng)均三雙!約基奇追威少神跡:又刷5紀(jì)錄獻(xiàn)準(zhǔn)絕殺

顏小白的籃球夢(mèng)
2026-03-25 14:16:02
結(jié)束10年曼城執(zhí)教生涯?英媒:瓜迪奧拉今夏離任 候選有兩大弟子

結(jié)束10年曼城執(zhí)教生涯?英媒:瓜迪奧拉今夏離任 候選有兩大弟子

智道足球
2026-03-25 13:32:37
呂迪格:皇馬知我激進(jìn)有度,9年無紅+季均5黃為證

呂迪格:皇馬知我激進(jìn)有度,9年無紅+季均5黃為證

體壇周報(bào)
2026-03-25 16:16:12
山姆緊急下架,“已立案調(diào)查”

山姆緊急下架,“已立案調(diào)查”

天津族
2026-03-26 00:25:01
從主動(dòng)落選,到湖人未來!里夫斯能否簽下頂薪?

從主動(dòng)落選,到湖人未來!里夫斯能否簽下頂薪?

籃球?qū)嶄?/span>
2026-03-26 00:14:43
美國對(duì)中國滲透沒白費(fèi),扶持的“內(nèi)鬼”,終于開始在中國露頭了

美國對(duì)中國滲透沒白費(fèi),扶持的“內(nèi)鬼”,終于開始在中國露頭了

歷史求知所
2025-12-01 11:30:06
網(wǎng)傳山東煉油廠的供應(yīng)鏈:伊朗原油洗白后運(yùn)來煉制,再賣到非洲掙大錢

網(wǎng)傳山東煉油廠的供應(yīng)鏈:伊朗原油洗白后運(yùn)來煉制,再賣到非洲掙大錢

三言四拍
2026-03-09 08:13:42
強(qiáng)過張子宇?天津雙塔被鄭海霞看好 這是女籃之幸還是不幸?

強(qiáng)過張子宇?天津雙塔被鄭海霞看好 這是女籃之幸還是不幸?

大嘴爵爺侃球
2026-03-25 09:20:45
戰(zhàn)場(chǎng)奇跡!1臺(tái)烏軍機(jī)器人死守陣地45天硬剛俄軍沖殺和機(jī)槍掃射

戰(zhàn)場(chǎng)奇跡!1臺(tái)烏軍機(jī)器人死守陣地45天硬剛俄軍沖殺和機(jī)槍掃射

子桑說
2026-03-25 17:27:05
張柏芝大兒子終于“長開”了!穿西裝比謝霆鋒還帥,網(wǎng)友:像爺爺

張柏芝大兒子終于“長開”了!穿西裝比謝霆鋒還帥,網(wǎng)友:像爺爺

木子愛娛樂大號(hào)
2026-01-07 21:47:13
逃難的林沖殺了收留他的王倫,這樣的人進(jìn)不了任何人的圈子

逃難的林沖殺了收留他的王倫,這樣的人進(jìn)不了任何人的圈子

涼湫瑾言
2026-03-23 13:29:51
上海女博士在家8年未出門,警察破門后,看到屋內(nèi)景象頓時(shí)傻眼了

上海女博士在家8年未出門,警察破門后,看到屋內(nèi)景象頓時(shí)傻眼了

詭譎怪談
2025-05-02 00:08:52
王楚欽帶三個(gè)“新人”打世乒賽?第五人到底是誰,懸念留到最后

王楚欽帶三個(gè)“新人”打世乒賽?第五人到底是誰,懸念留到最后

曹老師評(píng)球
2026-03-25 21:39:22
定了!又有明星來東莞開演唱會(huì)!

定了!又有明星來東莞開演唱會(huì)!

東莞好生活
2026-03-25 22:14:51
官媒曝光!進(jìn)價(jià)20元賣899元,暴利45倍!網(wǎng)友:智商稅

官媒曝光!進(jìn)價(jià)20元賣899元,暴利45倍!網(wǎng)友:智商稅

財(cái)經(jīng)八卦
2026-03-24 20:39:54
1912年,曹錕娶20歲陳寒蕊,新婚夜他酣睡,新娘見其蒼老悲泣不止

1912年,曹錕娶20歲陳寒蕊,新婚夜他酣睡,新娘見其蒼老悲泣不止

嘮叨說歷史
2026-03-24 18:52:24
一聲嘆息!薩拉赫帶著遺憾告別紅軍 去年夏天離開才是完美結(jié)局

一聲嘆息!薩拉赫帶著遺憾告別紅軍 去年夏天離開才是完美結(jié)局

雪狼侃體育
2026-03-25 23:05:55
2026-03-26 01:48:49
雷科技 incentive-icons
雷科技
專注AI硬科技
36590文章數(shù) 811949關(guān)注度
往期回顧 全部

科技要聞

紅極一時(shí)卻草草收?qǐng)?,Sora宣布正式關(guān)停

頭條要聞

伊朗:正在搜捕逃亡美軍

頭條要聞

伊朗:正在搜捕逃亡美軍

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財(cái)經(jīng)要聞

管濤:中東局勢(shì)如何影響人民幣匯率走勢(shì)?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實(shí)力

態(tài)度原創(chuàng)

藝術(shù)
手機(jī)
親子
旅游
房產(chǎn)

藝術(shù)要聞

張雪峰走了,他公司所在的這棟樓高177.8米,耗資超10億!

手機(jī)要聞

Bigme大我HiBreak Plus彩墨屏手寫手機(jī)亮相,預(yù)售價(jià)1699元

親子要聞

智利幼兒教育覆蓋率僅43%,專家吁提升投資與優(yōu)先地位

旅游要聞

普度寺玉蘭盛開

房產(chǎn)要聞

41億!259畝!建學(xué)?!齺嗊@個(gè)大城更,最新方案曝光!

無障礙瀏覽 進(jìn)入關(guān)懷版