国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

只需3步,教你部署自己的AI手機 | 保姆級教程

0
分享至

大家好,我是已經(jīng)擺爛了好幾天的冷逸。

今天上號了,給大家?guī)硪黄?strong>AI手機 的部署教程,手把手教學,教不會退網(wǎng)。

最近我開始琢磨 ROI 的事情,不知道是在哪個地方看到了這樣一句話:提高自己高 ROI 的付出,減少自己低 ROI 的內(nèi)耗。

ROI 是什么?投資回報率。在一些低價值的地方內(nèi)耗自己、禁錮自己,不值當。比如,預定會議發(fā)給領(lǐng)導,全網(wǎng)搜同款商品比價,規(guī)劃行程并同步到社交賬戶。

我就想,這些事為什么不能交給 AI 呢?

于是我折騰了好幾天,今天給大家?guī)砹舜鸢福瓤葱Ч?/p>

我讓 AI 給我預定今天的會議,并把會議鏈接發(fā)到工作室群里。左邊是真機的執(zhí)行效果,右邊是AI跑的全過程。

所有過程,0接管,全自動。

為了防止有人杠,我還錄了幾段視頻。



這種看著手機自己干活的感覺,像極了當初老板在辦公室看我干活的樣子,有一種莫名的爽感。

對了,這里面的所有數(shù)據(jù)都是在本地跑的,不上網(wǎng),非常安全。


一手教程

怎么做的?先簡單說一下要用到的模型、環(huán)境、工具以及關(guān)鍵步驟。

跟大象裝進冰箱一樣,這個 AI手機 的部署也是分為三步:

  • 1、搭建大模型推理環(huán)境(小白建議用Ollama,高手用vllm)。

  • 2、搭建安卓執(zhí)行環(huán)境(抱歉,尊貴的iOS用戶暫時還不能體驗)。

  • 3、搭建GUI Agent運行環(huán)境。

需要用到的模型和工具有:

  • 0、前置環(huán)境:Python。

  • 1、推理模型:GELab-Zero-4B-preview,來自階躍星辰,非常能打的GUI模型。

  • 2、模型運行:Ollama。

  • 3、安卓連電腦的工具:ADB。

  • 4、運行Agent:GELab-Zero Agent(支持MCP),也是階躍出品。

  • 5、電腦配置:GPU≥8GB。

  • 6、一根USB數(shù)據(jù)線。

看到這里,先別方。接下來,我會逐字逐句的詳細講解,并全程配有演示截圖。

0)安裝Python環(huán)境

首先,要確保自己安裝得有3.12以上版本的 Python。

可以先在命令行里輸入這段命令,查看你的Python版本號。

python --version

什么?你不知道什么是命令行界面(CLI),也不知道在哪里調(diào)用?

行,我今天就教你一個 coding 秘籍,在任意文件夾的地址欄里輸入 cmd ,可以快捷調(diào)用命令行(這點記住了,后面要考),然后在這個“黑底代碼框”里輸入 python --version 就可以查看版本號了。


當然,高手是按Win+R鍵直接調(diào)出運行框,輸入cmd進入。

對了,本文大部分我都是以 Windows 視角來講的,蘋果電腦也基本差不多,把一些關(guān)鍵按鍵替換一下就好了。

如果已安裝了 Python(已裝過Trae、VS code、Claude Code的,大概率都裝過Python),命令行會這樣顯示。


如果沒有安裝 Python,推薦使用miniforge來安裝。安裝過程需要注意勾選,并將 conda 加入 path 的選項(后面會講如何設(shè)置變量),以確保 conda 能夠被正確激活。

詳細過程見Install部分:

https://github.com/conda-forge/miniforge

安裝后需要激活 conda,在 powershell (按Win+R輸入powershell)輸入:

Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser

注意!別把,那是解釋這段命令的。

Mac 和 Linux 用戶,則用這個命令下載并安裝 miniforge:

bash Miniforge3-$(uname)-$(uname -m).sh

安裝完成后,新建并激活一個 Python 環(huán)境:

conda activate gelab-zero

1)搭建大模型推理環(huán)境

安裝好 Python 環(huán)境后,接下來就是在你的電腦里裝一個大模型,讓它能夠?qū)κ謾C的 GUI 界面進行識別、推理。

一般,本地大模型的部署主要通過Ollamavllm。Ollama 適合個人,vllm 適合企業(yè)或有一定技術(shù)背景的人。

我知道,你肯定只想了解 Ollama。

跟大象裝進冰箱一樣,Ollama 就是大模型的冰箱,它把大模型分配到 GPU/CPU 里進行運算、干活。

記得,一定要讓Ollama開著,不能關(guān)掉。別問為什么,因為我吃過虧——我把 Ollama 從后臺關(guān)掉了,然后 CLI 那邊就拼命報錯……

安裝 Ollama,非常簡單。直接前往ollama.com,下載安裝,就可以了。


裝好后,記得設(shè)置一下Ollama的本地模型文件夾,別讓它默認放在C盤。不然你C盤要爆的。


然后,下載并部署gelab-zero-4b-preview模型,建議通過 huggingface cli的方式下載。

如果沒有安裝過huggingface cli,先執(zhí)行這個命令:

pip install huggingface_hub


然后,從huggingface下載gelab-zero-4b-preview 模型權(quán)重,命令是:

hf download --no-force-download stepfun-ai/GELab-Zero-4B-preview --local-dir gelab-zero-4b-preview


模型下載好了,是這樣的頁面。


接著,將模型導入到Ollama。先輸入這個命令。

cd gelab-zero-4b-preview

再輸這個命令:

ollama create gelab-zero-4b-preview -f Modelfile

這里,可能大部分人都會報錯,這是因為Ollama.exe地址不對。


建議自己在C盤找或者搜一下Ollama.exe這個文件,一般在AppData文件夾下的Local文件夾里。

找到后,復制這段路徑。


然后重新輸入命令:

C:\Users\Administrator\AppData\Local\Programs\Ollama\Ollama.exe create gelab-zero-4b-preview -f Modelfile

模型數(shù)據(jù)就開始往Ollama導了。


4B模型,建議GPU在12GB以上,跑得比較順暢。當然,8G也能跑,就是會有點慢。

如果GPU算力不夠,建議你做一些量化處理。

ollama create -q f16 gelab-zero-4b-preview

等它導入完成后,模型就安裝好了。已經(jīng)可以在Ollama里用了。

打開Ollama,可以看到模型里多了一個“gelab-zero-4b-preview”,你可以隨便問幾個問題測試一下。


它能正常吐token,那就代表gelab-zero-4b-preview模型已部署成功。


u1s1,階躍這個GUI模型是真滴強,在多個GUI bench上拿到SOTA表現(xiàn)。


而且,才4B,非常實用,非常平民了。

2)搭建安卓設(shè)備執(zhí)行環(huán)境

有了Python環(huán)境,也有了本地模型,接下來就是給手機和電腦牽線搭橋了,這一步很關(guān)鍵。

簡單來說就是,一在手機里打開開發(fā)者模式,二在電腦里安裝ABD工具。這樣,就能夠通過電腦直接操作手機/模擬器。

首先,打開一臺任意的安卓機,進入「設(shè)置」頁面。

找到「我的設(shè)備」或「關(guān)于手機」選項,狂點版本號5次以上,直到出現(xiàn)“您已處于開發(fā)者模式”為止。


然后返回「設(shè)置」頁面,找到或搜索「開發(fā)者選項」,點擊進入。


在「開發(fā)者選項」中,找到并開啟「USB調(diào)試」功能。接下來,屏幕會出現(xiàn)一些重要提示,全部同意。


接下來,給電腦安裝ABD(Android Debug Bridge,安卓調(diào)試橋)工具,它是鏈接電腦與 Android 設(shè)備的通信渠道。

Windows用戶,直接下載ABD工具壓縮包,然后解壓并加入系統(tǒng)環(huán)境變量即可。

下載地址:

https://dl.google.com/android/repository/platform-tools-latest-windows.zip

如何設(shè)置環(huán)境變量呢?跟大象裝進冰箱一樣還是分為三步。

首先,找到電腦的「高級系統(tǒng)設(shè)置」。


其次,點「環(huán)境變量」,找到「Path」變量。


然后,編輯Path變量,點「新建」創(chuàng)建一個新變量,把你的ABD工具壓縮包地址添加進來就可以了。


之后,陸續(xù)點「確定」,保存更改,關(guān)閉頁面。

Mac或Linux用戶的話,則建議通過 Homebrew(Mac)或系統(tǒng)自帶包管理器(Linux)來安裝 ADB 工具。

如果沒有安裝 Homebrew,可以先執(zhí)行:

ruby -e $(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)

然后,輸入命令安裝 ADB 工具:

brew cask install android-platform-tools

到這里,手機的開發(fā)者模式和電腦的ADB工具都搞定了。

接下來,用USB數(shù)據(jù)線將手機鏈接到電腦,然后在命令行里輸入:

adb devices

如果鏈接成功,你會看到這樣的提示。


首次鏈接,手機上會出現(xiàn)這樣一段提示,點「確定」即可。


3)搭建GELab-Zero Agent 運行環(huán)境

模型配好了,電腦與手機的連接器也弄好了,接下來就是搭建模型的運行環(huán)境,也就是GUI Agent。

階躍已經(jīng)把這個GUI智能體封裝好了,并且還做了開源,我們只需要克隆過來就可以了。

打開CLI輸入命令:

git clone https://github.com/stepfun-ai/gelab-zero

這一步可能會比較慢(GitHub比較考驗上網(wǎng)環(huán)境),耐心等一下。

克隆完成后,輸入命令進入gelab-zero agent

cd gelab-zero

安裝一下依賴。

pip install -r requirements.txt

安裝完成后,它會這樣顯示。


到此,就可以正常使用了。使用命令參考:

python examples/run_single_task.py 你的任務

比如,我們讓它預定一個會議,并把會議鏈接分享到微信群。

python examples/run_single_task.py 打開騰訊會議,預定12月31日0點0分的會議,然后把會議鏈接分享到微信群“冷逸工作室”。

AI就開始自己在手機上跑起來了。


它會識別手機的每個界面,然后一步步地往下走。


這個任務一共執(zhí)行了14步,我把完整的工作記錄放在這里了。

(可上下滑動,查看全圖)

4)搭建軌跡可視化環(huán)境(可選)

所有的任務軌跡,都會默認保存在 running_log/server_log/os-copilot-local-eval-logs/ 目錄下。

如果你想查看任務軌跡,可以使用 streamlit 來對軌跡進行可視化。

先輸入命令:

cd gelab-zero

然后輸入命令:

streamlit run --server.address 127.0.0.1 visualization/main_page.py --server.port 33503


然后,在瀏覽器中訪問http://localhost:33503,輸入session ID即可查看任務的工作過程。

每次任務執(zhí)行都會生成唯一的 session ID,在任務結(jié)束后可以得到。

5)llama部署(可選)

階躍的Step GUI,也支持llama.cpp部署。

詳細參考階躍在Github上的教程:

https://github.com/stepfun-ai/gelab-zero/blob/main/README_CN.md

llama部署后,可以在Jan等任意支持llama的本地客戶端里拉起API服務。

6)MCP配置(可選)

如果你嫌本地模型慢,想用云端模型,也可以把GELab-Zero Agent封裝成MCP server,在其他客戶端里調(diào)用MCP進行使用。

先啟動gelab-zero。

cd gelab-zero

然后打開MCP服務。

python mcp_server/detailed_gelab_mcp_server.py

你如果看到了這樣的界面,就代表MCP Server配置好了。


接下來,在Chabot等客戶端中直接調(diào)用MCP Server就行。

比如,MCP用Gelab-MCP-Server,模型用GPT-5.1,這速度、質(zhì)量簡直起飛。


這種端云協(xié)同帶來的好處是,它可以在保障隱私安全的同時,極大程度地拓展 GUI Agent 的能力邊界。

云端大模型專注高級規(guī)劃和復雜意圖理解,本地模型負責具體GUI執(zhí)行和原子操作,以確保所有具體操作和執(zhí)行軌跡都留在本地。

這對于企業(yè)來說,非常重要。


更多用例

階躍的Step GUI系列模型,既包括端側(cè)模型Step-GUI Edge(原GELab-Zero-4B)、云側(cè)模型(Step-GUI ),也包含MCP協(xié)議,支持的場景非常豐富,可在200個APP中順利執(zhí)行,是同類模型的4倍。

給大家看一些其他開發(fā)者搓的用例。

在多個電商平臺搜同款比價。

規(guī)劃周末的旅行計劃,并同步到社交賬戶。

自動發(fā)公眾號文章(by好友@Brad強)。

最有意思的是,有個叫@圖圖 的開發(fā)者給機械手接上Step-GUI模型,讓它自己邊玩手機邊刷抖音,這是GUI直接進入物理世界了。

這種通過外接具身智能的方式,可以跳過很多終端的權(quán)限,有著更高的自由度。


是不是還挺有趣的,現(xiàn)在就想手搓一個?建議你立即行動起來!

不到半小時,就能搓出一部自己的AI手機。

如果你覺得步驟麻煩,不想自己動手,也可以直接調(diào)用他們的Step-GUI Chat API接口。

Model Name: step-gui

目前,API正限時免費體驗中。

API接入指引:

https://ai.feishu.cn/wiki/BfVHwghPdiyp2ckS3HfcJZAmnsc


今天,Manus作價數(shù)10億美元賣給Meta,創(chuàng)下了Meta第三大收購的紀錄。

大半個AI圈都在慶祝,這驗證了Agent領(lǐng)域有著極大的市場,而且是一個全新的藍海市場。GUI Agent作為消費終端Agent的重要形態(tài),同樣有著不可估量的市場空間。

而且,它是AI Agent能否真正實現(xiàn)“智能代理”的關(guān)鍵。

階躍星辰這次開源的Step-GUI系列模型,既有GUI基模,也有GUI Agent,還支持MCP、API(限時免費中)。我感覺它是接入門檻最低的,也是生態(tài)最全的,拉起了GUI從“模型-應用”的整個流程。

這波開源真的很贊,值得大家的Star。


開源地址:

https://github.com/stepfun-ai/gelab-zero

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
春節(jié)剛過完,茅臺價格又跌下來了

春節(jié)剛過完,茅臺價格又跌下來了

深水財經(jīng)社
2026-03-02 20:35:04
沒想到竟然這么多工作需要保密的!網(wǎng)友:不讓看非看被一槍斃了

沒想到竟然這么多工作需要保密的!網(wǎng)友:不讓看非看被一槍斃了

另子維愛讀史
2025-12-08 20:58:22
伊朗高級教士中,87歲的哈梅內(nèi)伊不算老,有些人都奔著100歲去了

伊朗高級教士中,87歲的哈梅內(nèi)伊不算老,有些人都奔著100歲去了

黃娜老師
2026-03-03 00:55:17
阿布扎比再遭襲擊,阿聯(lián)酋發(fā)布全國緊急警報

阿布扎比再遭襲擊,阿聯(lián)酋發(fā)布全國緊急警報

極目新聞
2026-03-03 07:31:26
蘇聯(lián)“人猿雜交”實驗:5名女孩與11只猩猩參與,結(jié)局如何?

蘇聯(lián)“人猿雜交”實驗:5名女孩與11只猩猩參與,結(jié)局如何?

談史論天地
2026-02-28 13:35:18
讓明星集體“撞衫”,阿迪達斯急了?

讓明星集體“撞衫”,阿迪達斯急了?

有意思報告
2026-03-02 12:01:03
我存款1500萬,婆婆問有多少,我說5萬,小叔子急了,5萬?我本錢誰給

我存款1500萬,婆婆問有多少,我說5萬,小叔子急了,5萬?我本錢誰給

奶茶麥子
2026-03-02 23:49:11
浴缸陪睡只是冰山一角,多位助理服務明星方式曝光,一個個太離譜

浴缸陪睡只是冰山一角,多位助理服務明星方式曝光,一個個太離譜

離離言幾許
2026-03-02 15:53:17
巴拿馬運河兩端港口運營恢復,MSC完成首船裝卸

巴拿馬運河兩端港口運營恢復,MSC完成首船裝卸

海事服務網(wǎng)CNSS
2026-03-02 19:58:04
美軍瞞不住了!炸航母基地,炸11億美元雷達,幾十萬噸燃油被點燃

美軍瞞不住了!炸航母基地,炸11億美元雷達,幾十萬噸燃油被點燃

通鑒史智
2026-03-03 10:03:36
紀實:浙江幼師幼兒園潛伏22年,警察曝光真實身份,家長很后怕

紀實:浙江幼師幼兒園潛伏22年,警察曝光真實身份,家長很后怕

談史論天地
2026-03-01 09:49:38
內(nèi)塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國一總領(lǐng)館及一軍事基地,擊落3架美軍機

內(nèi)塔尼亞胡辦公室遭猛烈襲擊!伊朗:摧毀美國一總領(lǐng)館及一軍事基地,擊落3架美軍機

新民晚報
2026-03-02 19:04:01
英國宣布參與對伊朗軍事行動 戰(zhàn)機已升空

英國宣布參與對伊朗軍事行動 戰(zhàn)機已升空

桂系007
2026-02-28 23:56:12
伊朗將回歸世俗社會

伊朗將回歸世俗社會

八桂知事
2026-03-02 14:07:58
霍爾木茲海峽禁航,已有油輪被擊沉!國內(nèi)船企:未接到封鎖消息,正準備進去裝貨

霍爾木茲海峽禁航,已有油輪被擊沉!國內(nèi)船企:未接到封鎖消息,正準備進去裝貨

第一財經(jīng)資訊
2026-03-02 17:30:33
馬刺整活整出歷史級浪漫!1-2-3-4-5 號球衣首發(fā)陣,太炸了!

馬刺整活整出歷史級浪漫!1-2-3-4-5 號球衣首發(fā)陣,太炸了!

林子說事
2026-03-03 07:48:19
西班牙拒絕美方使用其基地打擊伊朗

西班牙拒絕美方使用其基地打擊伊朗

新華社
2026-03-02 23:40:05
為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

為什么美國、日本第一時間就知道中國的決策、軍事及重大的工程等

Thurman在昆明
2026-03-02 01:31:00
娛樂圈的對賭協(xié)議有多恐怖?贏的人就是楊冪,輸者直接變成張國立

娛樂圈的對賭協(xié)議有多恐怖?贏的人就是楊冪,輸者直接變成張國立

林輕吟
2026-03-01 19:35:00
扎克伯格帶老婆看Prada秀,時尚圈坐C位!除老婆沒變其余全變了…

扎克伯格帶老婆看Prada秀,時尚圈坐C位!除老婆沒變其余全變了…

商務范
2026-03-02 15:47:18
2026-03-03 13:08:49
沃垠AI incentive-icons
沃垠AI
努力分享一些有用、有趣的AI干貨
47文章數(shù) 13關(guān)注度
往期回顧 全部

科技要聞

手機AI在MWC上卷出了新高度

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個非常奇怪的地方

頭條要聞

美國三架F-15E被擊落 美軍聲明中有個非常奇怪的地方

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護夫:喊話薛之謙給張杰道歉

財經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

汽車要聞

長安汽車2月銷量151922輛 環(huán)比逆勢增長12.8%

態(tài)度原創(chuàng)

本地
時尚
家居
手機
公開課

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

普通人穿衣真的很簡單!單品選對、搭配合理,大方舒適又得體

家居要聞

萬物互聯(lián) 享科技福祉

手機要聞

一加15T新機正面形象公開,采用1.xx mm物理極窄四等邊設(shè)計

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版