国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ChatGPT-5.4屬實“動手王者”,一句話征服微信,但我卻被氣笑了

0
分享至



自從OpenAI發(fā)布GPT-5.4以后,我的朋友圈和訂閱的公眾號就被它占領了。

所有人都在討論同一個詞,叫做原生電腦操控能力(Native Computer Use)。鋪天蓋地的標題寫著“AI終于能接管你的電腦了”“GPT-5.4操控桌面超越人類水平”,評論區(qū)也都清一色地在喊“為時已晚,有機體!”

說實話,看到這些宣傳的時候,我的第一反應不是興奮,而是懷疑。因為“AI操控電腦”這個概念并不新鮮,今年1月OpenClaw爆火的時候,大家就已經(jīng)見識過了。

而且過去兩年,每隔幾個月就有人喊一次“agent時代來了”,結(jié)果每次實際體驗都差點意思。所以這次GPT-5.4的“原生電腦操控”,到底是真的質(zhì)變,還是又一輪營銷話術?

我決定自己動手試試。

花了大半天進行測試,我的結(jié)論是:它確實邁出了很大一步,但也確實沒有宣傳里說的那么神。

有些場景讓我真心震撼,有些場景又讓我哭笑不得。

以及可以肯定的是,ChatGPT-5.4它遠不止內(nèi)置了一個OpenClaw那么簡單。

01

ChatGPT 終于學會“動手”了

GPT-5.4是OpenAI 第一個內(nèi)置電腦操控能力的主線模型。

這里得先解釋一下“原生電腦操控能力”(Native Computer Use)。

這個概念聽起來很唬人,但其實核心邏輯并不復雜。

以前的ChatGPT,本質(zhì)上都是一個“嘴強王者”。你問它怎么在Excel里做個數(shù)據(jù)透視表,它能給你寫出詳細到令人發(fā)指的教程,但它自己動不了手。你得自己一步步照著做。

而原生電腦操控能力,說人話就是AI不只是會聊天了,它會像人一樣直接用電腦干活。它能看到當前屏幕上有什么,理解哪個是瀏覽器、哪個是按鈕、哪個是輸入框,然后自己去點擊、輸入、切換窗口、滾動頁面、提交表單。發(fā)現(xiàn)做錯了,它還能回退或者換一種操作方式。

舉個例子,我讓Codex給我在文件里生成一個TXT,然后寫一句話“你好 世界”,那么Codex就真的新建一個TXT,然后在里面寫字。

你可能會問,這和寫個自動化腳本有什么區(qū)別?

區(qū)別大了。傳統(tǒng)的自動化腳本需要提前把每一步流程寫死,網(wǎng)頁結(jié)構(gòu)一變、按鈕位置一挪,腳本就廢了。但原生電腦操控能力更像是一個人在操作,它能看到屏幕上的內(nèi)容,根據(jù)當前的實際情況判斷下一步該干什么,具備隨機應變的能力。

[Desktop 2026.03.06 - 10.54.48.02.mp4]

我們可以用微信來舉例子,因為微信從產(chǎn)品設計、底層架構(gòu)到安全體系,從根源上就沒有給第三方agent留任何合規(guī)的技術通道。

而且微信的API是外部系統(tǒng)與微信服務端合規(guī)交互的唯一官方通道,而截至目前,微信開放平臺完全沒有對外開放個人微信賬號的私聊、群聊消息發(fā)送相關的API接口。

但ChatGPT-5.4實現(xiàn)了。



我通過Codex要求ChatGPT-5.4歸納24小時內(nèi)的AI新聞,然后將其以字母AI的風格轉(zhuǎn)化為選題,最后發(fā)到群里供同事們查看。并且在選題最后,寫一句話代表這條消息是ChatGPT-5.4發(fā)送的。

ChatGPT-5.4不僅完成任務,還主動提出要求,幫我把這段話改得更自然。

它現(xiàn)在不僅能看懂屏幕上的元素,還能實現(xiàn)完整的鍵盤鼠標模擬。

當時我的內(nèi)心是無比震驚的,因為哪怕是OpenClaw,想要征服微信都要費很大力氣,ChatGPT-5.4竟然這么輕易就能實現(xiàn)了。

于是我例行測試了一下ChatGPT-5.4對瀏覽器的控制,我本以為這是個簡單活兒,畢竟我的瀏覽器就是Chrome,而OpenAI自己的AI瀏覽器用的也是Chrome內(nèi)核。

結(jié)果卻給我氣笑了。

我讓Codex打開douyin.com,可ChatGPT-5.4給我打開的是“抖音。com”



于是我問Codex,怎么輸入的是中文,它跟我說因為它是模擬鍵盤輸入,我的輸入法是中文,所以輸錯了。由于英語鍵盤是沒有輸入欄的,也就意味著ChatGPT-5.4看不到輸入欄,所以當我切換成中文輸入法的時候,它就沒辦法正常輸入網(wǎng)頁。



當然,它也不是萬能的。頁面太復雜的時候容易點錯地方,操作速度通常比人慢,而且涉及付款、刪除文件、處理隱私數(shù)據(jù)這類高風險操作時,你最好還是盯著點它。

OpenAI給了ChatGPT兩種“動手”的方式。第一種叫代碼模式,AI會用Python寫Playwright腳本來操控瀏覽器和應用程序,點哪里、輸入什么、怎么導航,全部通過代碼精確執(zhí)行。

第二種叫截圖模式。AI直接“看”你的屏幕截圖,然后像人一樣發(fā)出鼠標和鍵盤指令,不需要任何代碼作為中間層。

OpenAI還專門做了一個叫“Playwright Interactive”的實驗性功能,讓AI可以一邊寫代碼一邊實時測試,甚至能在構(gòu)建網(wǎng)頁應用的同時自己打開瀏覽器去調(diào)試。



官方演示里,GPT-5.4 從一句話的提示出發(fā),直接生成了一個等距視角的主題公園模擬游戲,帶路徑鋪設、游客尋路、排隊系統(tǒng),然后自己打開瀏覽器去玩了一遍來檢查Bug。

一句話變成一個可運行的游戲,這個演示確實唬人。

02

不只是接管電腦

有一個叫做OSWorld-Verified的測試,是專門衡量AI通過截圖加鍵盤鼠標自主操控桌面能力的基準測試,在這項測試中GPT-5.4拿到了75.0%的成功率。

上一代GPT-5.2只有47.3%,而人類基準線是72.4%。

也就是說,GPT-5.4 在“看著屏幕操作電腦”這件事上,已經(jīng)超過了普通人的平均水平。

在WebArena-Verified上,GPT-5.4也拿到了67.3%的成功率;在Online-Mind2Web 上,僅靠截圖觀察就達到了92.8%。

這些數(shù)字的意義在于。如今的ChatGPT在操控電腦這方面,已經(jīng)不再是實驗室里的玩具,它是真的能用了。

其實不難看出,OpenClaw對ChatGPT-5.4的加持很大。

2026年2月14日,斯坦伯格正式宣布加入OpenAI。奧特曼同步在 X 平臺官宣,稱其將負責 “推動下一代個人agent的研發(fā)”。

同時明確OpenClaw項目將移交至獨立開源基金會運營,OpenAI承諾為項目提供持續(xù)的資源、資金與技術支持。

于是ChatGPT-5.4就帶著濃烈的OpenClaw味登場了。

OpenClaw有一個大問題,貴。由于軟件本身會將上下文一并發(fā)送至大模型,這就導致在一些場景下,它的token消耗會非常恐怖。

所以OpenAI引入了一個叫“Compaction”的機制,上下文壓縮。簡單來說,當AI在執(zhí)行一個很長的多步驟任務時,它會自動總結(jié)和修剪中間過程的歷史記錄,只保留關鍵信息。

這樣既能維持長任務的連貫性,又不會把 token 預算一下子燒光。這是GPT-5.4作為第一個主線模型被訓練支持的能力,之前只有專門的Codex編碼模型才有類似的功能。



然后是推理能力。GPT-5.4 Thinking版本有一個很實用的新特性,在處理復雜問題時,它會先展示一個推理計劃的大綱,告訴你“我打算怎么做”。

更關鍵的是,你可以在它推理的過程中隨時打斷、調(diào)整方向,不用從頭再來。這個功能聽起來不起眼,但用過就知道,以前讓AI做一個復雜任務,如果方向跑偏了,你只能重新發(fā)一條消息從零開始。

現(xiàn)在你可以中途喊停說“不對,換個思路”,它能接著往下走。

在專業(yè)知識工作的GDPval基準上,GPT-5.4拿到了83.0%,而GPT-5.2是70.9%,提升了12個百分點。在BrowseComp(衡量 AI 持續(xù)瀏覽網(wǎng)頁查找難以定位的信息的能力)上,GPT-5.4 Pro版本達到了89.3%,刷新了紀錄。

Mercor的APEX-Agents基準測試也顯示,GPT-5.4 在制作幻燈片、金融建模、法律分析這類長周期專業(yè)任務上表現(xiàn)突出。

另外還有一個面向開發(fā)者的重要更新,那就是Tool Search。

以前調(diào)用 API 時,所有可用工具的定義都要一股腦塞進上下文里,光這些定義就能吃掉幾萬個token?,F(xiàn)在GPT-5.4只加載一個輕量級的工具列表,需要用哪個再去查具體定義。在Scale的 MCP Atlas 基準測試中,這種方式在36個MCP服務器的場景下,token消耗直接降低了47%,準確率不變。

最后,OpenAI還推出了ChatGPT直接嵌入Microsoft Excel和谷歌Sheets的集成功能。GPT-5.4可以讀取單元格范圍、執(zhí)行多步分析、自動寫公式。

這對企業(yè)用戶來說是個大殺器,AI不再是你和表格之間的“傳話筒”,它直接坐進了你的表格里干活。

但我也有一些擔憂。OpenClaw之所以魔幻,不僅僅是因為AI能做事,更是因為 AI 做的事經(jīng)常超出人類預期,當這種能力被內(nèi)置到一個擁有數(shù)億用戶的產(chǎn)品里,我總覺得心里毛毛的。

Codex現(xiàn)在可以設置,讓ChatGPT-5.4擁有完全訪問你電腦的權限,從而做到真正的原生控制。



說實話,這個功能我不敢測試,甚至連開啟都不敢。別問,問就是我電腦花錢買的,而且包含了我的個人敏感數(shù)據(jù)。

OpenAI在GPT-5.4的安全評估中提到,Thinking版本的欺騙行為概率更低,“說明模型缺乏隱藏其推理過程的能力,思維鏈監(jiān)控仍然是有效的安全工具”。

這話聽著讓人安心,但也側(cè)面說明了一個事實,他們確實在擔心AI會“隱藏推理過程”這件事。

不管怎樣,GPT-5.4的發(fā)布標志著一個新階段的開始。AI不再只是對話框里那個能說會道的助手,它正在學會伸出手來,觸碰你的屏幕、你的文件、你的工作流。

那只龍蝦現(xiàn)在已經(jīng)游進了OpenAI的池塘里,而它掀起的浪,才剛剛開始。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
49歲阿姨結(jié)識53歲大叔,搭伙后相約四川旅游,2天后向女兒哭訴

49歲阿姨結(jié)識53歲大叔,搭伙后相約四川旅游,2天后向女兒哭訴

詭譎怪談
2025-04-16 13:55:48
CCTV5直播巴薩vs西班牙人:巴薩分心歐冠 仍能贏得加泰德比

CCTV5直播巴薩vs西班牙人:巴薩分心歐冠 仍能贏得加泰德比

智道足球
2026-04-11 12:36:58
醉駕騎電動自行車上高速?金山交警緊急攔截除隱患

醉駕騎電動自行車上高速?金山交警緊急攔截除隱患

新聞晨報隨申Hi
2026-04-10 14:52:05
全紅嬋風波大結(jié)局,事件關聯(lián)多位運動員,一人被抓,處罰結(jié)果曝光

全紅嬋風波大結(jié)局,事件關聯(lián)多位運動員,一人被抓,處罰結(jié)果曝光

日落于西
2026-04-11 16:09:23
Token消耗暴增千倍,云廠商開始慌了

Token消耗暴增千倍,云廠商開始慌了

市值榜
2026-04-10 00:31:16
風向突變,以德為首的西方國家齊發(fā)聲:中國已在換電關鍵領域崛起

風向突變,以德為首的西方國家齊發(fā)聲:中國已在換電關鍵領域崛起

獨舞獨舞
2026-04-11 18:31:26
俄稱烏克蘭在復活節(jié)?;鹌陂g襲擊庫爾斯克州

俄稱烏克蘭在復活節(jié)停火期間襲擊庫爾斯克州

財聯(lián)社
2026-04-11 23:42:45
北京藍牌配額再縮減,搖號新政容錯率極低,別讓十年苦等歸零

北京藍牌配額再縮減,搖號新政容錯率極低,別讓十年苦等歸零

右耳遠聞
2026-04-11 13:18:14
分手2個月后被前男友掐死,安徽22歲女醫(yī)學生案即將二審,受害者母親:希望維持一審死刑判決,希望他盡快被執(zhí)行

分手2個月后被前男友掐死,安徽22歲女醫(yī)學生案即將二審,受害者母親:希望維持一審死刑判決,希望他盡快被執(zhí)行

大風新聞
2026-04-11 16:19:05
去年女友自殺,今年他突發(fā)腦出血進了重癥監(jiān)護室!

去年女友自殺,今年他突發(fā)腦出血進了重癥監(jiān)護室!

奮斗在韓國
2026-04-10 16:50:17
美國終于開始害怕?比稀土更致命王牌出手了,萬斯:中國要冷靜

美國終于開始害怕?比稀土更致命王牌出手了,萬斯:中國要冷靜

混沌錄
2026-04-10 22:53:19
長得一模一樣!男籃U18新星李沂澤疑似換名字、年齡改小2歲!

長得一模一樣!男籃U18新星李沂澤疑似換名字、年齡改小2歲!

籃球大圖
2026-04-11 09:52:02
2026款Model Y加量不加價,你會買嗎

2026款Model Y加量不加價,你會買嗎

沙雕小琳琳
2026-04-11 19:41:41
馬伊琍公布喜訊不到24小時,文章高調(diào)求"復合" 姚笛才是笑到最后

馬伊琍公布喜訊不到24小時,文章高調(diào)求"復合" 姚笛才是笑到最后

小椰的奶奶
2026-04-11 00:25:15
CBA最新排名!前三名基本穩(wěn)固,京粵爭第四,12-14搶最后一席!

CBA最新排名!前三名基本穩(wěn)固,京粵爭第四,12-14搶最后一席!

籃球資訊達人
2026-04-11 23:45:18
伊能靜長文控訴!十年沒二人世界,她抑郁是秦昊缺位還是自作自受

伊能靜長文控訴!十年沒二人世界,她抑郁是秦昊缺位還是自作自受

劉森森
2026-04-11 16:11:41
26.98萬起!問界官宣:新車20天預訂破10萬臺

26.98萬起!問界官宣:新車20天預訂破10萬臺

高科技愛好者
2026-04-11 22:55:12
他駕蔣緯國專機起義回大陸,文革中關押6年后越獄

他駕蔣緯國專機起義回大陸,文革中關押6年后越獄

壹貳叁的壹
2025-11-05 14:00:35
華為單周狂攬25.9%!榮耀跌穿10%,國產(chǎn)手機圈突然“靜音”了

華為單周狂攬25.9%!榮耀跌穿10%,國產(chǎn)手機圈突然“靜音”了

時尚的弄潮
2026-04-11 15:33:19
全紅嬋緊抱谷愛凌,張口就說:你好漂亮啊,整個人閃閃發(fā)光

全紅嬋緊抱谷愛凌,張口就說:你好漂亮啊,整個人閃閃發(fā)光

喜文多見01
2026-03-26 09:54:39
2026-04-12 00:39:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2367文章數(shù) 8057關注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級區(qū)沖到升級區(qū)

娛樂要聞

鄭鈞回應兒子走路:會監(jiān)督他挺直腰板

財經(jīng)要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態(tài)度原創(chuàng)

本地
時尚
教育
健康
公開課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

普通人穿衣其實很簡單!構(gòu)造腰線、一衣多穿,大方舒適又自然

教育要聞

留學為什么不香了?

干細胞抗衰4大誤區(qū),90%的人都中招

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版