国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

頭部AI公司陸續(xù)推出自動(dòng)化Agent,這些“AI員工”的表現(xiàn)如何?

0
分享至

就在昨天,OpenAI 和 Anthropic 像約好了一樣,同時(shí)甩出了自家的重磅更新:Claude Opus 4.6和GPT-5.3-Codex。AI公司陸續(xù)推出自動(dòng)化Agent,這些“AI員工”的表現(xiàn)如何?它們將帶來哪些新機(jī)會(huì)?

硅谷這次不是在更新一個(gè)工具,而是在給整個(gè)人類職場改規(guī)則。

AI公司扎堆推出自動(dòng)化 Agent,本質(zhì)上就是把過去躲在聊天框里的模型,拉出來丟進(jìn)真實(shí)電腦、真實(shí)代碼庫、真實(shí)業(yè)務(wù)流程里,讓它們當(dāng)一回你手下的員工。

這些新一代 AI 員工,已經(jīng)不是玩具級別的實(shí)習(xí)生,而是可以真正扛活的熟練工。

但它們不是萬能的超級英雄,而是需要你學(xué)會(huì)管理、學(xué)會(huì)分工、學(xué)會(huì)設(shè)邊界的一支數(shù)字外包團(tuán)隊(duì)。

誰能先學(xué)會(huì)用 AI 帶團(tuán)隊(duì),誰就能在這波變革里抄近道。

OpenAI 這一波,是在行動(dòng)力上踩死油門。



GPT-5.3-Codex最恐怖的一點(diǎn),是官方直接承認(rèn):它在自己的誕生過程中發(fā)揮了關(guān)鍵作用。

換一種說法,就是模型已經(jīng)能幫工程師寫訓(xùn)練代碼、改工具鏈、找Bug,甚至參與下一代模型的迭代。

這意味著什么?

意味著你以前得拉一整個(gè)工程小組干的活,現(xiàn)在一臺云上的AI員工就能跑通七成。

再看它的成績單。

在模擬人類操控電腦的 OSWorld 場景里,新模型從前代可憐的38.2%準(zhǔn)確率,一躍到64.7%。

人類平均水平是72%。

也就是說,它已經(jīng)不是瞎點(diǎn)亂點(diǎn)的腳本小子,而是能像普通白領(lǐng)一樣,會(huì)切屏、會(huì)開軟件、會(huì)在各種窗口間來回倒騰任務(wù)。

在命令行的 Terminal-Bench 2.0 測試中,它直接干到77.3%,把GPT-5.2甩開一大截。



對于一個(gè)要在服務(wù)器、容器、Linux環(huán)境下跑任務(wù)的AI員工來說,這個(gè)分?jǐn)?shù)的意義只有一句話:你可以放心把真正的工程環(huán)境交給他打理了。

編碼能力更不用說,在SWE-Bench Pro這種用真實(shí)開源項(xiàng)目、四種語言、還專門防套路、防刷分的硬核榜單里,它做到當(dāng)前一流水平,而且用更少Token搞定問題。

這就是純粹的工程生產(chǎn)力。

另一邊,Anthropic的Claude Opus 4.6走的是完全不同的路子。

OpenAI在拼誰跑得快,Anthropic在拼誰看得遠(yuǎn)、記得住、想得深。

大模型這兩年一個(gè)老大難問題,就是所謂上下文腐蝕。

理論上說支持幾十萬上下文,實(shí)際一塞幾百頁文檔,就開始前后矛盾、顧頭不顧尾。

Opus 4.6直接把桌子掀了。

在MRCR v2這種專門干它的長版本大海撈針測試?yán)?,新版本的召回率干?6%,上一代只有18.5%。

從機(jī)械硬背到真正記住,這就是量變到質(zhì)變的拐點(diǎn)。

更狠的是,那1M的上下文窗口。



這已經(jīng)不是讀一篇報(bào)告,而是把整個(gè)知識庫吞下去。

幾百頁財(cái)報(bào)、幾十萬字代碼、成堆協(xié)議文檔一起扔進(jìn)去,讓它去幫你找第xxx頁腳注里那個(gè)小數(shù)點(diǎn)錯(cuò)沒錯(cuò),這在之前幾乎是科幻。

再加上最高128k的輸出。

你不是讓它寫一篇文章,而是可以讓它寫完一整份行業(yè)白皮書、一個(gè)復(fù)雜系統(tǒng)的完整代碼架構(gòu),甚至一家公司級別的流程重構(gòu)方案。

這才是真正意義上的知識型AI員工:讀得進(jìn)、接得住、吐得出。

那么,這些自動(dòng)化Agent現(xiàn)在到底能干什么?



先別幻想什么科幻電影里的鋼鐵俠管家,腳踏實(shí)地一點(diǎn),你會(huì)發(fā)現(xiàn)它們已經(jīng)可以在幾個(gè)方向上穩(wěn)定創(chuàng)造價(jià)值。

在工程團(tuán)隊(duì)里,GPT-5.3-Codex這種Agent可以從一個(gè)需求文檔出發(fā),自己拆分任務(wù),寫代碼,跑測試,修Bug,打包部署,小問題還會(huì)自己查日志排查原因。

人類工程師的角色,正在從寫代碼,變成給目標(biāo)、做Review、定規(guī)范。

在知識密集行業(yè),比如投研、咨詢、法律合規(guī),Claude Opus 4.6那1M上下文,幾乎就是天生為這類工作設(shè)計(jì)的。

它可以一次性吞掉一家公司的歷年年報(bào)、公告、新聞、研報(bào),再結(jié)合你給的提綱,幫你產(chǎn)出一份邏輯完整、數(shù)據(jù)鏈條干凈的分析。

最重要的是,它在細(xì)節(jié)上不容易丟針,這在嚴(yán)肅場景里是決定生死的能力。

在運(yùn)營和業(yè)務(wù)側(cè),Agent可以代替人工去跑各種重復(fù)但瑣碎的操作。



登錄后臺、導(dǎo)出報(bào)表、清洗數(shù)據(jù)、生成日報(bào)周報(bào);在瀏覽器里批量查價(jià)格、看競品、截圖歸檔;甚至在你的CRM、工單系統(tǒng)里來回切換,幫你整理客戶跟進(jìn)記錄。

這些一線員工最煩的機(jī)械活,AI員工的精力是無限的。

那它們表現(xiàn)到底算不算合格?

如果把幾十年前的自動(dòng)化當(dāng)作給工廠裝了電機(jī),那這波AI Agent,更像是給辦公室裝了一條看不見的傳送帶。

速度和準(zhǔn)確率,已經(jīng)超過大多數(shù)人類在疲憊狀態(tài)下的表現(xiàn)。

但他們還做不到的是:自己定義目標(biāo)、自己做關(guān)鍵價(jià)值判斷。

也就是說,它們已經(jīng)是很強(qiáng)的執(zhí)行層,但還不是獨(dú)當(dāng)一面的決策層。

真正的機(jī)會(huì),在于誰能最先把這批AI員工,嵌進(jìn)自己的業(yè)務(wù)閉環(huán)里。

對個(gè)體來說,你可以把它當(dāng)成:



一支不下班的代碼外包團(tuán)隊(duì)。

一個(gè)永遠(yuǎn)在幫你讀文檔、記筆記、提煉要點(diǎn)的私人研究助理。

一群愿意24小時(shí)陪你試錯(cuò)、做方案、跑模型的影子同事。

對公司來說,機(jī)會(huì)更直接:

可以用更少的人,撐起更大的業(yè)務(wù)規(guī)模。

可以用更便宜的重復(fù)性人力,轉(zhuǎn)化出更多高附加值的創(chuàng)意崗位。

可以在原本不敢碰的復(fù)雜方向上試水,因?yàn)橛蠥I員工幫忙兜底細(xì)節(jié)。

那我們可以怎么用?



先從一個(gè)具體崗位下手,而不是從全公司大躍進(jìn)開始。

比如給開發(fā)組配一個(gè)代碼Agent,明確它負(fù)責(zé)的范圍是:單測、重構(gòu)建議、基礎(chǔ)Bug修復(fù)。

比如給投研團(tuán)隊(duì)配一個(gè)長文檔Agent,讓它只負(fù)責(zé)資料匯總與初稿,最終結(jié)論必須由人拍板。

人的職責(zé)也要升級。

你不再只是執(zhí)行任務(wù)者,而是 AI 團(tuán)隊(duì)的組長。

要學(xué)會(huì)寫清目標(biāo),而不是手把手教步驟。

要學(xué)會(huì)設(shè)計(jì)檢查點(diǎn),而不是盲目信任結(jié)果。

要學(xué)會(huì)跨工具協(xié)同,而不是只盯著一個(gè)聊天窗口。

至于那些喜歡端著架子、守著舊經(jīng)驗(yàn)不肯變的人,真正的危機(jī)在這里。

不是被AI干掉,而是被會(huì)用AI的人輕松超車。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歐冠一夜4場:全是生死大戰(zhàn)!16強(qiáng)將出爐 意甲雙雄命懸一線

歐冠一夜4場:全是生死大戰(zhàn)!16強(qiáng)將出爐 意甲雙雄命懸一線

葉青足球世界
2026-02-25 09:58:56
歐冠16強(qiáng)出爐!1/8決賽抽簽將于2月27日19時(shí)進(jìn)行

歐冠16強(qiáng)出爐!1/8決賽抽簽將于2月27日19時(shí)進(jìn)行

懂球帝
2026-02-26 07:06:03
120抵達(dá)40分鐘后病人才上救護(hù)車,老人搶救無效死亡急救中心被判賠17萬余元 急救搬抬如何破局?|紅星深度

120抵達(dá)40分鐘后病人才上救護(hù)車,老人搶救無效死亡急救中心被判賠17萬余元 急救搬抬如何破局?|紅星深度

紅星新聞
2026-02-25 21:05:18
公司市值近百億!“關(guān)鍵先生”除夕前去世,享年61歲……5天前還在開會(huì)

公司市值近百億!“關(guān)鍵先生”除夕前去世,享年61歲……5天前還在開會(huì)

上觀新聞
2026-02-25 14:12:07
馬筱梅兒子被質(zhì)疑不是新生兒,疑在大S忌日出生,行程被扒惹爭議

馬筱梅兒子被質(zhì)疑不是新生兒,疑在大S忌日出生,行程被扒惹爭議

古希臘掌管月桂的神
2026-02-25 12:42:43
廣東1歲男童家門口走失,當(dāng)?shù)鼗貞?yīng):在家附近的魚塘中發(fā)現(xiàn)該兒童,已無生命體征

廣東1歲男童家門口走失,當(dāng)?shù)鼗貞?yīng):在家附近的魚塘中發(fā)現(xiàn)該兒童,已無生命體征

瀟湘晨報(bào)
2026-02-25 22:07:19
繼父摟腰親吻女童引爭議,當(dāng)時(shí)生母就在現(xiàn)場

繼父摟腰親吻女童引爭議,當(dāng)時(shí)生母就在現(xiàn)場

天涯社區(qū)
2026-02-25 17:08:18
許家印身后,江蘇包工頭黃裕輝被恒大拖欠360億,82個(gè)項(xiàng)目停工

許家印身后,江蘇包工頭黃裕輝被恒大拖欠360億,82個(gè)項(xiàng)目停工

復(fù)轉(zhuǎn)小能手
2026-02-25 23:39:49
2-1!巴爾韋德獨(dú)造2球,熊皇破門制勝,皇馬雙殺晉級,或再戰(zhàn)曼城

2-1!巴爾韋德獨(dú)造2球,熊皇破門制勝,皇馬雙殺晉級,或再戰(zhàn)曼城

我的護(hù)球最獨(dú)特
2026-02-26 06:08:37
歐冠史詩級臥底!本塞拜尼單場解鎖失誤全成就,把多特坑出歐冠

歐冠史詩級臥底!本塞拜尼單場解鎖失誤全成就,把多特坑出歐冠

阿錯(cuò)田間生活
2026-02-26 06:47:45
跨省掛職!王明穎任中山市副市長

跨省掛職!王明穎任中山市副市長

南方都市報(bào)
2026-02-25 20:26:10
別再存定期了!央行釋放重要信號:普通人的財(cái)富保衛(wèi),主戰(zhàn)場已變

別再存定期了!央行釋放重要信號:普通人的財(cái)富保衛(wèi),主戰(zhàn)場已變

復(fù)轉(zhuǎn)小能手
2026-02-24 17:31:33
抓捕馬杜羅的飛行員雙腿被子彈打穿,被授予最高榮譽(yù)——國會(huì)榮譽(yù)勛章

抓捕馬杜羅的飛行員雙腿被子彈打穿,被授予最高榮譽(yù)——國會(huì)榮譽(yù)勛章

大洛杉磯LA
2026-02-26 01:08:17
造不出就買!260 億吞下美國打印機(jī)巨頭,珠海破解暴利壟斷

造不出就買!260 億吞下美國打印機(jī)巨頭,珠海破解暴利壟斷

知識TNT
2026-02-24 12:30:09
皇馬沒有在本菲卡身上再掉鏈子,但這已經(jīng)是某種成功了嗎?

皇馬沒有在本菲卡身上再掉鏈子,但這已經(jīng)是某種成功了嗎?

寫球的牧子
2026-02-26 06:51:36
中國幣圈富豪孫宇晨:快刪除所有90后之前出生人的聯(lián)系方式 停用微信換豆包

中國幣圈富豪孫宇晨:快刪除所有90后之前出生人的聯(lián)系方式 停用微信換豆包

快科技
2026-02-25 18:52:04
硅谷養(yǎng)老夢碎!OpenAI深夜突發(fā):不接受996的就走,AGI不養(yǎng)閑人

硅谷養(yǎng)老夢碎!OpenAI深夜突發(fā):不接受996的就走,AGI不養(yǎng)閑人

新智元
2026-02-25 09:23:15
破紀(jì)錄,湖人隊(duì)輸凱爾特人隊(duì)的比賽創(chuàng)造了2000年以來的收視紀(jì)錄

破紀(jì)錄,湖人隊(duì)輸凱爾特人隊(duì)的比賽創(chuàng)造了2000年以來的收視紀(jì)錄

好火子
2026-02-26 06:57:17
永久停業(yè)!天津這家22年老店也干黃了?

永久停業(yè)!天津這家22年老店也干黃了?

天津人
2026-02-25 17:46:07
伴隨著孫穎莎3-1晉級!女單16強(qiáng)全部誕生,中國8人日本6人韓國1人

伴隨著孫穎莎3-1晉級!女單16強(qiáng)全部誕生,中國8人日本6人韓國1人

曹說體育
2026-02-25 23:41:40
2026-02-26 07:16:49
之乎者也小魚兒
之乎者也小魚兒
激揚(yáng)文字,直擊心靈
848文章數(shù) 97關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

教育
家居
藝術(shù)
手機(jī)
公開課

教育要聞

專業(yè)調(diào)劑不懂就虧大了!3招避免入坑

家居要聞

藝居辦公 溫度與效率

藝術(shù)要聞

這些作品太美了,仙氣飄飄,三位大咖不容錯(cuò)過!

手機(jī)要聞

谷歌官方“豆包手機(jī)”來了,安卓旗艦迎來AI操控功能

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版