国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic把測試寫進(jìn)5步:QA團(tuán)隊發(fā)現(xiàn)后集體算了一筆賬

0
分享至


一個QA工程師寫完整套注冊頁測試要多久?4小時是保守估計,2小時是資深選手的極限操作。Anthropic最新放出的Agentic QA工作流,把這個數(shù)字壓到了5分鐘——從提示詞到通過測試,全程零人工干預(yù)。

這不是Demo炫技。他們公開了完整的技術(shù)棧:CLAUDE.md規(guī)則引擎、技能文件(Skill Files)、Playwright瀏覽器工具,三層架構(gòu)環(huán)環(huán)相扣。我看完第一反應(yīng)是:這哪是AI寫測試,這是把QA工程師的腦回路給數(shù)字化了。

第一步:讀規(guī)則,比新人入職培訓(xùn)還快

Agent啟動后的第一個動作是打開CLAUDE.md。這個文件里藏著項目的「憲法」:強(qiáng)制規(guī)則、工作流、需要加載的技能清單。針對注冊頁測試任務(wù),Agent自動勾選了5項技能:playwright-cli、selectors、page-objects、test-standards、data-strategy。

人類新人入職,光熟悉這些規(guī)范就得半天。Agent的讀取時間是——我數(shù)了一下原文的描述節(jié)奏——基本等于文件打開的瞬間。規(guī)則不再是文檔,變成了可執(zhí)行的配置。

這里有個細(xì)節(jié)值得玩味。CLAUDE.md里寫的不是「寫個好測試」,而是具體到「Page Object Model怎么分層」「locator getter和action method的區(qū)別」「組件如何組合進(jìn)page object」。顆粒度細(xì)到能直接落地,這是大多數(shù)團(tuán)隊的文檔做不到的。

第二步:探應(yīng)用,DOM結(jié)構(gòu)秒變結(jié)構(gòu)化數(shù)據(jù)

Agent通過playwright-cli向瀏覽器發(fā)出指令:「訪問/register,列出所有表單字段、按鈕、標(biāo)題和驗證信息?!狗祷氐慕Y(jié)果是一份機(jī)器直接能讀的清單:

標(biāo)題:"Create your account"(role: heading, level: 1)

必填字段:First name、Last name、Email address、Password、Confirm password

密碼框帶占位提示:"At least 8 characters"

主按鈕:"Create account"

輔助鏈接:"Already have an account? Sign in"

人類做同樣的事需要打開DevTools、逐元素檢查、復(fù)制selector、整理成文檔。Agent的「觀察」是結(jié)構(gòu)化的、可消費的、直接能進(jìn)代碼的。原文里用了「Discovery result」這個詞,很準(zhǔn)確——這不是瀏覽,是勘探。

我注意到一個設(shè)計巧思:Agent被要求同時抓取「role、label、placeholder」等多維屬性。這意味著它拿到的不是裸DOM,而是帶語義標(biāo)簽的地圖??稍L問性(Accessibility)屬性在這里成了機(jī)器理解的橋梁,一舉兩得。

第三步:抄作業(yè),現(xiàn)有代碼庫就是最佳教材

Agent接下來做了件很「人類」的事:它去翻了pages/app/和test-data/factories/app/,看前輩們怎么寫的。Page object怎么分層?Factory用什么格式?Fixture怎么注入?

這一步解決了AI寫代碼的千古難題——風(fēng)格一致性。沒有這一步,Agent生成的代碼會像外包團(tuán)隊交的活:能跑,但和現(xiàn)有 codebase 格格不入。有了這一步,它寫的是「我們項目的代碼」,不是「AI生成的代碼」。

原文在這里留了個懸念,第四步和第五步的內(nèi)容被截斷了。但從已披露的信息推斷,完整的流程應(yīng)該是:生成page object → 創(chuàng)建user factory → 組裝fixture → 編寫smoke test → 覆蓋validation error的回歸測試。

傳統(tǒng)流程里,這幾步環(huán)環(huán)相扣,一步錯步步錯。Agent的優(yōu)勢在于上下文不丟失:它記得CLAUDE.md的規(guī)則、記得剛才探到的DOM結(jié)構(gòu)、記得現(xiàn)有代碼的模式,三股信息流在同一個上下文窗口里碰撞。

算賬時刻:4小時 vs 5分鐘,省下的時間去哪了?

原文列出的「Before agentic QA」清單很扎心:Inspecting the DOM, writing locators, setting up factories, wiring fixtures, writing tests, debugging failures。6個環(huán)節(jié),每個都是時間黑洞。

Agent的輸入只有一句話:"The app has a new user registration page at /register. Create a page object, a user factory, a smoke test, and regression tests for validation errors."

我算了筆賬。假設(shè)一個迭代周期有20個類似的功能點需要測試覆蓋,傳統(tǒng)模式需要80小時(2人周),Agentic模式需要100分鐘。省下的時間如果投入探索性測試、性能壓測、安全掃描,QA團(tuán)隊的價值主張會完全變樣。

但原文也埋了伏筆:「an agent is only as good as the instructions it follows」。這句話出現(xiàn)在第二篇的結(jié)尾,像一句警告。5分鐘的奇跡背后,是CLAUDE.md的精心編寫、技能文件的領(lǐng)域沉淀、Playwright工具的原子化設(shè)計。沒有這些基建,Agent就是另一個會胡寫的Copilot。

技術(shù)棧拆解:三層架構(gòu)各自扛什么

把五篇文章串起來看,Anthropic搭的是個三層系統(tǒng):

底層:項目腳手架(Project Scaffold)——給AI設(shè)計的目錄結(jié)構(gòu),讓Agent知道去哪找什么。

中間層:規(guī)則與技能(CLAUDE.md + Skill Files)——規(guī)則定邊界,技能填內(nèi)容?!赣肞age Object Model」是規(guī)則,「page object具體怎么寫」是技能。

上層:感知與執(zhí)行(Browser Tool + Agent Loop)——讓Agent能看見應(yīng)用、能操作瀏覽器、能驗證結(jié)果。

這個分層很產(chǎn)品經(jīng)理思維。每一層解決一個明確的問題,層與層之間接口清晰。換團(tuán)隊、換技術(shù)棧,可以只換技能文件層,骨架不動。

原文有個類比讓我印象很深:「a good structure only gets you so far if the AI is just a code suggester」。代碼建議器(Code Suggester)和代理(Agent)的區(qū)別,就像導(dǎo)航App和自動駕駛——前者告訴你怎么走,后者直接踩油門。

一個被忽略的細(xì)節(jié):調(diào)試去哪了?

傳統(tǒng)測試開發(fā)里,寫代碼占3成時間,調(diào)試占7成。Agentic QA的原文幾乎沒提調(diào)試環(huán)節(jié),這是刻意省略還是真的不需要?

從披露的信息推測,調(diào)試被前置到了「探索應(yīng)用」和「檢查現(xiàn)有模式」兩步。Agent在寫第一行代碼前,已經(jīng)確認(rèn)了DOM結(jié)構(gòu)、確認(rèn)了代碼風(fēng)格、確認(rèn)了規(guī)則邊界。人類調(diào)試是因為「不知道會出什么問題」,Agent的確定性來自「先探后寫」。

但這有個前提:被測應(yīng)用是穩(wěn)定的。如果注冊頁還在頻繁改版,Agent的「勘探」結(jié)果可能很快過期。原文沒覆蓋這個場景,可能是五篇文章的篇幅限制,也可能是留給讀者的思考題。

另一個開放問題是驗證策略。Agent寫的測試,誰來驗證它測對了?原文的標(biāo)題叫「From Prompt to Passing Test」,暗示測試最終是通過狀態(tài)。但「通過」不等于「有效」,這是QA領(lǐng)域的老生常談。Anthropic是否設(shè)計了元測試(Test for the test),第五篇之后的內(nèi)容值得期待。

技術(shù)債的角度也值得玩味。Agent生成的測試代碼,未來由誰維護(hù)?如果下一個人類QA接手,他能讀懂AI的寫法嗎?原文強(qiáng)調(diào)Agent會「抄現(xiàn)有模式」,這降低了認(rèn)知門檻,但長期看,團(tuán)隊可能需要建立「AI生成代碼」的審查規(guī)范。

回到開頭那個4小時vs5分鐘的對比。數(shù)字很刺激,但真正的問題或許是:當(dāng)機(jī)械勞動被壓縮到極限,QA工程師的專業(yè)價值該如何重新定義?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“春養(yǎng)肝,病不沾”,3種天然“養(yǎng)肝菜”換著吃,養(yǎng)肝排毒強(qiáng)免疫

“春養(yǎng)肝,病不沾”,3種天然“養(yǎng)肝菜”換著吃,養(yǎng)肝排毒強(qiáng)免疫

江江食研社
2026-03-22 08:30:14
短短1年,靈活就業(yè)者暴增4千萬

短短1年,靈活就業(yè)者暴增4千萬

深度報
2026-03-23 21:47:58
黃仁勛呼吁所有人使用AI提升自己:大學(xué)生畢業(yè)時都要成AI專家

黃仁勛呼吁所有人使用AI提升自己:大學(xué)生畢業(yè)時都要成AI專家

快科技
2026-03-24 22:46:04
成都又一幼兒園突然宣告將停辦,家長著急了

成都又一幼兒園突然宣告將停辦,家長著急了

天府觀察
2026-03-25 16:13:49
語出驚人!摩根大通CEO戴蒙稱,伊朗戰(zhàn)爭長期來看是好事!為什么這樣說?

語出驚人!摩根大通CEO戴蒙稱,伊朗戰(zhàn)爭長期來看是好事!為什么這樣說?

王爺說圖表
2026-03-25 18:51:12
伊朗據(jù)悉要求希望通過霍爾木茲海峽的船舶提供船員和貨物詳情

伊朗據(jù)悉要求希望通過霍爾木茲海峽的船舶提供船員和貨物詳情

財聯(lián)社
2026-03-25 18:48:03
2026年開年,增程突然不香了?最大反轉(zhuǎn):油混正在悄悄翻盤!

2026年開年,增程突然不香了?最大反轉(zhuǎn):油混正在悄悄翻盤!

華庭講美食
2026-03-25 07:13:09
出軌的女人,你陪男人睡,不是因為你的美,是因為你的天真和廉價

出軌的女人,你陪男人睡,不是因為你的美,是因為你的天真和廉價

加油丁小文
2026-03-25 08:30:09
皇馬5-1曼城后0-1負(fù)弱旅,百年頑疾拖垮球隊

皇馬5-1曼城后0-1負(fù)弱旅,百年頑疾拖垮球隊

徐纗老表哥
2026-03-25 07:21:41
腳神張純燁食品級小腳丫

腳神張純燁食品級小腳丫

情感大頭說說
2026-03-25 18:04:07
風(fēng)云突變!伊朗拒絕和談計劃,美軍調(diào)派82空降師前往中東,準(zhǔn)備地面作戰(zhàn)

風(fēng)云突變!伊朗拒絕和談計劃,美軍調(diào)派82空降師前往中東,準(zhǔn)備地面作戰(zhàn)

大洛杉磯LA
2026-03-26 05:29:32
華爾街大鱷稱:黃金正重演2008年劇本!金價將漲到11400美元?

華爾街大鱷稱:黃金正重演2008年劇本!金價將漲到11400美元?

王爺說圖表
2026-03-25 22:43:39
俄方發(fā)出警告,普京搶在特朗普之前訪華?美財長:已無法阻止中國

俄方發(fā)出警告,普京搶在特朗普之前訪華?美財長:已無法阻止中國

浪子阿邴聊體育
2026-03-25 03:25:35
四川井研一公交車身標(biāo)語引爭議 官方:系個人自費5000元投放的廣告,已整改清除

四川井研一公交車身標(biāo)語引爭議 官方:系個人自費5000元投放的廣告,已整改清除

紅星新聞
2026-03-25 20:09:43
張雪峰“被去世”烏龍:全網(wǎng)慌了!誰來替寒門說真話

張雪峰“被去世”烏龍:全網(wǎng)慌了!誰來替寒門說真話

舟望停云
2026-03-26 00:55:54
合肥市廬陽區(qū)教體局通報:合肥安信地產(chǎn)大廈398室等被查!

合肥市廬陽區(qū)教體局通報:合肥安信地產(chǎn)大廈398室等被查!

肥東論壇
2026-03-25 22:22:28
張雪峰8億遺產(chǎn)如何分?法定繼承vs遺囑繼承,妻子女兒份額大不同

張雪峰8億遺產(chǎn)如何分?法定繼承vs遺囑繼承,妻子女兒份額大不同

別人都叫我阿螫
2026-03-25 17:35:23
20歲女生長期開燈睡覺胖到200斤

20歲女生長期開燈睡覺胖到200斤

觀威海
2026-03-24 09:35:51
香港再無董建華

香港再無董建華

華人星光
2025-11-25 12:01:27
《鏢人》再破紀(jì)錄,打敗《飛馳人生3》,登頂中國冠軍

《鏢人》再破紀(jì)錄,打敗《飛馳人生3》,登頂中國冠軍

影視高原說
2026-03-24 19:32:39
2026-03-26 06:23:00
賽博蘭博
賽博蘭博
專注搗鼓AI效率工具,試圖在這個時代留下數(shù)字分身的探索者。
41文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關(guān)停

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機(jī) 現(xiàn)場畫面披露

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機(jī) 現(xiàn)場畫面披露

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

旅游
時尚
教育
藝術(shù)
軍事航空

旅游要聞

保山隆陽水寨:海棠花開艷如霞,一樹紅花迎春來

女人過了40歲別胡亂穿衣,趕緊看看這些日系穿搭,舒適又耐看

教育要聞

雄安新區(qū):北京史家胡同小學(xué)分校,傳承“和諧教育”理念

藝術(shù)要聞

原來唐朝貴婦的生活,比我們還會享受!

軍事要聞

伊朗重申非交戰(zhàn)國家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進(jìn)入關(guān)懷版