国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Edge團隊把AI關進"籠子":生成代碼可以,動手執(zhí)行不行

0
分享至


自動化測試喊了很多年,真正落地的團隊卻不多。不是不想做,是門檻實在太高——業(yè)務人員不會寫代碼,會寫代碼的人又懶得維護腳本。Microsoft Edge QA團隊最近開源的AutoGenesis,想拆掉這道墻:讓測試人員用自然語言描述場景,AI負責生成代碼,確定性的程序負責執(zhí)行。他們在Windows、macOS、iOS、Android四個平臺上跑通了這套方案,月執(zhí)行步驟超過200萬,通過率99%,用例規(guī)模700+。

頻繁發(fā)版、需求變得比翻臉還快、團隊規(guī)模不管大小……很多測試工程師的噩夢,Edge團隊一樣不落全中。

Edge基于Chromium開發(fā),跟著Chrome的高頻發(fā)版節(jié)奏,每次Chromium的變更都難以預測,回歸測試量極大。為了破局,團隊折騰了好幾輪技術方案,最終做出了AutoGenesis。

AI能力爆發(fā)之后,一個念頭很自然:能不能讓AI包辦自動化測試?

理論上,AI能聽懂人話、能快速學習不同平臺的UI結構,似乎完美契合。但關鍵問題是:怎么用AI?直接讓它執(zhí)行測試,還是只讓它生成代碼?這個選擇決定了方案是能用還是不能用。

團隊系統(tǒng)對比了三條路,發(fā)現(xiàn)AI直接執(zhí)行這條路走不通。

AI的不確定性是"執(zhí)行"環(huán)節(jié)的致命傷。測試步驟一多,AI可能忘記上下文,重復執(zhí)行;遇到意外彈窗,可能陷入無限循環(huán);更麻煩的是,你無法準確追蹤"現(xiàn)在走到哪一步了",出錯后根本定位不了問題。

讓AI基于截圖判斷"測試是否通過"同樣不靠譜:把"看起來像成功"誤判為通過,無法像傳統(tǒng)斷言那樣精確驗證文本和數(shù)值,判斷過程還是黑盒,失敗時無從追溯。

這就像雇一個人在黑暗中蒙眼走路——偶爾走對,但你不敢把身家性命押上去。Demo階段或許能糊弄過去,生產(chǎn)環(huán)境絕對不行。

AutoGenesis的解法很克制:AI只做它最擅長的事(理解意圖、生成代碼),確定性的程序做它最擅長的事(穩(wěn)定執(zhí)行)。


為了落地這個理念,團隊設計了四層架構,核心原則是AI的工作邊界嚴格限定在第二層,第四層執(zhí)行層完全不碰AI:

架構解決了技術可行性,但真正的考驗是怎么讓團隊用起來。Edge團隊的測試人員里,外包占大多數(shù)——懂業(yè)務、會設計用例,但不懂編程。傳統(tǒng)自動化對他們來說門檻太高,只能繼續(xù)手工點點點。

AutoGenesis改變了分工:正式工程師搭建工具鏈、制定標準、培訓外包;外包人員用自然語言寫測試場景,AI生成代碼。外包員工用自己擅長的方式,直接產(chǎn)出專業(yè)級自動化代碼,完全不需要學編程。

數(shù)據(jù)說話:月度運行超過200萬步驟,99%通過率,700+用例規(guī)模。AutoGenesis不只是工具,更是一套方法論——技術人員專注架構與知識傳遞,非技術人員從手工測試升級為自動化建設者。

具體用起來比想象中簡單。不需要懂Selenium,不需要懂Appium,只需要會描述"我想測什么":

第一步,用Gherkin格式寫測試場景,接近自然語言:

Feature: Edge Pagerendering Tests
Scenario: Test msn.com website on Edge
Given I have launched Edge browser
When I click the search box in NTP page
And I input "msn.com" in the search box
And I press enter to navigate to the page
And I wait for the page to load completely
Then I should see the tab with the title "msn.com"

第二步,觸發(fā)AI生成代碼??梢杂肰S Code擴展里的"Send to Copilot"按鈕,也可以在GitHub Copilot Chat里直接調用autoGenesis-run skill。

第三步,Copilot自動調用MCP工具逐步執(zhí)行,生成Python步驟定義代碼。

第四步,執(zhí)行測試。點擊"Run"按鈕,或者命令行運行behave features/。


這個簡潔體驗的背后,是四層架構各司其職。LLM層只做一件事:把Gherkin步驟翻譯成MCP工具調用序列,生成Python步驟定義代碼。為了支持四大平臺,團隊實現(xiàn)了兩個MCP Server——PyWinauto MCP Server管Windows,Appium MCP Server管iOS、Android和macOS。

AI有不確定性,怎么保證生成的代碼可控?團隊設計了三階段Preview-Confirm工作流,把代碼寫入控制權交還給人類:先清除緩存、生成唯一ID,然后Copilot逐步調用工具并自動錄制,接著生成diff預覽供人工審查,最后確認無誤才寫入文件。

執(zhí)行層選了Behave——Python生態(tài)里成熟的BDD框架。Gherkin的語法結構和LLM的推理模式天然契合,自然語言描述的用例讓QA、PM甚至外包都能參與定義,打破了"自動化只能靠開發(fā)者"的壁壘。由于Behave是同步框架而MCP是異步實現(xiàn),團隊用janus.Queue做了線程橋接,步驟函數(shù)通過call_tool_sync以同步方式調用異步工具,超時400秒。

VS Code擴展不是必須的,但確實降低了門檻。擴展在每個Scenario上方顯示"Send to Copilot"和"Run"兩個按鈕,一鍵觸發(fā);Setup管理面板自動檢測Python、Node.js、MCP Server配置,可視化解決環(huán)境問題。核心能力完全獨立,擴展和Skill只是效率增強。

回到最初的問題——技術門檻高、腳本維護難,AutoGenesis用四個設計回應:

自然語言描述,AI生成代碼。Edge團隊的外包人員貢獻了413個PR,證明可行。

一套技術棧覆蓋四大平臺,告別各平臺獨立維護的噩夢。

MCP協(xié)議約束AI邊界,執(zhí)行層脫離AI推理,99%通過率驗證了穩(wěn)定性。

單場景編寫從2-3小時縮短到10-15分鐘,后續(xù)執(zhí)行零AI調用成本,規(guī)模越大越劃算。

測試自動化做了很多年,大家都知道重要,但真正推進時總被門檻和維護成本絆住。AutoGenesis的價值在于同時解決這兩個問題——用AI降低門檻,用"AI只生成不執(zhí)行"保證穩(wěn)定性。這不是炫技的工具,是從工程師需求出發(fā)、在真實業(yè)務里打磨出來的務實方案。

開源地址:github.com/microsoft/AutoGenesis,MIT License。如果你的團隊也正面臨這些挑戰(zhàn),這個案例或許能給你一些真正"能落地"的啟發(fā)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
沙特:若對伊開戰(zhàn)將啟動巴基斯坦核保護傘

沙特:若對伊開戰(zhàn)將啟動巴基斯坦核保護傘

Nee看
2026-03-25 19:07:00
特朗普殺了他全家!他會當伊朗張學良嗎?

特朗普殺了他全家!他會當伊朗張學良嗎?

烏鴉校尉
2026-03-25 18:19:47
馬筱梅眼含淚水回應!買房真因不是自私,汪小菲第一次和張?zhí)m同隊

馬筱梅眼含淚水回應!買房真因不是自私,汪小菲第一次和張?zhí)m同隊

潮鹿逐夢
2026-03-24 13:13:55
研究所所長猥褻下屬后續(xù),女主多張高清照曝光,知情人再爆料

研究所所長猥褻下屬后續(xù),女主多張高清照曝光,知情人再爆料

觀察鑒娛
2026-03-26 09:25:28
不得不說,面相真的能看出一個人的路子。停播快兩個月的李亞鵬,

不得不說,面相真的能看出一個人的路子。停播快兩個月的李亞鵬,

小光侃娛樂
2026-03-26 17:05:03
為什么只有革命衛(wèi)隊與美以干,而伊朗40萬國防軍沉默觀戰(zhàn)?

為什么只有革命衛(wèi)隊與美以干,而伊朗40萬國防軍沉默觀戰(zhàn)?

廖保平
2026-03-17 09:04:38
連蔡依林都在玩,“雪山救狐貍”到底是什么梗?對話視頻原創(chuàng)作者:最初只是為了賣醬板鴨,特意設置反轉劇情,沒想到會這么火

連蔡依林都在玩,“雪山救狐貍”到底是什么梗?對話視頻原創(chuàng)作者:最初只是為了賣醬板鴨,特意設置反轉劇情,沒想到會這么火

極目新聞
2026-03-25 19:37:57
露出了狐貍尾巴?朱立倫主動邀約國民黨“立委”,或為逼宮鄭麗文

露出了狐貍尾巴?朱立倫主動邀約國民黨“立委”,或為逼宮鄭麗文

承受之重
2026-03-25 12:45:53
1981年,彭真獄中見江青,江青出言不遜提出:我要見華國鋒鄧小平

1981年,彭真獄中見江青,江青出言不遜提出:我要見華國鋒鄧小平

微野談寫作
2026-01-27 06:00:03
人情薄如紙!丈夫住院100天沒人探望,出院當天大伯突然打來電話

人情薄如紙!丈夫住院100天沒人探望,出院當天大伯突然打來電話

水泥土的搞笑
2026-03-26 17:37:27
15戰(zhàn)14勝,加時掀翻東部第一!新鷹王27+8+12證明賤賣特雷楊有理

15戰(zhàn)14勝,加時掀翻東部第一!新鷹王27+8+12證明賤賣特雷楊有理

鍋子籃球
2026-03-26 11:25:55
充電樁市場價格戰(zhàn)慘烈!每度電服務費收三毛 利潤只有4分錢

充電樁市場價格戰(zhàn)慘烈!每度電服務費收三毛 利潤只有4分錢

快科技
2026-03-24 00:22:40
江蘇擬建一條過江通道,或將再破“世界紀錄”

江蘇擬建一條過江通道,或將再破“世界紀錄”

水泥土的搞笑
2026-03-26 14:04:59
到底是誰讓馬景濤穿這身衣服的?簡直是災難現(xiàn)場!

到底是誰讓馬景濤穿這身衣服的?簡直是災難現(xiàn)場!

西樓知趣雜談
2026-03-25 23:41:24
美軍發(fā)布戰(zhàn)果,摧毀中國產(chǎn)戰(zhàn)機,伊朗空軍損失殆盡

美軍發(fā)布戰(zhàn)果,摧毀中國產(chǎn)戰(zhàn)機,伊朗空軍損失殆盡

愛吃醋的貓咪
2026-03-22 22:29:08
利空突襲,全線殺跌!

利空突襲,全線殺跌!

中國基金報
2026-03-26 13:16:51
周杰倫的INS被網(wǎng)友沖爆,新歌MV里手表調到“83”,疑用舊戀情炒作賣新唱片

周杰倫的INS被網(wǎng)友沖爆,新歌MV里手表調到“83”,疑用舊戀情炒作賣新唱片

回旋鏢
2026-03-25 20:38:44
延壽9年,心臟病風險降60%!悉尼大學最新:飲食、睡眠、運動最佳組合出爐,小改變也大有益

延壽9年,心臟病風險降60%!悉尼大學最新:飲食、睡眠、運動最佳組合出爐,小改變也大有益

醫(yī)諾維
2026-03-24 17:02:18
廣東:力爭到2026年底 建成50個以上特色鮮明、功能突出的生產(chǎn)性服務業(yè)集聚區(qū)

廣東:力爭到2026年底 建成50個以上特色鮮明、功能突出的生產(chǎn)性服務業(yè)集聚區(qū)

財聯(lián)社
2026-03-26 10:15:09
中國軍事專家送日本3句話,太絕了,真不是嚇唬他們

中國軍事專家送日本3句話,太絕了,真不是嚇唬他們

安安說
2026-03-26 11:21:19
2026-03-26 20:03:00
像素與芯片
像素與芯片
有態(tài)度網(wǎng)友ytd
466文章數(shù) 2關注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權,700名員工卻下崗

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
親子
家居
時尚
公開課

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補償方案出爐!

親子要聞

這就是引導型老師的厲害嗎?

家居要聞

傍海而居 靜觀蝴蝶海

皮衣+裙,高級到炸

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版