国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

程序員不許寫代碼!OpenAI硬核實(shí)驗(yàn):3人指揮AI,5個(gè)月造出百萬(wàn)行

0
分享至

  

  新智元報(bào)道

  編輯:元宇

  【新智元導(dǎo)讀】在OpenAI一項(xiàng)內(nèi)部實(shí)驗(yàn)中,一個(gè)最初僅3人的團(tuán)隊(duì)、5個(gè)月、從零到一造出「百萬(wàn)行代碼產(chǎn)品」,沒(méi)有一行代碼是人類程序員完成的,而不手工寫代碼,也是該項(xiàng)目的一條鐵律。

  這一次,人類軟件工程被「倒過(guò)來(lái)」做了!

  剛剛,OpenAI官博曝光了他們的一次內(nèi)部實(shí)驗(yàn):

  一支最初3人的工程師團(tuán)隊(duì),利用Codex智能體在5個(gè)月內(nèi)從零造出了一個(gè)「百萬(wàn)行代碼產(chǎn)品」。

  在整個(gè)過(guò)程中,人類不寫手工代碼,而是把精力集中在「想清楚要什么、把規(guī)則立起來(lái)」,其余的一切交給AI。

  每人每天平均能推進(jìn)3.5個(gè)PR(Pull Request,代碼合并請(qǐng)求),而PR的執(zhí)行環(huán)節(jié)(實(shí)現(xiàn)、測(cè)試、文檔、CI配置)全程由智能體代勞。

  OpenAI為這套工作流賦予了一個(gè)十分形象的名字:「駕馭工程(Harness Engineering)」。

  

  https://openai.com/index/harness-engineering/

  在實(shí)驗(yàn)里,程序員不再是那個(gè)熬夜寫B(tài)ug,再熬夜修Bug的「碼農(nóng)」,而是原來(lái)的「執(zhí)行者」變?yōu)椤格{馭者」。

  這不止是10倍效率提升的「生產(chǎn)力革命」,而是一次對(duì)「軟件工程」定義的顛覆,直接宣告了人類「手工代碼時(shí)代」的終結(jié)。

  改變

  從一個(gè)空的git倉(cāng)庫(kù)開(kāi)始

  這次實(shí)驗(yàn)從AI的第一次提交開(kāi)始。

  2025年8月下旬,當(dāng)空倉(cāng)庫(kù)里落下第一個(gè)commit(提交)時(shí),它就已經(jīng)不是人類寫的——當(dāng)時(shí)沒(méi)有任何既有人類代碼可以充當(dāng)「錨點(diǎn)」。

  更魔幻的:連那個(gè)用來(lái)指導(dǎo)AI怎么干活的說(shuō)明書AGENTS.md,第一版也是AI自己寫的。

  從第一天起,這個(gè)倉(cāng)庫(kù)就是由智能體塑造的。人類不許寫代碼,成了這個(gè)項(xiàng)目的一條不可逾越的鐵律

  這不是為了偷懶,而是一種近乎自虐的「刻意練習(xí)」,只有切斷了人類「親自上手」的退路,才能倒逼團(tuán)隊(duì)去破解那個(gè)在完全無(wú)人情況下構(gòu)建代碼的終極問(wèn)題。

  于是,這個(gè)3人小團(tuán)隊(duì)(后擴(kuò)展到7人),一下子好像成了拿著鞭子的牧羊人,驅(qū)趕著一群不知疲倦的Codex智能體在代碼草原上狂奔。

  結(jié)果令人震撼:5個(gè)月,一百萬(wàn)行代碼。

  重新定義工程師的角色

  這項(xiàng)實(shí)驗(yàn)的早期進(jìn)展,比OpenAI的研究人員預(yù)想得要慢。

  不是因?yàn)镃odex不行,而是因?yàn)榄h(huán)境定義得不夠清晰:智能體缺少實(shí)現(xiàn)高層目標(biāo)所需的工具、抽象和內(nèi)部結(jié)構(gòu)。

  于是,OpenAI工程團(tuán)隊(duì)的主要工作變成了一件事:讓智能體有能力完成有價(jià)值的工作

  他們把大目標(biāo)拆成更小的構(gòu)建塊(設(shè)計(jì)、編碼、評(píng)審、測(cè)試等),提示智能體把這些塊搭起來(lái),再用它們?nèi)ソ怄i更復(fù)雜的任務(wù)。

  當(dāng)事情失敗時(shí),答案幾乎從來(lái)不是「再試一次」,這里唯一的推進(jìn)方式就是讓Codex去完成工作,人類工程師通常會(huì)退一步問(wèn)自己:

  到底缺了什么能力?怎樣把它變得對(duì)智能體既清晰可見(jiàn),又可以被強(qiáng)制執(zhí)行?

  整個(gè)過(guò)程中,人類幾乎完全通過(guò)提示詞與系統(tǒng)交互:工程師描述任務(wù),運(yùn)行智能體,讓它發(fā)起一個(gè)PR。

  為了推進(jìn)PR完成,研究人員會(huì)讓Codex在本地自審改動(dòng),請(qǐng)求額外的本地和云端智能體評(píng)審,回應(yīng)人類或智能體的反饋,然后在一個(gè)循環(huán)里不斷迭代,直到所有智能體評(píng)審者都滿意。

  隨著時(shí)間推移,幾乎所有評(píng)審工作都移交給了「智能體對(duì)智能體」。

  提升應(yīng)用程序的可讀性

  隨著代碼吞吐量的增加,OpenAI發(fā)現(xiàn):AI編碼的瓶頸變成了人工質(zhì)量檢查(QA)的能力。

  于是,人類的時(shí)間和注意力成了真正的約束。

  為了突破這一瓶頸,OpenAI的辦法是讓Codex能夠直接讀取應(yīng)用程序的用戶界面、日志以及應(yīng)用指標(biāo)等內(nèi)容。

  他們將Chrome DevTools協(xié)議接入了智能體運(yùn)行時(shí),并開(kāi)發(fā)了處理DOM快照、截圖和導(dǎo)航的技能。

  

  于是,Codex可以自己復(fù)現(xiàn)bug、驗(yàn)證修復(fù)、推理UI行為。

  OpenAI對(duì)可觀測(cè)性工具也采取了同樣的做法。

  日志、指標(biāo)、追蹤通過(guò)本地可觀測(cè)性棧暴露給Codex,并且對(duì)每個(gè)worktree(工作區(qū))都是隔離、臨時(shí)的環(huán)境。

  任務(wù)完成后,這套環(huán)境就會(huì)被銷毀。

  智能體可以用LogQ查日志,用PromQL查指標(biāo)。

  于是,「確保服務(wù)啟動(dòng)在800ms內(nèi)完成」或者「這四條關(guān)鍵用戶路徑里沒(méi)有任何一個(gè)span超過(guò)兩秒」這樣的提示,就變得真正可執(zhí)行。

  做了這些之后,OpenAI研究人員經(jīng)常看到Codex一次運(yùn)行連續(xù)工作六個(gè)小時(shí)以上,通常還是在人類睡覺(jué)的時(shí)候。

  

  給Codex一張地圖

  而不是一本1000頁(yè)的說(shuō)明書

  讓智能體處理大型復(fù)雜任務(wù)時(shí),上下文管理是最大的挑戰(zhàn)之一。

  OpenAI研究人員早期學(xué)到的一個(gè)簡(jiǎn)單經(jīng)驗(yàn)就是:

  給Codex一張地圖,而不是一本1000頁(yè)的說(shuō)明書。

  一開(kāi)始,團(tuán)隊(duì)試圖寫一個(gè)超大的AGENTS.md文件,把所有規(guī)則、邏輯、注意事項(xiàng)都塞進(jìn)去。結(jié)果,這成了一場(chǎng)災(zāi)難。

  因?yàn)锳I的注意力也是稀缺資源。

  給它一本1000頁(yè)的說(shuō)明書,它會(huì)迷失在細(xì)節(jié)里,漏掉關(guān)鍵約束,或者把目標(biāo)搞錯(cuò)。

  而且,這種單體大文檔維護(hù)起來(lái)簡(jiǎn)直是噩夢(mèng),很快就會(huì)變成「陳舊規(guī)則的墳場(chǎng)」。

  于是,團(tuán)隊(duì)迅速調(diào)整策略,他們把AGENTS.md變成了一張「尋寶地圖」。

  這個(gè)文件只有大約100行,它不包含具體知識(shí),只是一個(gè)目錄,就像一個(gè)導(dǎo)航地圖,指向倉(cāng)庫(kù)深處更深層的真實(shí)來(lái)源。

  設(shè)計(jì)文檔被編目并索引,包括驗(yàn)證狀態(tài)以及一套定義「以智能體為先」操作原則的核心信念。

  └── SECURITY.md

  真正的知識(shí)庫(kù)在結(jié)構(gòu)化的docs/目錄里,是系統(tǒng)的唯一事實(shí)來(lái)源。

  這就是「漸進(jìn)式披露」:智能體從一個(gè)小而穩(wěn)定的入口開(kāi)始,被教會(huì)下一步去哪找,而不是一開(kāi)始就被信息淹沒(méi)。

  OpenAI的研究人員還用工具強(qiáng)制執(zhí)行這一點(diǎn)。

  通過(guò)專門的lint和CI任務(wù)校驗(yàn)知識(shí)庫(kù)是否最新、是否交叉鏈接、結(jié)構(gòu)是否正確。

  架構(gòu)文檔給出領(lǐng)域劃分和包分層的頂層視圖。質(zhì)量文檔為每個(gè)產(chǎn)品領(lǐng)域和架構(gòu)層打分,持續(xù)追蹤差距。

  為了保證AI不讀到過(guò)時(shí)的信息,團(tuán)隊(duì)甚至專門安排了一個(gè)「文檔園丁」智能體。

  它的工作只有一個(gè):定期掃描文檔,發(fā)現(xiàn)那些與代碼實(shí)現(xiàn)不一致的陳舊描述,然后自動(dòng)發(fā)起修復(fù)PR。

  讓智能體「看得懂」

  既然倉(cāng)庫(kù)完全由智能體生成,OpenAI研究人員的一個(gè)目標(biāo),就是讓智能體只靠倉(cāng)庫(kù)本身,就能理解完整業(yè)務(wù)領(lǐng)域。

  從智能體視角看,任何它在運(yùn)行時(shí)上下文中訪問(wèn)不到的知識(shí),都等于不存在。

  比如放在Google Docs、聊天記錄、人類大腦的知識(shí),對(duì)系統(tǒng)來(lái)說(shuō)都是不可見(jiàn)的。

  它能看到的只有倉(cāng)庫(kù)里版本化的工件,如代碼、Markdown、schema、可執(zhí)行計(jì)劃。

  如果智能體找不到這些上下文知識(shí),它們就會(huì)和剛?cè)肼毜男峦乱粯?,?duì)于實(shí)際業(yè)務(wù)進(jìn)展一無(wú)所知。

  

  因此,必須把越來(lái)越多的上下文推回倉(cāng)庫(kù)。

  當(dāng)然,給Codex更多上下文,并不是要塞給它更多零散指令,而是把信息組織好、結(jié)構(gòu)化,讓它可以推理。

  自動(dòng)化圍欄

  讓程序員成為代碼世界的「牧羊人」

  光有文檔,還不足以讓一個(gè)完全由智能體生成的代碼庫(kù)保持一致。

  AI畢竟是概率模型,它會(huì)產(chǎn)生幻覺(jué),會(huì)偷懶,會(huì)寫出「看似能跑實(shí)則一團(tuán)糟」的代碼。

  怎么解決?

  智能體在邊界清晰、結(jié)構(gòu)可預(yù)測(cè)的環(huán)境中效率最高。

  OpenAI通過(guò)強(qiáng)制執(zhí)行「不變量」,而不是微觀管理實(shí)現(xiàn)細(xì)節(jié),讓智能體可以高速前進(jìn)而不破壞基礎(chǔ)。

  這就好比為Codex這樣日行千里的AI烈馬,套上了韁繩和馬鞍。

  OpenAI圍繞一個(gè)嚴(yán)格的架構(gòu)模型構(gòu)建系統(tǒng)。每個(gè)業(yè)務(wù)領(lǐng)域都有固定層級(jí),并且依賴方向被嚴(yán)格驗(yàn)證,只允許有限的合法邊界。

  規(guī)則很簡(jiǎn)單:在每個(gè)業(yè)務(wù)領(lǐng)域內(nèi)(如App Settings),代碼只能沿著固定層級(jí)「向前」依賴:

  Types→Config→Repo→Service→Runtime→UI

  橫切關(guān)注點(diǎn)(認(rèn)證、連接器、遙測(cè)、功能開(kāi)關(guān)等)只能通過(guò)一個(gè)顯式接口:Providers。

  其他依賴一律禁止,并通過(guò)自定義lint(也是Codex生成)和結(jié)構(gòu)測(cè)試強(qiáng)制執(zhí)行。

  

  這種架構(gòu)通常是公司規(guī)模到幾百人時(shí)才會(huì)認(rèn)真設(shè)計(jì)的。但在有編碼智能體的情況下,這是前提條件。

  此外,OpenAI的研究人員還定義了一組「品味不變量」,如:

  強(qiáng)制結(jié)構(gòu)化日志

  schema和類型的命名規(guī)范

  文件大小上限

  平臺(tái)級(jí)可靠性要求

  在這個(gè)過(guò)程中,必須明確區(qū)分的是哪些地方必須嚴(yán)格,哪些地方可以放權(quán)。

  這好比管理一個(gè)大型工程平臺(tái):邊界集中管控,內(nèi)部高度自治。

  AI生成的代碼未必符合人類審美,但只要正確、可維護(hù)、對(duì)智能體可讀,就OK。

  在這個(gè)過(guò)程中,人類的品味不會(huì)消失,而是被持續(xù)「編碼」進(jìn)系統(tǒng)。

  評(píng)審意見(jiàn)、重構(gòu)PR、用戶bug都會(huì)轉(zhuǎn)化為文檔更新,或直接升格為工具規(guī)則。

  當(dāng)文檔不夠用時(shí),就需要把規(guī)則寫進(jìn)代碼。

  扔掉鍵盤

  勇敢去駕馭AI

  OpenAI的這項(xiàng)實(shí)驗(yàn)宣告了:大量以CRUD為主的崗位,正在被重塑。

  如果一個(gè)從零開(kāi)始的系統(tǒng),可以在5個(gè)月內(nèi),由3個(gè)人(不寫一行代碼)構(gòu)建出百萬(wàn)行規(guī)模,傳統(tǒng)軟件公司里那些龐大的開(kāi)發(fā)團(tuán)隊(duì),還有存在的必要嗎?

  在這個(gè)即將到來(lái)的新時(shí)代,工程師的定義將被徹底改寫。

  你需要的是強(qiáng)大的「架構(gòu)能力」,能夠定義系統(tǒng)的邊界,設(shè)計(jì)模塊之間的約束,構(gòu)建那個(gè)讓AI不跑偏的「圍欄」。

  同時(shí),你還需要精準(zhǔn)的「表達(dá)能力」,學(xué)會(huì)用最清晰的語(yǔ)言(無(wú)論是自然語(yǔ)言還是結(jié)構(gòu)化文檔)向AI描述你的意圖。

  拒絕AI編程,堅(jiān)持手搓代碼的人終將被浪潮吞沒(méi),只有那些懂得駕馭AI的程序員,才有可能成為AI時(shí)代的贏家。

  參考資料:

  https://openai.com/index/harness-engineering/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人民幣狂飆5600點(diǎn)!美元沒(méi)跌,人民幣卻獨(dú)自升值,誰(shuí)在瘋狂買入?

人民幣狂飆5600點(diǎn)!美元沒(méi)跌,人民幣卻獨(dú)自升值,誰(shuí)在瘋狂買入?

云景侃記
2026-02-27 11:47:42
身中4彈不松手!為抓捕馬杜羅他駕重傷直升機(jī)完成絕密突襲

身中4彈不松手!為抓捕馬杜羅他駕重傷直升機(jī)完成絕密突襲

老馬拉車莫少裝
2026-02-26 14:56:46
新加坡住了一年才敢說(shuō):被吹上天的居者有其屋,其實(shí)是一地雞毛

新加坡住了一年才敢說(shuō):被吹上天的居者有其屋,其實(shí)是一地雞毛

天下霸奇
2026-02-24 08:09:25
吃瓜!曝東契奇與相戀10年超模女友分手,1年無(wú)互動(dòng)卻點(diǎn)贊網(wǎng)紅模特

吃瓜!曝東契奇與相戀10年超模女友分手,1年無(wú)互動(dòng)卻點(diǎn)贊網(wǎng)紅模特

818體育
2026-02-26 15:01:37
愛(ài)潑斯坦案再曝猛料!女星指控獻(xiàn)祭,證人曝狩獵派對(duì)像饑餓游戲

愛(ài)潑斯坦案再曝猛料!女星指控獻(xiàn)祭,證人曝狩獵派對(duì)像饑餓游戲

小徐講八卦
2026-02-25 07:05:52
約中年女人出來(lái)玩?這四個(gè)雷區(qū)千萬(wàn)別踩,踩一個(gè)就永遠(yuǎn)“躺列”

約中年女人出來(lái)玩?這四個(gè)雷區(qū)千萬(wàn)別踩,踩一個(gè)就永遠(yuǎn)“躺列”

楓紅染山徑
2026-02-27 11:27:33
成本1500萬(wàn),上映7天票房破1億,《夜王》憑什么讓觀眾瘋狂買單?

成本1500萬(wàn),上映7天票房破1億,《夜王》憑什么讓觀眾瘋狂買單?

科學(xué)發(fā)掘
2026-02-27 01:15:22
媒體人:中國(guó)贏下這場(chǎng)才能逼日本把八村和河村叫回來(lái)比劃一下

媒體人:中國(guó)贏下這場(chǎng)才能逼日本把八村和河村叫回來(lái)比劃一下

懂球帝
2026-02-27 07:50:11
3月這3生肖起飛了!事業(yè)暴走、賺錢輕松,錯(cuò)過(guò)再等一年!

3月這3生肖起飛了!事業(yè)暴走、賺錢輕松,錯(cuò)過(guò)再等一年!

毅談生肖
2026-02-27 11:42:05
真正的財(cái)閥氣質(zhì)!53歲李富真亮相兒子首爾大學(xué)典禮,太驚艷了

真正的財(cái)閥氣質(zhì)!53歲李富真亮相兒子首爾大學(xué)典禮,太驚艷了

愛(ài)下廚的阿椅
2026-02-27 08:36:11
臺(tái)海巡署回應(yīng)大陸喊話,金門有望成回歸試點(diǎn)

臺(tái)海巡署回應(yīng)大陸喊話,金門有望成回歸試點(diǎn)

補(bǔ)懂事的孩紙
2026-02-26 12:27:32
斯諾克賽程:決出4強(qiáng),中國(guó)保1席爭(zhēng)2席,TOP16對(duì)抗,3人搶紅包!

斯諾克賽程:決出4強(qiáng),中國(guó)保1席爭(zhēng)2席,TOP16對(duì)抗,3人搶紅包!

劉姚堯的文字城堡
2026-02-27 07:57:34
F-35前教官落網(wǎng)!美前空軍少校為大國(guó)秘密授課被抓

F-35前教官落網(wǎng)!美前空軍少校為大國(guó)秘密授課被抓

老馬拉車莫少裝
2026-02-26 15:25:13
驚呆!真實(shí)案例,公務(wù)員也不香了嗎?

驚呆!真實(shí)案例,公務(wù)員也不香了嗎?

慧翔百科
2026-02-27 11:51:51
你遇到過(guò)什么“神仙老師”? 網(wǎng)友:那一刻,我覺(jué)得他是超人

你遇到過(guò)什么“神仙老師”? 網(wǎng)友:那一刻,我覺(jué)得他是超人

夜深愛(ài)雜談
2026-02-25 21:17:57
TOP14位身高170以上的女神,有顏有燈有演技

TOP14位身高170以上的女神,有顏有燈有演技

素然追光
2026-01-02 02:45:02
你見(jiàn)過(guò)哪些悶聲發(fā)大財(cái)?shù)娜??網(wǎng)友:干這個(gè)買三套房子,兩個(gè)門面

你見(jiàn)過(guò)哪些悶聲發(fā)大財(cái)?shù)娜??網(wǎng)友:干這個(gè)買三套房子,兩個(gè)門面

夜深愛(ài)雜談
2026-02-01 18:57:04
“我就是她取精生子的工具”清華學(xué)霸哭訴,撕開(kāi)了女富豪的遮羞布

“我就是她取精生子的工具”清華學(xué)霸哭訴,撕開(kāi)了女富豪的遮羞布

百態(tài)中的情感起伏
2026-02-23 12:25:50
賴清德投誠(chéng)大陸?“臺(tái)獨(dú)”內(nèi)部炸鍋,大陸心里有數(shù),這事絕不簡(jiǎn)單

賴清德投誠(chéng)大陸?“臺(tái)獨(dú)”內(nèi)部炸鍋,大陸心里有數(shù),這事絕不簡(jiǎn)單

命運(yùn)自認(rèn)幽默
2026-02-26 20:28:59
為玩《生化9》瘋狂補(bǔ)課!新玩家一周通關(guān)系列8部正傳

為玩《生化9》瘋狂補(bǔ)課!新玩家一周通關(guān)系列8部正傳

Steam社區(qū)
2026-02-27 11:56:30
2026-02-27 12:32:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14600文章數(shù) 66644關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂

頭條要聞

特朗普在白宮"宴請(qǐng)"奪金的美國(guó)男子冰球隊(duì):吃麥當(dāng)勞

頭條要聞

特朗普在白宮"宴請(qǐng)"奪金的美國(guó)男子冰球隊(duì):吃麥當(dāng)勞

體育要聞

一場(chǎng)必須要贏的比賽,男籃何止擊敗了裁判

娛樂(lè)要聞

繼網(wǎng)暴谷愛(ài)凌后 美國(guó)欲沒(méi)收其全部收入

財(cái)經(jīng)要聞

魅族手機(jī),終成棄子?

汽車要聞

寶馬X5傳承版發(fā)布:給經(jīng)典G05的一場(chǎng)體面謝幕?

態(tài)度原創(chuàng)

房產(chǎn)
旅游
藝術(shù)
游戲
軍事航空

房產(chǎn)要聞

巨虧160億后,這家房企巨頭,轉(zhuǎn)戰(zhàn)海南做貿(mào)易!

旅游要聞

整整倆月!河南這家5A級(jí)景區(qū)對(duì)全國(guó)游客免門票

藝術(shù)要聞

紫氣東來(lái),好運(yùn)一整年!

《FF7重制版》第三部順利開(kāi)發(fā)因仍然使用虛幻4

軍事要聞

美國(guó)11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版