国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5.2連肝7天,300萬(wàn)行代碼造出Chrome級(jí)瀏覽器

0
分享至


新智元報(bào)道

編輯:定慧 艾倫

【新智元導(dǎo)讀】一個(gè)大模型持續(xù)寫代碼,能寫多久?一小時(shí)?一天?還是像大部分AI編程工具那樣,完成一個(gè)任務(wù)就結(jié)束對(duì)話?Cursor的CEO MichaelTruell決定搞一次極限壓力測(cè)試!

Michael Truell讓Cursor中的GPT-5.2連續(xù)運(yùn)行了整整一周。

不是一小時(shí),不是一天,而是不眠不休,晝夜不停,168小時(shí)持續(xù)寫代碼。

結(jié)果?

300萬(wàn)行代碼。數(shù)千個(gè)文件。

AI完全從零構(gòu)建出一個(gè)全新瀏覽器。


而且,還是Chrome那種瀏覽器。

HTML解析、CSS布局、文本渲染、還有一個(gè)自研的JavaScript虛擬機(jī)——全是AI自己寫的。

Michael Truell輕描淡寫地發(fā)了條推文:它基本能跑!簡(jiǎn)單的網(wǎng)頁(yè)能快速且正確地渲染出來(lái)。


一個(gè)模型究竟能跑多久

傳統(tǒng)的AI編程工具,比如Github Copilot和早期的其他IDE,都是一問(wèn)一答模式。

對(duì)話長(zhǎng)度有限,上下文有限,任務(wù)復(fù)雜度有限。

后來(lái)出現(xiàn)了所謂的Agentic編程——Claude Code、Cursor Agent、Windsurf等工具讓AI可以自主執(zhí)行多步任務(wù),讀取文件、運(yùn)行命令、修復(fù)錯(cuò)誤。

這已經(jīng)是很大的進(jìn)步,但大多數(shù)情況下,任務(wù)仍然以分鐘計(jì)算,最多幾小時(shí)。

AI完成一個(gè)功能,人類review,然后繼續(xù)下一個(gè)任務(wù)。

但沒(méi)有人嘗試過(guò)讓一個(gè)模型連續(xù)跑一周。

直到GPT-5.2。

Cursor團(tuán)隊(duì)讓GPT-5.2持續(xù)運(yùn)行了整整一周,不是斷斷續(xù)續(xù),而是連續(xù)工作。


在這一周里,它:

  • 寫下了超過(guò)300萬(wàn)行代碼

  • 創(chuàng)建了數(shù)千個(gè)文件

  • 執(zhí)行了數(shù)萬(wàn)億個(gè)token

  • 從零構(gòu)建了一個(gè)完整的瀏覽器渲染引擎

一個(gè)模型究竟能運(yùn)行多久?

答案是:理論上,可以無(wú)限

只要基礎(chǔ)設(shè)施穩(wěn)定,只要任務(wù)足夠明確,AI就能持續(xù)工作——不眠不休,不吃不喝,7×24小時(shí)全年無(wú)休。

就像澳洲的放羊大叔的「賽博黑工」。

但實(shí)際上,不同模型的「耐力」差異巨大。

上下文窗口是第一道門檻。

早期的GPT-3.5只有4K token上下文,意味著對(duì)話稍長(zhǎng)就會(huì)失憶。

Claude 3推出了200K上下文,GPT-4 Turbo跟進(jìn)128K,Gemini 1.5 Pro更是號(hào)稱支持100萬(wàn)token。

但上下文長(zhǎng)度只是理論值——真正考驗(yàn)的是模型在長(zhǎng)任務(wù)中能否保持一致性、專注度和執(zhí)行力。

Cursor團(tuán)隊(duì)在實(shí)驗(yàn)中發(fā)現(xiàn)了關(guān)鍵差異。


在Cursor這篇官方博客中,團(tuán)隊(duì)在實(shí)驗(yàn)中發(fā)現(xiàn)了關(guān)鍵差異:

  • GPT-5.2能長(zhǎng)時(shí)間自主工作,遵循指令精準(zhǔn),保持專注不偏離;

  • Claude Opus 4.5傾向盡早結(jié)束,走捷徑,頻繁把控制權(quán)交還給用戶;

  • GPT-5.1-Codex雖專為編碼訓(xùn)練,但規(guī)劃能力不如GPT-5.2,所以容易中斷。

用更直白的話說(shuō):Opus像個(gè)急躁的實(shí)習(xí)生,干一會(huì)就想問(wèn)「這樣行不行?我先交了哈」;


GPT-5.2像個(gè)老練的高級(jí)工程師,交代清楚任務(wù)就埋頭干到底。

這也是為什么Cursor官方宣稱:GPT-5.2是處理長(zhǎng)期運(yùn)行任務(wù)的前沿模型。

不止瀏覽器。

Cursor還透露了其他正在運(yùn)行的實(shí)驗(yàn)項(xiàng)目:JavaLSP、Windows 7模擬器和Excel克隆。

數(shù)據(jù)都很夸張,AI自己不停地寫了55萬(wàn)行代碼、120萬(wàn)行代碼和160萬(wàn)行代碼。(話說(shuō),Excel代碼比Windows還多點(diǎn),因吹斯。


多智能體系統(tǒng)協(xié)作

一個(gè)模型在一周內(nèi)寫300萬(wàn)行代碼,注意是不停的寫,沒(méi)有人類干預(yù)!

這顯然不是一個(gè)模型「單打獨(dú)斗」,怎么做到的?

Cursor團(tuán)隊(duì)透露了他們的秘密武器:多智能體系統(tǒng)(Multi-Agent System)。


最初,他們嘗試讓所有Agent平等協(xié)作,通過(guò)共享文件來(lái)同步狀態(tài)。結(jié)果發(fā)現(xiàn):

Agent會(huì)持有鎖太久,或者干脆忘記釋放鎖。二十個(gè)Agent的速度下降到相當(dāng)于兩三個(gè)Agent的有效吞吐量。


這像極了人類團(tuán)隊(duì)中常見的問(wèn)題:會(huì)議太多、溝通成本高、責(zé)任邊界不清。

最終有效的方案是分層架構(gòu)

  • 規(guī)劃者(Planners):持續(xù)探索代碼庫(kù),創(chuàng)建任務(wù),進(jìn)行高層決策

  • 執(zhí)行者(Workers):專注于完成具體任務(wù),不關(guān)心全局,提交后繼續(xù)下一個(gè)

  • 評(píng)審(Agent):判斷每輪迭代是否合格,決定是否進(jìn)入下一階段

這幾乎是人類軟件公司的組織架構(gòu):產(chǎn)品經(jīng)理/架構(gòu)師負(fù)責(zé)規(guī)劃,程序員負(fù)責(zé)執(zhí)行,QA負(fù)責(zé)評(píng)審。

但區(qū)別在于——這是成百上千個(gè)Agent同時(shí)工作。

Cursor團(tuán)隊(duì)實(shí)現(xiàn)了上百個(gè)Agent可以在同一個(gè)代碼庫(kù)上協(xié)同工作數(shù)周,幾乎沒(méi)有代碼沖突。

這意味著AI已經(jīng)學(xué)會(huì)了人類團(tuán)隊(duì)需要多年才能磨合出的協(xié)作默契。

瀏覽器的「護(hù)城河」

比你想象的要深得多

如果聽到「不就是個(gè)顯示網(wǎng)頁(yè)的軟件嗎」這種評(píng)價(jià),所有做過(guò)瀏覽器內(nèi)核的工程師大概都會(huì)苦笑。

在計(jì)算機(jī)科學(xué)的鄙視鏈里,手寫瀏覽器內(nèi)核的難度,僅次于手寫一個(gè)操作系統(tǒng)。

為了讓你對(duì)這300萬(wàn)行代碼有個(gè)概念,我們需要看一眼谷歌的Chromium(Chrome的開源母體)。

作為人類軟件工程的巔峰之一,Chromium的代碼量早已突破3500萬(wàn)行。

它不僅僅是一個(gè)軟件,本質(zhì)上已經(jīng)是一個(gè)「?jìng)窝b成應(yīng)用程序的操作系統(tǒng)」。

GPT-5.2挑戰(zhàn)的究竟是什么?

首先是CSS的「混沌理論」。

網(wǎng)頁(yè)排版從來(lái)不是簡(jiǎn)單的堆積木。

CSS標(biāo)準(zhǔn)里充滿了各種歷史遺留的怪癖、層疊規(guī)則(Cascade)和復(fù)雜的繼承邏輯。

一位前火狐瀏覽器工程師曾打過(guò)比方:實(shí)現(xiàn)一個(gè)完美的CSS引擎,就像是在模擬一個(gè)物理法則隨心所欲變化的宇宙。你改動(dòng)一個(gè)父元素的屬性,可能導(dǎo)致幾千個(gè)子元素的布局瞬間崩塌。

其次是「虛擬機(jī)里的虛擬機(jī)」。

這次AI不僅寫了界面,還寫了一個(gè)JS虛擬機(jī)。

現(xiàn)代網(wǎng)頁(yè)跑的JavaScript代碼需要內(nèi)存管理、垃圾回收(GC)和安全沙箱。

稍微處理不好,網(wǎng)頁(yè)就會(huì)吃光你的內(nèi)存,或者直接讓黑客穿透瀏覽器接管電腦。

最要命的是,它選了Rust。

Rust這門語(yǔ)言以「絕不妥協(xié)的安全」著稱,它的編譯器就像一位極度神經(jīng)質(zhì)的考官。

人類工程師在寫業(yè)務(wù)邏輯時(shí),往往要花一半的時(shí)間和編譯器「吵架」,處理借用檢查(BorrowChecker)和生命周期問(wèn)題。

AI不僅要懂業(yè)務(wù),還得在幾百萬(wàn)行代碼的規(guī)模下,讓這位「考官」挑不出毛病。

能在七天內(nèi)把這些硬骨頭啃下來(lái),并且讓它們協(xié)同工作,這已經(jīng)不是簡(jiǎn)單的「寫得快」了,這意味機(jī)器開始具備了頂級(jí)的架構(gòu)掌控力。

當(dāng)AI能夠「忍受孤獨(dú)」

但這則新聞?wù)嬲恼c(diǎn),其實(shí)不在于瀏覽器本身,而在于那個(gè)「Uninterrupted」(無(wú)中斷)

這是AI進(jìn)化的分水嶺。

在此之前,我們熟悉的AI編程工具(比如早期的Copilot)的情況是:你寫個(gè)函數(shù)頭,它補(bǔ)全五行代碼;你發(fā)個(gè)指令,它生成一個(gè)腳本。

它們的記憶是碎片化的,注意力是短暫的。

一旦任務(wù)稍微復(fù)雜一點(diǎn),比如「重構(gòu)這個(gè)模塊」,它們往往會(huì)顧頭不顧尾,改了這頭壞了那頭,最后還得人來(lái)擦屁股。

但這次不一樣。這是一次「長(zhǎng)時(shí)任務(wù)」的勝利。

這300萬(wàn)行代碼分布在數(shù)千個(gè)文件里。

當(dāng)AI寫到第300萬(wàn)行時(shí),它必須依然「記得」第1行代碼里定下的架構(gòu)規(guī)矩;

當(dāng)渲染引擎和JS虛擬機(jī)打架時(shí),它必須能回溯幾萬(wàn)行代碼去尋找Bug的源頭。

這168個(gè)小時(shí)里,GPT-5.2肯定寫出過(guò)Bug。

但它沒(méi)有停下來(lái)報(bào)錯(cuò)等待人類投喂答案,而是自己讀取錯(cuò)誤日志,自己調(diào)試,自己重構(gòu),然后繼續(xù)前行。

這種「編寫-運(yùn)行-修復(fù)」的自主閉環(huán),曾經(jīng)是我們?nèi)祟惞こ處熥钜詾榘恋淖o(hù)城河。

現(xiàn)在,這條護(hù)城河被填平了。

我們正在目睹AI從「聊天伴侶」向「數(shù)字勞工」的質(zhì)變。

以前我們指揮AI做「任務(wù)」,比如「寫個(gè)貪吃蛇」;

現(xiàn)在我們指揮AI做「項(xiàng)目」,比如「造個(gè)瀏覽器」。

沉默的螺旋

雖然這個(gè)AI版瀏覽器的成熟度距離Chrome還有很長(zhǎng)的路要走,但它證明了路徑的可行性。

當(dāng)算力可以轉(zhuǎn)化為極其復(fù)雜的工程實(shí)施能力時(shí),軟件開發(fā)的邊際成本將趨近于零。

這場(chǎng)實(shí)驗(yàn)最令人震撼的,其實(shí)不是屏幕上那個(gè)渲染出的網(wǎng)頁(yè),而是那個(gè)在后臺(tái)沉默運(yùn)行了整整七天的進(jìn)度條。

它不眠不休,不急不躁,以每秒數(shù)千字符的速度構(gòu)建著數(shù)字世界的基石。

也許我們?cè)撝匦聦徱暋竸?chuàng)造」的定義了。

只有當(dāng)工具開始獨(dú)自在深夜里解決問(wèn)題時(shí),我們才明白,它不再只是工具,而是我們的同行者。

從澳洲大叔的「賽博黑工」

到AI長(zhǎng)時(shí)任務(wù)

用5行代碼逼瘋硅谷的澳洲放羊大叔,其實(shí)只做了一件事情,就是讓AI不達(dá)目標(biāo)不能停止。


至于Prompt.md寫了什么命令,并不是重點(diǎn)。

就像今天Cursor CEO搞的這個(gè)極限壓力測(cè)試一樣,目標(biāo)就是造一個(gè)Chrome、造一個(gè)Windows、開發(fā)一個(gè)Excel,只要沒(méi)完成目標(biāo),AI就要一直運(yùn)行下去。 回到最開始那個(gè)問(wèn)題:

一個(gè)AI究竟能自己干多久?

物理上的答案是無(wú)窮。只要你有足夠的算力、穩(wěn)定的基礎(chǔ)設(shè)施、清晰的任務(wù)定義,AI可以無(wú)限運(yùn)行下去。

但更重要的是,這改變了軟件開發(fā)的經(jīng)濟(jì)學(xué)。

傳統(tǒng)軟件開發(fā)的主要成本是人力和時(shí)間。

一個(gè)10人團(tuán)隊(duì)開發(fā)一個(gè)復(fù)雜項(xiàng)目,可能需要6個(gè)月到數(shù)年。每個(gè)月的人力成本可能是幾十萬(wàn)到上百萬(wàn)。

現(xiàn)在,AI可以在一周內(nèi)完成原本需要數(shù)月的工作。

成本可能只是一些token費(fèi)用,Emad Mostaque(Stability AI前CEO)猜測(cè)Cursor瀏覽器項(xiàng)目可能消耗了約30億個(gè)token。

他還有一個(gè)想法:用多少token能夠重寫一套Windows級(jí)別的操作系統(tǒng)?成本如何?


Token是越來(lái)越便宜的,就像之前的水和電,最終基于token的算力也會(huì)變得極其廉價(jià)。

于是,軟件經(jīng)濟(jì)學(xué)就被徹底顛覆。比如,軟件按照授權(quán)付費(fèi)的方式恐怕要消失了。

在2026年的今天,軟件開發(fā)正在經(jīng)歷一場(chǎng)基因級(jí)別的變異。

從前,代碼是人類一行一行敲出來(lái)的產(chǎn)物。

未來(lái),代碼可能只是人類意圖的自動(dòng)展開:你描述你想要什么,AI就能把它變成現(xiàn)實(shí)。

一個(gè)模型能跑多久?

只要你需要,它就能跑下去。

參考資料:

https://x.com/mntruell/status/2011562190286045552

https://x.com/leerob/status/2011565729838166269

https://cursor.com/cn/blog/scaling-agents


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
央企“最牛女副處長(zhǎng)”落馬:兩年與上司開房410次,細(xì)節(jié)曝光

央企“最牛女副處長(zhǎng)”落馬:兩年與上司開房410次,細(xì)節(jié)曝光

西門老爹
2025-12-16 15:35:31
以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國(guó)并不會(huì)第一個(gè)翻臉

以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國(guó)并不會(huì)第一個(gè)翻臉

八斗小先生
2025-12-26 09:33:27
攻防兩端都有輸出,合理使用的話快船鋒線老將還是能起到這樣的?

攻防兩端都有輸出,合理使用的話快船鋒線老將還是能起到這樣的?

稻谷與小麥
2026-01-16 00:56:39
美媒:美國(guó)將暫停對(duì)75個(gè)國(guó)家的所有簽證

美媒:美國(guó)將暫停對(duì)75個(gè)國(guó)家的所有簽證

新華社
2026-01-14 22:40:07
1987年,蔣經(jīng)國(guó)最后一張全家合影,身患糖尿病,第二年去世!

1987年,蔣經(jīng)國(guó)最后一張全家合影,身患糖尿病,第二年去世!

鶴羽說(shuō)個(gè)事
2026-01-06 10:46:23
回顧:孫小果被注射死刑后,以前女同學(xué)透露其習(xí)慣,令人感到害怕

回顧:孫小果被注射死刑后,以前女同學(xué)透露其習(xí)慣,令人感到害怕

飛云如水
2025-01-11 15:15:34
CBA | 布朗回歸,浙江方興渡豪取主場(chǎng)八連勝!

CBA | 布朗回歸,浙江方興渡豪取主場(chǎng)八連勝!

魯中晨報(bào)
2026-01-15 22:03:06
錢再多也沒(méi)用!霍啟剛個(gè)人財(cái)產(chǎn)曝光僅3天,惡心的一幕還是出現(xiàn)了

錢再多也沒(méi)用!霍啟剛個(gè)人財(cái)產(chǎn)曝光僅3天,惡心的一幕還是出現(xiàn)了

往史過(guò)眼云煙
2026-01-15 22:00:49
1968年,林彪想換北京軍區(qū)司令,毛主席只問(wèn)了一句話,林彪徹底啞火

1968年,林彪想換北京軍區(qū)司令,毛主席只問(wèn)了一句話,林彪徹底啞火

老杉說(shuō)歷史
2026-01-09 22:00:17
我媽偏心哥哥30年,直到看見他給她的備注:老不死提款機(jī)

我媽偏心哥哥30年,直到看見他給她的備注:老不死提款機(jī)

真實(shí)人物采訪
2026-01-14 14:00:02
死傷抗議者過(guò)多,伊朗醫(yī)院系統(tǒng)被壓垮!醫(yī)護(hù)連做心肺復(fù)蘇的時(shí)間都沒(méi)有

死傷抗議者過(guò)多,伊朗醫(yī)院系統(tǒng)被壓垮!醫(yī)護(hù)連做心肺復(fù)蘇的時(shí)間都沒(méi)有

互聯(lián)網(wǎng)大觀
2026-01-11 14:31:51
海外患者打飛的來(lái)中國(guó)就醫(yī)

海外患者打飛的來(lái)中國(guó)就醫(yī)

第一財(cái)經(jīng)資訊
2026-01-15 10:25:03
賴清德開始轉(zhuǎn)移家人,洪秀柱一錘定音,中方:臺(tái)灣和委瑞內(nèi)拉不同

賴清德開始轉(zhuǎn)移家人,洪秀柱一錘定音,中方:臺(tái)灣和委瑞內(nèi)拉不同

傲傲講歷史
2026-01-14 13:26:46
安徽將調(diào)整全省城鄉(xiāng)居民社保繳費(fèi)標(biāo)準(zhǔn),繳15年最高可領(lǐng)1400元以上

安徽將調(diào)整全省城鄉(xiāng)居民社保繳費(fèi)標(biāo)準(zhǔn),繳15年最高可領(lǐng)1400元以上

虎哥閑聊
2026-01-14 13:48:52
不論情人或夫妻,讓男人長(zhǎng)期有感覺(jué)的女人,往往具備3個(gè)特質(zhì)

不論情人或夫妻,讓男人長(zhǎng)期有感覺(jué)的女人,往往具備3個(gè)特質(zhì)

葉飛飛情感屋
2026-01-15 16:10:02
呂布的方天畫戟威力那么大,為何古代軍隊(duì)不批量裝備?看一眼造價(jià),曹操都得心疼哆嗦

呂布的方天畫戟威力那么大,為何古代軍隊(duì)不批量裝備?看一眼造價(jià),曹操都得心疼哆嗦

桃煙讀史
2026-01-11 22:11:06
浪子回頭9:江湖的真相

浪子回頭9:江湖的真相

金昔說(shuō)故事
2026-01-14 16:04:48
伊朗宗教高層:若哈梅內(nèi)伊遭襲,將對(duì)美以發(fā)動(dòng)全球圣戰(zhàn)

伊朗宗教高層:若哈梅內(nèi)伊遭襲,將對(duì)美以發(fā)動(dòng)全球圣戰(zhàn)

桂系007
2026-01-12 00:23:38
上海警方首創(chuàng)“交通治堵大模型”,今年將在1800余個(gè)路口布設(shè)

上海警方首創(chuàng)“交通治堵大模型”,今年將在1800余個(gè)路口布設(shè)

上觀新聞
2026-01-15 13:29:05
聶衛(wèi)平家屬發(fā)布訃告:先生12年前做癌癥手術(shù),去年因腦;杳12天,女兒悲痛發(fā)聲“子欲養(yǎng)而親不待”

聶衛(wèi)平家屬發(fā)布訃告:先生12年前做癌癥手術(shù),去年因腦;杳12天,女兒悲痛發(fā)聲“子欲養(yǎng)而親不待”

極目新聞
2026-01-15 08:55:48
2026-01-16 03:44:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14342文章數(shù) 66499關(guān)注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

美突襲委內(nèi)瑞拉動(dòng)用神秘武器:委士兵跪倒在地吐血

頭條要聞

美突襲委內(nèi)瑞拉動(dòng)用神秘武器:委士兵跪倒在地吐血

體育要聞

聶衛(wèi)平:黑白棋盤上的凡人棋圣

娛樂(lè)要聞

92歲陶玉玲去世,馮遠(yuǎn)征曹可凡悼念

財(cái)經(jīng)要聞

央行再次結(jié)構(gòu)性降息0.25個(gè)百分點(diǎn)

汽車要聞

吉利帝豪/繽越推冠軍一口價(jià) 起售價(jià)4.88萬(wàn)

態(tài)度原創(chuàng)

數(shù)碼
游戲
藝術(shù)
公開課
軍事航空

數(shù)碼要聞

部分內(nèi)存條價(jià)格暴漲超300% 報(bào)告稱存儲(chǔ)市場(chǎng)進(jìn)入超級(jí)牛市

任天堂股價(jià)暴跌!為何索尼未收影響?專家分析來(lái)了

藝術(shù)要聞

300億!341米!迪拜將建全球首個(gè)奔馳品牌城市

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國(guó)已正式開始出售委內(nèi)瑞拉石油

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版