国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

GPT-5.2連肝7天,300萬行代碼造出Chrome級瀏覽器

0
分享至


新智元報道

編輯:定慧 艾倫

【新智元導(dǎo)讀】一個大模型持續(xù)寫代碼,能寫多久?一小時?一天?還是像大部分AI編程工具那樣,完成一個任務(wù)就結(jié)束對話?Cursor的CEO MichaelTruell決定搞一次極限壓力測試!

Michael Truell讓Cursor中的GPT-5.2連續(xù)運行了整整一周。

不是一小時,不是一天,而是不眠不休,晝夜不停,168小時持續(xù)寫代碼。

結(jié)果?

300萬行代碼。數(shù)千個文件。

AI完全從零構(gòu)建出一個全新瀏覽器。


而且,還是Chrome那種瀏覽器。

HTML解析、CSS布局、文本渲染、還有一個自研的JavaScript虛擬機——全是AI自己寫的。

Michael Truell輕描淡寫地發(fā)了條推文:它基本能跑!簡單的網(wǎng)頁能快速且正確地渲染出來。


一個模型究竟能跑多久

傳統(tǒng)的AI編程工具,比如Github Copilot和早期的其他IDE,都是一問一答模式。

對話長度有限,上下文有限,任務(wù)復(fù)雜度有限。

后來出現(xiàn)了所謂的Agentic編程——Claude Code、Cursor Agent、Windsurf等工具讓AI可以自主執(zhí)行多步任務(wù),讀取文件、運行命令、修復(fù)錯誤。

這已經(jīng)是很大的進步,但大多數(shù)情況下,任務(wù)仍然以分鐘計算,最多幾小時。

AI完成一個功能,人類review,然后繼續(xù)下一個任務(wù)。

但沒有人嘗試過讓一個模型連續(xù)跑一周。

直到GPT-5.2。

Cursor團隊讓GPT-5.2持續(xù)運行了整整一周,不是斷斷續(xù)續(xù),而是連續(xù)工作


在這一周里,它:

  • 寫下了超過300萬行代碼

  • 創(chuàng)建了數(shù)千個文件

  • 執(zhí)行了數(shù)萬億個token

  • 從零構(gòu)建了一個完整的瀏覽器渲染引擎

一個模型究竟能運行多久?

答案是:理論上,可以無限。

只要基礎(chǔ)設(shè)施穩(wěn)定,只要任務(wù)足夠明確,AI就能持續(xù)工作——不眠不休,不吃不喝,7×24小時全年無休。

就像澳洲的放羊大叔的「賽博黑工」。

但實際上,不同模型的「耐力」差異巨大。

上下文窗口是第一道門檻。

早期的GPT-3.5只有4K token上下文,意味著對話稍長就會失憶。

Claude 3推出了200K上下文,GPT-4 Turbo跟進128K,Gemini 1.5 Pro更是號稱支持100萬token。

但上下文長度只是理論值——真正考驗的是模型在長任務(wù)中能否保持一致性、專注度和執(zhí)行力。

Cursor團隊在實驗中發(fā)現(xiàn)了關(guān)鍵差異。


在Cursor這篇官方博客中,團隊在實驗中發(fā)現(xiàn)了關(guān)鍵差異:

  • GPT-5.2能長時間自主工作,遵循指令精準,保持專注不偏離;

  • Claude Opus 4.5傾向盡早結(jié)束,走捷徑,頻繁把控制權(quán)交還給用戶;

  • GPT-5.1-Codex雖專為編碼訓(xùn)練,但規(guī)劃能力不如GPT-5.2,所以容易中斷。

用更直白的話說:Opus像個急躁的實習(xí)生,干一會就想問「這樣行不行?我先交了哈」;


GPT-5.2像個老練的高級工程師,交代清楚任務(wù)就埋頭干到底。

這也是為什么Cursor官方宣稱:GPT-5.2是處理長期運行任務(wù)的前沿模型。

不止瀏覽器。

Cursor還透露了其他正在運行的實驗項目:JavaLSP、Windows 7模擬器和Excel克隆。

數(shù)據(jù)都很夸張,AI自己不停地寫了55萬行代碼、120萬行代碼和160萬行代碼。(話說,Excel代碼比Windows還多點,因吹斯汀)


多智能體系統(tǒng)協(xié)作

一個模型在一周內(nèi)寫300萬行代碼,注意是不停的寫,沒有人類干預(yù)!

這顯然不是一個模型「單打獨斗」,怎么做到的?

Cursor團隊透露了他們的秘密武器:多智能體系統(tǒng)(Multi-Agent System)。


最初,他們嘗試讓所有Agent平等協(xié)作,通過共享文件來同步狀態(tài)。結(jié)果發(fā)現(xiàn):

Agent會持有鎖太久,或者干脆忘記釋放鎖。二十個Agent的速度下降到相當于兩三個Agent的有效吞吐量。


這像極了人類團隊中常見的問題:會議太多、溝通成本高、責(zé)任邊界不清。

最終有效的方案是分層架構(gòu)

  • 規(guī)劃者(Planners):持續(xù)探索代碼庫,創(chuàng)建任務(wù),進行高層決策

  • 執(zhí)行者(Workers):專注于完成具體任務(wù),不關(guān)心全局,提交后繼續(xù)下一個

  • 評審(Agent):判斷每輪迭代是否合格,決定是否進入下一階段

這幾乎是人類軟件公司的組織架構(gòu):產(chǎn)品經(jīng)理/架構(gòu)師負責(zé)規(guī)劃,程序員負責(zé)執(zhí)行,QA負責(zé)評審。

但區(qū)別在于——這是成百上千個Agent同時工作。

Cursor團隊實現(xiàn)了上百個Agent可以在同一個代碼庫上協(xié)同工作數(shù)周,幾乎沒有代碼沖突。

這意味著AI已經(jīng)學(xué)會了人類團隊需要多年才能磨合出的協(xié)作默契。

瀏覽器的「護城河」

比你想象的要深得多

如果聽到「不就是個顯示網(wǎng)頁的軟件嗎」這種評價,所有做過瀏覽器內(nèi)核的工程師大概都會苦笑。

在計算機科學(xué)的鄙視鏈里,手寫瀏覽器內(nèi)核的難度,僅次于手寫一個操作系統(tǒng)。

為了讓你對這300萬行代碼有個概念,我們需要看一眼谷歌的Chromium(Chrome的開源母體)。

作為人類軟件工程的巔峰之一,Chromium的代碼量早已突破3500萬行。

它不僅僅是一個軟件,本質(zhì)上已經(jīng)是一個「偽裝成應(yīng)用程序的操作系統(tǒng)」。

GPT-5.2挑戰(zhàn)的究竟是什么?

首先是CSS的「混沌理論」。

網(wǎng)頁排版從來不是簡單的堆積木。

CSS標準里充滿了各種歷史遺留的怪癖、層疊規(guī)則(Cascade)和復(fù)雜的繼承邏輯。

一位前火狐瀏覽器工程師曾打過比方:實現(xiàn)一個完美的CSS引擎,就像是在模擬一個物理法則隨心所欲變化的宇宙。你改動一個父元素的屬性,可能導(dǎo)致幾千個子元素的布局瞬間崩塌。

其次是「虛擬機里的虛擬機」。

這次AI不僅寫了界面,還寫了一個JS虛擬機。

現(xiàn)代網(wǎng)頁跑的JavaScript代碼需要內(nèi)存管理、垃圾回收(GC)和安全沙箱。

稍微處理不好,網(wǎng)頁就會吃光你的內(nèi)存,或者直接讓黑客穿透瀏覽器接管電腦。

最要命的是,它選了Rust。

Rust這門語言以「絕不妥協(xié)的安全」著稱,它的編譯器就像一位極度神經(jīng)質(zhì)的考官。

人類工程師在寫業(yè)務(wù)邏輯時,往往要花一半的時間和編譯器「吵架」,處理借用檢查(BorrowChecker)和生命周期問題。

AI不僅要懂業(yè)務(wù),還得在幾百萬行代碼的規(guī)模下,讓這位「考官」挑不出毛病。

能在七天內(nèi)把這些硬骨頭啃下來,并且讓它們協(xié)同工作,這已經(jīng)不是簡單的「寫得快」了,這意味機器開始具備了頂級的架構(gòu)掌控力。

當AI能夠「忍受孤獨」

但這則新聞?wù)嬲恼c,其實不在于瀏覽器本身,而在于那個「Uninterrupted」(無中斷)。

這是AI進化的分水嶺。

在此之前,我們熟悉的AI編程工具(比如早期的Copilot)的情況是:你寫個函數(shù)頭,它補全五行代碼;你發(fā)個指令,它生成一個腳本。

它們的記憶是碎片化的,注意力是短暫的。

一旦任務(wù)稍微復(fù)雜一點,比如「重構(gòu)這個模塊」,它們往往會顧頭不顧尾,改了這頭壞了那頭,最后還得人來擦屁股。

但這次不一樣。這是一次「長時任務(wù)」的勝利。

這300萬行代碼分布在數(shù)千個文件里。

當AI寫到第300萬行時,它必須依然「記得」第1行代碼里定下的架構(gòu)規(guī)矩;

當渲染引擎和JS虛擬機打架時,它必須能回溯幾萬行代碼去尋找Bug的源頭。

這168個小時里,GPT-5.2肯定寫出過Bug。

但它沒有停下來報錯等待人類投喂答案,而是自己讀取錯誤日志,自己調(diào)試,自己重構(gòu),然后繼續(xù)前行。

這種「編寫-運行-修復(fù)」的自主閉環(huán),曾經(jīng)是我們?nèi)祟惞こ處熥钜詾榘恋淖o城河。

現(xiàn)在,這條護城河被填平了。

我們正在目睹AI從「聊天伴侶」向「數(shù)字勞工」的質(zhì)變。

以前我們指揮AI做「任務(wù)」,比如「寫個貪吃蛇」;

現(xiàn)在我們指揮AI做「項目」,比如「造個瀏覽器」。

沉默的螺旋

雖然這個AI版瀏覽器的成熟度距離Chrome還有很長的路要走,但它證明了路徑的可行性。

當算力可以轉(zhuǎn)化為極其復(fù)雜的工程實施能力時,軟件開發(fā)的邊際成本將趨近于零。

這場實驗最令人震撼的,其實不是屏幕上那個渲染出的網(wǎng)頁,而是那個在后臺沉默運行了整整七天的進度條。

它不眠不休,不急不躁,以每秒數(shù)千字符的速度構(gòu)建著數(shù)字世界的基石。

也許我們該重新審視「創(chuàng)造」的定義了。

只有當工具開始獨自在深夜里解決問題時,我們才明白,它不再只是工具,而是我們的同行者。

從澳洲大叔的「賽博黑工」

到AI長時任務(wù)

用5行代碼逼瘋硅谷的澳洲放羊大叔,其實只做了一件事情,就是讓AI不達目標不能停止。


至于Prompt.md寫了什么命令,并不是重點。

就像今天Cursor CEO搞的這個極限壓力測試一樣,目標就是造一個Chrome、造一個Windows、開發(fā)一個Excel,只要沒完成目標,AI就要一直運行下去。 回到最開始那個問題:

一個AI究竟能自己干多久?

物理上的答案是無窮。只要你有足夠的算力、穩(wěn)定的基礎(chǔ)設(shè)施、清晰的任務(wù)定義,AI可以無限運行下去。

但更重要的是,這改變了軟件開發(fā)的經(jīng)濟學(xué)。

傳統(tǒng)軟件開發(fā)的主要成本是人力和時間。

一個10人團隊開發(fā)一個復(fù)雜項目,可能需要6個月到數(shù)年。每個月的人力成本可能是幾十萬到上百萬。

現(xiàn)在,AI可以在一周內(nèi)完成原本需要數(shù)月的工作。

成本可能只是一些token費用,Emad Mostaque(Stability AI前CEO)猜測Cursor瀏覽器項目可能消耗了約30億個token。

他還有一個想法:用多少token能夠重寫一套Windows級別的操作系統(tǒng)?成本如何?


Token是越來越便宜的,就像之前的水和電,最終基于token的算力也會變得極其廉價。

于是,軟件經(jīng)濟學(xué)就被徹底顛覆。比如,軟件按照授權(quán)付費的方式恐怕要消失了。

在2026年的今天,軟件開發(fā)正在經(jīng)歷一場基因級別的變異。

從前,代碼是人類一行一行敲出來的產(chǎn)物。

未來,代碼可能只是人類意圖的自動展開:你描述你想要什么,AI就能把它變成現(xiàn)實。

一個模型能跑多久?

只要你需要,它就能跑下去。

參考資料:

https://x.com/mntruell/status/2011562190286045552

https://x.com/leerob/status/2011565729838166269

https://cursor.com/cn/blog/scaling-agents


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
加盟中超,簽約上港?巴洛特利官宣,1年合同,球隊曝光

加盟中超,簽約上港?巴洛特利官宣,1年合同,球隊曝光

樂聊球
2026-01-15 12:31:59
贓款超83%來自境外,不法商人充當李勇“白手套”

贓款超83%來自境外,不法商人充當李勇“白手套”

極目新聞
2026-01-14 20:22:36
棋圣千古!聶衛(wèi)平俠氣豪情寄國足 一生情緣亦成憾

棋圣千古!聶衛(wèi)平俠氣豪情寄國足 一生情緣亦成憾

體壇周報
2026-01-15 14:02:11
“傳奇”聶衛(wèi)平抗癌:10多年前已做直腸癌手術(shù),暴瘦40斤,“我怎么能聽天由命呢”

“傳奇”聶衛(wèi)平抗癌:10多年前已做直腸癌手術(shù),暴瘦40斤,“我怎么能聽天由命呢”

極目新聞
2026-01-15 11:44:25
勇士交易目標!場均32+6+4!要價3個首輪簽

勇士交易目標!場均32+6+4!要價3個首輪簽

籃球教學(xué)論壇
2026-01-15 13:51:27
世界最冷的十座城市,中國有6座上榜,最冷竟然是它!

世界最冷的十座城市,中國有6座上榜,最冷竟然是它!

中國藝術(shù)家
2026-01-15 05:23:28
別再被騙了!閆學(xué)晶根本未在部隊退休,隱瞞多年的轉(zhuǎn)業(yè)內(nèi)幕公開

別再被騙了!閆學(xué)晶根本未在部隊退休,隱瞞多年的轉(zhuǎn)業(yè)內(nèi)幕公開

報君知史
2026-01-15 10:01:19
可以堆雪人啦!長沙大部地區(qū)下周有中到大雪,積雪深度3~7厘米

可以堆雪人啦!長沙大部地區(qū)下周有中到大雪,積雪深度3~7厘米

三湘都市報
2026-01-15 10:30:52
官方:佛山地鐵兩條此前已獲批線路,需再次上報審核

官方:佛山地鐵兩條此前已獲批線路,需再次上報審核

南方都市報
2026-01-15 12:25:07
唐方裕已任中央政策研究室主任

唐方裕已任中央政策研究室主任

農(nóng)民日報
2026-01-15 09:54:21
媒體:多國空軍排隊購買梟龍戰(zhàn)機

媒體:多國空軍排隊購買梟龍戰(zhàn)機

財聯(lián)社
2026-01-14 17:33:05
中戲院長落馬,牽出明星暗線!寒門藝考生的前路究竟在哪里?

中戲院長落馬,牽出明星暗線!寒門藝考生的前路究竟在哪里?

垛垛糖
2026-01-14 20:33:18
天哪,中鐵某局都發(fā)不出工資了?

天哪,中鐵某局都發(fā)不出工資了?

黯泉
2026-01-15 10:45:56
伊朗前足球明星夫婦街頭抗議遇難

伊朗前足球明星夫婦街頭抗議遇難

可樂談情感
2026-01-15 01:29:38
俄烏戰(zhàn)爭,擊碎了多少“神一樣的存在”

俄烏戰(zhàn)爭,擊碎了多少“神一樣的存在”

望岳
2026-01-12 20:36:38
現(xiàn)貨白銀大幅跳水,跌幅擴大至7%

現(xiàn)貨白銀大幅跳水,跌幅擴大至7%

每日經(jīng)濟新聞
2026-01-15 09:43:56
怎樣判斷一個人的認知在你之上

怎樣判斷一個人的認知在你之上

詩詞中國
2026-01-13 19:38:16
伊朗抗議者親手擊斃下令射殺群眾的伊朗軍官

伊朗抗議者親手擊斃下令射殺群眾的伊朗軍官

桂系007
2026-01-12 00:31:50
24分大勝!楊瀚森爆砍22分,核心1節(jié)打垮對手,扎心1問:令人無奈

24分大勝!楊瀚森爆砍22分,核心1節(jié)打垮對手,扎心1問:令人無奈

話體壇
2026-01-15 12:42:18
比韓國更難踢!U23國足下場對手近4屆奪1冠2亞 2次交手全敗+吞0-3

比韓國更難踢!U23國足下場對手近4屆奪1冠2亞 2次交手全敗+吞0-3

我愛英超
2026-01-14 22:35:50
2026-01-15 15:03:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
14339文章數(shù) 66483關(guān)注度
往期回顧 全部

科技要聞

千問接入淘寶支付寶,大模型開卷辦事能力

頭條要聞

51:50美參院否決限制特朗普戰(zhàn)爭權(quán)議案 萬斯投關(guān)鍵1票

頭條要聞

51:50美參院否決限制特朗普戰(zhàn)爭權(quán)議案 萬斯投關(guān)鍵1票

體育要聞

你是個好球員,我們就拿你交易吧

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網(wǎng)友集體悼念

財經(jīng)要聞

“瘋狂的白銀”,還能走多遠?

汽車要聞

今年推出超40款新車,BBA要把失去的奪回來

態(tài)度原創(chuàng)

手機
家居
藝術(shù)
數(shù)碼
公開課

手機要聞

號稱行業(yè)唯一內(nèi)置風(fēng)扇的AIR,紅魔11 Air搭載馭風(fēng)4.0主動散熱風(fēng)扇

家居要聞

自在自宅 個性自由

藝術(shù)要聞

歷代書家集字春聯(lián)大集合

數(shù)碼要聞

米物上架小魔方45W氮化鎵充電器,69元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版