国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GLM-5真夠頂:超24小時(shí)跑代碼,700次工具調(diào)用、800次切上下文!

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

當(dāng)看到GLM-5正式發(fā)布后的能力,才驚覺前幾天神秘模型Pony Alpha的熱度還是有點(diǎn)保守了。

因?yàn)檫@一次,GLM-5直接把開源AI也拽進(jìn)了長(zhǎng)任務(wù)時(shí)代

瞧,GLM-5直接身兼數(shù)職,自己連續(xù)跑代碼超過(guò)24小時(shí),700次工具調(diào)用、800次上下文切換之后……

它直接用JavaScript,從零手搓了一個(gè)Game Boy Advance(GBA)模擬器!

外觀渲染畫面是這樣的:



屏幕里是這樣的:



在沒有渲染情況下的動(dòng)態(tài)效果如下:



視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

要知道,這對(duì)于AI來(lái)說(shuō),是一個(gè)絕對(duì)無(wú)法取巧的工程任務(wù)。

因?yàn)镚BA模擬器涉及到了500多條CPU指令集、內(nèi)存分頁(yè)機(jī)制、音頻子系統(tǒng)和圖形渲染時(shí)序等任務(wù)。

哪怕一條指令遵循出錯(cuò),或者一次文件寫入偏差,整個(gè)項(xiàng)目就會(huì)在幾個(gè)小時(shí)后崩盤。

并且GLM-5面對(duì)的還是無(wú)并行、無(wú)任何參考代碼、關(guān)閉網(wǎng)絡(luò)搜索的那種。

即便如此,從視頻給出的結(jié)果中我們也不難發(fā)現(xiàn),GLM-5確實(shí)是發(fā)揮非常穩(wěn)定:

  • 工具調(diào)用穩(wěn)定:第700次和第一次在語(yǔ)法、格式、準(zhǔn)確度上沒有差異;
  • 指令遵循持久:上下文即使切換了800次,依舊遵守Meta-Prompt的規(guī)范、約定和流程;
  • 工作判斷穩(wěn)定:GLM-5知道自己什么時(shí)候該測(cè)試、信息記錄、切換策略等;
  • 上下文夠可靠:每次上下文清空后,GLM-5能從筆記和文件中準(zhǔn)確恢復(fù)工作狀態(tài)。

這也難怪不少網(wǎng)友在看完之后直呼:

  • 它(GLM-5)可以制作精美的CAD模型!



并且目前GLM-5的評(píng)測(cè)結(jié)果也已出爐,在權(quán)威榜單Artificial Analysis中,直接到了與Claude Opus 4.5比肩的水平。



在業(yè)內(nèi)公認(rèn)的主流基準(zhǔn)測(cè)試中,GLM-5的編程能力也是實(shí)現(xiàn)了與Claude Opus 4.5對(duì)齊:



并且在衡量模型經(jīng)營(yíng)能力的Vending Bench 2中,GLM-5取得了開源第一的成績(jī):



但畢竟Claude Opus是閉源,護(hù)城河一下子被GLM-5這個(gè)開源模型給端掉,也是引得不少網(wǎng)友歡呼:

  • 感謝開源!



那么GLM-5這位開源界的第一位“全棧架構(gòu)師”,還有什么樣的實(shí)力?

接下來(lái),一波深度實(shí)測(cè)開源版Opus級(jí)別的模型,走起~

已經(jīng)有人申請(qǐng)上架App Store了

我們的測(cè)試將在Claude Code中調(diào)用GLM-5 API的方式展開。

因此,我們第一個(gè)測(cè)試就是做最考驗(yàn)?zāi)P偷倪壿嬮]環(huán)能力的游戲——要求GLM-5從零生成一個(gè)3D版大富翁



接下來(lái),我們直接來(lái)看下效果:



視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

可以看到,面對(duì)如此復(fù)雜的需求,GLM-5穩(wěn)穩(wěn)地把所有功能都實(shí)現(xiàn)了出來(lái)。

若是Prompt更加精細(xì),我們就可以得到一個(gè)OpenClaw對(duì)戰(zhàn)的《龍蝦版3D大富翁》



視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

而且已經(jīng)有用戶使用GLM-5做了個(gè)學(xué)術(shù)版“抖音”,并且提交上架蘋果App Store!



視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

10余款A(yù)PP都要上架了(showcase.z.ai):



實(shí)測(cè)繼續(xù)。

這一次,我們要測(cè)試GLM-5對(duì)復(fù)雜物理規(guī)律描述的理解能力,請(qǐng)聽Prompt:

  • 創(chuàng)建一個(gè)玻璃十二面體,每個(gè)面是一個(gè)遮罩,顯示中央相同旋轉(zhuǎn)基底環(huán)結(jié)的不同設(shè)計(jì)(看起來(lái)像拼貼/濾鏡)。應(yīng)用一些細(xì)微的泛光效果。在它外面再加一層大約兩倍大小的第二層(透明)玻璃殼,并讓每個(gè)面透過(guò)時(shí)改變內(nèi)部玻璃的外觀成不同類型,比如透過(guò)外層的某一面,整個(gè)內(nèi)殼看起來(lái)像是染色玻璃、彩繪玻璃或線框等,僅供參考。使用 three.js,……



視頻地址:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

GLM-5依舊是精準(zhǔn)地捕捉到了Prompt中的關(guān)鍵詞,生成的HTML文件打開后,一個(gè)光影交錯(cuò)的十二面體懸浮在空中。

除此之外,包括像全棧類型任務(wù),例如制作一個(gè)完整、有設(shè)計(jì)感的電商網(wǎng)站,GLM-5也是可以拿捏。

以及有人也用GLM-5手搓了個(gè)3D版可交互的《我的世界》!



開源,Win Again

GLM-5的出現(xiàn),不論是從實(shí)測(cè)還是網(wǎng)友們的反響來(lái)看,都在標(biāo)志一件事情:

開源大模型完成了一次從助手到獨(dú)立工程師的質(zhì)變。

以前,我們用AI是寫一句Prompt,但需要不斷地去做調(diào)試的工作;但現(xiàn)在,用GLM-5可以是給它一個(gè)目標(biāo),然后去喝咖啡,偶爾回來(lái)看看它有沒有跑偏。

更宏觀地來(lái)看,這對(duì)于SaaS行業(yè)來(lái)說(shuō),也可能是一場(chǎng)風(fēng)暴。

畢竟就在前幾天,隨著Claude Opus等具備長(zhǎng)任務(wù)能力的閉源模型展現(xiàn)威力,國(guó)外市場(chǎng)已經(jīng)出現(xiàn)了恐慌。

例如當(dāng)時(shí)金融數(shù)據(jù)服務(wù)商FactSet最慘盤中暴跌10%,S&P Global、穆迪、納斯達(dá)克公司紛紛下跌,各大指數(shù)全線跳水。

Fortune和CNBC報(bào)道稱,SaaS軟件類股票遭到拋售,投資者擔(dān)心,如果AI能現(xiàn)場(chǎng)手搓一個(gè)CRM系統(tǒng),誰(shuí)還去買年費(fèi)軟件。

雖然黃仁勛安撫說(shuō)AI會(huì)增強(qiáng)現(xiàn)有工具,但GLM-5的實(shí)測(cè)表現(xiàn)告訴我們:重塑或許已經(jīng)在發(fā)生。

更重要的是,之前這種能力是閉源巨頭的特權(quán)?,F(xiàn)在,GLM-5把這把鑰匙交到了所有開發(fā)者手里。

或許這次開源模型24小時(shí)不間斷自己跑代碼只是一個(gè)起點(diǎn),未來(lái)會(huì)更長(zhǎng)、更快、更好、更強(qiáng)。

Two More Things:

GLM其實(shí)從4.5版本開始就死磕AI編程這件事,現(xiàn)在這個(gè)國(guó)產(chǎn)AI的coding套餐在國(guó)內(nèi)外也是相當(dāng)火爆;這次智譜一上來(lái)就限售,外國(guó)網(wǎng)友們都是在“求”的狀態(tài)。

以及,智譜公司的大樓,現(xiàn)在也是成了個(gè)打卡點(diǎn)



開頭我們提到的GBA模擬器,由于GLM-5一直在跑,程序員小哥哥下班打車是這樣的:Agent乘客。



GitHub:
https://github.com/zai-org/GLM-5

Hugging Face:
https://huggingface.co/zai-org/GLM-5

ModelScope:
https://modelscope.cn/models/ZhipuAI/GLM-5

GameBoy Advance體驗(yàn):
https://e01.ai/gba

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
春節(jié)高速免費(fèi)最后1分鐘:有人壓哨通過(guò)省下1000多元,也有車主從蕭山上高速后“卡點(diǎn)”失敗交了幾百元通行費(fèi)

春節(jié)高速免費(fèi)最后1分鐘:有人壓哨通過(guò)省下1000多元,也有車主從蕭山上高速后“卡點(diǎn)”失敗交了幾百元通行費(fèi)

都市快報(bào)橙柿互動(dòng)
2026-02-24 09:16:26
隱瞞了我們62年!摘假發(fā)卸掉濃妝,李谷一的真實(shí)容貌其實(shí)長(zhǎng)這樣

隱瞞了我們62年!摘假發(fā)卸掉濃妝,李谷一的真實(shí)容貌其實(shí)長(zhǎng)這樣

相思賦予誰(shuí)a
2026-02-23 12:08:28
特朗普非常迫切,中國(guó)非常淡定從容!

特朗普非常迫切,中國(guó)非常淡定從容!

占豪
2026-02-25 01:18:03
春節(jié)期間樓市成交量突現(xiàn)翻倍式增長(zhǎng),房?jī)r(jià)的玩笑這次開大了

春節(jié)期間樓市成交量突現(xiàn)翻倍式增長(zhǎng),房?jī)r(jià)的玩笑這次開大了

重遠(yuǎn)投資觀
2026-02-24 15:23:23
西紅柿立大功!醫(yī)生研究發(fā)現(xiàn):老人吃西紅柿,或能緩解4種癥狀

西紅柿立大功!醫(yī)生研究發(fā)現(xiàn):老人吃西紅柿,或能緩解4種癥狀

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-01-21 21:50:30
《好好的時(shí)光》央視首播收視第1,觀眾評(píng)價(jià)一針見血,扮嫩又鬧騰

《好好的時(shí)光》央視首播收視第1,觀眾評(píng)價(jià)一針見血,扮嫩又鬧騰

娛君墜星河
2026-02-24 11:54:23
徹底撕破臉!谷愛凌坦言:代表中國(guó)參賽后,在美遭毆打、宿舍被闖

徹底撕破臉!谷愛凌坦言:代表中國(guó)參賽后,在美遭毆打、宿舍被闖

科學(xué)發(fā)掘
2026-02-25 02:38:37
7場(chǎng)5球1助!皇馬新大羅卻遭狠批,19歲就散步,難接班姆巴佩

7場(chǎng)5球1助!皇馬新大羅卻遭狠批,19歲就散步,難接班姆巴佩

阿泰希特
2026-02-24 14:15:02
鄧家佳翻車!2026年唯一公開發(fā)“LNY”的中國(guó)明星,評(píng)論區(qū)淪陷

鄧家佳翻車!2026年唯一公開發(fā)“LNY”的中國(guó)明星,評(píng)論區(qū)淪陷

萌神木木
2026-02-22 15:20:15
軍購(gòu)特別條例下月6日付委,韓國(guó)瑜提醒國(guó)民黨團(tuán)趨吉避兇

軍購(gòu)特別條例下月6日付委,韓國(guó)瑜提醒國(guó)民黨團(tuán)趨吉避兇

新時(shí)光點(diǎn)滴
2026-02-25 01:55:06
你最爽的一次經(jīng)歷是啥樣?網(wǎng)友:還清了所有外債

你最爽的一次經(jīng)歷是啥樣?網(wǎng)友:還清了所有外債

另子維愛讀史
2026-02-22 22:58:56
新加坡大滿貫:2月25日賽程公布,孫穎莎戰(zhàn)老將,向鵬黃友政對(duì)決

新加坡大滿貫:2月25日賽程公布,孫穎莎戰(zhàn)老將,向鵬黃友政對(duì)決

乒談
2026-02-24 23:12:17
12345不能亂打了!2026年開始整治亂打熱線現(xiàn)象

12345不能亂打了!2026年開始整治亂打熱線現(xiàn)象

醫(yī)脈圈
2026-02-24 12:13:20
黎智英女兒:懇請(qǐng)谷愛凌為父發(fā)聲后,不到24小時(shí),港府回應(yīng)了

黎智英女兒:懇請(qǐng)谷愛凌為父發(fā)聲后,不到24小時(shí),港府回應(yīng)了

百態(tài)人間
2026-02-24 15:45:57
2026年2月,建筑集團(tuán)公司已經(jīng)全面停工停產(chǎn)!

2026年2月,建筑集團(tuán)公司已經(jīng)全面停工停產(chǎn)!

巢客HOME
2026-02-23 20:26:27
貝加爾湖墜車事件:活下來(lái)的江蘇爸爸,往后的每一天都是煎熬

貝加爾湖墜車事件:活下來(lái)的江蘇爸爸,往后的每一天都是煎熬

社會(huì)日日鮮
2026-02-23 14:05:41
徐璐打羽毛球 注意力都被她的身材給吸引了 誰(shuí)還看打羽毛球的過(guò)程啊

徐璐打羽毛球 注意力都被她的身材給吸引了 誰(shuí)還看打羽毛球的過(guò)程啊

林子說(shuō)事
2026-02-24 11:51:44
恭喜汪小菲又當(dāng)爸爸!產(chǎn)房照曝光兒子好帥氣,馬筱梅抱孩子很溫柔

恭喜汪小菲又當(dāng)爸爸!產(chǎn)房照曝光兒子好帥氣,馬筱梅抱孩子很溫柔

娛樂圈圈圓
2026-02-24 15:30:08
鞏俐21歲時(shí)寫的字,顛覆了我的想象!

鞏俐21歲時(shí)寫的字,顛覆了我的想象!

石場(chǎng)阿鑫
2026-01-16 13:41:02
炸鍋!國(guó)美才女淪陷海外,私密視頻被掛成人網(wǎng),留學(xué)生集體背鍋?

炸鍋!國(guó)美才女淪陷海外,私密視頻被掛成人網(wǎng),留學(xué)生集體背鍋?

戧詞奪理
2026-02-23 15:32:24
2026-02-25 05:23:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12196文章數(shù) 176392關(guān)注度
往期回顧 全部

科技要聞

宇樹科技發(fā)布四足機(jī)器人Unitree As2

頭條要聞

男子摟住繼女強(qiáng)吻動(dòng)作親密 當(dāng)?shù)貗D聯(lián)介入

頭條要聞

男子摟住繼女強(qiáng)吻動(dòng)作親密 當(dāng)?shù)貗D聯(lián)介入

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個(gè)熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會(huì)照顧好3個(gè)孩子

財(cái)經(jīng)要聞

縣城消費(fèi)「限時(shí)繁榮」了十天

汽車要聞

入門即滿配 威蘭達(dá)AIR版上市 13.78萬(wàn)元起

態(tài)度原創(chuàng)

游戲
藝術(shù)
房產(chǎn)
公開課
軍事航空

LOL傳奇選手公布戀情!發(fā)博曬照被夸夫妻相,女方身份曝光

藝術(shù)要聞

投資95億,高428米!海南第一高樓最新進(jìn)展

房產(chǎn)要聞

330萬(wàn)人涌入!春節(jié)全國(guó)樓市,第一個(gè)賣爆的區(qū)域出現(xiàn)了!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍參聯(lián)會(huì)主席警告:對(duì)伊朗動(dòng)武可能帶來(lái)重大風(fēng)險(xiǎn)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版