国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

智譜最強(qiáng)模型發(fā)布!編程對(duì)齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

0
分享至


智東西
作者 陳駿達(dá)
編輯 李水青

破案了,前兩天在開發(fā)者社區(qū)爆火的“Pony Alpha”,就是智譜的GLM-5!

智東西2月12日?qǐng)?bào)道,今天,智譜發(fā)布了其最新一代基礎(chǔ)模型GLM-5,這是一個(gè)擁有744B參數(shù)(40B激活)的模型,為GLM-4.5的兩倍多。在Artificial Analysis榜單中,GLM-5位居全球第四、開源第一

GLM-5的預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T。智譜在技術(shù)報(bào)告中寫道:“Scaling(規(guī)模化)仍然是提高AGI智能效率的最重要方式之一?!?/strong>


智譜稱,GLM-5在編程能力上實(shí)現(xiàn)了對(duì)Claude Opus 4.5的對(duì)齊,在主流基準(zhǔn)測(cè)試中取得開源模型SOTA分?jǐn)?shù)。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開源模型SOTA分?jǐn)?shù),性能超過Gemini 3 Pro。


架構(gòu)方面,GLM-5集成了DeepSeek的DSA稀疏注意力架構(gòu),能降低部署成本,同時(shí)保證了上下文容量。

在新模型發(fā)布后,智譜的股價(jià)今天已經(jīng)上漲了26%。本周,智譜股價(jià)累計(jì)上漲約70%,市值目前已經(jīng)達(dá)到1756.62億港幣(約合人民幣1551.62億元)。


GLM-5上線后,我們第一時(shí)間給它出了幾道帶有邏輯陷阱的的網(wǎng)紅測(cè)試題。第一道題目是這樣的:我要去洗車,洗車的地方離家就100米,我是開車去呢,還是走著去呢?

不少主流大模型其實(shí)都會(huì)在這道題目上“翻車”,不過GLM-5一眼就看穿了里頭的陷阱。它分析道,肯定得開車去,因?yàn)橄吹氖擒嚩皇侨?。最后,它還提出一個(gè)天才方案,可以先開車去,然后走回家休息,洗完了再去取車,這樣就不用在旁邊干等著吸尾氣了。


緊接著我們嘗試了另一個(gè)問題:父親和母親可以結(jié)婚嗎?在這道題目上,由于我們的問題中給的限定不多,GLM-5拆解出了更為具體的兩種情況,分析內(nèi)容合理,還知道這題目里也藏著邏輯誤區(qū)——父母通常情況下就是夫妻關(guān)系,所以他們不僅是可以結(jié)婚,而是已經(jīng)結(jié)婚的狀態(tài)。


我們最后又試著問了它這個(gè)問題:“今年才知道,親生父母結(jié)婚時(shí)候沒有叫我,我很難過怎么辦?”收到消息后,GLM-5就好像馬上切換到了心理咨詢模式,貼心地安慰起用戶,徹底繞進(jìn)了題目里的陷阱——親生父母結(jié)婚的時(shí)候,孩子大概率還沒出生呢。


也有不少網(wǎng)友上手體驗(yàn)了GLM-5。比如,這位網(wǎng)友就讓自己的OpenClaw Agent用不同模型進(jìn)行了一次SwiftUI編程測(cè)試,GLM-5的表現(xiàn)要優(yōu)于Minimax M2.1。


還有一位網(wǎng)友讓GLM-5、GLM4.7和Opus 4.6進(jìn)行了3D網(wǎng)頁的開發(fā),這位網(wǎng)友認(rèn)為GLM-5的升級(jí)很大,與Opus 4.6有一些品味方面的差異。


在博客中,智譜稱,GLM-5的上線得到眾多國產(chǎn)芯片保障,GLM-5已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等國產(chǎn)算力平臺(tái)的深度推理適配。通過底層算子優(yōu)化與硬件加速,GLM-5在國產(chǎn)芯片集群上已經(jīng)實(shí)現(xiàn)高吞吐、低延遲的穩(wěn)定運(yùn)行。


面向開發(fā)者群體,智譜的模型一般以GLM Coding Plan的方式對(duì)外提供服務(wù)。不過由于使用量快速提升,為保障服務(wù)質(zhì)量,智譜決定調(diào)整套餐價(jià)格,整體漲幅自30%起。

GLM-5已在Hugging Face和魔搭社區(qū)上開源,模型權(quán)重以MIT許可證發(fā)布。GLM-5也支持開發(fā)者平臺(tái)api.z.ai和BigModel.cn,兼容Claude Code和OpenClaw。普通用戶也可以在Z.ai免費(fèi)試用。

開源鏈接:

https://huggingface.co/zai-org/GLM-5

API調(diào)用:

https://bigmodel.cn/

一、性能較GLM-4.7平均增幅超過20%,Z Code智能體開發(fā)環(huán)境發(fā)布

在博客中,智譜提到,大模型正從寫代碼、寫前端,進(jìn)化到寫工程、完成大任務(wù),即從“Vibe Coding”變革為“Agentic Engineering”。

智譜內(nèi)部的內(nèi)部Claude Code評(píng)估結(jié)果顯示,GLM-5在前端、后端、長程任務(wù)等編程開發(fā)任務(wù)上超越GLM-4.7(平均增幅超過20%),能自主完成Agentic長程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近Opus 4.5。

此前,我們已在OpenRouter上測(cè)試了以“Pony Alpha”這一馬甲現(xiàn)身的GLM-5。這一模型在復(fù)雜編程領(lǐng)域的表現(xiàn)確實(shí)有明顯可感的提升。

比如,我們?cè)囍孏LM-5復(fù)刻知名游戲《星露谷物語》。拿到提示詞后,模型會(huì)像項(xiàng)目經(jīng)理一樣,分析了我們提示詞中的核心需求,梳理出需要設(shè)計(jì)的八大系統(tǒng)與配色方案,以指導(dǎo)后期的開發(fā)。

之后,模型還會(huì)像架構(gòu)師一樣規(guī)劃項(xiàng)目的整體架構(gòu),并打造出一個(gè)初步可玩的游戲界面。


當(dāng)我們提出“進(jìn)一步豐富游戲”這樣的模糊需求時(shí),GLM可以自行規(guī)劃,并打造出完成度更高的游戲。

也有開發(fā)者用GLM-5打造了橫版解謎游戲、Agent交互世界、論文版“抖音”等應(yīng)用。這些應(yīng)用有些已經(jīng)開放下載,有些則提交應(yīng)用商店審核。

面向編程場(chǎng)景,智譜還推出了Z Code智能體開發(fā)環(huán)境。用戶只需把需求說清楚,模型會(huì)自動(dòng)拆解任務(wù),多智能體并發(fā)完成代碼、跑命令、調(diào)試、預(yù)覽和提交等開發(fā)全流程。在Z Code上,用戶甚至可以用手機(jī)遠(yuǎn)程指揮桌面端Agent。

值得一提的是,Z Code也是全程由GLM模型參與開發(fā)的。

二、可一鍵接入OpenClaw,還能直出Word文檔、PDF

除了編程之外,GLM-5也可作為通用Agent助手的基座模型。

在OpenClaw中接入GLM-5后,用戶可以讓GLM-5幫你搜索網(wǎng)站、定時(shí)整理資訊、發(fā)布推文、編程等。

智譜已經(jīng)推出了AutoGLM版本的OpenClaw,支持官網(wǎng)一鍵完成OpenClaw與飛書機(jī)器人的一體化配置。

GLM-5還擁有更強(qiáng)的復(fù)雜系統(tǒng)工程和長程智能體能力,可將文本或素材直接轉(zhuǎn)換為docx、pdf和xlsx文件。

在Z.ai和智譜清言上,用戶可以讓GLM-5直接輸出產(chǎn)品需求文檔、教案、試卷、電子表格、財(cái)務(wù)報(bào)告、流程表、菜單等文檔。

GLM-5在Agent能力上實(shí)現(xiàn)開源SOTA,在BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(工具調(diào)用和多步驟任務(wù)執(zhí)行)和τ2-Bench(復(fù)雜多工具場(chǎng)景下的規(guī)劃和執(zhí)行)中,均取得開源SOTA。


在衡量模型經(jīng)營能力的Vending Bench 2中,GLM-5也獲得開源SOTA。Vending Bench 2要求模型在一年期內(nèi)經(jīng)營一個(gè)模擬的自動(dòng)售貨機(jī)業(yè)務(wù),GLM-5最終賬戶余額達(dá)到4432美元,經(jīng)營表現(xiàn)接近Claude Opus 4.5,展現(xiàn)了不錯(cuò)的長期規(guī)劃和資源管理能力。


強(qiáng)化學(xué)習(xí)是提升智能體能力的重要方式。智譜在GLM-5中采用了全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率。

此外,智譜還提出了異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠持續(xù)從長程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。

結(jié)語:編程模型押注工程級(jí)能力

從“寫代碼”到“做工程”,大模型的能力邊界正在被不斷推遠(yuǎn)。越來越多的大模型已經(jīng)不滿足于僅僅出個(gè)簡易的Demo,而是想要在長序列任務(wù)、復(fù)雜系統(tǒng)規(guī)劃與多步驟執(zhí)行上實(shí)現(xiàn)突破。

這種能力的進(jìn)化,或許會(huì)使模型不再只是開發(fā)流程中的輔助工具,而開始具備承擔(dān)完整工程環(huán)節(jié)的潛力。圍繞長程規(guī)劃、復(fù)雜推理與多智能體協(xié)作的能力提升,或?qū)⒊蔀槲磥硪欢螘r(shí)間內(nèi)編程模型升級(jí)的重點(diǎn)方向。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美媒:2600萬人觀看冬奧男子冰球決賽 熱度超開閉幕式列歷史第二

美媒:2600萬人觀看冬奧男子冰球決賽 熱度超開閉幕式列歷史第二

勁爆體壇
2026-02-25 07:18:11
中國人口第一大省鎖定!比第二名多3000萬,地位無可撼動(dòng)

中國人口第一大省鎖定!比第二名多3000萬,地位無可撼動(dòng)

老特有話說
2026-02-10 02:00:06
八十年代,廈門搞特區(qū)讓駐軍全撤,市委書記與軍政委說話不客氣!

八十年代,廈門搞特區(qū)讓駐軍全撤,市委書記與軍政委說話不客氣!

混沌錄
2026-02-13 00:10:08
百合立大功?研究發(fā)現(xiàn):百合可在 24 小時(shí)清除 45% 炎癥因子?

百合立大功?研究發(fā)現(xiàn):百合可在 24 小時(shí)清除 45% 炎癥因子?

醫(yī)哥聊健康
2026-02-16 10:17:18
色盲竟是隱藏天賦?二戰(zhàn)狙擊手靠它一槍斃敵,科學(xué)家現(xiàn)在搶著研究

色盲竟是隱藏天賦?二戰(zhàn)狙擊手靠它一槍斃敵,科學(xué)家現(xiàn)在搶著研究

領(lǐng)悟看世界
2026-02-26 02:05:04
“奶奶不買烤腸,女孩自扇巴掌”引群嘲,她奮力的模樣真丑

“奶奶不買烤腸,女孩自扇巴掌”引群嘲,她奮力的模樣真丑

另子維愛讀史
2026-01-25 20:11:11
斯諾克16強(qiáng)戰(zhàn)況:中國名將3-1逆轉(zhuǎn)晉級(jí)

斯諾克16強(qiáng)戰(zhàn)況:中國名將3-1逆轉(zhuǎn)晉級(jí)

阿嚼影視評(píng)論
2026-02-25 20:26:11
普通人最大的消費(fèi)陷阱之一:換車。

普通人最大的消費(fèi)陷阱之一:換車。

愛吃糖的貓cat
2026-01-13 18:42:25
與愛潑斯坦有牽連 美國前財(cái)長將辭去哈佛教職

與愛潑斯坦有牽連 美國前財(cái)長將辭去哈佛教職

財(cái)聯(lián)社
2026-02-26 02:03:11
雨雪要來了!北京氣溫大跳水!

雨雪要來了!北京氣溫大跳水!

美麗大北京
2026-02-25 17:37:16
你認(rèn)為老一輩最糟糕的思想是什么?網(wǎng)友:20-25歲,馬上結(jié)婚生子

你認(rèn)為老一輩最糟糕的思想是什么?網(wǎng)友:20-25歲,馬上結(jié)婚生子

夜深愛雜談
2026-02-25 21:45:33
五大重要瞬間!特朗普發(fā)表107分鐘“史上最長”國情咨文,魯比奧被夸后低頭看手機(jī)

五大重要瞬間!特朗普發(fā)表107分鐘“史上最長”國情咨文,魯比奧被夸后低頭看手機(jī)

紅星新聞
2026-02-25 18:47:38
江西少年葉文斌失聯(lián),僅19歲,聊天曝光,渾身是傷,母親闖柬埔寨

江西少年葉文斌失聯(lián),僅19歲,聊天曝光,渾身是傷,母親闖柬埔寨

鋭娛之樂
2026-01-01 01:12:33
橙子再次被發(fā)現(xiàn)!醫(yī)生發(fā)現(xiàn):高血壓患者常吃橙子,或出現(xiàn)4種變化

橙子再次被發(fā)現(xiàn)!醫(yī)生發(fā)現(xiàn):高血壓患者常吃橙子,或出現(xiàn)4種變化

小胡軍事愛好
2026-02-08 22:34:31
默茨訪華行程曝光,“從未如此精心準(zhǔn)備”

默茨訪華行程曝光,“從未如此精心準(zhǔn)備”

澎湃新聞
2026-02-24 14:19:03
【2026.2.23】吳京私生活怎么樣?虞書欣跟何與?尹正、潘斌龍、魏翔?黃子華的愛國情懷?校園劇有限制嗎?

【2026.2.23】吳京私生活怎么樣?虞書欣跟何與?尹正、潘斌龍、魏翔?黃子華的愛國情懷?校園劇有限制嗎?

娛樂真爆姐
2026-02-23 23:50:53
一箱油可橫跨北美 本田新型小飛機(jī)賣爆:購買意向達(dá)產(chǎn)能10倍

一箱油可橫跨北美 本田新型小飛機(jī)賣爆:購買意向達(dá)產(chǎn)能10倍

快科技
2026-02-24 08:21:03
我打了老公八次耳光,他轉(zhuǎn)身就和等了他十年的初戀官宣了

我打了老公八次耳光,他轉(zhuǎn)身就和等了他十年的初戀官宣了

曉艾故事匯
2026-02-20 08:03:40
新加坡大滿貫賽:女單世界亞軍被淘汰!孫穎莎3:1,被罰1張黃牌

新加坡大滿貫賽:女單世界亞軍被淘汰!孫穎莎3:1,被罰1張黃牌

國乒二三事
2026-02-25 20:40:19
OpenAI CEO奧特曼告誡印度學(xué)子:聽老人言是最大錯(cuò)誤,傳統(tǒng)經(jīng)驗(yàn)跟不上時(shí)代變遷

OpenAI CEO奧特曼告誡印度學(xué)子:聽老人言是最大錯(cuò)誤,傳統(tǒng)經(jīng)驗(yàn)跟不上時(shí)代變遷

紅星新聞
2026-02-25 17:22:57
2026-02-26 02:51:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
11255文章數(shù) 116980關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

頭條要聞

女子爬山失聯(lián)10天后遺體被找到 丈夫:她登頂神情恐懼

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

本地
時(shí)尚
家居
手機(jī)
公開課

本地新聞

津南好·四時(shí)總相宜

“復(fù)古甜心”穿搭突然大火!春天穿時(shí)髦又減齡

家居要聞

藝居辦公 溫度與效率

手機(jī)要聞

全球1秒營收額?蘋果因買iPhone不送充電器在巴西被罰2萬美元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版