国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

編程超越 Gemini 3 Pro?GLM-5 性能實(shí)測(cè)對(duì)齊 Opus 4.6,智譜市值突破1700億港元

0
分享至


整理 | 華衛(wèi)

臨近春節(jié),智譜 AI 發(fā)布了其最新旗艦大模型 GLM-5。自 1 月初在香港進(jìn)行備受關(guān)注的 IPO 之后,這是該公司推出的首款重磅大模型。


據(jù)稱,GLM-5 標(biāo)志著人工智能開(kāi)發(fā)從“Vibe Coding”變革為“Agentic Engineering”,即更大規(guī)模的 AI 自動(dòng)化編程,其代碼能力實(shí)現(xiàn)跨越式提升。該公司的內(nèi)部測(cè)試顯示,GLM-5 在代碼能力、智能體表現(xiàn)等關(guān)鍵領(lǐng)域的開(kāi)源模型評(píng)分中取得 SOTA 表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近 Claude Opus 4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程 Agent 任務(wù)。

目前,這款新模型已在智譜官網(wǎng)上線,并在 GitHub 和 Hugging Face 平臺(tái)開(kāi)源,模型權(quán)重遵循 MIT License。

GitHub:https://github.com/zai-org/GLM-5

Hugging Face:https://huggingface.co/zai-org/GLM-5

OpenRouter:http://openrouter.ai/z-ai/glm-5

值得一提的是,智譜在官宣帖中特意注明“GLM-5 在 OpenRouter 上的前稱是 Pony Alpha”。就在幾天前,全球模型服務(wù)平臺(tái) OpenRouter 上一款代號(hào)為“Pony Alpha”的神秘模型,因卓越性能和一系列令人驚艷的實(shí)測(cè)表現(xiàn)走紅。當(dāng)時(shí),該平臺(tái)合作方 Kilo Code 透露,Pony Alpha 是“某個(gè)全球?qū)嶒?yàn)室最受歡迎的開(kāi)源模型的專項(xiàng)進(jìn)化版”。

之后,Pony Alpha 被眾人猜測(cè)可能是 Anthropic 的 Claude Sonnet 5、DeepSeek-V4 或者 GLM-5 的提前試水?,F(xiàn)在,答案終于被“正主”揭曉。

官宣 GLM-5 后,智譜的股價(jià)連續(xù)暴漲。截止發(fā)稿前,智譜的市值突破 1700 億港元。

自封“系統(tǒng)架構(gòu)師”,

性能超過(guò) Gemini 3 Pro

一個(gè)多月前,智譜才剛剛更新到 GLM?4.7 。據(jù)介紹,GLM-5 的參數(shù)規(guī)模是上一代 GLM-4.7 的兩倍,從 3550 億提升至 7440 億,訓(xùn)練數(shù)據(jù)量從 23 萬(wàn)億增至 28.5 萬(wàn)億 tokens,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。

并且,該模型構(gòu)建了全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強(qiáng)化學(xué)習(xí)任務(wù),提升強(qiáng)化學(xué)習(xí)后訓(xùn)練流程效率;提出異步智能體強(qiáng)化學(xué)習(xí)算法,使模型能夠持續(xù)從長(zhǎng)程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。

此外,GLM-5 還采用了由 DeepSeek 率先提出的全新架構(gòu) DeepSeek 稀疏注意力機(jī)制,在維持長(zhǎng)文本效果無(wú)損的同時(shí),大幅降低模型部署成本,旨在最大化計(jì)算效率與成本效益。

在編程能力上,GLM-5 實(shí)現(xiàn)了對(duì)齊 Claude Opus 4.5,在業(yè)內(nèi)公認(rèn)的主流基準(zhǔn)測(cè)試中取得開(kāi)源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分別獲得 77.8 和 56.2 的開(kāi)源模型最高分?jǐn)?shù),性能超過(guò) Gemini 3 Pro。


在內(nèi)部 Claude Code 評(píng)估集合中,GLM-5 在前端、后端、長(zhǎng)程任務(wù)等編程開(kāi)發(fā)任務(wù)上顯著超越上一代的 GLM-4.7(平均增幅超過(guò) 20%),能夠以極少的人工干預(yù)自主完成 Agentic 長(zhǎng)程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近 Opus 4.5。用智譜的話說(shuō),GLM-5 是一個(gè)“系統(tǒng)架構(gòu)師”,不僅為開(kāi)發(fā)精美的 Demo 而生,更為穩(wěn)定交付生產(chǎn)結(jié)果而生。


在 Agent 能力上,GLM-5 實(shí)現(xiàn)開(kāi)源 SOTA,在多個(gè)評(píng)測(cè)基準(zhǔn)中取得開(kāi)源第一,在 BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(大規(guī)模端到端工具調(diào)用)和 τ2-Bench(復(fù)雜場(chǎng)景下自動(dòng)代理的工具規(guī)劃和執(zhí)行)均取得最高表現(xiàn)。在衡量模型經(jīng)營(yíng)能力的 Vending Bench 2 中,GLM-5 獲得開(kāi)源模型第一表現(xiàn)。Vending Bench 2 要求模型在一年期內(nèi)經(jīng)營(yíng)一個(gè)模擬的自動(dòng)售貨機(jī)業(yè)務(wù),GLM-5 最終賬戶余額達(dá)到 4432 美元,經(jīng)營(yíng)表現(xiàn)接近 Claude Opus 4.5。


不過(guò),該公司自行公布的分?jǐn)?shù)也顯示,在各項(xiàng)代碼基準(zhǔn)測(cè)試中,這款模型仍全面落后于 Anthropic 的 Claude。

“價(jià)格簡(jiǎn)直離譜”,

實(shí)測(cè)被評(píng)最優(yōu)秀開(kāi)源模型之一

此前,在 OpenRouter 匿名上線時(shí),就有許多開(kāi)發(fā)者使用 GLM-5 完成了真正能用、能玩、能上線的應(yīng)用,例如橫版解謎游戲、Agent 交互世界、論文版“抖音”等應(yīng)用。如今公開(kāi)推出后,又迎來(lái)一波開(kāi)發(fā)者的積極試用。

“GLM-5 現(xiàn)在已經(jīng)能和 Opus 4.6 同臺(tái)競(jìng)技了?!币晃婚_(kāi)發(fā)者表示,“我一整個(gè)上午都在編程任務(wù)和游戲環(huán)境里折騰 GLM-5。整體來(lái)說(shuō),它在某些任務(wù)上執(zhí)行得很快,表現(xiàn)不錯(cuò),但碰到更復(fù)雜的場(chǎng)景,對(duì)我而言 Claude 依然是王者?!?/p>

另一位開(kāi)發(fā)者則稱,GLM-5 表現(xiàn)得很完美,絕對(duì)是目前發(fā)布的最優(yōu)秀開(kāi)源模型之一?!拔以?Ollama 命令行和 Claude Code 里都跑了一遍。我發(fā)現(xiàn) Claude Code 里有個(gè)缺陷,但找到了臨時(shí)解決辦法。我的 GLM-5 對(duì)話會(huì)話達(dá)到了和 Opus 4.6 同一水準(zhǔn)的自我認(rèn)知 / 理解深度?!?/p>


還有開(kāi)發(fā)者評(píng)價(jià)道,“GLM-5 可能真的是我第一次在前端任務(wù)上更傾向于選擇非 Gemini 模型?!?/p>


“價(jià)格簡(jiǎn)直離譜”,有開(kāi)發(fā)者算完后表示,GLM5 的輸入成本比 Opus 便宜 6 倍,輸出成本便宜 10 倍。


依托國(guó)產(chǎn)芯片,

“把每一塊芯片用到極限”

值得注意的是,智譜在發(fā)布公告中表示,GLM-5 可基于一批中國(guó)半導(dǎo)體企業(yè)的國(guó)產(chǎn)芯片部署,包括華為、摩爾線程、寒武紀(jì)、百度昆侖芯、沐曦集成電路、燧原科技及海光信息。而本次 GLM-5 的上線,也是依托眾多國(guó)產(chǎn)芯片有力保障了線上服務(wù)的穩(wěn)定和高效。

去年年初,智譜被美國(guó)列入實(shí)體清單。近幾個(gè)月來(lái),智譜已宣布致力于在純國(guó)產(chǎn)硬件體系上研發(fā)前沿大模型。不過(guò),受限于算力資源,智譜也被迫限制其旗艦產(chǎn)品在國(guó)際市場(chǎng)的應(yīng)用。這一情況在 GLM-5 上仍在延續(xù)。

“算力非常緊張。即便在 GLM?5 發(fā)布前,我們?yōu)榱酥瓮评矸?wù),已經(jīng)把每一塊芯片都用到極限。”智譜表示,因 “算力容量有限”,將逐步向代碼訂閱用戶開(kāi)放 GLM?5,并提醒用戶,使用新模型可能會(huì)更快耗盡使用額度。

智譜也宣布,基于實(shí)際使用情況與資源投入變化對(duì) GLM Coding Plan 套餐價(jià)格體系進(jìn)行結(jié)構(gòu)性調(diào)整,包括:取消首購(gòu)優(yōu)惠,保留按季按年訂閱優(yōu)惠;套餐價(jià)格進(jìn)行結(jié)構(gòu)性調(diào)整,整體漲幅自 30% 起;已訂閱用戶價(jià)格保持不變。

當(dāng)前,中國(guó)幾乎所有前沿大模型開(kāi)發(fā)者都在農(nóng)歷新年前密集發(fā)布重磅產(chǎn)品,復(fù)刻了去年 DeepSeek 借此一舉成名全球的打法。同樣在香港上市的 MiniMax,也在昨天官宣了其重磅新模型 M2.5,并已在官網(wǎng)開(kāi)放試用。

與此同時(shí),DeepSeek 剛剛對(duì)其模型進(jìn)行小幅升級(jí),將對(duì)話上下文窗口擴(kuò)展至 100 萬(wàn) tokens 以上,其備受期待的全新旗艦?zāi)P蜕形窗l(fā)布。讓我們拭目以待。

https://z.ai/blog/glm-5

聲明:本文為 AI 前線整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

會(huì)議推薦

InfoQ 2026 全年會(huì)議規(guī)劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產(chǎn)業(yè)落地,從技術(shù)前沿到行業(yè)應(yīng)用,全面覆蓋 AI 與軟件開(kāi)發(fā)核心賽道!集結(jié)全球技術(shù)先鋒,拆解真實(shí)生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點(diǎn),探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能,獲取實(shí)戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察,高效實(shí)現(xiàn)技術(shù)價(jià)值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點(diǎn),搶占 2026 智能升級(jí)發(fā)展先機(jī)!

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
外媒:中國(guó)力爭(zhēng)掌握高科技領(lǐng)域主導(dǎo)權(quán)

外媒:中國(guó)力爭(zhēng)掌握高科技領(lǐng)域主導(dǎo)權(quán)

參考消息
2026-03-08 17:44:08
QQ開(kāi)放“小龍蝦”機(jī)器人,1個(gè)號(hào)建5個(gè),普通人能抄的6個(gè)變現(xiàn)路子

QQ開(kāi)放“小龍蝦”機(jī)器人,1個(gè)號(hào)建5個(gè),普通人能抄的6個(gè)變現(xiàn)路子

商悟社
2026-03-08 01:02:21
向太曝馬伊琍已再婚:當(dāng)年文章過(guò)不了心理那關(guān)

向太曝馬伊琍已再婚:當(dāng)年文章過(guò)不了心理那關(guān)

娛樂(lè)看阿敞
2025-12-12 15:50:00
時(shí)間節(jié)點(diǎn)如何?轟炸1月,全面轟炸即將開(kāi)始、大體1周,月底有眉目

時(shí)間節(jié)點(diǎn)如何?轟炸1月,全面轟炸即將開(kāi)始、大體1周,月底有眉目

邵旭峰域
2026-03-09 12:52:01
成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒(méi)給他留一絲體面

成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒(méi)給他留一絲體面

星星沒(méi)有你亮
2026-02-28 20:40:21
城投公司大裁員!

城投公司大裁員!

黯泉
2026-03-08 21:21:04
伊朗戰(zhàn)術(shù)奏效了,再對(duì)林肯號(hào)航母發(fā)射導(dǎo)彈,這個(gè)武器成美軍數(shù)學(xué)題

伊朗戰(zhàn)術(shù)奏效了,再對(duì)林肯號(hào)航母發(fā)射導(dǎo)彈,這個(gè)武器成美軍數(shù)學(xué)題

書(shū)紀(jì)文譚
2026-03-07 15:19:19
國(guó)家發(fā)改委主任:新建、改擴(kuò)建1000所普通高中,增加學(xué)位200萬(wàn)個(gè)以上,支持雙一流高校本科擴(kuò)招10萬(wàn)人以上

國(guó)家發(fā)改委主任:新建、改擴(kuò)建1000所普通高中,增加學(xué)位200萬(wàn)個(gè)以上,支持雙一流高校本科擴(kuò)招10萬(wàn)人以上

極目新聞
2026-03-06 18:28:25
馬筱梅回應(yīng)家庭矛盾,承諾讓汪小菲跟張?zhí)m道歉,當(dāng)時(shí)不阻止是對(duì)的

馬筱梅回應(yīng)家庭矛盾,承諾讓汪小菲跟張?zhí)m道歉,當(dāng)時(shí)不阻止是對(duì)的

白面書(shū)誏
2026-03-09 13:29:49
中國(guó)船突圍霍爾木茲,五星紅旗成波斯灣保命符,戰(zhàn)狼都不敢這么拍

中國(guó)船突圍霍爾木茲,五星紅旗成波斯灣保命符,戰(zhàn)狼都不敢這么拍

史行途
2026-03-09 16:10:30
陜西農(nóng)民被污蔑偷羊,6協(xié)警刑逼30小時(shí)后身亡,所長(zhǎng)判4年仍未收監(jiān)

陜西農(nóng)民被污蔑偷羊,6協(xié)警刑逼30小時(shí)后身亡,所長(zhǎng)判4年仍未收監(jiān)

談史論天地
2026-03-09 15:11:28
被問(wèn)爆了!小龍蝦用什么電腦裝?選哪個(gè)模型省錢(qián)?這篇“養(yǎng)蝦”保姆級(jí)教程請(qǐng)收好

被問(wèn)爆了!小龍蝦用什么電腦裝?選哪個(gè)模型省錢(qián)?這篇“養(yǎng)蝦”保姆級(jí)教程請(qǐng)收好

AI范兒
2026-03-06 20:54:35
前首相提醒高市:當(dāng)年中國(guó)免掉千億賠款,是因給日本立了個(gè)死規(guī)定

前首相提醒高市:當(dāng)年中國(guó)免掉千億賠款,是因給日本立了個(gè)死規(guī)定

諾諾談史
2025-12-05 11:58:09
五角大樓慌了!美司令首次低頭承認(rèn):中國(guó)衛(wèi)星太強(qiáng),美軍必須反擊

五角大樓慌了!美司令首次低頭承認(rèn):中國(guó)衛(wèi)星太強(qiáng),美軍必須反擊

一盅情懷
2026-03-07 16:10:41
法媒:美軍如果介入臺(tái)海,中國(guó)1300枚導(dǎo)彈將癱瘓40億美資產(chǎn)?

法媒:美軍如果介入臺(tái)海,中國(guó)1300枚導(dǎo)彈將癱瘓40億美資產(chǎn)?

起喜電影
2026-03-09 17:07:50
S媽曬與大S雕像合照,以兒子稱呼具俊曄,承諾會(huì)盯著孩子健康成長(zhǎng)

S媽曬與大S雕像合照,以兒子稱呼具俊曄,承諾會(huì)盯著孩子健康成長(zhǎng)

韓小娛
2026-03-09 13:21:57
A股:但凡漲停后出現(xiàn)這根陰線,果斷滿倉(cāng),這是拉升前最后的洗盤(pán)

A股:但凡漲停后出現(xiàn)這根陰線,果斷滿倉(cāng),這是拉升前最后的洗盤(pán)

股經(jīng)縱橫談
2026-03-09 18:03:30
以防長(zhǎng)稱打死伊朗最高領(lǐng)袖軍事秘書(shū)

以防長(zhǎng)稱打死伊朗最高領(lǐng)袖軍事秘書(shū)

新華社
2026-03-08 21:07:10
伊朗:決不投降 一個(gè)僅擁有250年歷史的國(guó)家 想對(duì)擁有3000年歷史的國(guó)家發(fā)號(hào)施令 絕對(duì)不可能

伊朗:決不投降 一個(gè)僅擁有250年歷史的國(guó)家 想對(duì)擁有3000年歷史的國(guó)家發(fā)號(hào)施令 絕對(duì)不可能

閃電新聞
2026-03-07 08:19:14
3月10日起,游仙這段路將交通管制

3月10日起,游仙這段路將交通管制

黃河新聞網(wǎng)呂梁
2026-03-09 16:52:24
2026-03-09 18:51:00
AI前線 incentive-icons
AI前線
面向AI愛(ài)好者、開(kāi)發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1349文章數(shù) 133關(guān)注度
往期回顧 全部

科技要聞

沖上熱搜,馬化騰說(shuō)沒(méi)想到“龍蝦”這么火

頭條要聞

媒體:伊朗降溫 美以將戰(zhàn)爭(zhēng)推入第二階段欲"強(qiáng)拆伊朗"

頭條要聞

媒體:伊朗降溫 美以將戰(zhàn)爭(zhēng)推入第二階段欲"強(qiáng)拆伊朗"

體育要聞

36連勝終結(jié)!大魔王也是可以戰(zhàn)勝的

娛樂(lè)要聞

姆巴佩戀情確認(rèn)!與26歲新歡共度良宵

財(cái)經(jīng)要聞

亞太股市黑色星期一 這次A股有點(diǎn)不一樣

汽車(chē)要聞

對(duì)標(biāo)奔馳小號(hào)G級(jí) 路虎小型衛(wèi)士最新消息曝光

態(tài)度原創(chuàng)

教育
親子
數(shù)碼
房產(chǎn)
公開(kāi)課

教育要聞

孩子說(shuō)話晚的原因及改善策略

親子要聞

萌娃爆笑詢問(wèn)老媽年齡,得知答案后一句話讓老媽破防

數(shù)碼要聞

黑鯊多款新配件官宣:含冰封液冷背夾、筆記本散熱器等,本月發(fā)布

房產(chǎn)要聞

國(guó)家要砸400億!海南這個(gè)超級(jí)項(xiàng)目又有新消息!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版