国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智譜發(fā)布GLM-5技術(shù)細(xì)節(jié):工程級智能,適配國產(chǎn)算力

0
分享至

2月12日,智譜發(fā)布GLM-5,技驚四座。10天后技術(shù)報告出爐,讓人們一窺GLM-5模型的內(nèi)在基因。

有意思的不是又刷了什么榜,而是整個思路變了:不再比參數(shù)大小,開始比系統(tǒng)工程能力。

GLM-5做的三件事都挺實在:1、模型真的能完成復(fù)雜任務(wù)了,不只是寫幾行代碼;2、訓(xùn)練效率上了一個臺階,超大模型不再是純燒錢游戲;3、從底層到推理框架全面適配國產(chǎn)芯片——這個最關(guān)鍵。

如果說之前是“中國在追趕”,現(xiàn)在則已經(jīng)開始搭自己的技術(shù)體系了。

從"給代碼"到"做系統(tǒng)"

報告提了個概念轉(zhuǎn)變:從 Vibe Coding 到 Agentic Engineering。前者是你說一句我給段代碼,后者是你給目標(biāo)、我自己規(guī)劃拆解、寫代碼調(diào)工具、調(diào)試迭代,直到把整個系統(tǒng)搞定。

GLM-5的重點已經(jīng)不是單題得分,而是:

200K上下文(幾百頁文檔的量)
跨文件軟件工程任務(wù)
長周期任務(wù)中持續(xù)規(guī)劃修正
多輪交互保持思考一致性

比如 Vending-Bench 2 要求"模擬經(jīng)營自動售貨機(jī)一年",最后看賬戶余額。GLM-5在開源模型里第一,接近 Claude Opus 4.5。這測的是長期決策能力,不是問答題。

模型開始有"工程級智能"了。

稀疏注意力:不再無腦燒算力

GLM-5有744B參數(shù)(激活40B),訓(xùn)練了28.5萬億token。按傳統(tǒng)架構(gòu),算力消耗會爆炸。

核心創(chuàng)新是DSA(DeepSeek稀疏注意力)。傳統(tǒng)注意力機(jī)制"看所有內(nèi)容",計算復(fù)雜度平方級增長;DSA動態(tài)判斷"哪些token真正重要",只算關(guān)鍵部分。

200K長上下文下,DSA把注意力計算量降低1.5–2倍。

而且——無損。

其他高效注意力方法通常犧牲精度,DSA通過繼續(xù)預(yù)訓(xùn)練平滑過渡,性能不退化。

結(jié)果是:

  • 同樣算力 → 更長上下文
  • 同樣成本 → 更高推理能力
  • 同樣硬件 → 更大模型

對中國來說,效率創(chuàng)新比堆算力重要得多。

強(qiáng)化學(xué)習(xí)架構(gòu)重構(gòu)

GLM-5的RL體系做了徹底改造。

生成與訓(xùn)練解耦。模型生成軌跡,訓(xùn)練在另一套系統(tǒng)異步進(jìn)行。過去要等最慢任務(wù)完成才繼續(xù)訓(xùn)練,現(xiàn)在誰先完成誰先訓(xùn)練,吞吐大幅提升。對長程Agent任務(wù)至關(guān)重要。

異步Agent RL算法解決了真實軟件工程中任務(wù)持續(xù)數(shù)小時的問題。引入:

  • Token-in-Token-out(避免重新分詞誤差)
  • 雙側(cè)重要性采樣
  • DP-aware路由優(yōu)化KV cache

模型能在復(fù)雜環(huán)境中穩(wěn)定學(xué)習(xí),不會因策略偏移崩潰。

說白了,解決的是"如何讓大模型在真實任務(wù)中持續(xù)自我改進(jìn)"。

真正關(guān)鍵的一步:適配國產(chǎn)算力

報告對中國AI最重要的部分在這。

GLM-5原生適配國產(chǎn)GPU生態(tài),已兼容華為昇騰、摩爾線程、海光、寒武紀(jì)、昆侖芯、天數(shù)智芯、燧原。

不是"能跑"那種適配,而是:

  • KV cache調(diào)度優(yōu)化
  • 通信機(jī)制適配
  • 混合精度訓(xùn)練匹配
  • INT4量化感知訓(xùn)練對齊
  • 分布式并行策略重構(gòu)

很多國產(chǎn)芯片生態(tài)的難點不是算力,是軟件棧。

GLM-5的意義在于:不是圍繞單一海外硬件架構(gòu)設(shè)計,而是面向多種國產(chǎn)算力平臺做系統(tǒng)級適配。

這是個質(zhì)變——中國大模型開始圍繞本土硬件生態(tài)做工程優(yōu)化,不再被動遷移。

報告稱,得益于上述軟硬協(xié)同的極致優(yōu)化,GLM-5 在單臺國產(chǎn)算力節(jié)點上的性能表現(xiàn),已足可媲美由兩臺國際主流 GPU 組成的計算集群;不僅如此,在長序列處理場景下,其部署成本更是大幅降低了 50%。

軟硬件閉環(huán)正在形成

把GLM-5的技術(shù)路徑拆開看,是個完整閉環(huán):

模型架構(gòu)創(chuàng)新(DSA)→ 訓(xùn)練效率優(yōu)化(異步RL)→ 內(nèi)存與通信壓縮(ZeRO、激活卸載)→ 低精度對齊(INT4 QAT)→ 國產(chǎn)芯片深度適配

這是一條完整的國產(chǎn)AI工程鏈路。

過去中國AI的優(yōu)勢在應(yīng)用層,現(xiàn)在開始進(jìn)入架構(gòu)創(chuàng)新、算法工程、訓(xùn)練系統(tǒng)、芯片適配、推理框架的全棧優(yōu)化。

這份技術(shù)報告的真正意義,不在某個基準(zhǔn)測試分?jǐn)?shù),在于中國AI第一次以"體系能力"展示競爭力。

從炫技到成熟

GLM-5的報告沒過度強(qiáng)調(diào)"我們比誰強(qiáng)多少",詳細(xì)披露訓(xùn)練流程、算法選擇、工程權(quán)衡、消融實驗。這本身就是成熟的表現(xiàn)。

當(dāng)一個模型開始談GPU利用率、長尾延遲、KV cache復(fù)用、量化kernel對齊、災(zāi)難性遺忘控制——它已經(jīng)不是在秀能力,而是在做工業(yè)級系統(tǒng)。

對中國來說,GLM-5更像是一次宣告:我們不僅能做大模型,也能做自己的算力適配,還能把兩者打通。

這才是真正的跨越。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“江湖大腿”藏歲月,四十三歲仍如荷

“江湖大腿”藏歲月,四十三歲仍如荷

飛娛日記
2026-02-25 08:41:28
來了,皇馬!老弗爺欽點,1億“超巨”來投!三大強(qiáng)援或攜手加盟

來了,皇馬!老弗爺欽點,1億“超巨”來投!三大強(qiáng)援或攜手加盟

頭狼追球
2026-02-25 10:24:47
衛(wèi)報:奧納納希望重奪曼聯(lián)一號門將的位置

衛(wèi)報:奧納納希望重奪曼聯(lián)一號門將的位置

MUREDS
2026-02-25 23:53:27
中國男足“復(fù)工”:對陣三支頂級球隊,邵佳一會借鑒安東戰(zhàn)術(shù)嗎?

中國男足“復(fù)工”:對陣三支頂級球隊,邵佳一會借鑒安東戰(zhàn)術(shù)嗎?

體育大嘴兒
2026-02-24 23:22:32
為什么10年前沒人考公,而現(xiàn)在卻擠破頭?終于有扎心答案了…

為什么10年前沒人考公,而現(xiàn)在卻擠破頭?終于有扎心答案了…

慧翔百科
2026-02-25 11:30:38
女人和男性朋友一起自駕游,回到家卻發(fā)現(xiàn)老公已經(jīng)帶著孩子搬了家

女人和男性朋友一起自駕游,回到家卻發(fā)現(xiàn)老公已經(jīng)帶著孩子搬了家

多久情感
2026-02-24 14:27:57
中國最豐滿的5位女星,美的各有千秋,她們的身材也太犯規(guī)了

中國最豐滿的5位女星,美的各有千秋,她們的身材也太犯規(guī)了

觀察者海風(fēng)
2026-02-07 14:48:53
哈曼:過去一般是拜仁壓制槍手,不過我認(rèn)為兩隊無法會師決賽

哈曼:過去一般是拜仁壓制槍手,不過我認(rèn)為兩隊無法會師決賽

懂球帝
2026-02-25 20:49:06
全球獨此兩棵!1960年在荒廢的別墅中找到,嫁接后年產(chǎn)值81億元

全球獨此兩棵!1960年在荒廢的別墅中找到,嫁接后年產(chǎn)值81億元

不寫散文詩
2025-10-27 18:03:24
上海炒股冠軍肺腑之語:如果接下來迎來牛市,建議死啃中字頭戰(zhàn)法

上海炒股冠軍肺腑之語:如果接下來迎來牛市,建議死啃中字頭戰(zhàn)法

股經(jīng)縱橫談
2026-02-14 17:51:00
大膽買入,其他交給時間!

大膽買入,其他交給時間!

金牛遠(yuǎn)望號
2026-02-25 19:07:17
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
千萬網(wǎng)紅“一栗小莎子”確診癌癥,不良惡習(xí)害了她,兒子不到兩歲

千萬網(wǎng)紅“一栗小莎子”確診癌癥,不良惡習(xí)害了她,兒子不到兩歲

溫讀史
2026-01-24 07:39:28
德國那位軍事專家說得夠直白:美國不是怕中國,是怕打了也白打

德國那位軍事專家說得夠直白:美國不是怕中國,是怕打了也白打

扶蘇聊歷史
2026-01-28 18:04:09
第二個李登輝出現(xiàn)?恐是民進(jìn)黨臥底,要繼承王金平衣缽害殘國民黨

第二個李登輝出現(xiàn)?恐是民進(jìn)黨臥底,要繼承王金平衣缽害殘國民黨

遁走的兩輪
2026-02-19 14:27:38
海南“封關(guān)”,美國和新加坡竟然沒有發(fā)聲?

海南“封關(guān)”,美國和新加坡竟然沒有發(fā)聲?

流蘇晚晴
2025-12-24 18:12:19
今年春節(jié)檔平均票價47.8元,為近6年最低;《鏢人》成春節(jié)檔唯一實現(xiàn)票房連續(xù)逆跌的影片,首日票房僅第4,第四日升至第2,檔期總票房為第3

今年春節(jié)檔平均票價47.8元,為近6年最低;《鏢人》成春節(jié)檔唯一實現(xiàn)票房連續(xù)逆跌的影片,首日票房僅第4,第四日升至第2,檔期總票房為第3

北青網(wǎng)-北京青年報
2026-02-24 17:08:09
三孩政策刺激無果后,中央下狠手了!新政策讓3代人拍手叫好

三孩政策刺激無果后,中央下狠手了!新政策讓3代人拍手叫好

吃青菜長高
2026-02-24 20:11:17
高市早苗新表態(tài),日元應(yīng)聲急跌!

高市早苗新表態(tài),日元應(yīng)聲急跌!

東京在線
2026-02-25 19:22:48
卡里莫夫一直在培養(yǎng)女兒為總統(tǒng)接班人,為何臨終前卻軟禁了她

卡里莫夫一直在培養(yǎng)女兒為總統(tǒng)接班人,為何臨終前卻軟禁了她

優(yōu)趣紀(jì)史記
2026-02-24 18:37:15
2026-02-26 04:56:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
142109文章數(shù) 2652642關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

夫妻晚5秒錯過免費高速付1700元:氣得我不得了

頭條要聞

夫妻晚5秒錯過免費高速付1700元:氣得我不得了

體育要聞

勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

本地
旅游
數(shù)碼
游戲
手機(jī)

本地新聞

津南好·四時總相宜

旅游要聞

重慶酉陽櫻花漫古城,吊腳飛檐藏春歸,這才是中式浪漫天花板!

數(shù)碼要聞

三星發(fā)布 Galaxy Buds 4 與 Buds 4 Pro 耳機(jī)產(chǎn)品

《如龍極3》中文配音訪談:中文配音與本地化并非易事

手機(jī)要聞

超大核飆到4.74GHz!三星Galaxy S26系列首發(fā)第五代驍龍8至尊版for Galaxy

無障礙瀏覽 進(jìn)入關(guān)懷版