国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智譜AI,徹底爆了!開源模型GLM-4.5,能力全面SOTA

0
分享至

昨日,智譜發(fā)布了新一代旗艦模型GLM-4.5,引發(fā)了全球AI圈的關(guān)注。作為中國大模型領(lǐng)域的“國家隊”代表,他們之前還被OpenAI視為主要競爭對手。

本次發(fā)布的GLM-4.5模型,據(jù)說在推理、代碼、智能體綜合能力方面,達到開源模型SOTA水平;在真實場景Agentic Coding對比評測中,實測結(jié)果國內(nèi)最佳。并且GLM-4.5在Hugging Face與ModelScope平臺同步開源,模型權(quán)重遵循MIT License。

01

綜合性能SOTA,殺入全球大模型第一梯隊


GLM-4.5融合更多復雜推理、代碼和智能體等多種通用能力并取得技術(shù)突破,首次在單個模型中實現(xiàn)將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。

根據(jù)最具有代表性的12個評測,即MMLU Pro、AIME24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCL v3和BrowseComp。綜合平均分,GLM-4.5取得了全球模型第三、國產(chǎn)模型第一,開源模型第一。

GLM-4.5參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3,但同樣在多項標準基準測試中表現(xiàn)得更加出色,這得益于GLM模型的更高參數(shù)效率。在衡量模型代碼能力的SWE-Bench Verified 榜單上,GLM-4.5系列位于性能/參數(shù)比帕累托前沿,這表明在相同規(guī)模下,GLM-4.5系列實現(xiàn)了最佳性能。

在性能優(yōu)化之外,GLM-4.5系列也在成本和效率上實現(xiàn)突破,由此帶來遠低于主流模型定價:API調(diào)用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。

同時,高速版本實測生成速度超過100 tokens/秒,支持低延遲、高并發(fā)的實際部署需求,兼顧成本效益與交互體驗。

據(jù)官方介紹,GLM-4.5系列能夠勝任全棧開發(fā)任務,編寫較為復雜的應用、游戲、交互網(wǎng)頁。

在實際應用當中,GLM-4.5模型能力和體驗究竟如何呢?下面就跟隨K哥一起上手實測。

02

用GLM-4.5手搓一個智能體后,

我卸載了所有AI編程工具

正好這兩天在參加WAIC2025(世界人工智能大會),我想做個逛展智能體,來幫助我從100場論壇、800個展臺當中挑選出我最感興趣的,并且制定逛展計劃,這個任務就交給GLM-4.5了。我們使用模型的原生能力,來開發(fā)這個功能和交互都相對復雜的Agent。

先打開網(wǎng)站:Z.ai

完整注冊后,在左上角選擇模型GLM-4.5。

在輸入框下方看到:AI PPT、全棧開發(fā)、寫代碼、幫我寫、搜信息等,選擇「全棧開發(fā)」。

在讓AI幫你開發(fā)之前,需要整理好需求,我們要開發(fā)的智能體要能夠基于WAIC2025的信息,按照用戶的要求進行檢索、制定逛展計劃,界面交互簡潔友好。

還要解決數(shù)據(jù)來源的問題,我把“WAIC2025媒體指南”電子版上傳到Z.ai。

然后把梳理好的需求,整理成提示詞,如下:

開發(fā)一個“WAIC2025逛展智能體”,功能點如下:

1、根據(jù)用戶的要求檢索展會信息...

2、基于用戶輸入,調(diào)用大模型GLM-4.5能力,理解用戶需求,根據(jù)“WAIC2025的信息”制定規(guī)劃逛展計劃...

3、提醒功能:根據(jù)制定的計劃,在論壇或活動開始前1小時彈窗提醒...

4、界面設計...

將提示詞輸入后,開發(fā)工作就開始了。界面左側(cè)是編碼過程,右側(cè)是程序預覽界面。

整個編碼任務被拆分成4個部分:分析圖片數(shù)據(jù)和構(gòu)建會展信息庫、設計界面布局組件、實現(xiàn)會展信息檢索、實現(xiàn)逛展計劃、優(yōu)化界面與交互。

首先執(zhí)行的是:分析圖片數(shù)據(jù)和構(gòu)建會展信息庫,模型能夠根據(jù)圖片內(nèi)容構(gòu)建會展信息數(shù)據(jù)庫。

接下來,實現(xiàn)信息檢索、制定計劃的功能,這部分需求描述比較明確,所以實現(xiàn)起來比較快。

功能實現(xiàn)完畢,最后一步就是對界面布局交互的進一步優(yōu)化,現(xiàn)在已經(jīng)可以在右邊看到界面效果了。

最后是項目總結(jié),到這一步項目就算是執(zhí)行結(jié)束了,整個過程都是基于GLM-4.5模型的原生能力生成的,真正實現(xiàn)了張張嘴就能編程。

下面就來看看逛展智能體的運行效果吧,點擊左上方的小眼睛圖標,就可以打開程序鏈接。

界面是我喜歡的賽博朋克風格,檢索功能體驗也十分流暢。

再體驗下制定計劃功能,輸入關(guān)鍵字、選擇日期,就可以生成一份專屬逛展計劃。

Z.ai還支持代碼工程打包下載、代碼發(fā)布,發(fā)布后就可以在線使用。

貼上這個智能體的鏈接,歡迎大家體驗:

https://f0vbx6ngdgk1-deploy.space.z.ai

我之前嘗試過Cursor、Codex等AI編程工具,體驗完GLM-4.5的原生編程能力,我不會再考慮其它工具了,它能夠完成我的大部分智能體開發(fā)需求,而且不需要你懂編程,只要描述清楚需求,剩下的交給它就行了。

03

GLM-4.5為什么這么強?源自技術(shù)創(chuàng)新

你一定好奇,為什么GLM-4.5能力這么強,下面我們看下模型的架構(gòu)與技術(shù)實現(xiàn)。

GLM-4.5采用混合專家(MoE)架構(gòu),包括GLM-4.5:總參數(shù)量3550億,激活參數(shù)為320億;GLM-4.5-Air:總參數(shù)量1060億,激活參數(shù)為120億。

GLM-4.5和GLM-4.5-Air均支持混合推理模式,提供兩種模式:用于復雜推理和工具使用的思考模式,以及用于即時響應的非思考模式。模型都是在15萬億token的通用數(shù)據(jù)上進行了預訓練,然后在代碼、推理、智能體等領(lǐng)域的8萬億token數(shù)據(jù)上進行了針對性訓練,最后通過強化學習進一步增強了模型的推理、代碼與智能體能力。

GLM-4.5真正實現(xiàn)了高速、低成本。不僅API調(diào)用價格便宜,還支持低延遲、高并發(fā)的實際部署需求,兼顧成本效益與交互體驗。

無論你是資深程序員還是編程小白,都能通過GLM-4.5快速構(gòu)建應用,讓技術(shù)服務于創(chuàng)意,讓創(chuàng)意推動技術(shù)進步;“人人都是開發(fā)者”正在成為現(xiàn)實。

最后,給大家送個福利,智譜正推出“50塊就能包月爽用GLM-4.5,調(diào)用量無上限”的活動,名額有限,不妨試試。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
今晚七點開賽!2026全英羽毛球公開賽決賽賽程公布

今晚七點開賽!2026全英羽毛球公開賽決賽賽程公布

極目新聞
2026-03-08 15:53:46
湖北單親媽媽嫁65歲美國老頭,帶兒子移民美國,婚后14年老頭去世

湖北單親媽媽嫁65歲美國老頭,帶兒子移民美國,婚后14年老頭去世

哄動一時啊
2026-02-09 16:56:31
全款一口價15.99萬起 2026款凱迪拉克XT4正式上市

全款一口價15.99萬起 2026款凱迪拉克XT4正式上市

太平洋汽車
2026-03-06 16:07:18
高速服務區(qū)靠什么盈利?保潔大姐說出真相,顛覆了我的三觀!

高速服務區(qū)靠什么盈利?保潔大姐說出真相,顛覆了我的三觀!

愛下廚的阿釃
2026-03-08 16:21:08
銀價爆了! 12月5日白銀價格再度大漲 報58.11美元/盎司 日內(nèi)漲幅1.75%

銀價爆了! 12月5日白銀價格再度大漲 報58.11美元/盎司 日內(nèi)漲幅1.75%

每日經(jīng)濟新聞
2026-03-07 21:35:32
巴基斯坦也沒有想到,跟著中國混來混去,結(jié)果自己也混了一個霸主

巴基斯坦也沒有想到,跟著中國混來混去,結(jié)果自己也混了一個霸主

老范談史
2025-12-09 20:00:56
武漢“飛行汽車”要來啦!上班可以打“飛的”

武漢“飛行汽車”要來啦!上班可以打“飛的”

湖心點評
2026-03-08 17:08:15
西安事變死了多少人?難怪蔣介石關(guān)押張學良一輩子

西安事變死了多少人?難怪蔣介石關(guān)押張學良一輩子

瑩瑩的歷史說
2026-03-08 11:19:32
新歡就是出軌對象!買超喜當爸,當年那個“小三”成功上位了

新歡就是出軌對象!買超喜當爸,當年那個“小三”成功上位了

八斗小先生
2026-03-08 12:25:18
不可錯過!3月8日下午16:00比賽!中央5套CCTV5、CCTV5+直播表

不可錯過!3月8日下午16:00比賽!中央5套CCTV5、CCTV5+直播表

皮皮觀天下
2026-03-08 15:53:35
局勢變了,俄羅斯開始上場,伊朗致電普京,特朗普開出停戰(zhàn)條件

局勢變了,俄羅斯開始上場,伊朗致電普京,特朗普開出停戰(zhàn)條件

楠楠自語
2026-03-08 16:51:21
出軌、凈身出戶?這次,74歲的梁錦松,終究在伏明霞身上栽了跟頭

出軌、凈身出戶?這次,74歲的梁錦松,終究在伏明霞身上栽了跟頭

秋姐居
2026-02-10 09:19:42
深圳街頭超大屏火了!祝深圳女性掙大錢、發(fā)量堅挺、氣血很足!網(wǎng)友:這就是我愛深圳的原因

深圳街頭超大屏火了!祝深圳女性掙大錢、發(fā)量堅挺、氣血很足!網(wǎng)友:這就是我愛深圳的原因

深圳晚報
2026-03-08 11:48:46
三個人48小時,用了3000元不到,做了部全網(wǎng)5億流量的爆款AI短劇

三個人48小時,用了3000元不到,做了部全網(wǎng)5億流量的爆款AI短劇

九千光年
2026-03-06 18:58:09
讓人淚目!李金羽賽后口誤稱“魯能”,使山東老球迷集體破防

讓人淚目!李金羽賽后口誤稱“魯能”,使山東老球迷集體破防

獅王亂彈
2026-03-08 07:25:19
三星堆文明不是不能解釋,而是不好解釋,它有太多令人詭異的地方

三星堆文明不是不能解釋,而是不好解釋,它有太多令人詭異的地方

抽象派大師
2026-03-08 16:27:36
浙江2:0輕取青島西海岸,鄭智很難復制邵佳一的成功

浙江2:0輕取青島西海岸,鄭智很難復制邵佳一的成功

李廣專業(yè)體育評論
2026-03-08 17:35:28
朝鮮資源匱乏下的機械奇觀

朝鮮資源匱乏下的機械奇觀

直面影像
2026-03-07 16:16:43
大內(nèi)總管被殺,伊朗開始軟化?

大內(nèi)總管被殺,伊朗開始軟化?

西樓飲月
2026-03-07 23:35:57
反轉(zhuǎn)!周某某(女,32歲),被拘留

反轉(zhuǎn)!周某某(女,32歲),被拘留

南方都市報
2026-03-08 15:27:39
2026-03-08 19:15:00
技術(shù)領(lǐng)導力 incentive-icons
技術(shù)領(lǐng)導力
Mr.K,出過書,做過CTO
70文章數(shù) 581關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

美軍精銳空降師4000余人進入待命 被指或要推地面戰(zhàn)

頭條要聞

美軍精銳空降師4000余人進入待命 被指或要推地面戰(zhàn)

體育要聞

大傷后被交易,他說:22歲的我已經(jīng)死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財經(jīng)要聞

油價要失控?

汽車要聞

9分鐘充飽 全新騰勢Z9GT首搭閃充技術(shù)26.98萬起

態(tài)度原創(chuàng)

游戲
時尚
教育
本地
公開課

D加密最大對手再進化!門檻大降 生化9等大作都遭殃

2026春夏一定要擁有的6只包,好看又百搭

教育要聞

全國政協(xié)委員孔維克:建議學制縮短至10年,逐步取消中考。(新黃河)

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版