国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型實(shí)現(xiàn)“8小時(shí)工作制” !智譜GLM-5.1大幅提升長(zhǎng)程任務(wù)能力

0
分享至

《科創(chuàng)板日?qǐng)?bào)》4月10日訊(記者 李明明)智譜發(fā)布其迄今最智能的模型。

近日,智譜發(fā)布并開源新一代旗艦?zāi)P虶LM-5.1。據(jù)介紹,其是唯一達(dá)到8小時(shí)級(jí)持續(xù)工作的開源模型,在最接近真實(shí)軟件開發(fā)的SWE-bench Pro基準(zhǔn)測(cè)試中,GLM-5.1實(shí)現(xiàn)國(guó)產(chǎn)模型首次超越Opus 4.6。

OpenRouter顯示,伴隨此次發(fā)布,智譜GLM再度提價(jià)10%。

《科創(chuàng)板日?qǐng)?bào)》記者從相關(guān)方獲悉,與過(guò)去一年行業(yè)主旋律“降價(jià)”截然相反,智譜本次提價(jià),編碼場(chǎng)景定價(jià)首次追平海外頭部廠商Anthropic。這也寓示著國(guó)產(chǎn)大模型從價(jià)格戰(zhàn)、低價(jià)換量轉(zhuǎn)向性能溢價(jià)。

實(shí)測(cè)GLM-5.1

關(guān)于GLM-5.1的智能水平,智譜團(tuán)隊(duì)告訴《科創(chuàng)板日?qǐng)?bào)》記者,GLM-5.1提高了代碼能力,在完成長(zhǎng)程任務(wù)方面提升尤為顯著。和此前分鐘級(jí)交互的模型不同,它能夠在一次任務(wù)中獨(dú)立、持續(xù)工作超過(guò)8小時(shí),期間自主規(guī)劃、執(zhí)行、自我進(jìn)化,最終交付完整的工程級(jí)成果。

代碼能力是模型智能水平進(jìn)一步提升的關(guān)鍵。據(jù)悉,在業(yè)內(nèi)最具代表性的三個(gè)代碼評(píng)測(cè)基準(zhǔn)的平均結(jié)果中,包括衡量模型專業(yè)軟件開發(fā)工作的SWE-Bench Pro、操作命令行解決問(wèn)題的Terminal-Bench 2.0、從零構(gòu)建完整代碼倉(cāng)庫(kù)的NL2Repo,GLM-5.1取得全球模型第三、國(guó)產(chǎn)模型第一、開源模型第一。

這也代表了大模型演進(jìn)到現(xiàn)在的趨勢(shì)之一,過(guò)去兩年,行業(yè)用Benchmark衡量模型有多智能。上述智譜團(tuán)隊(duì)向《科創(chuàng)板日?qǐng)?bào)》記者判斷,下一階段的衡量標(biāo)準(zhǔn)應(yīng)該是“能工作多久”,即模型在Long-Horizon Task中的表現(xiàn),能獨(dú)立完成多長(zhǎng)時(shí)間的人類任務(wù)。

業(yè)內(nèi)也形成了共識(shí),2025年3月,AI安全研究機(jī)構(gòu)METR提出了一個(gè)改變行業(yè)認(rèn)知的指標(biāo):任務(wù)完成時(shí)間線(Task-Completion Time Horizon)——不再衡量模型"多聰明",而是衡量它能獨(dú)立完成多長(zhǎng)時(shí)間的人類任務(wù)。研究顯示,前沿模型的時(shí)間線每7個(gè)月翻一倍。這條指數(shù)曲線被MIT Technology Review稱為"AI領(lǐng)域最重要的一張圖",Sequoia Capital據(jù)此在2026年初宣告"這就是AGI"。

在長(zhǎng)程任務(wù)中保持穩(wěn)定輸出,模型面對(duì)的不只是更大代碼量,而是一連串復(fù)雜的工程決策點(diǎn):主動(dòng)跑benchmark、定位瓶頸、修改方案、再跑測(cè)試。這對(duì)模型提出更高的要求,需要像人類工程師一樣,形成“實(shí)驗(yàn)→分析→優(yōu)化”的完整閉環(huán),而不是寫完代碼停下來(lái)等人打分。

《科創(chuàng)板日?qǐng)?bào)》記者用開發(fā)者工具實(shí)測(cè)了GLM-5.1,測(cè)試案例如下:有一個(gè)專門考驗(yàn)AI編程能力的測(cè)試,任務(wù)是讓AI做出一個(gè)能快速檢索海量數(shù)據(jù)的系統(tǒng),當(dāng)時(shí)最強(qiáng)的成績(jī)是Claude Opus 4.6創(chuàng)造的。

實(shí)測(cè)顯示,智譜GLM-5.1在持續(xù)進(jìn)行六百多次優(yōu)化、六千多次操作后,性能還在不斷提升,最終速度達(dá)到了之前最好成績(jī)的6倍。



據(jù)了解,GLM-5.1也刷新了國(guó)產(chǎn)開源模型的成績(jī)。

長(zhǎng)期以來(lái),全球大模型賽道始終存在一條難以逾越的鴻溝:開源模型與頂尖閉源模型之間存在肉眼可見(jiàn)的能力代差,而中國(guó)開源模型更是長(zhǎng)期被貼上追趕者的標(biāo)簽,在國(guó)際公認(rèn)的通用能力榜單上,始終與Claude、GPT系列的頂級(jí)閉源產(chǎn)品有明顯差距。

而在最貼近真實(shí)軟件開發(fā)場(chǎng)景的SWE-bench Pro基準(zhǔn)測(cè)試中,GLM-5.1實(shí)現(xiàn)國(guó)產(chǎn)模型對(duì)Claude Opus 4.6的首次超越。

智譜GLM再度提價(jià)10%

性能提升的同時(shí),智譜在價(jià)格層面也與海外廠商看齊,這也是國(guó)產(chǎn)模型價(jià)格首次對(duì)齊海外,模型聚合平臺(tái)OpenRouter顯示,智譜GLM再度提價(jià)10%。調(diào)價(jià)后,GLM-5.1在Coding場(chǎng)景的緩存命中Token價(jià)格已接近Anthropic旗下Claude Sonnet 4.6。

這不是智譜第一次漲價(jià),此前,智譜2月12日發(fā)布GLM Coding Plan 價(jià)格調(diào)整函稱, GLM Coding Plan市場(chǎng)需求持續(xù)強(qiáng)勁增長(zhǎng),用戶規(guī)模與調(diào)用量快速提升。公司決定對(duì)GLM Coding Plan套餐價(jià)格進(jìn)行結(jié)構(gòu)性調(diào)整,整體漲幅自30%起。

《科創(chuàng)板日?qǐng)?bào)》記者此前獨(dú)家獲悉,海外版GLM-5定價(jià)漲幅高于國(guó)內(nèi):Coding plan訂閱價(jià)格提高30%-60%,API調(diào)用價(jià)格提升67%-100%。

此舉為國(guó)產(chǎn)大模型2026年以來(lái)首次大幅提價(jià)。

一年前,行業(yè)還深陷“價(jià)格戰(zhàn)”,普遍降價(jià)九成以上爭(zhēng)奪份額。智譜為何敢于反向操作?

從核心動(dòng)因看,需求端爆發(fā)是直接推手。GLM Coding Plan聚焦開發(fā)者代碼生成、編程輔助場(chǎng)景,市場(chǎng)需求持續(xù)旺盛,用戶規(guī)模、接口調(diào)用量雙雙快速攀升,平臺(tái)長(zhǎng)期處于高負(fù)載運(yùn)行狀態(tài),對(duì)算力調(diào)度、服務(wù)穩(wěn)定性、響應(yīng)效率的要求顯著提高,需求增速超出原有資源規(guī)劃與承載能力。

在智譜2025年業(yè)績(jī)說(shuō)明會(huì)上,智譜CEO張鵬對(duì)《科創(chuàng)板日?qǐng)?bào)》記者介紹,一季度智譜的API調(diào)用定價(jià)提升83%,即便如此,市場(chǎng)依然呈現(xiàn)出供不應(yīng)求的情況,調(diào)用量增長(zhǎng)400%。當(dāng)前,智譜已成為國(guó)內(nèi)付費(fèi)Token消耗量最高的廠商之一。

關(guān)于漲價(jià),張鵬此前在中關(guān)村論壇上回應(yīng)稱,長(zhǎng)期依賴低價(jià)競(jìng)爭(zhēng)不利于行業(yè)發(fā)展,調(diào)價(jià)旨在將價(jià)格拉回正常的商業(yè)價(jià)值區(qū)間?!巴瓿梢粋€(gè)長(zhǎng)程任務(wù)所需要的Token量可能是回答一個(gè)簡(jiǎn)單問(wèn)題時(shí)的十倍甚至百倍,價(jià)格調(diào)整本質(zhì)上是價(jià)值變化的自然結(jié)果?!?/p>

據(jù)張鵬介紹,智譜已經(jīng)實(shí)現(xiàn)了Token在全球范圍內(nèi)的價(jià)值變現(xiàn)。目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球云服務(wù)商,并入駐OpenRouter、Vercel等國(guó)際主流模型聚合平臺(tái)。

智譜MaaS商業(yè)化方面,MaaS API平臺(tái)實(shí)現(xiàn)ARR 約17億元(約2.5億美金),同比提升60倍。

此外,《科創(chuàng)板日?qǐng)?bào)》記者注意到,2026年開年以來(lái),國(guó)內(nèi)AI行業(yè)已從過(guò)去的“價(jià)格戰(zhàn)”轉(zhuǎn)向“價(jià)值定價(jià)”,一些底層算力與模型服務(wù)集體調(diào)價(jià),主要包括:

騰訊云:3月11日對(duì)自研混元HY2.0系列模型大幅調(diào)價(jià), 4月9日再次宣布5月9日起AI算力、容器服務(wù)等產(chǎn)品統(tǒng)一上調(diào)5%。

阿里云:3月18日宣布4月18日起,AI算力相關(guān)產(chǎn)品價(jià)格上調(diào)5%-34%,智算版存儲(chǔ)產(chǎn)品上漲30%。

百度智能云:3月18日發(fā)布AI算力、存儲(chǔ)等產(chǎn)品調(diào)價(jià)公告,AI算力相關(guān)產(chǎn)品服務(wù)上調(diào)5%-30%,并行文件存儲(chǔ)價(jià)格上調(diào)約30%。

(科創(chuàng)板日?qǐng)?bào)記者 李明明)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
布倫特福德盯上蒂亞戈:34歲老將成夏窗香餑餑

布倫特福德盯上蒂亞戈:34歲老將成夏窗香餑餑

綠茵狂熱者
2026-04-10 21:39:20
山西輸球!全隊(duì)拒回更衣室!球員努力球隊(duì)掙扎,向潘江提五個(gè)問(wèn)題

山西輸球!全隊(duì)拒回更衣室!球員努力球隊(duì)掙扎,向潘江提五個(gè)問(wèn)題

理工男評(píng)籃球
2026-04-09 22:29:23
19歲科特迪瓦鋒線神童橫空出世,身價(jià)飛漲到1億歐,3大豪門瘋搶

19歲科特迪瓦鋒線神童橫空出世,身價(jià)飛漲到1億歐,3大豪門瘋搶

零度眼看球
2026-04-10 09:41:01
55歲上海炒股冠軍罕見(jiàn)發(fā)聲:吃透“月線+周線+日線”掙得懷疑人生

55歲上海炒股冠軍罕見(jiàn)發(fā)聲:吃透“月線+周線+日線”掙得懷疑人生

股經(jīng)縱橫談
2026-04-06 11:57:45
2-1險(xiǎn)勝19歲巴西新星,茲維列夫晉級(jí)ATP1000蒙特卡洛大師賽4強(qiáng)

2-1險(xiǎn)勝19歲巴西新星,茲維列夫晉級(jí)ATP1000蒙特卡洛大師賽4強(qiáng)

側(cè)身凌空斬
2026-04-10 20:11:39
馬面女孩吳小燕:毛巾蒙面13年,手術(shù)取出2公斤異物后過(guò)得怎樣了

馬面女孩吳小燕:毛巾蒙面13年,手術(shù)取出2公斤異物后過(guò)得怎樣了

小熊侃史
2025-12-25 11:27:42
先導(dǎo)智能,訂單爆了!

先導(dǎo)智能,訂單爆了!

飛鯨投研
2026-04-10 18:27:40
德比慘敗張慶鵬真臥底!邊緣化張帆+孟子凱,進(jìn)攻無(wú)戰(zhàn)術(shù),防守為0

德比慘敗張慶鵬真臥底!邊緣化張帆+孟子凱,進(jìn)攻無(wú)戰(zhàn)術(shù),防守為0

籃球資訊達(dá)人
2026-04-10 22:21:36
佩斯科夫:俄總統(tǒng)代表正在訪美,就恢復(fù)雙方經(jīng)濟(jì)合作保持接觸

佩斯科夫:俄總統(tǒng)代表正在訪美,就恢復(fù)雙方經(jīng)濟(jì)合作保持接觸

界面新聞
2026-04-10 18:46:50
又開打了!阿聯(lián)酋不宣而戰(zhàn),炸伊朗煉油廠,  把波斯灣攪成一鍋粥

又開打了!阿聯(lián)酋不宣而戰(zhàn),炸伊朗煉油廠, 把波斯灣攪成一鍋粥

愛(ài)吃醋的貓咪
2026-04-10 21:34:57
鄭麗文在北京,有重大表態(tài),賴清德急了,盧秀燕蔣萬(wàn)安回應(yīng)亮了

鄭麗文在北京,有重大表態(tài),賴清德急了,盧秀燕蔣萬(wàn)安回應(yīng)亮了

小陸搞笑日常
2026-04-10 15:33:56
俄媒這句話直接封神,“只有把中國(guó)惹急了,世界才會(huì)安靜。”

流史歲月
2026-04-09 13:55:03

外賣小哥新裝備!曝美團(tuán)順豐批量入手華為暢享90系列

外賣小哥新裝備!曝美團(tuán)順豐批量入手華為暢享90系列

CNMO科技
2026-04-10 15:53:05
俄上萬(wàn)億高鐵項(xiàng)目,不用中國(guó)高鐵技術(shù),采用錫納拉集團(tuán),現(xiàn)在怎樣

俄上萬(wàn)億高鐵項(xiàng)目,不用中國(guó)高鐵技術(shù),采用錫納拉集團(tuán),現(xiàn)在怎樣

蜉蝣說(shuō)
2026-04-10 18:08:49
卡拉格預(yù)測(cè)世界杯小組賽:巴西小組第二;日本力壓瑞典出線

卡拉格預(yù)測(cè)世界杯小組賽:巴西小組第二;日本力壓瑞典出線

懂球帝
2026-04-10 15:52:09
打爆了勇士?jī)?nèi)線!如今湖人必須要給先發(fā)中鋒提供足夠的支持才行?

打爆了勇士?jī)?nèi)線!如今湖人必須要給先發(fā)中鋒提供足夠的支持才行?

稻谷與小麥
2026-04-10 22:25:32
北京足協(xié):對(duì)中青賽U10組涉假球兩隊(duì)主帥進(jìn)行市內(nèi)永久禁足處罰

北京足協(xié):對(duì)中青賽U10組涉假球兩隊(duì)主帥進(jìn)行市內(nèi)永久禁足處罰

懂球帝
2026-04-10 13:02:58
古力娜扎:真空上陣是放飛自我還是資本博弈?

古力娜扎:真空上陣是放飛自我還是資本博弈?

娛樂(lè)領(lǐng)航家
2026-04-02 21:00:03
為什么WTO很少被提起了?中國(guó)入世談判花了15年,如今幾乎被架空

為什么WTO很少被提起了?中國(guó)入世談判花了15年,如今幾乎被架空

古史青云啊
2026-04-07 14:52:09
荒唐!貓王一生睡遍3000女人,42歲慘死臥室,內(nèi)褲褪到大腿根

荒唐!貓王一生睡遍3000女人,42歲慘死臥室,內(nèi)褲褪到大腿根

七阿姨愛(ài)八卦
2026-04-04 18:04:16
2026-04-10 22:39:00
財(cái)聯(lián)社 incentive-icons
財(cái)聯(lián)社
以“準(zhǔn)確、快速、權(quán)威、專業(yè)”為新聞準(zhǔn)則,為投資者提供專業(yè)的投資資訊。
706329文章數(shù) 1019876關(guān)注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

與內(nèi)塔尼亞胡通話后 特朗普改口了

頭條要聞

與內(nèi)塔尼亞胡通話后 特朗普改口了

體育要聞

17歲賺了一百萬(wàn)美元,25歲被CBA裁員

娛樂(lè)要聞

黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

財(cái)經(jīng)要聞

李強(qiáng)主持召開經(jīng)濟(jì)形勢(shì)專家和企業(yè)家座談會(huì)

汽車要聞

搭載第二代刀片電池及閃充技術(shù) 騰勢(shì)N8L閃充版預(yù)售35萬(wàn)起

態(tài)度原創(chuàng)

手機(jī)
時(shí)尚
親子
健康
軍事航空

手機(jī)要聞

華為Pura90來(lái)了!這個(gè)外觀你喜歡嗎?

今日熱點(diǎn):陳添祥長(zhǎng)文道歉;夏克立曾給前經(jīng)紀(jì)人傳上廁所照片……

親子要聞

一碗“剝皮藍(lán)莓”,讓寶媽被全網(wǎng)嘲諷:認(rèn)知低的人,再努力也白費(fèi)

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

軍事要聞

特朗普:對(duì)美國(guó)與伊朗達(dá)成和平協(xié)議“非常樂(lè)觀”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版