国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

把海外網(wǎng)友晃瞎的神秘大模型,還是中國制造。

0
分享至


今年春節(jié),這些大模型廠商屬于是一點(diǎn)寂寞也耐不住了。

輪流發(fā)射,啊不,應(yīng)該說是輪流在噴射新的模型出來。

除了萬眾矚目的 DeepSeek 還在憋氣,其他大模型公司都沒少閑著。。。

字節(jié)前幾天搞了個(gè) Seedance 2.0,靠著逼真的視頻效果先下一城。

而智譜則是在海外整了個(gè)新活:

經(jīng)常關(guān)注大模型發(fā)布的差友們這幾天應(yīng)該有刷到,前幾天,程序員非常愛用的 AI 聚合平臺(tái),Openrouter 那邊上架了一款匿名模型 —— Pony Alpha。


結(jié)果大家一上手使用后發(fā)現(xiàn)哥們是真能干事啊,定叫它好評如潮。


于是,熱情吃瓜的海外網(wǎng)友就開始了經(jīng)典的模型猜猜猜游戲,開始推測這個(gè)匿名模型是哪一家的手筆。


有說是 DeepSeek V4 的,也有說是 Grok 4.2 的,還有說是 llama 5 的。

還有人因?yàn)?Pony 這個(gè)代號,直接開始猜它是騰訊的新模型的。。。

可以說是眾說紛紜。


而昨天,謎底正式揭曉了。

不裝了,我攤牌了。

這個(gè)化名為 pony 的新東西,正是來自于智譜的GLM-5,而且還是個(gè)開源的模型。


世超打開 GLM-5 的基準(zhǔn)測試成績翻了一下,在智譜最看中的代碼能力這塊,GLM-5 直接逼近了大家公認(rèn)的 AI 編碼冠軍,Claude Opus 4.5。


當(dāng)然,現(xiàn)在各種各樣的 AI 排行榜太多了,大家可能不太理解智譜這次測的這個(gè) CC-bench-V2 又是個(gè)啥排行榜,代表了啥?

我簡單看了一下,智譜這次測的這個(gè) CC-bench-V2,主要考驗(yàn)的是你模型補(bǔ)全代碼的能力有多強(qiáng)。

說人話一點(diǎn),就是把模型丟到一個(gè)沒寫完的工程里,然后看它能不能自個(gè)兒哼哧哼哧把項(xiàng)目給做完。

這塊考的分越高,說明這次 GLM-5 處理復(fù)雜任務(wù)的能力越強(qiáng)。

眾所周知,現(xiàn)在大家想讓 AI 干的活那是越來越復(fù)雜,生成幾個(gè)簡單的 Html 文件已經(jīng)難不倒這些 AI 大模型了。

而想要把大項(xiàng)目給做好,那就需要讓模型具備這種處理復(fù)雜任務(wù)的能力。

另外還有個(gè)有趣的測試結(jié)果是,GLM-5 發(fā)生幻覺概率非常低。

當(dāng)一個(gè)問題它不知道的時(shí)候,GLM-5 會(huì)有很大的概率直接說不知道,而不是原地開始胡編亂造。


給孩子教的非常實(shí)誠了屬于是。

既能干活,又不容易產(chǎn)生幻覺。。。GLM-5 的這波更新,屬于完全沖著要讓 AI 好好干活去整的。

在官網(wǎng)上世超還看到一個(gè)非常驚艷的案例,他們直接讓 GLM-5 復(fù)刻了一個(gè)我的世界。


我下過來體驗(yàn)了一下,發(fā)現(xiàn)整個(gè)游戲只需要依賴瀏覽器就能運(yùn)行。

能跑能挖能疊方塊,操作手感非常流暢。


看別人拿 GLM-5 給整的這么猛,世超決定自己也簡單試一試。

先來點(diǎn)簡單點(diǎn)的活,拿前兩天特別火的洗車問題來考考它。


我想洗車,我家距離洗車店只有 50 米,請問你推薦我走路去還是開車去呢?

別看這個(gè)問題簡單,前幾天整懵了一堆大模型,不管是 DeepSeek 還是 OpenAI,還是其他的大模型。。。都全軍覆沒


這些大模型都覺得 50 米的距離太近了,誰開車啊,于是轉(zhuǎn)頭建議大家走路去洗車。。。


而 GLM-5 面對這個(gè)問題,則是直接看透了問題的本質(zhì) ——人不開車怎么洗車呢?然后完成了一波干凈利索的輸出。


當(dāng)然,這種簡單的邏輯題不翻車只能算合格,接下來,世超準(zhǔn)備給它上點(diǎn)難度,看看它寫代碼的水平。

不知道差友們前段時(shí)間有沒看過一個(gè)叫《技能五子棋》的喜劇。

劇里的演員們就在傳統(tǒng)五子棋的基礎(chǔ)上,加入了各種各樣花里胡哨的技能元素。

比如,“飛沙走石” 這個(gè)技能,就是把棋盤上對方的一枚棋子給拿起來丟掉。


再比如“靜如止水”這個(gè)技能,就是給對面玩家上定身術(shù),讓他不能繼續(xù)下棋。

所以世超決定用 AI 來快速復(fù)刻一下這個(gè)整活游戲。

咱們就敲這么一段話,接下來全部交個(gè) GLM 自由發(fā)揮。


結(jié)果不到三分鐘,它就給我搓完了。


打開一看,整的還挺有模有樣的。。。


不但我要求它安排的四個(gè)技能都整上去了,還給自動(dòng)生成了另外四個(gè)技能。

但是仔細(xì)一玩就露餡了。

點(diǎn)擊了飛沙走石(移除對面一個(gè)棋子)的技能,把對面的棋子給扔掉了之后,

按理來說要么是我繼續(xù)下棋,要么是對面下棋對吧。

這兩種情況還在我的理解范圍中,AI 給我寫成哪種邏輯我都能理解。

但是 GLM 在這個(gè) A or B 的選擇題中,選了 or。

它讓我選擇給對面的棋子下到哪里,明顯是神志不清邏輯錯(cuò)亂了。


不過好在它也很聽勸,把我們的需求再和它復(fù)述一下,那它很快就能 Get 到我們想要什么效果。


這樣一來,我們就得到了一個(gè)可以和 AI 原地對戰(zhàn)的技能五子棋游戲。


坦白說,現(xiàn)在 AI 寫代碼早就不是什么稀奇事了,能寫出這種量級的 Demo 只能說是 GLM-5 的基本操作,還比較在世超的意料之中。

但比較遺憾的是,因?yàn)檫@次上手的時(shí)間實(shí)在太短,世超沒法拿那些真正復(fù)雜的業(yè)務(wù)代碼去狠狠“拷打”一下它,看看它在那種成百上千個(gè)文件的大項(xiàng)目里,是不是還能保持這種清醒。

不過大家別急,今年世超手頭正好攢了一堆復(fù)雜的爛攤子需求,準(zhǔn)備年后面慢慢丟給它去跑一跑。

等后面深度體驗(yàn)了一段時(shí)間,真的摸清了它的上限和脾氣,再來和大伙做個(gè)更詳細(xì)的匯報(bào)。

撰文:早起

編輯:江江 & 面線

美編:素描

圖片、資料來源:智譜官網(wǎng)、X、網(wǎng)絡(luò)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
老人與十五級臺(tái)階的距離

老人與十五級臺(tái)階的距離

澎湃新聞
2026-02-28 07:38:31
274名士兵喪生后,阿富汗呼吁巴基斯坦談判:我們不支持暴力

274名士兵喪生后,阿富汗呼吁巴基斯坦談判:我們不支持暴力

起喜電影
2026-02-28 10:44:00
有啥事讓你最為震驚 網(wǎng)友說知道2016年南海事件前期的人員狀態(tài)嘛

有啥事讓你最為震驚 網(wǎng)友說知道2016年南海事件前期的人員狀態(tài)嘛

侃神評故事
2026-02-28 07:15:03
姜還是老的辣!港口被強(qiáng)收僅3天,李嘉誠一招破局,令人刮目相看

姜還是老的辣!港口被強(qiáng)收僅3天,李嘉誠一招破局,令人刮目相看

離離言幾許
2026-02-27 21:17:18
最高領(lǐng)袖辦公室附近遭襲,伊朗權(quán)力體系如何“去中心化”強(qiáng)化韌性?

最高領(lǐng)袖辦公室附近遭襲,伊朗權(quán)力體系如何“去中心化”強(qiáng)化韌性?

澎湃新聞
2026-02-28 15:10:31
突發(fā) | 知名品牌宣布:關(guān)閉中國所有門店!

突發(fā) | 知名品牌宣布:關(guān)閉中國所有門店!

天津廣播
2026-02-28 00:02:12
李小璐的新瓜,信息量有點(diǎn)大啊…

李小璐的新瓜,信息量有點(diǎn)大啊…

人間頌
2026-02-28 13:15:48
塵埃落定!廣東總商會(huì)副會(huì)長被終身監(jiān)禁,101億贓款全部沒收

塵埃落定!廣東總商會(huì)副會(huì)長被終身監(jiān)禁,101億贓款全部沒收

壹只灰鴿子
2026-02-17 22:45:09
3000萬打工人逃離北上廣,卻不知道縣城已被161個(gè)家族瓜分

3000萬打工人逃離北上廣,卻不知道縣城已被161個(gè)家族瓜分

流蘇晚晴
2026-02-27 18:06:43
老鋪黃金2026年首輪漲價(jià)20%至30%,去年三次調(diào)價(jià)累計(jì)漲超45%

老鋪黃金2026年首輪漲價(jià)20%至30%,去年三次調(diào)價(jià)累計(jì)漲超45%

每日經(jīng)濟(jì)新聞
2026-02-28 10:18:48
俄羅斯既沒那么強(qiáng)大也沒那么重要

俄羅斯既沒那么強(qiáng)大也沒那么重要

名人茍或
2026-02-28 00:02:14
美國防部施壓Anthropic!谷歌、OpenAI 200余名員工聯(lián)名聲援Anthropic

美國防部施壓Anthropic!谷歌、OpenAI 200余名員工聯(lián)名聲援Anthropic

爆角追蹤
2026-02-27 16:51:58
山姆被曝大降價(jià)!深圳門店最新回應(yīng)

山姆被曝大降價(jià)!深圳門店最新回應(yīng)

深圳晚報(bào)
2026-02-28 14:40:56
浙江一男子口頭勸醉酒朋友別開車后離開,朋友幾分鐘后駕車身亡;法院:死者屬嚴(yán)重醉酒狀態(tài),不應(yīng)僅限于口頭提醒,男子被判賠9.5萬余元

浙江一男子口頭勸醉酒朋友別開車后離開,朋友幾分鐘后駕車身亡;法院:死者屬嚴(yán)重醉酒狀態(tài),不應(yīng)僅限于口頭提醒,男子被判賠9.5萬余元

揚(yáng)子晚報(bào)
2026-02-28 11:21:00
官宣!抗癌新藥NK006獲批,9萬一針,晚期實(shí)體瘤患者新希望

官宣!抗癌新藥NK006獲批,9萬一針,晚期實(shí)體瘤患者新希望

王曉愛體彩
2026-02-26 08:03:14
圖訊 | 伊朗德黑蘭市中心景象

圖訊 | 伊朗德黑蘭市中心景象

環(huán)球網(wǎng)資訊
2026-02-28 15:14:21
駐伊朗使館特別提醒在伊中國公民切實(shí)加強(qiáng)安全防范

駐伊朗使館特別提醒在伊中國公民切實(shí)加強(qiáng)安全防范

界面新聞
2026-02-28 15:00:07
新加坡大滿貫:女單最強(qiáng)黑馬誕生!王藝迪2-4止步8強(qiáng)不敗金身告破

新加坡大滿貫:女單最強(qiáng)黑馬誕生!王藝迪2-4止步8強(qiáng)不敗金身告破

釘釘陌上花開
2026-02-28 15:08:34
一年8億兜底50萬從業(yè)者…中國企業(yè)家把錢花在了出乎意料的地方

一年8億兜底50萬從業(yè)者…中國企業(yè)家把錢花在了出乎意料的地方

智谷趨勢
2026-02-26 20:43:32
突發(fā)!C-130運(yùn)輸機(jī)墜毀,已致15死30傷,機(jī)上載有大量現(xiàn)金

突發(fā)!C-130運(yùn)輸機(jī)墜毀,已致15死30傷,機(jī)上載有大量現(xiàn)金

航空知識(shí)
2026-02-28 11:39:45
2026-02-28 16:16:49
差評XPIN incentive-icons
差評XPIN
用知識(shí)和觀點(diǎn)Debug the world!
10330文章數(shù) 489471關(guān)注度
往期回顧 全部

藝術(shù)要聞

2025第十四屆中國藝術(shù)節(jié)全國優(yōu)秀美術(shù)作品展 | 入選油畫選刊

頭條要聞

最高領(lǐng)袖辦公室附近遭襲 媒體:伊朗領(lǐng)導(dǎo)體系仍具韌性

頭條要聞

最高領(lǐng)袖辦公室附近遭襲 媒體:伊朗領(lǐng)導(dǎo)體系仍具韌性

體育要聞

球隊(duì)主力全報(bào)銷?頂風(fēng)擺爛演都不演了

娛樂要聞

疑似王一博被爆私密聊天記錄

財(cái)經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

游戲
教育
數(shù)碼
家居
軍事航空

《無主之地4》新DLC發(fā)布 新強(qiáng)敵與超珍戰(zhàn)利品登場

教育要聞

中考真題,計(jì)算-3×5×(-7)

數(shù)碼要聞

海信RGB-Mini LED電視UX 2026款3月5日發(fā)布

家居要聞

素色肌理 品意式格調(diào)

軍事要聞

新華社:美國伊朗要打了嗎

無障礙瀏覽 進(jìn)入關(guān)懷版