国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

神秘模型排名超 Gemma 4 31B:不跟 Qwen 硬剛,主打“快”和“省 token”

0
分享至


整理 | 褚杏娟

這兩天,OpenRouter 一個(gè)名為“Elephant”(大象)的模型,Trending 榜排名突然超過(guò) Gemma 4 31B,位列排行榜第二名。


根據(jù) Kilo 的說(shuō)法,這款模型來(lái)自一家知名開(kāi)源模型實(shí)驗(yàn)室,主打“智能效率”,在盡量減少 token 消耗的同時(shí),提供接近同規(guī)模 SOTA 性能表現(xiàn)。

Elephant 是一款 100B 參數(shù)隱身模型(stealth model),支持 256K token 上下文窗口,可以一次性加載整個(gè)代碼倉(cāng)庫(kù)或大型依賴樹;最大輸出長(zhǎng)度為 32K token,適合單次生成完整模塊或整套測(cè)試代碼。與此同時(shí),這款模型還支持提示緩存、函數(shù)調(diào)用和結(jié)構(gòu)化輸出,明顯面向企業(yè)級(jí)開(kāi)發(fā)和智能體工具鏈接入場(chǎng)景。

據(jù) Kilo 介紹,Elephant 不是一款單純追求規(guī)模的“大模型”,更強(qiáng)調(diào)速度、響應(yīng)和實(shí)際開(kāi)發(fā)效率。Elephant 主要針對(duì)快速代碼補(bǔ)全與調(diào)試、大規(guī)模文檔處理以及輕量級(jí)智能體交互等場(chǎng)景進(jìn)行了優(yōu)化,適合需要高頻調(diào)用、低延遲反饋的開(kāi)發(fā)工作流。相比那些更重、更慢的模型,Elephant 希望成為開(kāi)發(fā)者日常使用中的“高響應(yīng)主力模型”。

具體地,我們將同是 100B 級(jí)別的 NVIDIA Nemotron 3 Super、Qwen3.5-122B-A10B,以及 OpenAI 的 gpt-oss-120b 進(jìn)行了直接對(duì)比。

在速度方面,Elephant 最快,平均響應(yīng)時(shí)間約 1.27 秒;Qwen3.5-122B-A10B 最慢,平均約 31.38 秒。Elephant 在數(shù)據(jù)解析與提取平均響應(yīng)時(shí)間只花了 979 毫秒,綜合項(xiàng)目也只用了 3.70 秒。

相比之下,Qwen3.5-122B-A10B 的表現(xiàn)是靠更高的推理投入換來(lái)的,比如編程項(xiàng)目平均響應(yīng)時(shí)間高達(dá) 70.98 秒,綜合項(xiàng)目平均響應(yīng)時(shí)間更是達(dá)到 107.79 秒,數(shù)據(jù)解析與提取這類任務(wù)也用了 16,558 推理 token。


而在 token 消耗方面,Qwen3.5-122B-A10B 是這組里最“燒 token”的模型,推理 token 遠(yuǎn)高于另外三個(gè);gpt-oss-120b 和 Nemotron-3 Super 120B 屬于中間檔;Elephant 基本不消耗。


在指令遵循上,Elephant 在穩(wěn)定性上表現(xiàn)最突出。其一致性得分達(dá)到 9.6,說(shuō)明它在重復(fù)運(yùn)行中的結(jié)果波動(dòng)最小,是這組模型里最穩(wěn)定的一款。但 Qwen3.5-122B-A10B 在正確率和通過(guò)能力上依然領(lǐng)先,Nemotron-3 Super 120B A12B 表現(xiàn)較為均衡,而 gpt-oss-120b 則暴露出更明顯的波動(dòng)性。


Elephant 的問(wèn)題是綜合項(xiàng)目上只有 3.0,在數(shù)據(jù)解析與提取上是 6.5,側(cè)面說(shuō)明其目前追求的是高頻、低成本、先求有結(jié)果再說(shuō)的場(chǎng)景,而非復(fù)雜 agent 工作流或者關(guān)鍵判斷任務(wù)場(chǎng)景。

因此,如果將各個(gè)維度綜合起來(lái)打分的話,Qwen3.5-122B-A10B 綜合分 8.1,排第一,NVIDIA Nemotron-3 Super 120B A12B 6.7 分排第二,OpenAI gpt-oss-120b 第三,Elephant Alpha 第四。

與 Elephant Alpha 類似,Nemotron-3 Super 120B A12B 在綜合項(xiàng)目上拿到 10.0,在工具調(diào)用上也是 10.0,在數(shù)據(jù)解析與提取上同樣是 10.0。從結(jié)果看,它很適合那種流程清晰、任務(wù)邊界明確、強(qiáng)調(diào)執(zhí)行鏈條和調(diào)用能力的場(chǎng)景。但它在領(lǐng)域?qū)m?xiàng)上只有 2.9,在通用智能上是 3.8,在謎題求解上只有 3.5,說(shuō)明一旦任務(wù)從“結(jié)構(gòu)化執(zhí)行”轉(zhuǎn)向“開(kāi)放復(fù)雜推理”,其掉隊(duì)就很明顯。gpt-oss-120b 則在編程項(xiàng)目上只有 4.3,還出現(xiàn)了未遵循指令的問(wèn)題。

可以看出,雖然同為 100B 級(jí)別模型,但大家的研發(fā)重點(diǎn)并不相同。

Qwen3.5-122B-A10B 代表了重推理、重完成度路線,有更高的分?jǐn)?shù)和通過(guò)率,但需要付出更多延遲和更高推理開(kāi)銷。而 Nemotron-3 Super 120B A12B 是工作流型路線,它不一定最適合復(fù)雜開(kāi)放問(wèn)題,但在結(jié)構(gòu)化抽取、工具調(diào)用、執(zhí)行鏈條這類任務(wù)上表現(xiàn)突出。新上榜的 Elephant 則代表了極致輕量路線,把“快”和“低成本”做成了核心賣點(diǎn)。

https://aibenchy.com/zh/compare/nvidia-nemotron-3-super-120b-a12b-medium/qwen-qwen3-5-122b-a10b-medium/openrouter-elephant-alpha-medium/openai-gpt-oss-120b-medium/

https://blog.kilo.ai/p/introducing-elephant-a-new-stealth

會(huì)議推薦

QCon 全球軟件開(kāi)發(fā)大會(huì)·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會(huì)以“Agentic AI 時(shí)代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來(lái)自阿里、騰訊、字節(jié)跳動(dòng)、小米、百度等一線科技企業(yè)與創(chuàng)新團(tuán)隊(duì)的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開(kāi)深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
93年我?guī)碗x婚鄰居收玉米,不小心碰到她胸口她紅著眼問(wèn)彩禮給多少

93年我?guī)碗x婚鄰居收玉米,不小心碰到她胸口她紅著眼問(wèn)彩禮給多少

那年秋天
2026-05-06 18:30:05
這妹子眼神太純欲了,打戲也很投入!

這妹子眼神太純欲了,打戲也很投入!

貴圈真亂
2026-05-07 12:34:08
一臺(tái)游戲機(jī)賣了37年,巴西人還在買

一臺(tái)游戲機(jī)賣了37年,巴西人還在買

像素與芯片
2026-05-05 21:43:09
東體:內(nèi)地媒體遲遲無(wú)法辦理世界杯簽證,體育版權(quán)定價(jià)應(yīng)回歸理性

東體:內(nèi)地媒體遲遲無(wú)法辦理世界杯簽證,體育版權(quán)定價(jià)應(yīng)回歸理性

懂球帝
2026-05-07 11:16:09
烏克蘭外長(zhǎng):普京關(guān)心的是閱兵,而不是人的生命;澤連斯基要報(bào)仇

烏克蘭外長(zhǎng):普京關(guān)心的是閱兵,而不是人的生命;澤連斯基要報(bào)仇

不要把蜜語(yǔ)說(shuō)給側(cè)耳聽(tīng)
2026-05-07 09:24:23
31歲中乙中場(chǎng)停賽7個(gè)月罰6萬(wàn) 暴力染紅后威脅+推裁判 踹壞廣告板

31歲中乙中場(chǎng)停賽7個(gè)月罰6萬(wàn) 暴力染紅后威脅+推裁判 踹壞廣告板

風(fēng)過(guò)鄉(xiāng)
2026-05-07 12:12:48
深圳24小時(shí)“食物銀行”火了!面包牛奶免費(fèi)領(lǐng),惠及人口幾十萬(wàn)

深圳24小時(shí)“食物銀行”火了!面包牛奶免費(fèi)領(lǐng),惠及人口幾十萬(wàn)

青眼財(cái)經(jīng)
2026-05-06 20:27:23
俄羅斯是真眼饞!中國(guó)大量東風(fēng)導(dǎo)彈將要退役,可以出口換外匯嗎?

俄羅斯是真眼饞!中國(guó)大量東風(fēng)導(dǎo)彈將要退役,可以出口換外匯嗎?

潮鹿逐夢(mèng)
2026-05-06 16:44:26
大反轉(zhuǎn)!我國(guó)學(xué)者顛覆性發(fā)現(xiàn):補(bǔ)充Omega-3或損害大腦突觸功能,加速認(rèn)知衰退

大反轉(zhuǎn)!我國(guó)學(xué)者顛覆性發(fā)現(xiàn):補(bǔ)充Omega-3或損害大腦突觸功能,加速認(rèn)知衰退

醫(yī)諾維
2026-05-06 17:13:29
哈里梅根美國(guó)豪宅4億成交,"商業(yè)帝國(guó)"崩塌,褪去王室光環(huán)顯窘迫

哈里梅根美國(guó)豪宅4億成交,"商業(yè)帝國(guó)"崩塌,褪去王室光環(huán)顯窘迫

譯言
2026-05-07 08:34:31
東契奇?zhèn)笫状谓邮懿稍L:最初告訴我需要8周康復(fù)

東契奇?zhèn)笫状谓邮懿稍L:最初告訴我需要8周康復(fù)

體壇周報(bào)
2026-05-07 07:54:36
看這眼神和姿勢(shì),下一步就應(yīng)是………

看這眼神和姿勢(shì),下一步就應(yīng)是………

飛娛日記
2026-04-28 08:25:31
為什么準(zhǔn)噶爾蒙古選擇向東和清朝火拼,而沒(méi)有考慮西征西亞?

為什么準(zhǔn)噶爾蒙古選擇向東和清朝火拼,而沒(méi)有考慮西征西亞?

小豫講故事
2026-05-07 06:00:14
學(xué)生時(shí)代的王楚然,純欲天花板本人。原來(lái)校花真是從小美到大的!

學(xué)生時(shí)代的王楚然,純欲天花板本人。原來(lái)?;ㄕ媸菑男∶赖酱蟮?

科學(xué)發(fā)掘
2026-05-05 20:07:45
堅(jiān)守油車的理由是啥?網(wǎng)友分享太真實(shí)了,但很多人不買賬!

堅(jiān)守油車的理由是啥?網(wǎng)友分享太真實(shí)了,但很多人不買賬!

夜深愛(ài)雜談
2026-05-06 20:49:01
返回臺(tái)島后,賴清德說(shuō)了3句話,洪秀柱預(yù)判成真,大陸擲地有聲

返回臺(tái)島后,賴清德說(shuō)了3句話,洪秀柱預(yù)判成真,大陸擲地有聲

說(shuō)歷史的老牢
2026-05-06 09:59:45
五一行李箱墻刷屏全網(wǎng)!多地暖心接棒,“中國(guó)式”安全感火出圈

五一行李箱墻刷屏全網(wǎng)!多地暖心接棒,“中國(guó)式”安全感火出圈

孤酒老巷QA
2026-05-05 17:41:40
江蘇跨江大橋命名暗戰(zhàn),誰(shuí)在掌握絕對(duì)話語(yǔ)權(quán)?

江蘇跨江大橋命名暗戰(zhàn),誰(shuí)在掌握絕對(duì)話語(yǔ)權(quán)?

觀察眼看世界
2026-05-07 11:02:46
華為員工家屬:失業(yè)靠老公養(yǎng)。每月給我2萬(wàn)元,含房貸7000多元

華為員工家屬:失業(yè)靠老公養(yǎng)。每月給我2萬(wàn)元,含房貸7000多元

螞蟻大喇叭
2026-05-06 16:50:28
赫格塞思表示盡管有沖突,但美伊?;稹皼](méi)結(jié)束”

赫格塞思表示盡管有沖突,但美伊?;稹皼](méi)結(jié)束”

參考消息
2026-05-06 11:46:14
2026-05-07 13:08:49
AI前線 incentive-icons
AI前線
面向AI愛(ài)好者、開(kāi)發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1476文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!馬斯克租22萬(wàn)塊GPU給“死敵”

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

體育要聞

阿森納巴黎會(huì)師歐冠決賽!5月31日開(kāi)戰(zhàn)

娛樂(lè)要聞

小S阿雅重返大S母校,翻看大S畢業(yè)照

財(cái)經(jīng)要聞

特朗普:美伊“很有可能”達(dá)成協(xié)議

汽車要聞

理想為什么不做轎車,有了解釋……

態(tài)度原創(chuàng)

健康
教育
時(shí)尚
旅游
數(shù)碼

干細(xì)胞治燒燙傷面臨這些“瓶頸”

教育要聞

推開(kāi)門,世界廣闊!廈門2026屆初三“二檢”語(yǔ)文作文題出爐

“白色闊腿褲”今年夏天又火了!這樣穿時(shí)髦又高級(jí)

旅游要聞

“五一”假期盤點(diǎn):文旅消費(fèi)亮點(diǎn)紛呈

數(shù)碼要聞

三星筆記本版Exynos 2800芯片曝光:1.4nm十核CPU

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版