国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

匿名大象模型被螞蟻認(rèn)領(lǐng)!推理速度沖到第一,還能生成百萬(wàn)小說(shuō)

0
分享至


智東西
作者 李水青
編輯 心緣

智東西4月22日?qǐng)?bào)道,上周沖上OpenRouter熱榜(Trending)第一的匿名測(cè)試模型Elephant Alpha今早正式揭曉真身——螞蟻旗下的百靈模型Ling-2.6-flash。


匿名上線以來(lái),該模型調(diào)用量持續(xù)增長(zhǎng),連續(xù)多日位列熱榜榜首,日均tokens調(diào)用量達(dá)100B級(jí)別。不少網(wǎng)友試用后表示印象深刻,有人稱這是“用過(guò)最快的模型”“token效率很高”。

螞蟻今日宣布正式推出Ling-2.6-flash。該模型總參數(shù)量104B,激活參數(shù)7.4B,為Instruct模型。如下圖所示,該模型在Agent相關(guān)基準(zhǔn)上達(dá)到同尺寸SOTA水平,并在其他核心能力上表現(xiàn)出色。


Ling-2.6-flash追求的是在控制token消耗的前提下,保持對(duì)Agent任務(wù)的強(qiáng)競(jìng)爭(zhēng)力,主要具備以下三大核心能力:

1、混合線性架構(gòu),釋放推理效率:通過(guò)引入混合線性架構(gòu),模型從底層優(yōu)化計(jì)算效率。在4卡H20條件下,推理速度最快可達(dá)340 tokens/s,Prefill吞吐達(dá)到Nemotron-3-Super的2.2倍。

2、token效率優(yōu)化,提升智效比:訓(xùn)練過(guò)程中對(duì)token效率進(jìn)行針對(duì)性校準(zhǔn),力求以更精簡(jiǎn)輸出完成目標(biāo)。在Artificial Analysis完整評(píng)測(cè)中,Ling-2.6-flash僅消耗15M tokens,約為Nemotron-3-Super等模型的1/10。

3、面向Agent場(chǎng)景定向增強(qiáng):針對(duì)工具調(diào)用、多步規(guī)劃與任務(wù)執(zhí)行能力持續(xù)打磨。在BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench等評(píng)測(cè)中,即使面對(duì)激活參數(shù)更大的模型,依然取得相近甚至SOTA級(jí)別的表現(xiàn)。

從智東西上周對(duì)該模型的實(shí)測(cè)來(lái)看,其在執(zhí)行速度、指令響應(yīng)、前端原型開發(fā)與長(zhǎng)文件處理上表現(xiàn)高效,Agent規(guī)劃與工具調(diào)用能力較強(qiáng),但在項(xiàng)目級(jí)應(yīng)用開發(fā)上仍有局限。總體而言,這是一款在輕量級(jí)、高頻任務(wù)中具有優(yōu)勢(shì)的高效模型。


▲智東西用該模型接入類OpenClaw產(chǎn)品生成泰國(guó)7日游攻略網(wǎng)站

Ling-2.6-flash將在OpenRouter與官方平臺(tái)同步提供一周免費(fèi)API調(diào)用。

官方免費(fèi)期結(jié)束后,平臺(tái)仍將提供每日50萬(wàn)tokens免費(fèi)額度;超出部分按量計(jì)費(fèi):輸入0.6元/百萬(wàn)tokens,輸出1.8元/百萬(wàn)tokens。模型的BF16、FP8、INT4等版本也將于近期開源。

OpenRouter體驗(yàn)地址:
https://openrouter.ai/inclusionai/ling-2.6-flash:free

Ling-2.6-flash官方體驗(yàn)及API地址:
https://ling.tbox.cn/chat


一、實(shí)測(cè):秒級(jí)響應(yīng)、指哪打哪,幾十分鐘產(chǎn)出百萬(wàn)字長(zhǎng)篇

智東西在體驗(yàn)中首先嘗試了一些編程小項(xiàng)目,發(fā)現(xiàn)其響應(yīng)速度和Agent工具調(diào)用能力較強(qiáng)。

首先是一個(gè)網(wǎng)站,這主要考察模型的前端能力。拿到開發(fā)任務(wù)后,該模型對(duì)網(wǎng)站的幾個(gè)核心組件進(jìn)行了規(guī)劃,并主動(dòng)為這一網(wǎng)站加入了明暗模式切換、移動(dòng)端響應(yīng)式設(shè)計(jì)等我們并未要求的功能,最終耗時(shí)1分鐘左右完成開發(fā)。


當(dāng)我們要求它將網(wǎng)站的主色調(diào)改成綠色后,該模型用不到10秒鐘就完成了修改,其他大部分模型在處理修改任務(wù)時(shí)往往需要通讀上下文,逐一修改,花上幾分鐘。

而它基本做到了指哪兒打哪兒,這對(duì)于一些快速、高頻的網(wǎng)站調(diào)試需求是很實(shí)用的。


我們也試了試它有沒(méi)有打造項(xiàng)目級(jí)任務(wù)的能力,讓它根據(jù)自己的內(nèi)部知識(shí),復(fù)刻一個(gè)支付軟件。我們是在Kilo Code插件中體驗(yàn)的模型編程,由該模型驅(qū)動(dòng)的多個(gè)子Agent并行工作,進(jìn)一步放大了它的輸出速度優(yōu)勢(shì),但是其最終打造的結(jié)果僅能算是一個(gè)原型。這種表現(xiàn)可能與其較小的參數(shù)量有關(guān)。


(更多體驗(yàn)案例移步→《匿名模型“大象”攪局OpenRouter:100B參數(shù)沖到熱榜第一,實(shí)測(cè)結(jié)果如何》)

螞蟻官方也公布了一些Ling-2.6-flash的實(shí)戰(zhàn)演示:

在代碼場(chǎng)景,以網(wǎng)頁(yè)生成為例,Ling-2.6-flash兼具高審美表達(dá)與高速代碼生成能力,能準(zhǔn)確調(diào)用前端組件與圖標(biāo)庫(kù),適合單頁(yè)面演示和原型制作中的快速驗(yàn)證。

其INT4量化版本可在DGX Spark上運(yùn)行,下面視頻為基于Ling-2.6-flash&DGX Spark 構(gòu)建業(yè)界SOTA Hermes一體機(jī)教程。

Ling-2.6-flash結(jié)合Kilo Code可將視覺(jué)指令快速轉(zhuǎn)化為高質(zhì)量界面,勝任個(gè)性化視覺(jué)風(fēng)格生成、報(bào)刊級(jí)排版及周刊、報(bào)告等辦公內(nèi)容的即時(shí)生成。

在文本場(chǎng)景,Ling-2.6-flash僅憑Prompt即可勝任多步驟文本任務(wù)執(zhí)行,在指令遵循、文風(fēng)調(diào)整與實(shí)時(shí)生成方面表現(xiàn)突出。

在Agent工具調(diào)用場(chǎng)景,該模型具備強(qiáng)大的上下文檢索、工具調(diào)用與高速響應(yīng)能力,適合復(fù)雜信息處理與知識(shí)增強(qiáng)場(chǎng)景。

基于Ling-2.6-flash,長(zhǎng)篇寫作助手autonovel可覆蓋世界觀設(shè)定、角色構(gòu)建、大綱生成到正文創(chuàng)作的全流程,以200+ tokens/s的生成速度,僅需幾十分鐘即可產(chǎn)出百萬(wàn)字長(zhǎng)稿。

在需求整理和排期等真實(shí)工作場(chǎng)景中,Ling-2.6-flash能穩(wěn)定參與信息檢索、任務(wù)拆解、內(nèi)容處理與工具協(xié)同,具備較低的幻覺(jué)率與較高的結(jié)果可用性。

二、架構(gòu)升級(jí):推理吞吐最高提升4倍

Ling-2.6-flash延用了Ling 2.5的模型架構(gòu)設(shè)計(jì):在Ling 2.0架構(gòu)基礎(chǔ)上引入混合線性注意力機(jī)制,通過(guò)增量訓(xùn)練將GQA注意力機(jī)制升級(jí)為1:7的MLA+Lightning Linear高效混合架構(gòu)。


得益于混合注意力機(jī)制與高度稀疏化的MoE架構(gòu),Ling-2.6-flash在推理效率上優(yōu)勢(shì)顯著。與同尺寸級(jí)別的主流SOTA模型相比,首字響應(yīng)更快,長(zhǎng)輸出場(chǎng)景下的生成效率更高,Prefill吞吐與Decode吞吐最高均可達(dá)到約4倍提升。隨著上下文長(zhǎng)度和生成長(zhǎng)度增加,吞吐優(yōu)勢(shì)進(jìn)一步放大。



在預(yù)訓(xùn)練階段,團(tuán)隊(duì)通過(guò)大規(guī)模算子融合提升訓(xùn)練效率;推理側(cè)則圍繞真實(shí)部署場(chǎng)景深度適配,使融合算子在融合粒度、實(shí)現(xiàn)路徑與數(shù)值行為上盡可能與訓(xùn)練側(cè)保持一致。相關(guān)推理算子將隨linghe陸續(xù)開源。

針對(duì)不同精度場(chǎng)景,推理鏈路進(jìn)行了系統(tǒng)性優(yōu)化:

BF16推理:實(shí)現(xiàn)QK Norm+RoPE、Group RMSNorm+Sigmoid Gate等關(guān)鍵算子深度融合,MoE Router GEMM與LM Head GEMM采用BF16 Input+FP32 Output計(jì)算方式。

FP8推理:進(jìn)一步融合RMSNorm、SwiGLU與量化算子,針對(duì)小Batch Size引入Split-K的Blockwise FP8 GEMM,以此帶來(lái)更高的系統(tǒng)吞吐、單用戶TPS、更短的等待時(shí)間,以及在真實(shí)交互場(chǎng)景下更穩(wěn)定、更流暢的使用體驗(yàn)。


在Artificial Analysis榜單的Output Speed維度測(cè)評(píng)中,Ling-2.6-flash以215 tokens/s的輸出速度處于第一梯隊(duì)。


三、更優(yōu)性能,token消耗僅為同行十分之一

在Artificial Analysis的Intelligence vs. Output tokens對(duì)比中,Ling-2.6-flash展現(xiàn)了突出的token效率優(yōu)勢(shì):以15M output tokens實(shí)現(xiàn)了26分的Intelligence Index,在保持較強(qiáng)智能水平的同時(shí)將輸出消耗控制在相對(duì)更低的位置。相比部分依賴更長(zhǎng)輸出換取更高分?jǐn)?shù)的模型,它在“智能表現(xiàn)”與“輸出成本”之間取得了更優(yōu)平衡。

對(duì)于開發(fā)者和企業(yè)場(chǎng)景而言,這種能力帶來(lái)的價(jià)值可能是更低的推理開銷、更快的首字響應(yīng)、更短的整體生成時(shí)延,以及更流暢的交互體驗(yàn)。


▲基于AA榜單的官方測(cè)評(píng)分?jǐn)?shù)繪制

從token消耗看,在 Artificial Analysis Intelligence Index 的完整評(píng)測(cè)中,Ling-2.6-flash的總消耗僅為15M tokens,而Nemotron-3-Super等模型達(dá)到或超過(guò)110M tokens——僅用約1/10的token消耗完成同類評(píng)測(cè)任務(wù),智效比更高。


四、強(qiáng)化學(xué)習(xí)特訓(xùn):Agent能力對(duì)標(biāo)SOTA

為增強(qiáng)模型Agent能力,團(tuán)隊(duì)顯著擴(kuò)展了Ling-2.6-flash訓(xùn)練數(shù)據(jù)的難度與廣度,依托自研的大規(guī)模高保真交互環(huán)境,進(jìn)行了針對(duì)性的General Agent與Coding Agent強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練。

模型在指令遵循、工具調(diào)用、多步規(guī)劃及長(zhǎng)程執(zhí)行方面表現(xiàn)提升顯著,在BFCL-V4、TAU2-bench、SWE-bench Verified、PinchBench等榜單上表現(xiàn)優(yōu)異。通過(guò)RL優(yōu)化泛化性與穩(wěn)定性,在Claude Code、Kilo Code、Qwen Code、Hermes Agent、OpenClaw等框架中均展現(xiàn)了良好的使用體驗(yàn)。

此外,Ling-2.6-flash在通用知識(shí)、數(shù)學(xué)推理、指令遵循及長(zhǎng)文本解析等維度保持優(yōu)秀水準(zhǔn),各項(xiàng)指標(biāo)對(duì)齊同尺寸SOTA模型。


結(jié)語(yǔ):部分高復(fù)雜度場(chǎng)景受限,將繼續(xù)探索智效比邊界

經(jīng)過(guò)一周的持續(xù)迭代和優(yōu)化,Ling-2.6-flash在Agent場(chǎng)景的泛化性和穩(wěn)定性方面獲得進(jìn)一步提升。

Ling-2.6-flash在工具調(diào)用、多步規(guī)劃與長(zhǎng)程任務(wù)執(zhí)行等關(guān)鍵維度上實(shí)現(xiàn)了明顯提升。但百靈團(tuán)隊(duì)坦言,部分高復(fù)雜度場(chǎng)景中,受限于推理深度,模型仍可能出現(xiàn)一定的工具幻覺(jué);此外,在中英雙語(yǔ)自然切換、復(fù)雜指令遵循等方面仍有優(yōu)化空間。

該模型后續(xù)迭代將繼續(xù)探索智效比的更優(yōu)邊界,在保持高效推理特性的同時(shí),進(jìn)一步推動(dòng)智能產(chǎn)出質(zhì)量與token效率之間的深度平衡。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
晚年米芾寫出此大字神作,筆法縱橫莫測(cè),堪稱生平不世出的經(jīng)典

晚年米芾寫出此大字神作,筆法縱橫莫測(cè),堪稱生平不世出的經(jīng)典

幸福娃3790
2026-04-09 11:55:20
你見過(guò)老板是怎么把生意干黃的?網(wǎng)友:拿了雙一次性筷子還追出來(lái)

你見過(guò)老板是怎么把生意干黃的?網(wǎng)友:拿了雙一次性筷子還追出來(lái)

夜深愛雜談
2026-04-20 09:31:31
蔚來(lái),我算是把你看清了

蔚來(lái),我算是把你看清了

汽車十三行
2026-04-21 11:56:48
為什么2026教育突然松綁了?網(wǎng)友:過(guò)度內(nèi)卷只會(huì)影響孩子心理健康

為什么2026教育突然松綁了?網(wǎng)友:過(guò)度內(nèi)卷只會(huì)影響孩子心理健康

另子維愛讀史
2026-04-21 20:14:40
中方禁令為何時(shí)隔百天才爆發(fā)?日本媒體不再隱瞞,遮羞布被揭下

中方禁令為何時(shí)隔百天才爆發(fā)?日本媒體不再隱瞞,遮羞布被揭下

誰(shuí)將笑到最后
2026-04-22 17:27:39
汪嘉偉之子汪崎:心疼母親鄧星,再難不“啃”父親,贏得繼母好評(píng)

汪嘉偉之子汪崎:心疼母親鄧星,再難不“啃”父親,贏得繼母好評(píng)

細(xì)品名人
2026-03-26 07:10:29
2105km續(xù)航,9.79萬(wàn)!比亞迪官宣:新車上市

2105km續(xù)航,9.79萬(wàn)!比亞迪官宣:新車上市

新浪財(cái)經(jīng)
2026-04-21 14:30:59
收拾完伊朗,下一個(gè)輪到中國(guó)?以色列發(fā)戰(zhàn)爭(zhēng)威脅,中方送出5個(gè)字

收拾完伊朗,下一個(gè)輪到中國(guó)?以色列發(fā)戰(zhàn)爭(zhēng)威脅,中方送出5個(gè)字

千羽解讀
2026-04-18 10:12:15
阿斯塔納航空將于6月3日開通廣州—阿斯塔納直飛航線

阿斯塔納航空將于6月3日開通廣州—阿斯塔納直飛航線

北京商報(bào)
2026-04-21 15:34:11
凱特致敬伊麗莎白女王,戴其生前珍珠項(xiàng)鏈亮相,細(xì)節(jié)盡顯高情商

凱特致敬伊麗莎白女王,戴其生前珍珠項(xiàng)鏈亮相,細(xì)節(jié)盡顯高情商

世界王室那些事
2026-04-22 17:29:57
港媒:兩岸已步入到“準(zhǔn)統(tǒng)一”階段,“西藏模式”更具參考!

港媒:兩岸已步入到“準(zhǔn)統(tǒng)一”階段,“西藏模式”更具參考!

娛樂(lè)圈的筆娛君
2026-04-21 17:59:45
美加州熱氣球耗盡燃料降民居后院 13乘客淡定揮手 房主:難以置信

美加州熱氣球耗盡燃料降民居后院 13乘客淡定揮手 房主:難以置信

環(huán)球趣聞分享
2026-04-22 13:40:09
我國(guó)肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

我國(guó)肝癌高發(fā),茶葉是背后的禍因?醫(yī)生勸告:3種茶才是幫兇

岐黃傳人孫大夫
2026-04-12 06:30:03
特朗普下令“無(wú)限期停戰(zhàn)”,9千萬(wàn)伊朗人熬過(guò)最艱苦時(shí)刻?

特朗普下令“無(wú)限期停戰(zhàn)”,9千萬(wàn)伊朗人熬過(guò)最艱苦時(shí)刻?

牛鍋巴小釩
2026-04-22 16:01:58
603169,被證監(jiān)會(huì)立案!

603169,被證監(jiān)會(huì)立案!

證券時(shí)報(bào)e公司
2026-04-22 17:54:29
51歲李健,每天只吃一餐,每周4次健身,身體狀態(tài)像20歲小伙子

51歲李健,每天只吃一餐,每周4次健身,身體狀態(tài)像20歲小伙子

馬拉松跑步健身
2026-04-13 22:00:23
解秀梅大膽擁抱毛主席,多年后呂厚民回憶稱:主席可能被嚇到了

解秀梅大膽擁抱毛主席,多年后呂厚民回憶稱:主席可能被嚇到了

春秋硯
2026-04-22 11:40:08
iPhone 17突然降價(jià),這應(yīng)該是目前最香的iPhone了

iPhone 17突然降價(jià),這應(yīng)該是目前最香的iPhone了

劉奔跑
2026-04-19 23:10:21
蘋果8號(hào)員工干了49年:裁員名單繞著他走,因?yàn)橘r不起

蘋果8號(hào)員工干了49年:裁員名單繞著他走,因?yàn)橘r不起

世界圈
2026-04-04 13:13:03
發(fā)現(xiàn)了嗎,越是分床睡、經(jīng)濟(jì)AA制、不干涉對(duì)方隱私的夫妻,感情濃度往往越低,越把婚姻過(guò)成......

發(fā)現(xiàn)了嗎,越是分床睡、經(jīng)濟(jì)AA制、不干涉對(duì)方隱私的夫妻,感情濃度往往越低,越把婚姻過(guò)成......

LULU生活家
2026-04-21 19:20:03
2026-04-22 18:07:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
11659文章數(shù) 117037關(guān)注度
往期回顧 全部

科技要聞

對(duì)話梅濤:沒(méi)有視頻底座,具身智能走不遠(yuǎn)

頭條要聞

特朗普180°轉(zhuǎn)彎延長(zhǎng)?;?伊朗硬剛首次直接回絕談判

頭條要聞

特朗普180°轉(zhuǎn)彎延長(zhǎng)?;?伊朗硬剛首次直接回絕談判

體育要聞

網(wǎng)易傳媒再度簽約法國(guó)隊(duì)和阿根廷隊(duì)

娛樂(lè)要聞

復(fù)婚無(wú)望!baby黃曉明陪小海綿零交流

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長(zhǎng)?;鹌谙?/h3>

汽車要聞

純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬(wàn)起

態(tài)度原創(chuàng)

本地
家居
數(shù)碼
藝術(shù)
公開課

本地新聞

春色滿城關(guān)不?。座N梅浪漫盛放,吳山藏了一片四月雪

家居要聞

極簡(jiǎn)繪夢(mèng) 克制和諧

數(shù)碼要聞

Beats發(fā)布3米USB-C數(shù)據(jù)線:售229元 最高240W快充

藝術(shù)要聞

無(wú)花不風(fēng)景

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版