国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Elephant走紅:AI開(kāi)始為“Token浪費(fèi)”算細(xì)賬

0
分享至

2026年春季,大模型行業(yè)的高燒似乎正在退去,取而代之的是一種近乎冷酷的理性。近日,《財(cái)經(jīng)》報(bào)道指出,全球企業(yè)級(jí) AI 應(yīng)用中,約50%的Token正在被浪費(fèi)。

浪費(fèi)的原因很具體,AI應(yīng)用從“對(duì)話”轉(zhuǎn)向“執(zhí)行”,這些計(jì)算資源流向了較貴的大型旗艦?zāi)P?,Agent在復(fù)雜多輪任務(wù)中,歷史文件、對(duì)話會(huì)不斷累積,大量無(wú)用、冗余、過(guò)期的信息會(huì)不斷產(chǎn)生并且重復(fù)計(jì)算,Token消耗因此指數(shù)級(jí)增長(zhǎng)。也就是說(shuō),企業(yè)和開(kāi)發(fā)者在用最貴的車(chē)跑最短的路。

OpenRouter的流量數(shù)據(jù)反映了這個(gè)轉(zhuǎn)變:過(guò)去一個(gè)季度,旗艦級(jí)模型的調(diào)用占比在下降,100B–300B區(qū)間的模型調(diào)用量則明顯上升。以近日上線的100B 模型Elephant為例,單日流量暴漲500%,沖上熱榜榜首,成為OpenClaw等 Agent 最受歡迎的選型。開(kāi)發(fā)者開(kāi)始按任務(wù)類型分配模型,而不是一律用最頂配。這是工程理性回歸的信號(hào),不是對(duì)旗艦?zāi)P偷姆穸ā?/p>



為什么現(xiàn)在才開(kāi)始算這筆賬

幾年前,"選最強(qiáng)的模型"是最省心的工程決策。旗艦?zāi)P蛶缀踉谒腥蝿?wù)上都更好,成本問(wèn)題還沒(méi)到逼人重新設(shè)計(jì)架構(gòu)的程度。

現(xiàn)在情況變了,Agent需要“執(zhí)行”大量工作。一個(gè)客服Agent處理一張工單,可能需要調(diào)用模型十幾次:理解意圖、查詢知識(shí)庫(kù)、判斷優(yōu)先級(jí)、生成回復(fù)、核查格式。如果同時(shí)有幾千張工單在處理,每天的調(diào)用量輕松進(jìn)入百萬(wàn)級(jí)別。在這種頻率下,每次調(diào)用多付的溢價(jià)開(kāi)始在賬單上顯現(xiàn)。

今年3月,一位名為shelvenzhou的開(kāi)發(fā)者在Github進(jìn)行了一項(xiàng)基準(zhǔn)測(cè)試,引發(fā)了廣泛討論。他記錄自己的OpenClaw日常工作(包括代碼、郵件、PDF、圖片、搜索等)Token消耗情況——第一輪對(duì)話Token成本0.0050美元;第五輪對(duì)話Token成本0.0665美元,是第一輪的13.3倍;第10輪的Token成本達(dá)到了0.13美元,是第一輪的26倍。

根據(jù)報(bào)道,《財(cái)經(jīng)》統(tǒng)計(jì)了GitHub上有關(guān)“Token Waste”相關(guān)Issues的數(shù)量。這一討論至少有5200個(gè),僅2026年一季度就誕生了4150個(gè)。越來(lái)越多的開(kāi)發(fā)者在實(shí)際業(yè)務(wù)中正面臨控制Token浪費(fèi)的問(wèn)題。


目前大多數(shù)Agent的工程實(shí)現(xiàn)還相當(dāng)粗糙。面對(duì)Agent的多步任務(wù),Token消耗以接近線性的速度增長(zhǎng),而其中大量?jī)?nèi)容對(duì)當(dāng)前步驟毫無(wú)意義。這類問(wèn)題催生了一個(gè)新的工程概念——Agent Harness,它不是模型本身,而是包裹在模型外部、負(fù)責(zé)管理上下文、編排工具調(diào)用、控制執(zhí)行生命周期的“韁繩”和“馬具”。

Token 效率因此形成了兩條并行的壓力線,一條來(lái)自 Agent 框架側(cè),Harness 的出現(xiàn)就是典型代表;另一條來(lái)自模型側(cè),推動(dòng)廠商用更精簡(jiǎn)的參數(shù)完成同等質(zhì)量的推理。


模型,向?qū)嵱弥髁x靠攏

在這場(chǎng)范式轉(zhuǎn)移中,一批深耕“token效率”的模型成為了舞臺(tái)中央的主角。它們不比拼參數(shù)規(guī)模,而是在單位Token成本下,比拼推理速度、指令遵循度以及長(zhǎng)上下文的穩(wěn)定性。

根據(jù)OpenRouter 的 LLM Leaderboard在4月16日的數(shù)據(jù),模型格局呈現(xiàn)出明顯的“大模型控榜,小模型控場(chǎng)”的分化態(tài)勢(shì)。

在前20名的榜單中,傳統(tǒng)意義上的大尺寸旗艦?zāi)P停ㄈ鏑laude Opus 4.6、DeepSeek V3.2等),主要分布在榜單頭部和中上部,依然掌握著復(fù)雜任務(wù)的話語(yǔ)權(quán);而主打輕量化、高性價(jià)比的小尺寸模型(如Gemini 3 Flash、Grok 4.1 Fast、GPT-5.4 Nano等),且多集中在第 8 名至第 20 名的區(qū)間,形成了不可忽視的“腰部力量”。

可以明顯看到,小尺寸模型的漲幅驚人。根據(jù)4月16日數(shù)據(jù),排名第17位的 GPT-5.4 Nano以48%的驚人漲幅領(lǐng)跑增長(zhǎng)榜,100B模型Elephant單日漲幅 38%。


從App使用情況來(lái)看,OpenClaw、Hermes Agent、Kilo Code、CLaude Code 等成為這些小尺寸模型的“最大流量貢獻(xiàn)”,開(kāi)發(fā)者正在將小尺寸模型作為高頻、低延遲任務(wù)的首選。

在業(yè)界看來(lái),100B-300B已然成為一個(gè)實(shí)用主義區(qū)間。GPT-5.4-Mini是目前這條路線的典型代表之一,以更低延遲和更低成本大幅縮小與旗艦?zāi)P偷男阅懿罹唷?/p>

OpenAI 此前著重強(qiáng)調(diào)了新模型在多模型分層系統(tǒng)中的位置:以其自研編程助手Codex為例,GPT-5.4負(fù)責(zé)規(guī)劃、協(xié)調(diào)與最終判斷,而GPT-5.4 mini子智能體則并行處理代碼庫(kù)檢索、大文件審閱及輔助文檔處理等粒度更細(xì)的子任務(wù)。

OpenAI表示,隨著小型模型速度更快、功能更強(qiáng)大,開(kāi)發(fā)者無(wú)需使用單一模型處理所有任務(wù),而是可以構(gòu)建系統(tǒng),由大型模型負(fù)責(zé)決策,小型模型則快速大規(guī)模地執(zhí)行任務(wù)。這種分層調(diào)用的模式開(kāi)始變得實(shí)用而非將就。

Elephant Alpha是另一個(gè)值得關(guān)注的案例,該模型于4月13日深夜上線 Openrouter。同為100B參數(shù),Elephant定位為“智能效率”優(yōu)先,在保持256K 上下文窗口的同時(shí),重點(diǎn)優(yōu)化Token使用效率,適合代碼補(bǔ)全、快速文檔處理和輕量Agent交互等場(chǎng)景。由于來(lái)源匿名,其具體技術(shù)細(xì)節(jié)尚不透明,但在開(kāi)發(fā)者社區(qū)已有相當(dāng)?shù)膶?shí)測(cè)關(guān)注。




效率不是降級(jí),是分工

旗艦?zāi)P筒粫?huì)消失。在需要跨領(lǐng)域深度推理、多步驟規(guī)劃、復(fù)雜代碼生成的任務(wù)上,它們?nèi)匀皇潜匾?。沒(méi)有人認(rèn)真地認(rèn)為100B模型可以在所有場(chǎng)景下替代旗艦版。

但在日常的業(yè)務(wù)執(zhí)行層——那些占據(jù)大多數(shù)調(diào)用量的任務(wù)——用旗艦?zāi)P褪窃跒椴恍枰哪芰Ω顿M(fèi)。把這部分流量遷移到效率更高的模型上,毫無(wú)疑問(wèn)是更具性價(jià)比的決策。

這種分工在軟件工程里有先例。CPU發(fā)展從追求單核主頻轉(zhuǎn)向多核協(xié)作,不是因?yàn)閱魏瞬恢匾且驗(yàn)樵趯?shí)際工作負(fù)載下,多核架構(gòu)的整體吞吐遠(yuǎn)超單純堆主頻。數(shù)據(jù)庫(kù)領(lǐng)域也有類似的演變:OLTP和OLAP長(zhǎng)期共存,不同的查詢特征對(duì)應(yīng)不同的存儲(chǔ)和計(jì)算架構(gòu)。

模型選型的邏輯正在經(jīng)歷類似的成熟。Token效率正在成為工程師評(píng)估模型的核心維度之一——不是因?yàn)楸阋?,而是因?yàn)樵诟哳l調(diào)用的場(chǎng)景下,它直接關(guān)系到產(chǎn)品的商業(yè)可行性。那些在單位成本下能提供足夠推理質(zhì)量的模型,正在成為 Agentic應(yīng)用的默認(rèn)底座。

一條路線日漸清晰:規(guī)模繼續(xù)重要,但效率開(kāi)始定價(jià)......

*以上內(nèi)容不構(gòu)成投資建議,不代表刊登平臺(tái)之觀點(diǎn),市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎,請(qǐng)獨(dú)立判斷和決策。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
千億市值龍頭,白天觸及漲停,晚間公告業(yè)績(jī)大挫

千億市值龍頭,白天觸及漲停,晚間公告業(yè)績(jī)大挫

新浪財(cái)經(jīng)
2026-04-20 23:15:04
酒店窗簾太透明情侶全然不知! 60秒視頻片流出…路人狂拍

酒店窗簾太透明情侶全然不知! 60秒視頻片流出…路人狂拍

環(huán)球趣聞分享
2026-04-20 14:57:07
隨著巴黎圣日耳曼爆大冷門(mén)1-2,法甲最新積分榜出爐:爭(zhēng)冠白熱化

隨著巴黎圣日耳曼爆大冷門(mén)1-2,法甲最新積分榜出爐:爭(zhēng)冠白熱化

側(cè)身凌空斬
2026-04-20 07:55:12
追覓造車(chē)已進(jìn)入實(shí)質(zhì)性推進(jìn)階段,第二款旗艦SUV對(duì)標(biāo)理想L9、問(wèn)界M9 | 獨(dú)家

追覓造車(chē)已進(jìn)入實(shí)質(zhì)性推進(jìn)階段,第二款旗艦SUV對(duì)標(biāo)理想L9、問(wèn)界M9 | 獨(dú)家

鈦媒體APP
2026-04-20 10:40:57
美伊戰(zhàn)事期間真實(shí)的特朗普:抱怨、焦慮、搖擺不定!救飛行員時(shí)被幕僚擋戰(zhàn)情室外

美伊戰(zhàn)事期間真實(shí)的特朗普:抱怨、焦慮、搖擺不定!救飛行員時(shí)被幕僚擋戰(zhàn)情室外

紅星新聞
2026-04-20 15:36:11
火藥味已經(jīng)越來(lái)越濃了,現(xiàn)在不光是黃海和東海進(jìn)行軍事演習(xí)

火藥味已經(jīng)越來(lái)越濃了,現(xiàn)在不光是黃海和東海進(jìn)行軍事演習(xí)

安安說(shuō)
2026-04-20 11:03:05
視頻丨美伊?;饍H剩兩天 特朗普稱將談判 伊朗:不屬實(shí)

視頻丨美伊?;饍H剩兩天 特朗普稱將談判 伊朗:不屬實(shí)

國(guó)際在線
2026-04-20 07:01:31
安徽阜陽(yáng)一服刑人員在監(jiān)獄突然死亡,檢察院重新認(rèn)定為“非正常死亡”,獄警一審因虐待被監(jiān)管人員罪獲刑

安徽阜陽(yáng)一服刑人員在監(jiān)獄突然死亡,檢察院重新認(rèn)定為“非正常死亡”,獄警一審因虐待被監(jiān)管人員罪獲刑

極目新聞
2026-04-20 10:46:44
偉大的10-5!丁俊暉世錦賽開(kāi)門(mén)紅,創(chuàng)3大紀(jì)錄,會(huì)師趙心童沖8強(qiáng)!

偉大的10-5!丁俊暉世錦賽開(kāi)門(mén)紅,創(chuàng)3大紀(jì)錄,會(huì)師趙心童沖8強(qiáng)!

劉姚堯的文字城堡
2026-04-20 20:00:14
特朗普:若有突破進(jìn)展 愿同伊朗高級(jí)別領(lǐng)導(dǎo)人會(huì)面

特朗普:若有突破進(jìn)展 愿同伊朗高級(jí)別領(lǐng)導(dǎo)人會(huì)面

財(cái)聯(lián)社
2026-04-20 21:36:15
你們都是什么時(shí)候?qū)δ信麻_(kāi)竅的?網(wǎng)友:果然還是攔不住有心人

你們都是什么時(shí)候?qū)δ信麻_(kāi)竅的?網(wǎng)友:果然還是攔不住有心人

夜深愛(ài)雜談
2026-02-21 21:37:02
長(zhǎng)三角要變天?滬甬跨海通道獲批,寧波到上海將徹底改寫(xiě)格局

長(zhǎng)三角要變天?滬甬跨海通道獲批,寧波到上海將徹底改寫(xiě)格局

郭揦包工頭
2026-04-21 02:03:05
一個(gè)多月內(nèi),青島兩名市委常委相繼落馬

一個(gè)多月內(nèi),青島兩名市委常委相繼落馬

中國(guó)青年報(bào)
2026-04-20 22:08:12
雷軍在服務(wù)區(qū)被堵車(chē)?yán)锞S權(quán)?小米徐潔云回應(yīng):現(xiàn)場(chǎng)是車(chē)友朋友們,雷總在車(chē)?yán)镉涗浬弦欢蔚睦锍毯湍芎?,那些捏造謠言惡意傳播的,可以等著了

雷軍在服務(wù)區(qū)被堵車(chē)?yán)锞S權(quán)?小米徐潔云回應(yīng):現(xiàn)場(chǎng)是車(chē)友朋友們,雷總在車(chē)?yán)镉涗浬弦欢蔚睦锍毯湍芎?,那些捏造謠言惡意傳播的,可以等著了

魯中晨報(bào)
2026-04-20 07:32:08
大數(shù)據(jù)分析,在中國(guó),找個(gè)身高1米7年入20萬(wàn)的老公,到底有多難?

大數(shù)據(jù)分析,在中國(guó),找個(gè)身高1米7年入20萬(wàn)的老公,到底有多難?

深度報(bào)
2026-04-18 23:37:27
恭喜!曾春蕾當(dāng)選,成中國(guó)女排接應(yīng)第一人,江川給她做副手

恭喜!曾春蕾當(dāng)選,成中國(guó)女排接應(yīng)第一人,江川給她做副手

跑者排球視角
2026-04-20 22:01:45
滿載中國(guó)商品赴伊巨輪遭扣押!陸戰(zhàn)隊(duì)天降奪船,中東火藥桶恐引爆

滿載中國(guó)商品赴伊巨輪遭扣押!陸戰(zhàn)隊(duì)天降奪船,中東火藥桶恐引爆

健身狂人
2026-04-20 18:53:54
更新大潮來(lái)了?中央發(fā)文定調(diào):2026年起20年房齡老房子或又吃香了

更新大潮來(lái)了?中央發(fā)文定調(diào):2026年起20年房齡老房子或又吃香了

專業(yè)聊房君
2026-04-18 16:45:50
《八千里路云和月》遭痛批,抗戰(zhàn)劇要的是接地氣,不是“接地府”

《八千里路云和月》遭痛批,抗戰(zhàn)劇要的是接地氣,不是“接地府”

星宿影視?shū)?/span>
2026-04-20 16:24:42
“劉儀偉,我們的百億去哪了?”大片投資騙局受害人聯(lián)名質(zhì)問(wèn)

“劉儀偉,我們的百億去哪了?”大片投資騙局受害人聯(lián)名質(zhì)問(wèn)

文娛春秋Plus
2026-04-20 09:00:08
2026-04-21 04:55:00
華爾街見(jiàn)聞官方 incentive-icons
華爾街見(jiàn)聞官方
中國(guó)領(lǐng)先的金融商業(yè)信息提供商
144858文章數(shù) 2653325關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價(jià)10999元起

頭條要聞

19歲女孩挪用自家1700萬(wàn)當(dāng)"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬(wàn)當(dāng)"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂(lè)要聞

《八千里路云和月》田家泰暗殺

財(cái)經(jīng)要聞

利潤(rùn)暴跌7成,字節(jié)到底在做什么

汽車(chē)要聞

把天門(mén)山搬進(jìn)廠?開(kāi)仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

本地
教育
數(shù)碼
時(shí)尚
公開(kāi)課

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

教育要聞

問(wèn)答環(huán)節(jié):接受不完美,是最好的自愈

數(shù)碼要聞

REDMI 顯示器 G Pro 27U 2026輕體驗(yàn):電競(jìng)利器 桌面上的“小鋼炮”

春天衣服不用準(zhǔn)備太多!這幾大單品提前備好,百搭實(shí)用又不過(guò)時(shí)

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版