国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

刷Token走火入魔!Meta員工寫外掛作弊沖榜,1個月燒掉200萬美元

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】Meta內(nèi)部搞了個AI用量排行榜「Claudeonomics」,8.5萬員工拼消耗、沖段位、搶「Token傳奇」稱號。有人一個月燒掉200萬美元,有人寫外掛沖榜,有人掛著Agent睡覺也在跑——硅谷卷Token,已經(jīng)卷到走火入魔了。

一個人,30天,燒掉3285億token!

按Anthropic公開定價粗算,這些燒掉的算力成本接近200萬美元。

4月初,The Information記者Jyoti Mann在X上首次曝光Meta內(nèi)部「Claudeonomics」排行榜,30天全公司token總消耗超60萬億。


這些瘋狂的數(shù)字,來自Meta內(nèi)部一個名叫「Claudeonomics」排行榜的比賽,8.5萬人參與的燒token大賽,只展示前250名。

從銅牌、銀牌、金牌、鉑金、翡翠,一路升到「永恒會話」(Session Immortal),再到最高榮譽「Token傳奇」(Token Legend)。

沒錯,燒token都燒出段位來了。

這筆賬到底有多大?The Information專門做了一個計算器來拆解:


The Information報道中附帶的交互式token成本估算器,按Claude Opus 4.6占86%的模型配比、70%緩存命中率估算,1萬億token理論成本約550萬美元。

當(dāng)然,這只是按公開價的估算,但數(shù)據(jù)量級本身已經(jīng)足夠炸裂。

如果放到整個Meta來看,這個數(shù)字更恐怖:最近一個月token總消耗約60.2萬億

這是什么概念?

The Information做了一個估算:美國國會圖書館全部藏書折算約2.66萬億token,Meta的Llama 3訓(xùn)練數(shù)據(jù)是15萬億token,人類歷史上所有出版書籍加起來估算約20萬億token。

Meta員工30天燒掉的token量,是人類全部出版物的3倍!

這還只是開始。一周之后,這個數(shù)字據(jù)報道跳到了73.7萬億。

消息傳開后,業(yè)內(nèi)知名技術(shù)博主Gergely Orosz在X上一針見血地評論:

Token用量已經(jīng)是Meta績效評估的一部分。聰明人在刷他們認為領(lǐng)導(dǎo)想看的指標,就這么簡單。


這已經(jīng)不是某個工程師在用AI寫代碼的故事了,而演變成一場超大規(guī)模AI消耗競賽游戲:

覆蓋數(shù)萬人,有排名、有稱號、有榮譽體系。

曝光后兩天

排行榜就消失了

The Information的報道發(fā)出后,Meta內(nèi)部炸開了鍋。

有員工在內(nèi)部討論區(qū)寫道:

我建議大家算算這背后的能源消耗。要不是真的在發(fā)生,我會以為是個笑話。

到了周三,排行榜從Meta內(nèi)網(wǎng)消失了。

Meta發(fā)言人對外的說法是:排行榜是由創(chuàng)建者自行撤下的,不是公司下令。

公司強調(diào),員工評估看的是「實際交付影響」,不主張把個人token數(shù)據(jù)作為評估績效的主要方式。

但Meta發(fā)出的信號是矛盾的。

據(jù)The Information報道,Meta內(nèi)部一個名為Checkpoint的AI驅(qū)動績效追蹤系統(tǒng),確實將token使用量列為數(shù)據(jù)點之一。

排行榜雖然撤了,但公司官方的AI Insights儀表盤仍然對所有員工開放,你隨時可以查看自己和團隊的token消耗。

Meta發(fā)言人表示,AI Insights儀表盤的目的是幫助公司了解各組織如何向AI原生的工作方式轉(zhuǎn)型,它提供的洞察不只是token用量,還包括代碼相關(guān)指標和其他維度。

雖然,Meta停掉了排行榜,嘴上說不以token論英雄,但排行榜的邏輯仍然存在,這讓不少員工感受到公司釋放出的信號并不完全一致。

「代碼行數(shù)」

披上token新衣

這個排行榜雖然只存在了幾天,但它已經(jīng)催生出了一套「刷分」操作。


據(jù)The Information援引匿名員工描述,一些Meta工程師想出了各種辦法來膨脹自己的AI使用指標。

比如,一些工程師會讓AI Agent 生成大量細小改動,這些改動對功能幫助有限,但每次仍會形成一次commit,從而抬高其AI使用指標。

量上去了,排名自然好看。

還有人開發(fā)了轉(zhuǎn)錄機器人,掛在會議里自動做記錄。

有的人甚至專門鼓勵同事來用自己開發(fā)的轉(zhuǎn)錄工具,因為只要別人通過你的工具跑token,消耗量就算在你頭上。

類似的事不只發(fā)生在Meta。

亞馬遜電商部門去年也出現(xiàn)過一個案例。

一位經(jīng)理暗示團隊?wèi)?yīng)該更多使用AI編程工具Cline。于是團隊里有人直接改了代碼,讓每次和Cline的對話看起來消耗了10倍的token。

這個團隊的AI使用排名迅速沖到了分部前列。

不過到今年年初,亞馬遜調(diào)整了系統(tǒng),這個「作弊碼」失效了。

這些故事看起來有些荒誕,但熟悉軟件行業(yè)歷史的人一定不陌生。

Box CEO Aaron Levie直言:這讓他想起了AI出現(xiàn)之前,行業(yè)里圍繞「用代碼行數(shù)衡量程序員產(chǎn)出」的那些老爭論。

代碼行數(shù)也曾經(jīng)被當(dāng)作生產(chǎn)力指標。

結(jié)果工程師們學(xué)會了把一行能寫完的邏輯拆成十行:指標漲了,產(chǎn)出沒變,甚至更差了。

現(xiàn)在,同樣的故事只是換了個計量單位:代碼行數(shù)變成了token數(shù)。刷行數(shù)變成了刷commit、掛轉(zhuǎn)錄機器人、改系統(tǒng)讓數(shù)字翻10倍。

指標可量化,又和績效沾邊,就一定可能會「玩壞」。

據(jù)The Information報道,有Meta員工私下承認,那些token用量低的人,有時候會焦慮自己看起來「不夠AI native」。

同時這位員工也認為,高token用量不應(yīng)該成為一種身份符號,因為它并不是生產(chǎn)力的好指標。

不卷token的公司

怎么玩?

既然刷token排名的邏輯漏洞這么明顯,有沒有企業(yè)選擇另外一條路?

執(zhí)法裝備的公司Axon選擇了把AI激勵綁定在業(yè)務(wù)交付上,而不是消耗量上。

他們的做法是團隊如果利用AI工具超額完成年度路線圖目標15%以上,就能拿到現(xiàn)金獎金。

Axon總裁Josh Isner透露,今年公司各團隊集體的路線圖超額幅度正在追蹤到30%左右,主要歸功于Claude Code和Cursor的使用。

預(yù)計今年在AI編程工具上的支出將達到「數(shù)千萬美元」級別。

Isner認為,當(dāng)你引入「盡量多用這個工具我們就付錢」這種考核的時候,風(fēng)險越來越大:

你怎么知道你得到的是你想要的結(jié)果,或者說,到底有沒有任何結(jié)果?

Aaron Levie并不鼓勵tokenmaxxing,也不認為它會在硅谷之外的大公司里廣泛流行。

不過他也表示,自己理解這種沖動,因為當(dāng)前階段需要先讓工程師充分試用這些工具。

他選了另一種方式:既然AI能讓團隊更高效,那就把產(chǎn)品目標定得更高。員工能不能完成這些加碼后的目標,直接影響薪酬。

但Levie也沒有一刀切地否定token消耗。他認為應(yīng)該容忍一定程度的token「浪費」,因為那意味著團隊在嘗試新東西:

硅谷現(xiàn)在正處于這樣一個階段,你得讓工程師去試這些工具。

Levie愿意為試錯買單,但不愿意把「誰燒得最多」變成一種排名機制。

Axon和Box代表了一種觀點:token只是彈藥,你用了多少不重要,你使用它做出了什么才重要。

當(dāng)油表被當(dāng)成速度表

Meta的排行榜被撤了,但背后催生它的那股力量依然強大:

硅谷高管們集體把「多燒token」等同于「高生產(chǎn)力」的敘事一點也沒有減弱。


英偉達CEO黃仁勛

英偉達CEO黃仁勛就曾在All-In Podcast上說過一句被廣泛引用的話:

如果一個年薪50萬美元的工程師,連至少25萬美元的token都沒用掉,他會「高度警惕」。

他甚至設(shè)想了一個未來:Token會成為招聘時的標配福利,就像牙科保險和免費午餐一樣。工程師面試時會問:「這份工作給我配多少token?」

Meta CTO Andrew Bosworth在今年2月的一次科技會議上提到,如果一個頂級工程師花掉相當(dāng)于自己年薪的token成本,卻能把生產(chǎn)力提升到10倍,這筆錢就好比「白送的錢」,應(yīng)該繼續(xù)投,甚至不必設(shè)上限。

前OpenAI和特斯拉AI科學(xué)家Andrej Karpathy則是再造新詞:token消耗量儼然成了AI時代個人能力的新標尺:

你的token吞吐量是多少?你能指揮多少token吞吐量(Token throughput)?

當(dāng)行業(yè)大佬都在說「多燒token就是高生產(chǎn)力」,大家聽到的信號只有一個:不燒就是落后,這種FOMO(Fear of Missing Out,錯失恐懼)會迅速從「我要不要多用一點AI」變成「我敢不敢不用」。

沒有人想成為團隊里那個token用量墊底的人,而排行榜只是把這種焦慮變成了一場公開競賽。

但問題恰恰在這里。

Token消耗量之所以被追捧,是因為它是目前最容易量化的AI使用指標。

你很難衡量一個工程師「用AI之后交付質(zhì)量提升了多少」,但你可以精確地看到他燒了多少token,就它和「代碼行數(shù)」一樣。

但容易量化,不等于值得量化。

代碼行數(shù)對應(yīng)的是寫代碼的動作,并不代表軟件質(zhì)量;Token消耗量衡量的是API調(diào)用次數(shù),不等于工程產(chǎn)出。

這就好比油表能告訴你燒了多少油,但它不代表速度和里程。

而AI Agent時代,只會讓這個問題更尖銳。


NYT近期的報道描述了一種新景象:

工程師同時開十幾個窗口,放出幾十個Agent并行跑任務(wù),有些Agent系統(tǒng)被設(shè)計成24/7不間斷運行,在人類睡覺的時候還在持續(xù)消耗token。

一個全職Agent一周可以跑掉7億個token

當(dāng)token消耗可以脫離人類干預(yù)自動增長的時候,拿消耗量來衡量人的生產(chǎn)力,就更加荒謬了。

雖然,Meta的Claudeonomics排行榜已經(jīng)下線,但它折射出一個人類在技術(shù)采用上的「經(jīng)典悖論」:

當(dāng)一個工具的使用量可以被精確計量、可以被公開排名、可以和績效感知掛鉤,它就必然從工具變成表演。

代碼行數(shù)是這樣,commit次數(shù)是這樣,專利申請數(shù)、論文引用量、OKR完成率,全都是這樣。

每一個曾被當(dāng)作生產(chǎn)力代理指標的數(shù)字,最終都催生出了一套刷分產(chǎn)業(yè)。

現(xiàn)在輪到了token。

下一個被異化的指標會是什么?

也許是Agent的并發(fā)數(shù)量,也許是AI生成代碼的合并率,也許是某種我們今天還想象不到的新數(shù)字。

只要企業(yè)還分不清「鼓勵用AI」和「考核AI帶來的真實產(chǎn)出」,類似的刷榜游戲就不會停。

參考資料:

https://www.theinformation.com/articles/tokenmaxxing-tide-may-turning?rc=epv9gi

https://www.theinformation.com/articles/meta-employees-vie-ai-token-legend-status?rc=epv9gi

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
張敬軒登臺了,系統(tǒng)說他過關(guān)了,觀眾還沒點開彈幕

張敬軒登臺了,系統(tǒng)說他過關(guān)了,觀眾還沒點開彈幕

可樂談情感
2026-04-26 09:44:44
杜月笙救人一命后,對方送來二十根金條,他只留下一個梨

杜月笙救人一命后,對方送來二十根金條,他只留下一個梨

千秋文化
2026-03-31 20:54:38
戴著媽媽的項鏈去面試,被董事長看到,董事長震驚問:你媽媽是誰

戴著媽媽的項鏈去面試,被董事長看到,董事長震驚問:你媽媽是誰

千秋文化
2026-04-18 19:08:36
京圈隱形富婆曝光:宋丹丹百億家底,陳麗華550億,劉嘉玲9億房產(chǎn)

京圈隱形富婆曝光:宋丹丹百億家底,陳麗華550億,劉嘉玲9億房產(chǎn)

子芫伴你成長
2026-04-23 23:15:49
為什么東風(fēng)-41洲際導(dǎo)彈堅決不用北斗?不是不用,是絕不能用!

為什么東風(fēng)-41洲際導(dǎo)彈堅決不用北斗?不是不用,是絕不能用!

一姐說軍史
2026-04-13 12:27:41
100 日元兌 4.33 元:日本用三十年,把自己熬成了 “廉價國家”

100 日元兌 4.33 元:日本用三十年,把自己熬成了 “廉價國家”

深析古今
2026-03-31 10:10:57
五指山艦女兵受訪“一問三不知”,沒被罵反被夸,真實原因太戳人

五指山艦女兵受訪“一問三不知”,沒被罵反被夸,真實原因太戳人

奇思妙想草葉君
2026-04-24 17:11:11
天天315|“0糖是商標”,東鵬特飲被罵上熱搜股價下跌

天天315|“0糖是商標”,東鵬特飲被罵上熱搜股價下跌

齊魯壹點
2026-04-25 06:43:07
住2億別墅、雇4個保姆,'苦等'9年的沈夢辰,被那英一語擊中

住2億別墅、雇4個保姆,'苦等'9年的沈夢辰,被那英一語擊中

楓塵余往逝
2026-04-24 19:50:27
王凱領(lǐng)銜,吳越、祖峰助陣,40集國安大劇來襲 !將再掀追劇風(fēng)暴

王凱領(lǐng)銜,吳越、祖峰助陣,40集國安大劇來襲 !將再掀追劇風(fēng)暴

動物奇奇怪怪
2026-04-26 11:06:54
千萬企退人員多年合理訴求遲遲未落地!真實現(xiàn)狀深度解析

千萬企退人員多年合理訴求遲遲未落地!真實現(xiàn)狀深度解析

匹夫來搞笑
2026-04-25 15:26:44
足總杯半決賽:圣徒功虧一簣,曼城雙星救主,岡薩雷斯一錘定音!

足總杯半決賽:圣徒功虧一簣,曼城雙星救主,岡薩雷斯一錘定音!

體壇關(guān)鍵幀
2026-04-26 09:53:45
四川女籃為何奪冠?難怪宮魯鳴要王思雨不要張茹,李緣或回國家隊

四川女籃為何奪冠?難怪宮魯鳴要王思雨不要張茹,李緣或回國家隊

體育大學(xué)僧
2026-04-26 10:11:17
韓國陸軍招生海報因軍銜錯誤與模特“捏手指”手勢引熱議,張貼3天后被撤

韓國陸軍招生海報因軍銜錯誤與模特“捏手指”手勢引熱議,張貼3天后被撤

紅星新聞
2026-04-24 15:30:18
米體丨意甲二三四名的收入差……

米體丨意甲二三四名的收入差……

米蘭圈
2026-04-26 09:17:53
3月超60款新車發(fā)布,車企急了?

3月超60款新車發(fā)布,車企急了?

中國新聞周刊
2026-04-25 22:03:33
甄子丹自導(dǎo)自演好萊塢大片開機,票房劍指35億,成龍紀錄將被打破

甄子丹自導(dǎo)自演好萊塢大片開機,票房劍指35億,成龍紀錄將被打破

影視高原說
2026-04-26 09:42:56
中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

諦聽骨語本尊
2026-04-25 14:44:21
第一集就得打碼!這部黃暴美劇,終于開播了

第一集就得打碼!這部黃暴美劇,終于開播了

來看美劇
2026-04-08 17:02:19
他今年58歲了,你敢信?!

他今年58歲了,你敢信?!

健身迷
2026-04-13 09:34:17
2026-04-26 11:40:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15066文章數(shù) 66806關(guān)注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰(zhàn)”

頭條要聞

白宮突發(fā)槍擊案 250名記者聯(lián)名要求將晚宴變維權(quán)現(xiàn)場

頭條要聞

白宮突發(fā)槍擊案 250名記者聯(lián)名要求將晚宴變維權(quán)現(xiàn)場

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結(jié)局意難平

財經(jīng)要聞

DeepSeek V4背后,梁文鋒的轉(zhuǎn)身

汽車要聞

預(yù)售19.38萬元起 哈弗猛龍PLUS七座版亮相

態(tài)度原創(chuàng)

數(shù)碼
旅游
房產(chǎn)
親子
時尚

數(shù)碼要聞

華為MatePad Mini迭代版:OLED四等邊、5G、NFC全來了,沒短板了

旅游要聞

臺兒莊古城國潮文化季正式啟動 五一“入夢臺城”拉開帷幕

房產(chǎn)要聞

新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

親子要聞

媽媽記錄下寶寶的第一次擁抱,最幸福的瞬間

伊姐周六熱推:電視劇《方圓八百米》;電視劇《金關(guān)》......

無障礙瀏覽 進入關(guān)懷版