国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

火山引擎有了它自己的Token經(jīng)濟(jì)學(xué)

政治經(jīng)濟(jì)學(xué)

0
分享至


作者 | 王兆洋
郵箱 | wangzhaoyang@pingwest.com

Token,Token,還是Token。

在12月18日的FORCE原動力大會上,火山引擎總裁譚待半小時的開場演講里提了18次“Token”,而“云”則只出現(xiàn)了7次。

火山也再次更新了備受矚目的豆包大模型最新日均Token調(diào)用量:

50萬億。


這一指標(biāo)從發(fā)布至今實現(xiàn)了417 倍增長,相比去年 12 月則是超 10 倍增長。作為對比,Google10月最新公布的月均Token直接換算為日均量的數(shù)據(jù)是43萬億。豆包大模型的調(diào)用量已經(jīng)是中國第一、全球第三。

而根據(jù)IDC的報告,火山引擎在中國的公有云大模型的服務(wù)調(diào)用量上也是穩(wěn)居第一,MaaS市場份額從2024年的46.4%進(jìn)一步提升到了今年的49.2%。

“也就是說,在中國公有云上每產(chǎn)生的兩個Tokens就有一個是火山引擎生產(chǎn)的。”譚待在當(dāng)天面對臺下5000名觀眾說道。

在當(dāng)天的發(fā)布中,一如既往由火山來更新了字節(jié)最新模型的進(jìn)展。

豆包大模型1.8正式亮相,它在多項指標(biāo)上顯著提升,繼續(xù)走All-in-One的技術(shù)路線,文字、代碼、Agent、音頻,圖視頻等能力,全部在同一個基礎(chǔ)模型里演進(jìn);而專門為視頻生成服務(wù)的Seedance 1.5 pro也同步推出,在音畫同步、中文及方言處理上做到了“世界領(lǐng)先水平”。

字節(jié)要傳達(dá)的信息明顯:豆包大模型創(chuàng)造著Token,且它的進(jìn)化方向也正對應(yīng)著今天Token消耗的結(jié)構(gòu)性變化——從“推理取代訓(xùn)練”推動Token消耗,到今天多模態(tài)+Agent成為Token的絕對大頭,這些需求都可以被火山提供的服務(wù)滿足。

這一切迅猛增長的背后,火山引擎正在建立起一套它自己的Token經(jīng)濟(jì)學(xué)。

1

更多的Token就是代表更多智能

Token,是大模型處理信息的基本單位。無論是文字、圖像還是視頻,在模型中都在被轉(zhuǎn)換為Token序列進(jìn)行計算。本質(zhì)上,Token就是人們對AI的調(diào)用量。

但這背后存在一個問題:由于Token的計算方式基于長度,所以一篇文章和一段關(guān)鍵的代碼可能消耗相似的Token數(shù)量。那么,純粹的以Token數(shù)量來衡量,能否真實反映AI創(chuàng)造的價值?

火山引擎的算法人員在和我們的交流中回憶,其實曾經(jīng)火山內(nèi)部也有過類似爭論,但最終的結(jié)論是:Token量一定是對的指標(biāo)。


“AI要在實際場景產(chǎn)生價值,大家肯定要把它用起來,不管單位價值有大有小,但實際上一定是跟Token用量正相關(guān)的??赡苣阕罱K的那個關(guān)鍵決策對應(yīng)的只是‘是’或者‘否’,一個Token,但得出這個結(jié)論必然已經(jīng)用掉了大量Token。”

所以火山內(nèi)部最終明確,更多的Token就是代表更多智能。

而今天Token的增長,其內(nèi)在結(jié)構(gòu)也在悄然變化?;鹕揭嬷悄芩惴ㄘ?fù)責(zé)人吳迪提供了一個演化路徑:

“可能到了2027,2028年,一個普通的C端用戶從AI助手得到的很多的信號就是視覺的,你不會看到大段大段的文字了。那么,到時候LLM會以coding和agent的形式下沉到整個數(shù)字世界的底層運行邏輯里?!?/b>

換言之,Token會分層,LLM會向下成為底座,多模態(tài)的視覺、交互Token將在上層涌現(xiàn)。

這就會讓Token成為一個持續(xù)增長的指標(biāo),也是一個有效指標(biāo)。吳迪預(yù)測,到2030年,國內(nèi)市場的Token消耗量將是現(xiàn)在的百倍以上。屆時,衡量企業(yè)智能化程度的核心指標(biāo),將從其擁有的GPU數(shù)量轉(zhuǎn)變?yōu)橄牡腡oken總量,因為它是唯一能同時穿透“模型能力、使用頻率和真實需求”的統(tǒng)一指標(biāo)。

1

云設(shè)施必須以模型為中心重構(gòu)

更多Token意味更多智能,那么如何讓企業(yè)客戶更好生成它們需要的Token,就是火山作為從字節(jié)內(nèi)部走出的“AI云原生”基礎(chǔ)設(shè)施的任務(wù)。

過往云計算所習(xí)慣的一整套體系也因此出現(xiàn)“不適”,它更多是一個圍繞算力設(shè)計的體系,而火山認(rèn)為新的需求注定是圍繞模型的。

“傳統(tǒng) IaaS、PaaS、SaaS分層規(guī)劃的IT架構(gòu)不再有效,以模型為中心的AI云原生架構(gòu)正在形成?!弊T待說。


此次的一整套體系也由此誕生。

火山推出了“推理代工”,企業(yè)可將訓(xùn)練好的模型托管至火山,按實際Token消耗付費,無需自建推理集群;

Agent開發(fā)套件(ADK) 全面升級,支持動態(tài)運行時、多會話共享、強身份傳遞與內(nèi)置工具鏈;

智能端點(Endpoint) 支持模型路由,可根據(jù)效果、成本等策略自動分流至豆包、DeepSeek、Kimi等多模型后端;

方舟平臺進(jìn)一步升級,支持客戶在自有場景中做RL 強化學(xué)習(xí)等的微調(diào)。

而且這一系列產(chǎn)品里的很多細(xì)節(jié),都體現(xiàn)出很多根本性差異。

例如,Agent開發(fā)套件(ADK) 的動態(tài)運行時設(shè)計,直接挑戰(zhàn)了行業(yè)慣例。AWS AgentCore為每個會話啟動一個獨立運行時,而火山采用多會話共享模式。

火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人田濤濤直言,這是一個行業(yè)慣性的問題,AgentCore為每個session起一個Runtime,過去可以,但進(jìn)入模型時代就太奢侈了,而火山對成本敏感,字節(jié)自己內(nèi)部就一直有不同的更AI原生的需求,因此本就有不同的設(shè)計,現(xiàn)在可以推廣給更多模型用戶。

在火山看來,人們最終會“躍過”對算力的關(guān)注,最終直接沖著模型而來。

“你很難想象五年后新的創(chuàng)業(yè)者還會去云上租GPU、開數(shù)據(jù)庫。到時候在他們創(chuàng)業(yè)的第一天,他們會直接向云服務(wù)商‘要Token’,直接要的就是調(diào)用模型和配套工具。”吳迪說。

“我們已經(jīng)把像Response API、分布式的KV Cache、良好的P/D分離、一大堆高品質(zhì)的內(nèi)置Tools組裝好了,等著你把你的一個齒輪裝上來,這輛車就能跑。”

火山還配套改進(jìn)了模型服務(wù)的定價模式,推出了一個“AI節(jié)省計劃”,讓企業(yè)達(dá)到模型使用成本的全局最優(yōu)解。

“客戶只需要為用了的Token付錢?!?/p>

1

模型訓(xùn)練和市場需求一桿子打通

現(xiàn)在我們可以來看看字節(jié)和火山今天已經(jīng)有了什么:

  • 最大規(guī)模的云計算需求:內(nèi)部支撐抖音等國民級產(chǎn)品帶來的規(guī)模效應(yīng)和成本優(yōu)勢。

  • 最多用戶的大模型產(chǎn)品:豆包。而且在火山的視角,它也是一個最大的Agent產(chǎn)品。

  • 第一的Token調(diào)用量:50萬億/天,且還在猛漲。

  • 以及支持著豆包app和抖音這種巨量真實需求的多模態(tài)和推理大一統(tǒng)的豆包大模型。

這種全棧系統(tǒng)能力是今天最重要AI玩家必備的能力,橫向?qū)Ρ?,可以把目前的玩家分為三種路線:

  1. OpenAI + 微軟路線:模型自己的,云設(shè)施是戰(zhàn)略伙伴的。

  2. 阿里云路線:開源模型長在自己云上,然后近期在強推產(chǎn)品。

  3. Google路線:全部自研,模型閉源,產(chǎn)品到研發(fā)直接全面打通。

這里面,字節(jié)的路線很像Google。

豆包就對應(yīng)著Gemini,一個大一統(tǒng)的多模態(tài)agent模型。Seedance 1.5緊跟Veo3,甚至超過了對方。這一切的技術(shù)基礎(chǔ)也和Google類似,都長在自己的以AI為核心的機(jī)器學(xué)習(xí)平臺和云服務(wù)上,然后這些“Gemini同款”和“豆包同款”細(xì)化成產(chǎn)品再提供給外界。

而尚未被太多關(guān)注到的另一個“相似”,則是對待模型技術(shù)的方式上。

Google在Gemini 3的“翻身仗”后分享了很多內(nèi)部復(fù)盤,其中最重要一個因素就是模型、研發(fā)、產(chǎn)品和需求的統(tǒng)一打通。而字節(jié)如何訓(xùn)練模型此前并未被外界了解,它與大多模型公司一個非常大的不同是,它把真實市場需求直接一桿子打通到了模型訓(xùn)練層面。

火山引擎作為模型對外統(tǒng)一的出口,也有自己的算法人員,他們和字節(jié)的模型部門Seed緊密合作,甚至是“混合辦公”和各種靈活的配合方式,而火山引擎團(tuán)隊所獲取到的市場需求情況,可以直接影響模型研發(fā)方向和決策。

火山的模型策略團(tuán)隊會把市場上的需求反饋收集和抽象出來,直接影響到模型的重要功能和研發(fā)方向。

這都直接體現(xiàn)在豆包大模型的身上:

豆包之所以是一個大一統(tǒng)的模型,除了技術(shù)路線的選擇,也是從客戶體驗出發(fā):火山的客戶們認(rèn)為模型版本太多了,甚至字節(jié)內(nèi)部的“用戶”都搞不清楚各方面的區(qū)別,所以這個模型必須all in one來降低選擇成本。

字節(jié)認(rèn)為,今天訓(xùn)練模型最重要的是評估體系,而它絕對不應(yīng)該只是公開的benchmark,必須用真實業(yè)務(wù)價值來衡量模型能力。字節(jié)內(nèi)部已經(jīng)為B端建設(shè)了大量benchmark,模型開發(fā)成果必須真正符合實際的經(jīng)濟(jì)價值要求。

于是Seedance會在模型層面增加一個Draft樣片的能力,讓用戶不是抽卡,而是提前做預(yù)覽判斷;豆包模型在建設(shè)工具調(diào)用能力之外,直接在配套API中就配套做了許多built in的工具。128k上下文這種看起來能用來炫技但事實上實際需求并不高的能力,就會被去掉。

“在25年,有超過100萬家企業(yè)和個人使用了火山引擎的大模型服務(wù),覆蓋了100多個行業(yè),我們也對他們在火山方舟上的用量進(jìn)行了匿名統(tǒng)計,我們發(fā)現(xiàn),有超過100家企業(yè)在火山引擎累計Tokens使用量超過了1萬億?!弊T待在發(fā)布會上說。

這可能是比市場份額增長更值得玩味的一組數(shù)據(jù)。 它最能體現(xiàn)字節(jié)這種用需求指引模型發(fā)展的方式所帶來的收益。


所以,如果我們來拆解一下,字節(jié)的Token經(jīng)濟(jì)學(xué)就是:

1. 越多的Token意味越高智能

Token是智能的度量衡,其增長與結(jié)構(gòu)變化指引技術(shù)演進(jìn)。

2. 服務(wù)AI的云必須以模型為中心重構(gòu)

傳統(tǒng)云廠商的慣性已經(jīng)太大,而火山服務(wù)的最大客戶就是字節(jié)自己,字節(jié)就是一個長在AI和模型上的公司,火山解決的一直是AI的需求,現(xiàn)在這些需求變成外界的廣泛需求,它的技術(shù)思路就可以用來重構(gòu)整個云行業(yè)的方案。

3. Agent的普及會讓Token從原材料變?yōu)楦呒壍闹悄軉卧?,進(jìn)而帶來更大價值

譚待曾經(jīng)形容,目前基于Token的商業(yè)模式還很原始,而今天他認(rèn)為,隨著Agent的進(jìn)步和在企業(yè)里的普及,Token最終會走出今天“原材料”的定位。

Agent 可將模型串聯(lián),云平臺和中間件進(jìn)一步把Tokens組裝成Agents,并實現(xiàn)Agent和現(xiàn)有工作流、Agent和Agent之間的智能互通,以 API 或完整 Agent 的方式提供服務(wù),從更高抽象層次創(chuàng)造價值。

“今天討論Token,是從底層操作系統(tǒng)角度看,是在 IT 預(yù)算環(huán)節(jié)考慮;而抽象成 Agent 后,可從 BPO (業(yè)務(wù)流程外包)角度看待,那么它就是在擴(kuò)大整個市場的規(guī)模了?!弊T待說。

“人們常說的10萬億Agent市場,核心就是這個邏輯?!?/p>


點個愛心,再走 吧

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
故事:大清真正的第一罪人,既不是吳三桂,也不是鰲拜,其實是他

故事:大清真正的第一罪人,既不是吳三桂,也不是鰲拜,其實是他

卡西莫多的故事
2025-12-23 10:39:16
烏克蘭最美體操冠軍,放棄國籍做中國媳婦,37歲生二胎仍似少女

烏克蘭最美體操冠軍,放棄國籍做中國媳婦,37歲生二胎仍似少女

相思賦予誰a
2025-12-10 02:34:18
1958年,毛主席視察濟(jì)南,見到長征時警衛(wèi)員道:小鬼,你官不小嘛

1958年,毛主席視察濟(jì)南,見到長征時警衛(wèi)員道:小鬼,你官不小嘛

云霄紀(jì)史觀
2025-12-25 01:31:06
兩個拼車的人竟然親上了!盤點生活中那些有趣又尷尬的經(jīng)歷

兩個拼車的人竟然親上了!盤點生活中那些有趣又尷尬的經(jīng)歷

夜深愛雜談
2025-12-19 17:11:55
陳赫前妻許婧和匈牙利老公在沙特慶生,39 歲身材超棒,太吸睛。

陳赫前妻許婧和匈牙利老公在沙特慶生,39 歲身材超棒,太吸睛。

鄉(xiāng)野小珥
2025-12-23 05:38:57
2026三九時間表出爐!最冷18天鎖定,春節(jié)穿啥看這篇

2026三九時間表出爐!最冷18天鎖定,春節(jié)穿啥看這篇

阿纂看事
2025-12-24 09:48:36
美日對中國最恐懼的是海南封關(guān),如果成功,推廣全國就天下無敵了

美日對中國最恐懼的是海南封關(guān),如果成功,推廣全國就天下無敵了

我心縱橫天地間
2025-12-24 16:47:33
雷軍急推YU9被質(zhì)疑,網(wǎng)友:中年人怎敢把全家托付給小米!

雷軍急推YU9被質(zhì)疑,網(wǎng)友:中年人怎敢把全家托付給小米!

熱點菌本君
2025-12-23 19:06:18
曝泰軍端掉了柬埔寨“人體器官”交易點,無數(shù)中國人拍手叫好

曝泰軍端掉了柬埔寨“人體器官”交易點,無數(shù)中國人拍手叫好

胡嚴(yán)亂語
2025-12-22 10:00:02
大狂歡!集體漲停!剛剛,央行,利好來了!

大狂歡!集體漲停!剛剛,央行,利好來了!

中國基金報
2025-12-24 16:22:14
中國網(wǎng)貸公司在印度幾乎全軍覆沒,違約率最高達(dá)80%!

中國網(wǎng)貸公司在印度幾乎全軍覆沒,違約率最高達(dá)80%!

胡華成
2025-12-24 16:47:03
黃曉明帶兒子和媽媽包餃子,摘了假發(fā)套發(fā)量很藝術(shù),兒子很像楊穎

黃曉明帶兒子和媽媽包餃子,摘了假發(fā)套發(fā)量很藝術(shù),兒子很像楊穎

笑飲孤鴻非
2025-12-24 01:09:08
廣東臺的衰敗:從“萬人空巷”到“無人問津”,被誰奪走了靈魂

廣東臺的衰敗:從“萬人空巷”到“無人問津”,被誰奪走了靈魂

阿訊說天下
2025-12-24 17:14:51
泰國防長不點名批評:有些國家聲稱保持中立,實際上在幫柬埔寨

泰國防長不點名批評:有些國家聲稱保持中立,實際上在幫柬埔寨

觀星賞月
2025-12-24 12:37:23
楊瀚森總得分超河村!亞洲排名第12位,前十是誰?姚明9247分第三

楊瀚森總得分超河村!亞洲排名第12位,前十是誰?姚明9247分第三

你的籃球頻道
2025-12-24 14:57:18
女子賣淫每天接待30多位顧客,被捕后:我有夢想有什么錯

女子賣淫每天接待30多位顧客,被捕后:我有夢想有什么錯

罪案洞察者
2025-06-03 11:41:47
45歲董潔天安門騎行,穿1萬7羽絨服在大街吃肉串,86斤體重挺能吃

45歲董潔天安門騎行,穿1萬7羽絨服在大街吃肉串,86斤體重挺能吃

銀河史記
2025-12-24 18:27:42
齊達(dá)內(nèi)認(rèn)證!唯一能與皇馬平級的俱樂部,不是巴薩尤文

齊達(dá)內(nèi)認(rèn)證!唯一能與皇馬平級的俱樂部,不是巴薩尤文

瀾歸序
2025-12-25 01:57:21
索尼獨供時代終結(jié)!三星為iPhone 18供應(yīng)影像傳感器

索尼獨供時代終結(jié)!三星為iPhone 18供應(yīng)影像傳感器

快科技
2025-12-25 07:28:22
離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

離譜!楊書記為何敢直接拿走博物館的瓷花瓶?

仕道
2025-12-22 09:20:15
2025-12-25 09:44:49
硅星人 incentive-icons
硅星人
硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
2737文章數(shù) 10422關(guān)注度
往期回顧 全部

科技要聞

老板監(jiān)視員工微信只需300元

頭條要聞

路透社稱中國造出EUV光刻機(jī) "手搓"EUV光刻機(jī)難點披露

頭條要聞

路透社稱中國造出EUV光刻機(jī) "手搓"EUV光刻機(jī)難點披露

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經(jīng)要聞

美國未來18個月不對中國芯片加額外關(guān)稅

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

教育
旅游
親子
游戲
家居

教育要聞

2026年高考難度會下降嗎?了解高考的本質(zhì)和社會功能

旅游要聞

【圖集】快來看,觀山湖公園的“小精靈”

親子要聞

小號圣誕老人+麋鹿真的好可愛!

日本玩家Switch嚴(yán)重鼓大包仍能游玩 這還能用?

家居要聞

法式大平層 智能家居添彩

無障礙瀏覽 進(jìn)入關(guān)懷版