国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

【解讀】周濟 牛站奎:從電價優(yōu)勢到低成本詞元(Token)出海的敘事路徑成立嗎?

0
分享至



算力出海其實是“境外數(shù)據(jù)入關”,是境外數(shù)據(jù)進入中國進行“加工”之后再出國,還需要相關的政策配合。

本文作者系盤古智庫高級研究員周濟、盤古智庫高級研究員牛站奎,文章首發(fā)于“鈦媒體”。

本文大約2300字,讀完約5分鐘。

當前,市場上流行一種極度簡化的商業(yè)敘事:將中國豐富的綠電資源視為人工智能時代的“新煤礦”。其基本邏輯可以表述為:利用西部低至0.3 元每度的電力優(yōu)勢驅動大規(guī)模智算中心,通過算力芯片將電力轉化為可交易的詞元,再利用互聯(lián)網(wǎng)的零物流成本特征,將這些“數(shù)字產(chǎn)品”賣向全球。這一過程被形象地稱為“電力變算力,算力變詞元,詞元換美金”。但是,這個敘事在現(xiàn)實中是不是真的成立,還需要進一步探討的。

讓我們從最基礎的概念開始復盤,什么是詞元?詞元是大語言模型(LLM)處理信息的最小神經(jīng)元輸入單位。在物理層面,大模型無法直接讀懂自然語言的文本流,必須通過分詞器(Tokenizer)將文本映射為離散的數(shù)字序列。每一個詞元在模型內(nèi)部都對應一個高維空間中的向量(Embedding)。通俗的說,詞元不是字,也不是詞,而是模型進行矩陣運算時的“最小步長”。所以,他可以作為計算任務的計量單位,也就會被進一步的當成消耗算力的計價單位。

但是,詞元的切分,是非?!耙蛉硕悺钡氖虑?,每個模型會有自己的切分算法。處理同樣的1000 字中文報告,有些模型可能只需要1200 個詞元,而有些可能需要1800 個。這種切分方式的差異,直接導致了下游計算量的基數(shù)不同。所以不同模型的詞元的“含金量”在分詞階段就已經(jīng)產(chǎn)生了分化。

進一步看,模型處理詞元的過程是一個復雜的“自回歸”推理。當用戶輸入一個詞元序列時,模型會將其映射到多層Transformer架構中。每一層都包含多頭注意力機制(Multi-Head Attention)和前饋神經(jīng)網(wǎng)絡(FFN)。詞元向量都要與巨大的權重矩陣進行點積運算。在生成階段,每產(chǎn)生一個新的詞元,模型都要對之前所有的上下文詞元進行一次完整的前向傳播計算。這意味著,隨著對話長度的增加,計算壓力不是線性增加的,而是呈現(xiàn)出明顯的資源占用波動。這種“邏輯推演”的本質決定了,詞元的產(chǎn)出不是流水線上的物理組裝,而是一種高強度的數(shù)學模擬。在學術界和工程界,有一個公認的近似估算:生成(或處理)1 個 詞元所需的浮點運算次數(shù)約是2 倍的模型參數(shù)量。以一個 70B 參數(shù)的模型為例,每處理一個詞元需要硬件執(zhí)行1400 億次浮點運算。一次1000個詞元的典型對話,背后是140 萬億次的物理計算。在 Transformer 架構中,注意力機制的計算量與上下文長度的平方成正比(雖然 2026 年已有大量線性注意力技術的應用,但資源占用依然顯著)。這意味著處理“長文本”中的 1000 個 詞元,其成本遠高于處理“短文本”中的 1000 個詞元。太復雜的原理不是本文要探討的內(nèi)容,但是核心是模型對詞元的處理“辦法”,和不同任務類型,都決定了不同的計算次數(shù)要求,也決定著后期的實際消耗。

那么,詞元的成本應該怎么進行估計呢?在不考慮:第一、基建成本;第二、模型能力冗余的情況下,我們將單位詞元的基礎價格拆解為一個完整數(shù)據(jù)推導機制:


從上述推導中可以看出,詞元(Token)的實際成本是高度依賴于模型能力和硬件成本的。一個高效率的模型,不但會讓用戶覺得“更聰明”,同時也能極大的節(jié)約處理任務的時長。對于采用MoE(混合專家模型)架構的模型,其單位詞元能耗得到了革命性的下降。因為在推理時,模型僅激活5%-10% 的專家參數(shù)。這意味著,算法的進步直接導致了“電→詞元”轉化率的 5-10 倍提升。這種軟件側的效率提升,其影響力遠大于電價的降低。同樣的變化,還在硬件中,不考慮硬件進步對模型支撐能力的飛躍,單獨計算單位價格實際算力的提升,也將極大的降低硬件折舊成本,效果大于電費的降低。還有一個潛在的“金礦”,就是對于并行算力服務的協(xié)同管理優(yōu)化,也將降低詞元的成本。

按照一些智算中心的實際運行數(shù)據(jù)顯示,全生命周期的電費成本大約占到20%左右,而隨著技術的進步,全系統(tǒng)PUE系數(shù)會降低,單位硬件成本升高但是算力提升更快,所以這一比例還是在逐步降低的,按照上述公式折合到詞元的成本中,電價占比會進一步降低。所以,本質上低電價的敘事是在一個占比不到五分之一的成本項上進行優(yōu)化,但是如果算法架構落后或者芯片效率偏低,乃至并行優(yōu)化不到位,電價優(yōu)勢會被瞬間抹平。綜合來看,詞元經(jīng)濟絕不是電力的直接產(chǎn)物,它是由模型、芯片、集群工程、以及能源稟賦共同作用下的復雜結果。甚至,電價的權重在先進模型架構中正不斷被算法優(yōu)化和硬件折舊所稀釋。

詞元作為一個非標品,在商業(yè)競爭中的銷售定價邏輯應該遵循的是“效果導向定價”而非“成本加成定價”。在未來,一個“好用的”模型的詞元價格完全可能是一個邏輯混亂的模型或者難以處理復雜問題模型的價格的十倍。而這個價格差異的核心是模型自身的“智力溢價”,是對研發(fā)成本的回收和合理利潤的賺取。

但是,電價的優(yōu)勢就那么不重要嗎?當然不是。現(xiàn)在整個人工智能的生態(tài)系統(tǒng)的進步速度都很快,技術的擴算也不慢。通過上文對于詞元定價的推導分析,可以看出除了電力系統(tǒng)的建設或者說電價的變化,其他要素都是相對的“快變量”,而電價是相對的“慢變量”。同樣的市場競爭者,如果模型研發(fā)水平差異不大,都能夠買到(或生產(chǎn))水平差不多的芯片呢?從成本的角度來說,電價就會成為一個最重要的可變因素,而低電價背后的系統(tǒng)性優(yōu)勢不是一些競爭者短期內(nèi)能夠趕超的。這個應該說是算力出海的核心優(yōu)勢,不過要明確的概念是,算力出海其實是“境外數(shù)據(jù)入關”,是境外數(shù)據(jù)進入中國進行“加工”之后再出國,還需要相關的政策配合。綜合來看,詞元出海的優(yōu)勢還是明顯的,但是需要的整個軟件、硬件的系統(tǒng)性進步,是整個服務能力和政策開放程度的提升,而不是單純的強調(diào)電價方面的優(yōu)勢?!?/p>

文章首發(fā)于“鈦媒體”

圖文編輯:張洵

責任編輯:劉菁波

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為什么身邊用蘋果手機的人越來越多了?4個原因很真實

為什么身邊用蘋果手機的人越來越多了?4個原因很真實

小蜜情感說
2026-05-02 00:32:12
小米大型7座SUV曝光,設計思路太超前!

小米大型7座SUV曝光,設計思路太超前!

米粒說車唯一呀
2026-05-04 22:09:26
五一票房創(chuàng)11年最差,年輕人為啥寧刷短劇也不進影院?

五一票房創(chuàng)11年最差,年輕人為啥寧刷短劇也不進影院?

老特有話說
2026-05-04 15:44:13
1979年霍英東投資內(nèi)地,每次進京都要看裸女壁畫:畫在,我就放心

1979年霍英東投資內(nèi)地,每次進京都要看裸女壁畫:畫在,我就放心

微野談寫作
2026-05-03 12:20:12
鄭麗文表態(tài)季麟連“失言”已翻篇,趙少康:沒那么好翻

鄭麗文表態(tài)季麟連“失言”已翻篇,趙少康:沒那么好翻

郭茂辰海峽傳真
2026-05-04 21:43:01
美軍稱懸掛美國國旗商船通過霍爾木茲海峽,原油直線回落,黃金、白銀飄綠

美軍稱懸掛美國國旗商船通過霍爾木茲海峽,原油直線回落,黃金、白銀飄綠

新浪財經(jīng)
2026-05-04 22:15:42
五一越南河內(nèi)最震撼一幕:萬人排隊探訪“人間地獄”,韓國游客驚呼:太可怕了!

五一越南河內(nèi)最震撼一幕:萬人排隊探訪“人間地獄”,韓國游客驚呼:太可怕了!

緬甸中文網(wǎng)
2026-05-02 13:52:43
兩個朋友同時患癌,一個花50萬治療6個月去世,一個沒治療活了9年

兩個朋友同時患癌,一個花50萬治療6個月去世,一個沒治療活了9年

千秋文化
2026-04-29 19:11:26
消化科主任:胃癌最危險信號,不是胃疼,而是頻繁出現(xiàn)這4種異常

消化科主任:胃癌最危險信號,不是胃疼,而是頻繁出現(xiàn)這4種異常

路醫(yī)生健康科普
2026-05-04 16:45:03
中方在《開羅宣言》發(fā)表地埃及開羅米娜宮飯店建立紀念碑

中方在《開羅宣言》發(fā)表地埃及開羅米娜宮飯店建立紀念碑

澎湃新聞
2026-05-03 19:59:04
1:8局面出現(xiàn),巴拿馬對華喊話,中方斬釘截鐵,不能開危險先例

1:8局面出現(xiàn),巴拿馬對華喊話,中方斬釘截鐵,不能開危險先例

劉襈說體壇
2026-05-04 20:02:28
張雪機車發(fā)生故障退賽!車手德比斯回應:很抱歉 本來有機會兩連冠

張雪機車發(fā)生故障退賽!車手德比斯回應:很抱歉 本來有機會兩連冠

快科技
2026-05-04 11:31:04
2026養(yǎng)老金上漲“暫停鍵”已按下?真相:錢已到賬,信號已出

2026養(yǎng)老金上漲“暫停鍵”已按下?真相:錢已到賬,信號已出

陳恧侃故事
2026-05-03 16:16:17
太離譜!華西醫(yī)院五一放假引爭議,被罵想休息別當醫(yī)生,網(wǎng)友吵翻

太離譜!華西醫(yī)院五一放假引爭議,被罵想休息別當醫(yī)生,網(wǎng)友吵翻

譚談社會
2026-05-02 14:27:21
炸穿臺灣政壇!蔣友松強行遷走兩蔣懸棺,半世紀漂泊終要歸鄉(xiāng)

炸穿臺灣政壇!蔣友松強行遷走兩蔣懸棺,半世紀漂泊終要歸鄉(xiāng)

陳漎侃故事
2026-04-14 17:28:18
黃圣依去參加同學聚會,跟老同學們站一起,簡直像活成了兩代人

黃圣依去參加同學聚會,跟老同學們站一起,簡直像活成了兩代人

白宸侃片
2026-05-03 09:38:48
桂綸鎂連續(xù)三天爬熊野古道,穿一整身山之道,她太瘦了像50多歲!

桂綸鎂連續(xù)三天爬熊野古道,穿一整身山之道,她太瘦了像50多歲!

笑談歷史阿晡
2026-05-04 09:15:53
太可怕!結婚三年無孩,妻子失業(yè)躺平3個月,IT男發(fā)帖想離婚止損

太可怕!結婚三年無孩,妻子失業(yè)躺平3個月,IT男發(fā)帖想離婚止損

火山詩話
2026-05-04 06:36:10
醫(yī)生強調(diào):糖尿病前期不是消瘦,而是經(jīng)常出現(xiàn)這4個癥狀,別忽視

醫(yī)生強調(diào):糖尿病前期不是消瘦,而是經(jīng)常出現(xiàn)這4個癥狀,別忽視

芹姐說生活
2026-05-04 16:15:42
ESPN:姆巴佩和維尼修斯缺乏默契,類似當年的梅西和格列茲曼

ESPN:姆巴佩和維尼修斯缺乏默契,類似當年的梅西和格列茲曼

懂球帝
2026-05-04 20:53:18
2026-05-04 22:56:49
盤古智庫 incentive-icons
盤古智庫
盤古智庫官方賬號
5747文章數(shù) 9910關注度
往期回顧 全部

科技要聞

在中國市場搞「付費訂閱」,豆包咋想的?

頭條要聞

上科大39歲博導王晨輝為救孩子去世 同學發(fā)聲

頭條要聞

上科大39歲博導王晨輝為救孩子去世 同學發(fā)聲

體育要聞

騎士破猛龍:加雷特·阿倫的活力

娛樂要聞

張敬軒還是站上了英皇25周年舞臺

財經(jīng)要聞

魔幻的韓國股市,父母給嬰兒開戶買股票

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

時尚
本地
藝術
房產(chǎn)
家居

女人不管年紀多大,衣柜里都要準備幾件襯衫,百搭耐穿又簡約

本地新聞

用青花瓷的方式,打開西溪濕地

藝術要聞

火災后第17年,TVCC電視文化中心正式啟用

房產(chǎn)要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

家居要聞

靈動實用 生活藝術場

無障礙瀏覽 進入關懷版