国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從電價優(yōu)勢到低成本詞元(Token)出海的敘事路徑成立嗎?

0
分享至

文 | 盤古智庫

當(dāng)前,市場上流行一種極度簡化的商業(yè)敘事:將中國豐富的綠電資源視為人工智能時代的“新煤礦”。其基本邏輯可以表述為:利用西部低至 0.3 元每度的電力優(yōu)勢驅(qū)動大規(guī)模智算中心,通過算力芯片將電力轉(zhuǎn)化為可交易的詞元,再利用互聯(lián)網(wǎng)的零物流成本特征,將這些“數(shù)字產(chǎn)品”賣向全球。這一過程被形象地稱為“電力變算力,算力變詞元,詞元換美金”。但是,這個敘事在現(xiàn)實(shí)中是不是真的成立,還需要進(jìn)一步探討的。

讓我們從最基礎(chǔ)的概念開始復(fù)盤,什么是詞元?詞元是大語言模型(LLM)處理信息的最小神經(jīng)元輸入單位。在物理層面,大模型無法直接讀懂自然語言的文本流,必須通過分詞器(Tokenizer)將文本映射為離散的數(shù)字序列。每一個詞元在模型內(nèi)部都對應(yīng)一個高維空間中的向量(Embedding)。通俗的說,詞元不是字,也不是詞,而是模型進(jìn)行矩陣運(yùn)算時的“最小步長”。所以,他可以作為計算任務(wù)的計量單位,也就會被進(jìn)一步的當(dāng)成消耗算力的計價單位。

但是,詞元的切分,是非?!耙蛉硕悺钡氖虑?,每個模型會有自己的切分算法。處理同樣的 1000 字中文報告,有些模型可能只需要 1200 個詞元,而有些可能需要 1800 個。這種切分方式的差異,直接導(dǎo)致了下游計算量的基數(shù)不同。所以不同模型的詞元的“含金量”在分詞階段就已經(jīng)產(chǎn)生了分化。

進(jìn)一步看,模型處理詞元的過程是一個復(fù)雜的“自回歸”推理。當(dāng)用戶輸入一個詞元序列時,模型會將其映射到多層 Transformer架構(gòu)中。每一層都包含多頭注意力機(jī)制(Multi-Head Attention)和前饋神經(jīng)網(wǎng)絡(luò)(FFN)。詞元向量都要與巨大的權(quán)重矩陣進(jìn)行點(diǎn)積運(yùn)算。在生成階段,每產(chǎn)生一個新的詞元,模型都要對之前所有的上下文詞元進(jìn)行一次完整的前向傳播計算。

這意味著,隨著對話長度的增加,計算壓力不是線性增加的,而是呈現(xiàn)出明顯的資源占用波動。這種“邏輯推演”的本質(zhì)決定了,詞元的產(chǎn)出不是流水線上的物理組裝,而是一種高強(qiáng)度的數(shù)學(xué)模擬。在學(xué)術(shù)界和工程界,有一個公認(rèn)的近似估算:生成(或處理) 1 個 詞元所需的浮點(diǎn)運(yùn)算次數(shù)約是2 倍的模型參數(shù)量。以一個 70B 參數(shù)的模型為例,每處理一個詞元需要硬件執(zhí)行1400 億次浮點(diǎn)運(yùn)算。一次1000個詞元的典型對話,背后是 140 萬億次的物理計算。

在 Transformer 架構(gòu)中,注意力機(jī)制的計算量與上下文長度的平方成正比(雖然 2026 年已有大量線性注意力技術(shù)的應(yīng)用,但資源占用依然顯著)。這意味著處理“長文本”中的 1000 個 詞元,其成本遠(yuǎn)高于處理“短文本”中的 1000 個詞元。太復(fù)雜的原理不是本文要探討的內(nèi)容,但是核心是模型對詞元的處理“辦法”,和不同任務(wù)類型,都決定了不同的計算次數(shù)要求,也決定著后期的實(shí)際消耗。

那么,詞元的成本應(yīng)該怎么進(jìn)行估計呢?在不考慮:第一、基建成本;第二、模型能力冗余的情況下,我們將單位詞元的基礎(chǔ)價格拆解為一個完整數(shù)據(jù)推導(dǎo)機(jī)制:


從上述推導(dǎo)中可以看出,詞元(Token)的實(shí)際成本是高度依賴于模型能力和硬件成本的。一個高效率的模型,不但會讓用戶覺得“更聰明”,同時也能極大的節(jié)約處理任務(wù)的時長。對于采用 MoE(混合專家模型)架構(gòu)的模型,其單位詞元能耗得到了革命性的下降。因為在推理時,模型僅激活 5%-10% 的專家參數(shù)。這意味著,算法的進(jìn)步直接導(dǎo)致了“電→詞元”轉(zhuǎn)化率的 5-10 倍提升。這種軟件側(cè)的效率提升,其影響力遠(yuǎn)大于電價的降低。同樣的變化,還在硬件中,不考慮硬件進(jìn)步對模型支撐能力的飛躍,單獨(dú)計算單位價格實(shí)際算力的提升,也將極大的降低硬件折舊成本,效果大于電費(fèi)的降低。還有一個潛在的“金礦”,就是對于并行算力服務(wù)的協(xié)同管理優(yōu)化,也將降低詞元的成本。

按照一些智算中心的實(shí)際運(yùn)行數(shù)據(jù)顯示,全生命周期的電費(fèi)成本大約占到20%左右,而隨著技術(shù)的進(jìn)步,全系統(tǒng)PUE系數(shù)會降低,單位硬件成本升高但是算力提升更快,所以這一比例還是在逐步降低的,按照上述公式折合到詞元的成本中,電價占比會進(jìn)一步降低。所以,本質(zhì)上低電價的敘事是在一個占比不到五分之一的成本項上進(jìn)行優(yōu)化,但是如果算法架構(gòu)落后或者芯片效率偏低,乃至并行優(yōu)化不到位,電價優(yōu)勢會被瞬間抹平。綜合來看,詞元經(jīng)濟(jì)絕不是電力的直接產(chǎn)物,它是由模型、芯片、集群工程、以及能源稟賦共同作用下的復(fù)雜結(jié)果。甚至,電價的權(quán)重在先進(jìn)模型架構(gòu)中正不斷被算法優(yōu)化和硬件折舊所稀釋。

詞元作為一個非標(biāo)品,在商業(yè)競爭中的銷售定價邏輯應(yīng)該遵循的是“效果導(dǎo)向定價”而非“成本加成定價”。在未來,一個“好用的”模型的詞元價格完全可能是一個邏輯混亂的模型或者難以處理復(fù)雜問題模型的價格的十倍。而這個價格差異的核心是模型自身的“智力溢價”,是對研發(fā)成本的回收和合理利潤的賺取。

但是,電價的優(yōu)勢就那么不重要嗎?當(dāng)然不是?,F(xiàn)在整個人工智能的生態(tài)系統(tǒng)的進(jìn)步速度都很快,技術(shù)的擴(kuò)算也不慢。通過上文對于詞元定價的推導(dǎo)分析,可以看出除了電力系統(tǒng)的建設(shè)或者說電價的變化,其他要素都是相對的“快變量”,而電價是相對的“慢變量”。同樣的市場競爭者,如果模型研發(fā)水平差異不大,都能夠買到(或生產(chǎn))水平差不多的芯片呢?從成本的角度來說,電價就會成為一個最重要的可變因素,而低電價背后的系統(tǒng)性優(yōu)勢不是一些競爭者短期內(nèi)能夠趕超的。這個應(yīng)該說是算力出海的核心優(yōu)勢,不過要明確的概念是,算力出海其實(shí)是“境外數(shù)據(jù)入關(guān)”,是境外數(shù)據(jù)進(jìn)入中國進(jìn)行“加工”之后再出國,還需要相關(guān)的政策配合。綜合來看,詞元出海的優(yōu)勢還是明顯的,但是需要的整個軟件、硬件的系統(tǒng)性進(jìn)步,是整個服務(wù)能力和政策開放程度的提升,而不是單純的強(qiáng)調(diào)電價方面的優(yōu)勢。

(本文作者系盤古智庫高級研究員周濟(jì)、盤古智庫高級研究員牛站奎。)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗為什么不啟用內(nèi)賈德?

伊朗為什么不啟用內(nèi)賈德?

可樂談情感
2026-03-29 19:57:09
伊朗軍方:美方唯一能聽懂的語言就是武力 將“殲滅”來犯美軍

伊朗軍方:美方唯一能聽懂的語言就是武力 將“殲滅”來犯美軍

新京報
2026-03-29 19:38:13
浪姐7先導(dǎo)片塞32位姐姐,鏡頭多少不重要,有煙火氣才能打動觀眾

浪姐7先導(dǎo)片塞32位姐姐,鏡頭多少不重要,有煙火氣才能打動觀眾

子夜觀綜記
2026-03-29 20:55:10
梁詠琪和雙胞胎弟弟一起過50歲生日,曬兩人童年和50歲對比照,網(wǎng)友:這么好看的臉,他家居然有倆

梁詠琪和雙胞胎弟弟一起過50歲生日,曬兩人童年和50歲對比照,網(wǎng)友:這么好看的臉,他家居然有倆

臺州交通廣播
2026-03-29 10:07:08
一人睡遍整個娛樂圈?司曉迪打響了2026年第一炮

一人睡遍整個娛樂圈?司曉迪打響了2026年第一炮

閱毒君
2026-01-05 07:05:06
收官戰(zhàn)中打出賽季最強(qiáng)表現(xiàn)!湖人真的不考慮將他進(jìn)行轉(zhuǎn)正嗎?

收官戰(zhàn)中打出賽季最強(qiáng)表現(xiàn)!湖人真的不考慮將他進(jìn)行轉(zhuǎn)正嗎?

稻谷與小麥
2026-03-30 00:42:20
67歲王朔現(xiàn)狀:只能死在這兒了,女兒不讓死屋里,怕房子不好賣

67歲王朔現(xiàn)狀:只能死在這兒了,女兒不讓死屋里,怕房子不好賣

談史論天地
2026-03-27 17:05:03
印度發(fā)出最后警告:化肥不放行或致饑荒,14億人飯碗成危機(jī)

印度發(fā)出最后警告:化肥不放行或致饑荒,14億人飯碗成危機(jī)

阿傖說事
2026-03-29 17:44:45
為何女人甘愿做情人?揭開她們不為人知的選擇!

為何女人甘愿做情人?揭開她們不為人知的選擇!

特約前排觀眾
2026-03-30 00:15:03
單依純向李榮浩道歉

單依純向李榮浩道歉

都市快報橙柿互動
2026-03-29 16:29:58
美媒哀嘆,特朗普最愚蠢地方,就是把中美平起平坐的事實(shí)說了出來

美媒哀嘆,特朗普最愚蠢地方,就是把中美平起平坐的事實(shí)說了出來

真的好愛你
2026-03-29 04:34:21
“黃毛的爹,酗酒的媽”,上海三口之家火了,只有孩子看著不叛逆

“黃毛的爹,酗酒的媽”,上海三口之家火了,只有孩子看著不叛逆

妍妍教育日記
2026-03-29 07:40:03
香港新規(guī):拒絕解鎖手機(jī)判1年,3類人群最危險

香港新規(guī):拒絕解鎖手機(jī)判1年,3類人群最危險

全棧遛狗員
2026-03-28 11:45:59
雍正王朝穿幫鏡頭:康熙戴勞力士忍了,喬引娣穿球鞋真忍不了

雍正王朝穿幫鏡頭:康熙戴勞力士忍了,喬引娣穿球鞋真忍不了

杰絲聊古今
2026-03-29 07:16:55
聶公佐任廣東省委第十二巡視組組長

聶公佐任廣東省委第十二巡視組組長

汲古知新
2026-03-29 22:25:09
伊朗、胡塞武裝、黎巴嫩真主黨同步襲擊以色列,畫面曝光:胡塞武裝遠(yuǎn)程無人機(jī)侵入埃拉特上空,黎巴嫩真主黨導(dǎo)彈擊中以軍坦克并引發(fā)大火

伊朗、胡塞武裝、黎巴嫩真主黨同步襲擊以色列,畫面曝光:胡塞武裝遠(yuǎn)程無人機(jī)侵入埃拉特上空,黎巴嫩真主黨導(dǎo)彈擊中以軍坦克并引發(fā)大火

大象新聞
2026-03-29 12:45:17
多地出現(xiàn),緊急提醒!不要買、不要用!看到舉報

多地出現(xiàn),緊急提醒!不要買、不要用!看到舉報

新民晚報
2026-03-29 16:11:51
1951年,戴笠的兒子戴善武被執(zhí)行死刑,被槍斃的時候才36歲

1951年,戴笠的兒子戴善武被執(zhí)行死刑,被槍斃的時候才36歲

百年歷史老號
2026-03-28 20:32:38
張震岳收藏批評周杰倫新專輯的文章 網(wǎng)友:真的不好聽

張震岳收藏批評周杰倫新專輯的文章 網(wǎng)友:真的不好聽

可樂談情感
2026-03-29 20:07:16
網(wǎng)友分享細(xì)思恐極事件,呼吁大家相信直覺!

網(wǎng)友分享細(xì)思恐極事件,呼吁大家相信直覺!

特約前排觀眾
2026-03-23 00:10:06
2026-03-30 01:00:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財經(jīng)科技媒體
131496文章數(shù) 862029關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

中國警告美國:勿將"沖突戰(zhàn)亂"引入亞太地區(qū)

頭條要聞

中國警告美國:勿將"沖突戰(zhàn)亂"引入亞太地區(qū)

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

汪峰定律再現(xiàn)!李榮浩喊話單依純侵權(quán)

財經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

游戲
教育
親子
時尚
公開課

LCK傳奇選手被曝重磅丑聞?韓網(wǎng)爆料Ruler疑似逃稅遭調(diào)查!

教育要聞

建議給家長放春秋假,否則的話,學(xué)生放春秋假就失去意義

親子要聞

夏天來了,如何給小寶寶洗澡?具體步驟如下

來到1980的周也,好毛利蘭

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版