從Token到詞元，中國重塑全球AI產業(yè)生態(tài)

2026-04-11 19:02:57　來源: 廣東科技報

廣東舉報

分享至

日前，在國務院新聞辦公室的新聞發(fā)布會上，國家數(shù)據(jù)局局長劉烈宏正式宣布，AI領域核心術語“Token”的官方中文定名為“詞元”，并公布我國日均詞元調用量已突破140萬億，較2024年初增長超1400倍，較2025年底增長40%以上。這一里程碑式的定名與數(shù)據(jù)發(fā)布，標志著我國人工智能產業(yè)正從技術探索邁入規(guī)?；虡I(yè)落地的新紀元，詞元作為智能時代的“價值錨點”與“結算單位”，正重塑著全球AI產業(yè)生態(tài)。

從千億到百萬億：

中國AI駛入規(guī)?；鲩L快車道

如今，中國AI發(fā)展的“數(shù)字脈搏”正以詞元調用量的形式清晰跳動。今年3月以來，我國日均詞元（Token）調用量已超過140萬億，相比2024年初的1000億增長了1000多倍，相比2025年底的100萬億，3個月時間又增長了40%多。“日均詞元調用量的大量增加，充分表明中國的人工智能發(fā)展進入了快速增長階段?！眲⒘液瓯硎?，人工智能應用場景在不斷深化，從能對話到能決策執(zhí)行的智能體，中國人工智能產業(yè)的競爭力顯著增強，現(xiàn)在備受關注的Token出海，就是產業(yè)競爭力增強的一個標志。

據(jù)劉烈宏介紹，在各方共同努力下，我國高質量數(shù)據(jù)集的建設工作取得了階段性成效。截至2025年底，全國已建成的高質量數(shù)據(jù)集超過10萬個，總體量相當于中國國家圖書館數(shù)字資源總量的310倍。國家數(shù)據(jù)局將持續(xù)推進數(shù)據(jù)賦能人工智能創(chuàng)新發(fā)展，協(xié)同各方深入實施新一輪的高質量數(shù)據(jù)集建設行動計劃，以場景需求為牽引，加快推進先行先試的工作，打造技術可行、實用便捷、質量保障的AI-Ready（AI就緒度）高質量數(shù)據(jù)集，實現(xiàn)高質量數(shù)據(jù)集供給的量質提升。

解碼詞元：

AI大模型的“基本運算單元”與價值計量核心

究竟何為詞元？作為AI大模型處理信息的基本單位，我們以字為單位來讀書寫字，對于大模型，這個輸入輸出的單位就是Token。在AI的眼里，一個Token可能對應幾個漢字、單詞，也可能是一個標點、數(shù)字或者符號。它就像AI時代手機的流量一樣，每一個AI模型廠商都會提供自己的Token，并且以它的消耗量為單位向用戶收費。

無論是用戶的提問，還是AI生成的一段代碼，最終都要被拆解成Token來完成運算。例如火爆的“養(yǎng)龍蝦”（部署和使用本地AI智能體OpenClaw），想讓它變得更聰明，就得為大模型的服務付費，本質上就是在購買Token的使用量。

從技術本質來看，詞元是自然語言的數(shù)學化表達。一段文字、一個問題進入AI模型前，會先被“分詞器”拆解為若干詞元，拆分規(guī)則因模型分詞器設計而異：“朋友買了西瓜手機！”可能被拆分為“朋友”“買”“了”“西瓜”“手機”，而“Transformer”這類英文詞匯，可能被拆成“Trans”“former”。

這些拆分后的詞元，對人類而言是有意義的文字，對AI卻缺乏直觀認知。為了讓AI“理解”，大模型會先給每個Token分配一個數(shù)字編號，然后將這個編號轉化為一組數(shù)字坐標（向量）。這個坐標決定了AI如何“理解”這個詞。

更關鍵的是，AI對詞匯的理解并非固定不變，而是通過計算詞元坐標間的復雜關系實現(xiàn)動態(tài)解讀——比如“西瓜”，AI會根據(jù)上下文，將其坐標向“品牌”或“食物”相關方向調整，從而精準理解“西瓜手機”這類組合的含義。

總而言之，Token計量的，并不只是你看到的AI模型給出的答案，而是生成這個答案所需的全部計算資源。而進入以Openclaw（龍蝦）為代表的agent場景，這種Token的消耗會被指數(shù)級擴大。比如讓Openclaw替你干活，把“幫我整理一下文件夾”這句話甩給它之后，它可能需要先讀懂這個要求，然后拆解成十幾個子任務，每個子任務分別調用一次AI，每次調用都帶著完整的系統(tǒng)指令和上下文，必要的時候還要反復檢查有沒有做對、是否需要修正。這背后可能是幾十輪對話、幾萬個Token的連鎖消耗，這也是它看起來只干了點普通的活，但格外消耗Token的原因。

中國領跑全球：

詞元競爭背后的算力與產業(yè)優(yōu)勢

全球AI產業(yè)的競爭，正以詞元調用量為標尺展開。全球最大AI模型API聚合平臺OpenRouter最新數(shù)據(jù)顯示，截至3月15日，中國AI大模型的周調用量達到4.69萬億個Token，連續(xù)第二周超越美國。全球詞元調用量排名前三的位置，更是被中國模型占據(jù)。國產大模型MiniMax M2.5連續(xù)五周位居全球大模型調用量榜首，在公司總部的辦公區(qū)，產品研發(fā)人員展示了直觀的價格差距圖?！斑_到同樣能力水平的海外模型跟我們的相比，價格可能有十幾倍的差距?！?/p>

我們要知道，Token并不是憑空產生的，它是由高性能的GPU在消耗大量的電能，完成數(shù)千億次的推理運算后產生的數(shù)字資產。每生成一個Token都對應著真實的推理過程，也對應著真實的電力消耗和算力消耗。

而中國大模型公司之所以能夠把Token價格做得更低，主要原因有：第一是我們的電力優(yōu)勢。中國擁有更完善的電力基礎設施和技術體系，尤其是西部地區(qū)豐富的新能源綠電，正在與數(shù)據(jù)中心算力、樞紐加快耦合，把電直接轉化成AI時代的新型服務能力。第二是技術能力。近年來中國科技企業(yè)在推理芯片、模型架構和系統(tǒng)優(yōu)化上持續(xù)突破，這意味著面對同樣一個問題，中國的大模型往往可以用更少的算力、更短的時延、更高的能效，就把答案給算出來。有人說Token將是AI時代新的能源單位，中國電力、中國算力正在以一種全新的方式參與著全球的競爭。

詞元成產業(yè)“晴雨表”：

重構AI商業(yè)邏輯與產業(yè)生態(tài)

在人工智能時代，用戶輸入的每一個字，大模型生成的每一段話、識別的每一幅圖像，都在消耗詞元。國家數(shù)據(jù)局專家咨詢委員會委員張向宏介紹，日均超140萬億的詞元調用量，相當于1000萬億個中文詞匯，也相當于250個中國國家圖書館的資源量。

國家發(fā)展改革委國家信息中心人工智能處工程師蔡馳宇介紹，詞元日均調用量大幅增長，充分表明人工智能正加速從實驗室走向千行百業(yè)和千家萬戶，變成了實實在在的生產力工具，像水、電、網(wǎng)絡一樣，成為智能社會運轉的基礎資源。詞元的消耗量是人工智能產業(yè)發(fā)展的重要指標和“晴雨表”。

詞元的普及，更在重構人工智能產業(yè)的商業(yè)邏輯。圍繞詞元的調用、分發(fā)與結算，一套新的價值體系正在加速演進形成，并成為人工智能產業(yè)可能變現(xiàn)的重要路徑。蔡馳宇介紹，過去一家企業(yè)使用信息服務，需要購買信息軟件；現(xiàn)在一家企業(yè)使用信息服務，可直接調用大模型接口，用多少詞元，就付多少費用，以詞元消耗量的多少作為計費依據(jù)。這種按需付費的模式，大幅降低了企業(yè)的AI應用門檻，也讓AI產業(yè)的商業(yè)變現(xiàn)更具靈活性。

與此同時，專家表示，詞元消耗量增長也對電力資源提出了更高要求。今年的政府工作報告提出，實施算電協(xié)同等新基建工程。專家表示，算電協(xié)同的本質含義，就是要依托我國具有超前優(yōu)勢的綠電來發(fā)展算力產業(yè)和人工智能產業(yè)。

素材來源：央視新聞、央視財經(jīng)、科普中國

編輯：董敏煒

審核：馮海波劉肖勇

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機 / 數(shù)碼

房產 / 家居

從Token到詞元，中國重塑全球AI產業(yè)生態(tài)