国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從Token到詞元,中國重塑全球AI產業(yè)生態(tài)

0
分享至

日前,在國務院新聞辦公室的新聞發(fā)布會上,國家數(shù)據(jù)局局長劉烈宏正式宣布,AI領域核心術語“Token”的官方中文定名為“詞元”,并公布我國日均詞元調用量已突破140萬億,較2024年初增長超1400倍,較2025年底增長40%以上。這一里程碑式的定名與數(shù)據(jù)發(fā)布,標志著我國人工智能產業(yè)正從技術探索邁入規(guī)?;虡I(yè)落地的新紀元,詞元作為智能時代的“價值錨點”與“結算單位”,正重塑著全球AI產業(yè)生態(tài)。

01

從千億到百萬億:

中國AI駛入規(guī)?;鲩L快車道

如今,中國AI發(fā)展的“數(shù)字脈搏”正以詞元調用量的形式清晰跳動。今年3月以來,我國日均詞元(Token)調用量已超過140萬億,相比2024年初的1000億增長了1000多倍,相比2025年底的100萬億,3個月時間又增長了40%多。“日均詞元調用量的大量增加,充分表明中國的人工智能發(fā)展進入了快速增長階段?!眲⒘液瓯硎?,人工智能應用場景在不斷深化,從能對話到能決策執(zhí)行的智能體,中國人工智能產業(yè)的競爭力顯著增強,現(xiàn)在備受關注的Token出海,就是產業(yè)競爭力增強的一個標志。

據(jù)劉烈宏介紹,在各方共同努力下,我國高質量數(shù)據(jù)集的建設工作取得了階段性成效。截至2025年底,全國已建成的高質量數(shù)據(jù)集超過10萬個,總體量相當于中國國家圖書館數(shù)字資源總量的310倍。國家數(shù)據(jù)局將持續(xù)推進數(shù)據(jù)賦能人工智能創(chuàng)新發(fā)展,協(xié)同各方深入實施新一輪的高質量數(shù)據(jù)集建設行動計劃,以場景需求為牽引,加快推進先行先試的工作,打造技術可行、實用便捷、質量保障的AI-Ready(AI就緒度)高質量數(shù)據(jù)集,實現(xiàn)高質量數(shù)據(jù)集供給的量質提升。

02

解碼詞元:

AI大模型的“基本運算單元”與價值計量核心

究竟何為詞元?作為AI大模型處理信息的基本單位,我們以字為單位來讀書寫字,對于大模型,這個輸入輸出的單位就是Token。在AI的眼里,一個Token可能對應幾個漢字、單詞,也可能是一個標點、數(shù)字或者符號。它就像AI時代手機的流量一樣,每一個AI模型廠商都會提供自己的Token,并且以它的消耗量為單位向用戶收費。

無論是用戶的提問,還是AI生成的一段代碼,最終都要被拆解成Token來完成運算。例如火爆的“養(yǎng)龍蝦”(部署和使用本地AI智能體OpenClaw),想讓它變得更聰明,就得為大模型的服務付費,本質上就是在購買Token的使用量。

從技術本質來看,詞元是自然語言的數(shù)學化表達。一段文字、一個問題進入AI模型前,會先被“分詞器”拆解為若干詞元,拆分規(guī)則因模型分詞器設計而異:“朋友買了西瓜手機!”可能被拆分為“朋友”“買”“了”“西瓜”“手機”,而“Transformer”這類英文詞匯,可能被拆成“Trans”“former”。

這些拆分后的詞元,對人類而言是有意義的文字,對AI卻缺乏直觀認知。為了讓AI“理解”,大模型會先給每個Token分配一個數(shù)字編號,然后將這個編號轉化為一組數(shù)字坐標(向量)。這個坐標決定了AI如何“理解”這個詞。

更關鍵的是,AI對詞匯的理解并非固定不變,而是通過計算詞元坐標間的復雜關系實現(xiàn)動態(tài)解讀——比如“西瓜”,AI會根據(jù)上下文,將其坐標向“品牌”或“食物”相關方向調整,從而精準理解“西瓜手機”這類組合的含義。

總而言之,Token計量的,并不只是你看到的AI模型給出的答案,而是生成這個答案所需的全部計算資源。而進入以Openclaw(龍蝦)為代表的agent場景,這種Token的消耗會被指數(shù)級擴大。比如讓Openclaw替你干活,把“幫我整理一下文件夾”這句話甩給它之后,它可能需要先讀懂這個要求,然后拆解成十幾個子任務,每個子任務分別調用一次AI,每次調用都帶著完整的系統(tǒng)指令和上下文,必要的時候還要反復檢查有沒有做對、是否需要修正。這背后可能是幾十輪對話、幾萬個Token的連鎖消耗,這也是它看起來只干了點普通的活,但格外消耗Token的原因。

03

中國領跑全球:

詞元競爭背后的算力與產業(yè)優(yōu)勢

全球AI產業(yè)的競爭,正以詞元調用量為標尺展開。全球最大AI模型API聚合平臺OpenRouter最新數(shù)據(jù)顯示,截至3月15日,中國AI大模型的周調用量達到4.69萬億個Token,連續(xù)第二周超越美國。全球詞元調用量排名前三的位置,更是被中國模型占據(jù)。國產大模型MiniMax M2.5連續(xù)五周位居全球大模型調用量榜首,在公司總部的辦公區(qū),產品研發(fā)人員展示了直觀的價格差距圖?!斑_到同樣能力水平的海外模型跟我們的相比,價格可能有十幾倍的差距?!?/p>

我們要知道,Token并不是憑空產生的,它是由高性能的GPU在消耗大量的電能,完成數(shù)千億次的推理運算后產生的數(shù)字資產。每生成一個Token都對應著真實的推理過程,也對應著真實的電力消耗和算力消耗。

而中國大模型公司之所以能夠把Token價格做得更低,主要原因有:第一是我們的電力優(yōu)勢。中國擁有更完善的電力基礎設施和技術體系,尤其是西部地區(qū)豐富的新能源綠電,正在與數(shù)據(jù)中心算力、樞紐加快耦合,把電直接轉化成AI時代的新型服務能力。第二是技術能力。近年來中國科技企業(yè)在推理芯片、模型架構和系統(tǒng)優(yōu)化上持續(xù)突破,這意味著面對同樣一個問題,中國的大模型往往可以用更少的算力、更短的時延、更高的能效,就把答案給算出來。有人說Token將是AI時代新的能源單位,中國電力、中國算力正在以一種全新的方式參與著全球的競爭。

04

詞元成產業(yè)“晴雨表”:

重構AI商業(yè)邏輯與產業(yè)生態(tài)

在人工智能時代,用戶輸入的每一個字,大模型生成的每一段話、識別的每一幅圖像,都在消耗詞元。國家數(shù)據(jù)局專家咨詢委員會委員張向宏介紹,日均超140萬億的詞元調用量,相當于1000萬億個中文詞匯,也相當于250個中國國家圖書館的資源量。

國家發(fā)展改革委國家信息中心人工智能處工程師蔡馳宇介紹,詞元日均調用量大幅增長,充分表明人工智能正加速從實驗室走向千行百業(yè)和千家萬戶,變成了實實在在的生產力工具,像水、電、網(wǎng)絡一樣,成為智能社會運轉的基礎資源。詞元的消耗量是人工智能產業(yè)發(fā)展的重要指標和“晴雨表”。

詞元的普及,更在重構人工智能產業(yè)的商業(yè)邏輯。圍繞詞元的調用、分發(fā)與結算,一套新的價值體系正在加速演進形成,并成為人工智能產業(yè)可能變現(xiàn)的重要路徑。蔡馳宇介紹,過去一家企業(yè)使用信息服務,需要購買信息軟件;現(xiàn)在一家企業(yè)使用信息服務,可直接調用大模型接口,用多少詞元,就付多少費用,以詞元消耗量的多少作為計費依據(jù)。這種按需付費的模式,大幅降低了企業(yè)的AI應用門檻,也讓AI產業(yè)的商業(yè)變現(xiàn)更具靈活性。

與此同時,專家表示,詞元消耗量增長也對電力資源提出了更高要求。今年的政府工作報告提出,實施算電協(xié)同等新基建工程。專家表示,算電協(xié)同的本質含義,就是要依托我國具有超前優(yōu)勢的綠電來發(fā)展算力產業(yè)和人工智能產業(yè)。

素材來源:央視新聞、央視財經(jīng)、科普中國

編輯:董敏煒

審核:馮海波 劉肖勇


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

廣東科技報 incentive-icons
廣東科技報
傳播科技資訊,普及科學知識。
3346文章數(shù) 1261關注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關懷版