国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從Token到詞元:全模態(tài)時代的基模與交互入口

0
分享至

2026年3月24日,國家數(shù)據(jù)局首次在官方語境中確立“詞元”為Token的標準譯名,并披露國內(nèi)日均Token調(diào)用量已突破140萬億。但這仍只是“文本時代主導(dǎo)”的規(guī)模。

在語音、視頻與實時交互驅(qū)動的多模態(tài)場景中,隨著自主調(diào)用工具并交付結(jié)果的Agent大量部署,Token的生成與消耗方式正在發(fā)生范式性變化——

從離散文本走向連續(xù)感知,從低頻批量輸入走向高頻流式輸入,其生產(chǎn)方式、組織結(jié)構(gòu)與消耗效率,將直接決定下一代AI系統(tǒng)的能力上限與成本結(jié)構(gòu)。



早在2021年,復(fù)旦大學(xué)邱錫鵬教授較早明確采用“詞元”這一譯法,推動其在中文語境下的標準化。他指出,“詞元”既避免被簡單理解為自然語言中的“詞”,又保留了其作為語言處理基本單位的本質(zhì)內(nèi)涵。

而隨著大模型從文本走向多模態(tài)、從模型能力走向Agent系統(tǒng),“詞元”所對應(yīng)的,也不再只是一個術(shù)語問題,而是下一代智能系統(tǒng)的底層組織方式。

在這一趨勢下,圍繞統(tǒng)一Token結(jié)構(gòu)、全模態(tài)與情境智能展開布局的公司,正持續(xù)獲得資本關(guān)注。

近日,模思智能(MOSI)也官宣完成數(shù)億元的天使輪融資,由IDG資本領(lǐng)投,元禾控股、上海國投旗下上??苿?chuàng)及上海未來產(chǎn)業(yè)基金、奇績創(chuàng)壇、智譜系基金-星連資本及某頭部產(chǎn)業(yè)投資方聯(lián)合投資。

這筆融資背后,投資方顯然看重的并不只是單點產(chǎn)品能力,而是其對下一代技術(shù)路徑的提前布局,而多維資本也將擔任新一輪獨家財務(wù)顧問,攜手模思智能共同探索通用智能時代的下一步。

非共識路徑:從語音到全模態(tài),在統(tǒng)一的Token結(jié)構(gòu)中被表達和計算

早在2023年“百模大戰(zhàn)”期間,邱錫鵬便意識到,市場上雖然模型眾多,但底層技術(shù)路徑高度趨同。絕大多數(shù)資源持續(xù)涌向文本大模型賽道,基礎(chǔ)研究的多樣性卻在萎縮。

某種程度上,這種同質(zhì)化不僅限制了技術(shù)可能性的展開,也壓縮了探索新路徑的空間。

在這樣的背景下,模思智能并未沿著主流的純文本路線繼續(xù)加碼,而是選擇了一條更少人走的道路:從語音切入,走向全模態(tài),在統(tǒng)一的Token結(jié)構(gòu)中表達和計算不同模態(tài)的信息。



之所以選擇語音作為突破口,原因并不復(fù)雜。

相比純文本,音頻的信息密度更高,天然包含語調(diào)、節(jié)奏、情緒等文本難以完整承載的信號;同時,音頻也更容易與環(huán)境、動作和上下文形成連續(xù)輸入流,更接近真實世界中的人機交互方式。

它不僅是交互入口,更是通向“情境理解”的天然起點。

當Token不再只是文本中的離散符號,而成為連續(xù)感知信息的離散化表達后,模型要解決的問題也發(fā)生了變化:從“理解一句話”轉(zhuǎn)向“理解一個情境”。

模思智能將這一能力概括為“情境智能”(Contextual Intelligence)——以持續(xù)感知、動態(tài)記憶與環(huán)境理解為基礎(chǔ),使AI能夠在真實世界中進行自適應(yīng)交互。

在這一框架下,Token不再只是靜態(tài)輸入單元,而是構(gòu)成情境的基本信號。

而Agent,正是情境智能走向現(xiàn)實應(yīng)用的直接載體。

隨著以O(shè)penClaw等為代表的基礎(chǔ)設(shè)施逐步成熟,行業(yè)競爭也正在從單一的“模型能力”比拼,轉(zhuǎn)向?qū)换ト肟谂c環(huán)境理解能力的爭奪。語音、上下文與情境建模能力,正在成為新的技術(shù)分水嶺。

如果說邱錫鵬代表的是這一路線的學(xué)術(shù)源頭,那么模思智能則是這一方向的產(chǎn)業(yè)化載體;而上海創(chuàng)智學(xué)院提供的,則是支撐技術(shù)快速轉(zhuǎn)化的組織與資源平臺。

MOSS之后,真正的布局才剛剛開始

模思智能核心團隊長期深耕預(yù)訓(xùn)練、大模型與多模態(tài)方向,并持續(xù)推進統(tǒng)一Token路線的技術(shù)演進。

2023年2月,國內(nèi)首個類ChatGPT對話式大模型MOSS發(fā)布,打響了中國“百模大戰(zhàn)”的第一槍。但在模思智能團隊看來,真正重要的并不是打一場模型發(fā)布戰(zhàn),而是提前押注下一階段的技術(shù)結(jié)構(gòu)。

同年5月,團隊推出SpeechGPT,在業(yè)內(nèi)較早驗證了“離散化端到端語音大模型”這一路徑的可行性。

它所解決的核心問題,是首次將連續(xù)語音信號拆解并映射為離散Token序列,讓語音得以真正進入與文本統(tǒng)一的Token空間。

這意味著,機器理解人“說的話”和理解人“寫的話”,第一次有機會在同一套計算框架內(nèi)完成。



同年8月發(fā)布的SpeechTokenizer,則進一步將這一路線工程化,成為融合語義Token與聲學(xué)Token的音頻離散化編碼器,為后續(xù)語音理解與生成、乃至更廣義的多模態(tài)統(tǒng)一建模打下了底座。

這條路線一旦走通,向全模態(tài)擴展就是自然而然的結(jié)果。

2024年2月,AnyGPT發(fā)布,首次將語音、文本、圖像與視頻統(tǒng)一映射至離散Token體系,提出了真正意義上的離散化全模態(tài)基座模型架構(gòu)。

不同模態(tài)不再需要彼此割裂、分別訓(xùn)練,而是能夠在同一序列結(jié)構(gòu)中完成理解與生成。

至此,團隊此前多年的技術(shù)布局,第一次呈現(xiàn)出較為完整的輪廓。

從單點突破到能力閉環(huán)

此后,相關(guān)成果開始加速涌現(xiàn)。

2025年7月,MOSS-TTSD發(fā)布,作為國內(nèi)首個基于百萬小時音頻訓(xùn)練的開源中英雙語對話語音模型,在播客、影視配音等長內(nèi)容場景中展現(xiàn)出較強競爭力。



視頻地址:https://mp.weixin.qq.com/s/tXkD_9BWv7aHk_uflfb9-g

同年11月,聯(lián)合上海創(chuàng)智學(xué)院等機構(gòu)發(fā)布的下一代能動性模型體系NEX,在氛圍編程、工具使用、后端開發(fā)等多項基準測試中進入全球第一梯隊水平,將離散化架構(gòu)的優(yōu)勢進一步延伸至Agent與生產(chǎn)力場景。

進入2026年后,團隊以月度推進的節(jié)奏持續(xù)迭代:

  • MOSS-Transcribe-Diarize在復(fù)雜多說話人場景中實現(xiàn)領(lǐng)先表現(xiàn);
  • MOVA作為國內(nèi)首個高性能音視頻生成開源模型之一,開源后迅速獲得行業(yè)關(guān)注;
  • MOSS-Audio-Tokenizer在相同比特率下進一步刷新音頻重建性能;
  • 基于該Tokenizer訓(xùn)練的MOSS-TTS系列模型,則主要面向?qū)嶋H生產(chǎn)場景,在音色克隆相似度等指標上表現(xiàn)突出。

至此,模思智能已經(jīng)成為國內(nèi)少數(shù)完成“全模態(tài)基座模型能力閉環(huán)”的初創(chuàng)公司之一



視頻地址:https://mp.weixin.qq.com/s/tXkD_9BWv7aHk_uflfb9-g

這一系列成果背后,并不是若干彼此孤立的技術(shù)突破,而是同一個底層命題被不斷驗證后的自然延展:多模態(tài)信息可以通過統(tǒng)一的離散化方式映射到同一Token序列結(jié)構(gòu)中,進而實現(xiàn)統(tǒng)一計算。

離散化帶來的,不只是更高的壓縮效率,更重要的是賦予不同模態(tài)以可組合性與可計算性——而這正是全模態(tài)智能與Agent系統(tǒng)真正落地的底層架構(gòu)前提。

頂尖大模型產(chǎn)業(yè)化團隊:具備從0到N的全棧能力

支撐模思智能技術(shù)路徑的,是一支同時具備前沿研究深度與工程落地能力的核心團隊。

首席科學(xué)家邱錫鵬,復(fù)旦大學(xué)教授,國家杰出青年科學(xué)基金獲得者、上海創(chuàng)智學(xué)院全職導(dǎo)師,并榮獲2024年CCF-ACM AI Award(當年全球唯一獲獎人)。

他長期深耕自然語言處理與大模型方向,在端到端語音大模型與全模態(tài)基座模型等前沿領(lǐng)域持續(xù)保持技術(shù)領(lǐng)先,是國內(nèi)大模型領(lǐng)域兼具學(xué)術(shù)高度與產(chǎn)業(yè)影響力的領(lǐng)軍人物,多次入選全球前2%頂尖科學(xué)家榜單。

其著作《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》被廣泛用于高校教學(xué)。



CEO李世民出自邱錫鵬門下碩博連讀體系,以一作身份發(fā)表多篇CCF-A類論文,并深度參與科技部“新一代人工智能2030”重點研發(fā)項目,在擬人化人機交互方向?qū)崿F(xiàn)多項關(guān)鍵技術(shù)突破。

對李世民而言,創(chuàng)業(yè)并非角色轉(zhuǎn)換,而是其既有研究路徑在產(chǎn)業(yè)側(cè)的自然延伸。

值得注意的是,模思智能并非傳統(tǒng)意義上的“教授帶學(xué)生創(chuàng)業(yè)”,而是由上海創(chuàng)智學(xué)院與復(fù)旦大學(xué)聯(lián)合孵化的標桿項目。

作為上海市主導(dǎo)設(shè)立的新型研發(fā)機構(gòu),創(chuàng)智學(xué)院為公司提供了覆蓋算力、人才與產(chǎn)業(yè)資源的體系化支持,使其具備遠高于常規(guī)學(xué)術(shù)創(chuàng)業(yè)項目的起點與迭代速度。

2025年7月,在創(chuàng)智學(xué)院“首發(fā)八大AI成果”發(fā)布會上,邱錫鵬團隊聯(lián)合模思智能發(fā)布的MOSS-Audio被評價為“突破語音交互恐怖谷效應(yīng),為情境智能奠定基礎(chǔ)”。

△圖源:上海創(chuàng)智學(xué)院官微

同年9月,在一周年成果發(fā)布會上,團隊提出的規(guī)?;鞒檀竽P涂山忉尶蚣茉俅稳脒x七大創(chuàng)新成果,標志著中國在相關(guān)方向?qū)崿F(xiàn)從跟跑到領(lǐng)跑的躍遷。CEO李世民表示:

  • 創(chuàng)智學(xué)院的孵化,使我們能夠以遠超傳統(tǒng)學(xué)術(shù)創(chuàng)業(yè)的速度完成技術(shù)轉(zhuǎn)化。

公司目前已形成近百人的全棧技術(shù)體系,博士占比接近50%,核心成員主要來自復(fù)旦大學(xué)NLP體系(CS Ranking全球前列),并持續(xù)吸引來自多所頂尖高校的研究人才。

隨著公司逐步走向產(chǎn)業(yè)化落地,團隊引入多位具備阿里、字節(jié)、理想汽車等背景的關(guān)鍵成員,補齊工程化與商業(yè)化能力,為從1到N的規(guī)?;瘮U張奠定基礎(chǔ)。

商業(yè)化層面,模思智能多模態(tài)大模型開放平臺已進入全面公測階段,提供一站式API服務(wù),以高穩(wěn)定性與高性價比支撐企業(yè)級調(diào)用需求。

目前,公司已在消費電子、智能汽車、具身智能與AI陪伴等多個場景中與頭部客戶展開合作,初步驗證了技術(shù)落地能力與商業(yè)轉(zhuǎn)化潛力。

模思智能更強調(diào)從基座模型到垂直應(yīng)用的一體化能力構(gòu)建,其商業(yè)增長飛輪將圍繞“詞元(Token)的生產(chǎn)、分發(fā)與應(yīng)用”展開,從MaaS能力輸出延伸至2B、2B2C與2C多層級場景,逐步形成技術(shù)與商業(yè)雙輪驅(qū)動的公司。

誰在定義下一代智能

國家數(shù)據(jù)局首次官宣“詞元”譯名,在某種程度上標志著大模型產(chǎn)業(yè)正從早期野蠻生長走向更高程度的規(guī)范化。

這背后意味著,單純依賴參數(shù)堆疊與算力外推的階段正在逐步過去,未來模型能力的差距,可能越來越取決于架構(gòu)創(chuàng)新、系統(tǒng)組織方式以及頂尖人才密度。

模思智能試圖回答的,正是一個尚無定論的問題:當大模型進入深水區(qū),真正的護城河究竟是什么?

答案或許已不再只是參數(shù)規(guī)?;蛩懔ν度氡旧恚谟谑欠衲軌蚋缱R別并押注下一代智能的核心結(jié)構(gòu)。

對模思智能而言,這種結(jié)構(gòu)體現(xiàn)為:統(tǒng)一的Token表達、面向情境的持續(xù)理解能力,以及能夠調(diào)用工具、交付結(jié)果、與用戶建立長期關(guān)系的Agent系統(tǒng)。

當“詞元”進入官方語言,真正值得關(guān)注的,或許已不只是一個術(shù)語被定名,而是誰能夠率先定義:詞元將如何被生產(chǎn)、組織與使用。

某種意義上,這也正是在定義下一代智能系統(tǒng)的邊界。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海一所小學(xué)驚險一幕:41歲爸爸突然倒地,市民聯(lián)手120上演教科書式急救

上海一所小學(xué)驚險一幕:41歲爸爸突然倒地,市民聯(lián)手120上演教科書式急救

上觀新聞
2026-03-28 16:16:17
妹子遭輪X后一心求死,大家卻只想讓她活。跟親爹打一年官司,她終于合法去死了...

妹子遭輪X后一心求死,大家卻只想讓她活。跟親爹打一年官司,她終于合法去死了...

英國那些事兒
2026-03-27 23:27:25
忍無可忍!英格蘭該放棄昔日最佳了,全場噓聲太扎心

忍無可忍!英格蘭該放棄昔日最佳了,全場噓聲太扎心

奶蓋熊本熊
2026-03-29 03:49:02
張雪峰去世僅1天,辦公室內(nèi)景曝光,寫真照被指像遺照,擺設(shè)奇怪

張雪峰去世僅1天,辦公室內(nèi)景曝光,寫真照被指像遺照,擺設(shè)奇怪

180視角
2026-03-26 08:43:01
砸6700億建雄安,面積抵3個紐約,如今究竟咋樣了?

砸6700億建雄安,面積抵3個紐約,如今究竟咋樣了?

娛樂圈的筆娛君
2026-03-26 12:15:32
同樣是跟腱斷裂復(fù)出,塔圖姆與杜蘭特的效率根本不是一個級別!

同樣是跟腱斷裂復(fù)出,塔圖姆與杜蘭特的效率根本不是一個級別!

田先生籃球
2026-03-28 23:03:18
2026嚴查違規(guī)雙薪!機關(guān)退休人員兼職務(wù)必守紅線

2026嚴查違規(guī)雙薪!機關(guān)退休人員兼職務(wù)必守紅線

小鹿姐姐情感說
2026-03-27 00:20:23
恐怖!昨晚差點跟著張雪峰一起走了,上海女網(wǎng)友哭訴自己驚魂經(jīng)歷

恐怖!昨晚差點跟著張雪峰一起走了,上海女網(wǎng)友哭訴自己驚魂經(jīng)歷

火山詩話
2026-03-28 08:24:26
阿根廷友誼賽半場變臉,梅西上場后全隊災(zāi)難級表現(xiàn)

阿根廷友誼賽半場變臉,梅西上場后全隊災(zāi)難級表現(xiàn)

體壇周報
2026-03-28 11:57:18
不到100萬,毀了一輩子:那個曾經(jīng)飛揚跋扈的領(lǐng)導(dǎo),終于進去了

不到100萬,毀了一輩子:那個曾經(jīng)飛揚跋扈的領(lǐng)導(dǎo),終于進去了

蘇格拉高
2026-03-28 07:39:54
阿里取消入職體檢環(huán)節(jié)

阿里取消入職體檢環(huán)節(jié)

螞蟻大喇叭
2026-03-28 17:06:53
高三學(xué)生因不堪鳥鳴寫信請求拆除鳥巢,校長婉拒稱“世界不會為某個人因某事而暫?!?,學(xué)生回應(yīng):對生命與自然有了新的思考

高三學(xué)生因不堪鳥鳴寫信請求拆除鳥巢,校長婉拒稱“世界不會為某個人因某事而暫停”,學(xué)生回應(yīng):對生命與自然有了新的思考

大風(fēng)新聞
2026-03-28 20:14:32
張雪峰三大遺憾!50萬沒留住父親、對不起妻子,還有誤女兒前程

張雪峰三大遺憾!50萬沒留住父親、對不起妻子,還有誤女兒前程

八斗小先生
2026-03-27 16:18:15
藿香正氣水兌白醋,作用太厲害了!一年省下幾百塊,家家用得到

藿香正氣水兌白醋,作用太厲害了!一年省下幾百塊,家家用得到

三農(nóng)老歷
2026-03-27 10:03:22
一周至少20次!57歲男子腎衰竭,妻子:勸了很多次,就是不聽?

一周至少20次!57歲男子腎衰竭,妻子:勸了很多次,就是不聽?

橘子約定
2026-03-28 20:11:10
廣州一大批業(yè)主后悔賣房了!

廣州一大批業(yè)主后悔賣房了!

樓市滅霸
2026-03-28 12:54:30
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
山西太原一建筑發(fā)生火災(zāi) 已致1人死亡25人受傷

山西太原一建筑發(fā)生火災(zāi) 已致1人死亡25人受傷

新快報新聞
2026-03-28 22:42:10
核桃立大功!國際頂刊證實:可降低全身炎癥,4周壽命延長45%

核桃立大功!國際頂刊證實:可降低全身炎癥,4周壽命延長45%

思思夜話
2026-03-28 13:00:30
A股:大家坐穩(wěn)扶好了,從下周一起,大牛市或?qū)⒃俅沃匮輾v史了!

A股:大家坐穩(wěn)扶好了,從下周一起,大牛市或?qū)⒃俅沃匮輾v史了!

夜深愛雜談
2026-03-28 18:00:54
2026-03-29 06:12:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12360文章數(shù) 176427關(guān)注度
往期回顧 全部

科技要聞

華為盤古大模型負責(zé)人王云鶴確認離職

頭條要聞

伊朗:擊中美軍F-16戰(zhàn)機 強力反擊加速以政權(quán)崩潰

頭條要聞

伊朗:擊中美軍F-16戰(zhàn)機 強力反擊加速以政權(quán)崩潰

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經(jīng)要聞

臥底"科技與狠活"培訓(xùn):化工調(diào)味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

親子
旅游
家居
房產(chǎn)
健康

親子要聞

小孩子能口無遮攔到什么程度!網(wǎng)友:恨不得當場找個地縫鉆進去

旅游要聞

泰安市岱岳區(qū):賞梨花 看村晚 萬畝梨園迎客來

家居要聞

曲線華爾茲 現(xiàn)代簡約

房產(chǎn)要聞

首日430組來訪,單日120組認籌!海口首個真四代,徹底爆了!

干細胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進入關(guān)懷版