国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

“物?人?場”交互視域下,數(shù)字孿生技術(shù)的前沿探索

0
分享至

原文發(fā)表于《科技導(dǎo)報》2025 年第20 期 《 “物?人?場”交互視域下的數(shù)字孿生技術(shù)研究進(jìn)展 》

隨著新一代信息技術(shù)的融合創(chuàng)新,數(shù)字孿生(DT)技術(shù)作為推動數(shù)字化轉(zhuǎn)型與智能系統(tǒng)演進(jìn)的關(guān)鍵支撐,已廣泛應(yīng)用于工業(yè)制造、智慧城市、智能交通等領(lǐng)域。然而,現(xiàn)有研究主要聚焦于“物”的建模和分析,較少系統(tǒng)整合“人”和“環(huán)境”因素,難以滿足復(fù)雜智能系統(tǒng)對多層次、全方位交互的發(fā)展需求。鑒于此,《科技導(dǎo)報》邀請電子科技大學(xué)計算機科學(xué)與工程技術(shù)學(xué)院游佳莉、助理研究員鄧佳文、教授任福繼等撰文,文章引入“物?人?場”交互視域,從智能物理實體(物)、智能個體(人)以及虛實融合環(huán)境(場)3 大核心維度,全面且系統(tǒng)地剖析數(shù)字孿生技術(shù)的研究前沿與進(jìn)展,揭示三者如何相互作用、相互促進(jìn),為元宇宙的構(gòu)建提供支撐,并圍繞面臨的關(guān)鍵挑戰(zhàn)提出研究建議。研究成果為構(gòu)建具備多主體協(xié)同感知、多模態(tài)智能交互與虛實融合閉環(huán)反饋的新型數(shù)字孿生系統(tǒng)提供了理論基礎(chǔ)與實踐啟示。

新一代信息技術(shù)的集群式突破與融合創(chuàng)新,促使數(shù)字孿生(DT)技術(shù)邁入變革的新階段。該技術(shù)作為數(shù)字化轉(zhuǎn)型進(jìn)程中的關(guān)鍵驅(qū)動力,其發(fā)展歷程呈現(xiàn)出顯著的階段性演化的特點。然而,傳統(tǒng)以“物”為核心的建模范式已難以契合復(fù)雜系統(tǒng)智能化演進(jìn)的需求。針對這些挑戰(zhàn),研究人員正逐步將研究視角拓展到“物?人?場”的多層次交互框架。為了進(jìn)一步介紹“物”“人”和“場”的差異和共性,表1在定義、核心技術(shù)等7個維度上進(jìn)行了詳細(xì)對比。

表1 “物?人?場”交互視域下數(shù)字孿生技術(shù)的異同分析


基于“物?人?場”交互視域,數(shù)字孿生技術(shù)正演化為一個動態(tài)開放、智能協(xié)同的虛實融合體系,能夠支持多主體交互、環(huán)境自適應(yīng)優(yōu)化及智能服務(wù)升級。這一框架的提出,不僅有助于突破傳統(tǒng)數(shù)字孿生在復(fù)雜場景中的局限性,還能推動數(shù)字人、AI與數(shù)字孿生的深度協(xié)同,進(jìn)一步賦能工業(yè)智能化、智慧城市及元宇宙等新興領(lǐng)域,為未來智能社會的構(gòu)建提供技術(shù)支撐。

1 “物”:傳統(tǒng)數(shù)字孿生的起點

1.1 數(shù)字孿生的理論起源和顯著特征

數(shù)字孿生的概念可追溯到航天軍工領(lǐng)域,其演化脈絡(luò)可以劃分為“技術(shù)探索、概念提出、應(yīng)用萌芽、行業(yè)滲透”4個主要階段,如圖1所示。


圖1 數(shù)字孿生發(fā)展歷程

早在1969年,NASA就在阿波羅計劃中首次應(yīng)用了數(shù)字孿生技術(shù);1991年,Gelernter提出了“鏡像世界”這一類似概念;2002年,Grieves等正式提出了“數(shù)字孿生”概念,并構(gòu)建了一個包含實空間、虛擬空間以及兩者之間數(shù)據(jù)/數(shù)據(jù)流動的鏈接機制的“鏡像空間模型”,用以闡述物理實體與虛擬副本之間的交互關(guān)系,如圖2所示。


圖2 數(shù)字孿生示例

隨著物聯(lián)網(wǎng)、云計算及人工智能技術(shù)的快速發(fā)展,數(shù)字孿生在2010年代中期受到廣泛關(guān)注,并逐漸從靜態(tài)仿真模型演進(jìn)為動態(tài)、實時、可自適應(yīng)的智能系統(tǒng)。工業(yè)4.0的推進(jìn)使得數(shù)字孿生項目,如Verl得以普及。

數(shù)字孿生目前沒有統(tǒng)一的理論體系,自其誕生以來,各研究與應(yīng)用領(lǐng)域提出了很多定義。基于文獻(xiàn)分析結(jié)果,研究發(fā)現(xiàn)數(shù)字孿生技術(shù)相較于傳統(tǒng)數(shù)字化技術(shù),展現(xiàn)出以下4個顯著特征。

1)雙向動態(tài)映射:數(shù)字孿生技術(shù)強調(diào)虛擬空間中構(gòu)建物理實體的數(shù)字化表征,實現(xiàn)物理實體與其數(shù)字模型之間的雙向映射、數(shù)據(jù)互聯(lián)與狀態(tài)交互。

2)實時同步檢測:通過多源傳感數(shù)據(jù)的實時采集,數(shù)字模型能夠精確、動態(tài)地反映物理實體的狀態(tài)變化。

3)共生共智:在“共生”層面,這一特性表現(xiàn)為數(shù)字孿生與物理實體在系統(tǒng)整個生命周期內(nèi)的同步創(chuàng)建和協(xié)同發(fā)展。而“智能”方面:在微觀尺度上,指的是數(shù)字孿生系統(tǒng)內(nèi)部各模塊間的智能資源共享;在宏觀尺度上,則是在多個數(shù)字孿生系統(tǒng)組合形成的復(fù)雜系統(tǒng)中,各子系統(tǒng)間智慧因素的深度整合與協(xié)同優(yōu)化。

4)閉環(huán)優(yōu)化控制策略:數(shù)字孿生技術(shù)的關(guān)鍵效用體現(xiàn)在通過仿真手段制定優(yōu)化策略,實現(xiàn)對物理實體的閉環(huán)式控制與持續(xù)優(yōu)化。

1.2 國家重大需求

中國對數(shù)字孿生技術(shù)的戰(zhàn)略意義予以高度重視,自“十三五”規(guī)劃便開始部署相關(guān)政策,推動了該技術(shù)的試點與示范應(yīng)用。步入“十四五”規(guī)劃階段,數(shù)字孿生技術(shù)被明確定位為支撐數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的關(guān)鍵技術(shù)之一,標(biāo)志著技術(shù)發(fā)展進(jìn)入了加速階段。如表2所示,政策支持力度不斷強化,產(chǎn)業(yè)生態(tài)系統(tǒng)逐漸成熟,應(yīng)用領(lǐng)域持續(xù)拓展,促進(jìn)了數(shù)字孿生在多行業(yè)的融合。

表2 2020—2025年部分?jǐn)?shù)字孿生相關(guān)政策概覽


自2023年起,中央和地方政府相繼出臺了一系列政策文件,旨在支持?jǐn)?shù)字孿生技術(shù)的研發(fā)、標(biāo)準(zhǔn)化建設(shè)及產(chǎn)業(yè)化應(yīng)用。政策的持續(xù)推進(jìn)不僅加快了數(shù)字孿生技術(shù)的應(yīng)用實踐,還顯著提升了行業(yè)規(guī)范化水平。在國家政策的強力推動下,中國數(shù)字孿生技術(shù)正處于前所未有的發(fā)展高峰,產(chǎn)業(yè)生態(tài)系統(tǒng)日益完善,未來將在智能制造、智慧城市、虛擬仿真、數(shù)字經(jīng)濟(jì)等多個領(lǐng)域發(fā)揮更加關(guān)鍵的作用,為中國數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展提供堅實支撐。

1.3 數(shù)字孿生系統(tǒng)架構(gòu)

圖3展示一個完整的數(shù)字孿生系統(tǒng)框架,從底層的物理實體到頂層的應(yīng)用場景,形成了一個從數(shù)字采集到智能應(yīng)用的完整閉環(huán)。

1)數(shù)據(jù)層:可分為數(shù)據(jù)采集和數(shù)據(jù)融合2個子層,是數(shù)字孿生的基礎(chǔ)。

2)功能層:為數(shù)字孿生提供通用技術(shù)支撐,通常包含4大模塊,包含仿真引擎、可視化渲染、實時控制和分析優(yōu)化。

3)建模層:是區(qū)分?jǐn)?shù)字孿生與簡單仿真的關(guān)鍵,需解決多尺度與多物理場耦合問題。

4)應(yīng)用層:是數(shù)字孿生技術(shù)具體面向行業(yè)需求的關(guān)鍵環(huán)節(jié)。

5)隱私與倫理層:是貫穿全流程的防護(hù)網(wǎng)。


圖3 數(shù)字孿生系統(tǒng)框架

1.4 數(shù)字孿生關(guān)鍵技術(shù)

在數(shù)字孿生系統(tǒng)的整體架構(gòu)中,建模、渲染、仿真和物聯(lián)網(wǎng)(IoT)4大核心技術(shù)相互協(xié)同,共同構(gòu)建一個完整的數(shù)字孿生生態(tài)系統(tǒng),如圖4所示。進(jìn)一步,表3介紹了這4大技術(shù)的主要手段、發(fā)展趨勢以及主要局限性。


圖4 數(shù)字孿生關(guān)鍵技術(shù)

表3 數(shù)字孿生4大核心技術(shù)解析


1)建模技術(shù)作為數(shù)字孿生的基礎(chǔ)層,主要負(fù)責(zé)物理對象的數(shù)字化表征。這一過程不僅需要精確捕捉物理對象的空間特征,還要充分考慮其內(nèi)在的物理特性和行為規(guī)律。

在幾何建模中,主要用于構(gòu)建高精度的3D形態(tài),包括計算機輔助設(shè)計(CAD)、建筑信息建模(BIM)、點云重建等技術(shù)。在物理建模中,要用于模擬真實物理世界的力學(xué)、熱學(xué)、電磁場等屬性,典型方法包括有限元分析(FEA)和多體動力學(xué)(MBD)。AI技術(shù)加速了數(shù)據(jù)驅(qū)動建模的發(fā)展,核心方向包括:其一,深度學(xué)習(xí)與圖神經(jīng)網(wǎng)自動化建模;其二,強化學(xué)習(xí)+物理引擎,提高交互性;其三,生成式 AI(GAN、Diffusion Models),用于自動化生成逼真的數(shù)字孿生模型。

2)在可視化過程中,渲染技術(shù)扮演著重要的角色,它能夠?qū)?shù)字模型精確轉(zhuǎn)換為易于理解的可視形式。隨著圖形處理技術(shù)的不斷提升,當(dāng)前渲染技術(shù)的發(fā)展趨勢主要體現(xiàn)在混合渲染策略、神經(jīng)渲染方法的輕量化,多模態(tài)數(shù)據(jù)的實時融合及真實感渲染。

3)仿真技術(shù)則是數(shù)字孿生的“大腦”,通過物理仿真、離散事件仿真等方法,對系統(tǒng)行為進(jìn)行預(yù)測和優(yōu)化。它能夠模擬各種工況條件下的系統(tǒng)響應(yīng),為決策提供科學(xué)依據(jù)。特別是在結(jié)合人工智能技術(shù)后,仿真精度和效率都得到了顯著提升。仿真技術(shù)在數(shù)字孿生中的應(yīng)用正朝著多尺度融合、高效實時計算和智能增強模擬方向發(fā)展。

4)物聯(lián)網(wǎng)技術(shù)作為連接物理世界和數(shù)字世界的紐帶,依托傳感器網(wǎng)絡(luò)、邊緣計算等關(guān)鍵技術(shù),實現(xiàn)了數(shù)據(jù)的實時采集與傳遞。

1.5 數(shù)字孿生技術(shù)的典型應(yīng)用案例

數(shù)字孿生技術(shù)作為數(shù)字化轉(zhuǎn)型的核心引擎,正從傳統(tǒng)的物理場景建模向更復(fù)雜的環(huán)境與系統(tǒng)仿真拓展,逐步形成“場景孿生”這一重要應(yīng)用方向。

1)文化保護(hù)領(lǐng)域。數(shù)字孿生技術(shù)為文化遺產(chǎn)的數(shù)字化保存與活化利用提供了創(chuàng)新解決方案。任福繼研究團(tuán)隊以“科技賦能文化傳承”為核心理念,系統(tǒng)性地開展了文化遺產(chǎn)數(shù)字化保護(hù)研究,如圖5所示。這一案例的成功實施為后續(xù)中國傳統(tǒng)文化的保護(hù)提供了指導(dǎo)。


圖5 元宇宙?文化保護(hù)解決方案框架

2)天文領(lǐng)域。隨著數(shù)字孿生技術(shù)的興起,為天文學(xué)研究提供了全新的工具和方法,如圖6所示。數(shù)字孿生正在為天文學(xué)的各個層面提供新的思路,不僅能夠幫助天文學(xué)家更高效地進(jìn)行研究,還能將宇宙的奧秘以更加直觀和生動的方式呈現(xiàn)給每一個人。


圖6 數(shù)字孿生和天文領(lǐng)域結(jié)合的案例

2 “人”:數(shù)字AI驅(qū)動的數(shù)字人技術(shù)發(fā)展

2.1 數(shù)字人定義與發(fā)展脈絡(luò)

數(shù)字人是指通過計算機圖形學(xué)、人工智能、動作捕捉等先進(jìn)技術(shù),實現(xiàn)形象逼真、行為擬人、可實時交互的虛擬人物。

1)第1階段(20 世紀(jì)80—90年代)是基礎(chǔ)計算機圖形學(xué)(CG)虛擬人物階段,這一時期的虛擬人技術(shù)主要依托于計算機動畫和三維圖形技術(shù)。這一階段的虛擬人物雖然在視覺效果上取得突破,但仍存在動作表現(xiàn)機械化、交互功能缺失等技術(shù)局限,主要依賴離線渲染實現(xiàn),單幀渲染時長可達(dá)數(shù)小時,應(yīng)用場景主要集中在影視特效領(lǐng)域。

2)第2階段(21世紀(jì)初—2015年)是動作捕捉與實時渲染階段,這一階段以動作捕捉(MoCap)技術(shù)與實時渲染技術(shù)的突破性發(fā)展為標(biāo)志,實現(xiàn)了虛擬角色從靜態(tài)呈現(xiàn)到動態(tài)交互的重大跨越。

3)第3階段(2016年至今)是AI驅(qū)動的智能數(shù)字人階段。隨著深度學(xué)習(xí)、自然語言處理和計算機視覺技術(shù)的突破性發(fā)展,數(shù)字人實現(xiàn)了從單向展示到智能交互的質(zhì)的飛躍。

由于虛擬數(shù)字人的核心價值是提供類“人”服務(wù)于體驗,可以將現(xiàn)有的數(shù)字人按照交互能力和視覺風(fēng)格等維度進(jìn)行類型劃分,如圖7所示。

1)按照是否具備和用戶交互的能力,可以將虛擬數(shù)字人劃分為交互型和非交互型。進(jìn)一步地,根據(jù)驅(qū)動方式的不同,交互型數(shù)字人可以細(xì)分為AI驅(qū)動型和真人驅(qū)動型。

2)根據(jù)視覺風(fēng)格的不同,虛擬數(shù)字人可以劃分為2D數(shù)字人和3D數(shù)字人。這種數(shù)字人模型特別適用于對真實感和交互性要求較高的應(yīng)用場景,例如虛擬偶像、虛擬客戶服務(wù)、虛擬導(dǎo)覽服務(wù)等。


圖7 按照交互能力和視覺風(fēng)格進(jìn)行數(shù)字人劃分的框架

2.2 國家重大需求

為了促進(jìn)數(shù)字人技術(shù)的健康發(fā)展,各國政府和國際組織紛紛出臺相關(guān)政策支持。從政策發(fā)展歷程來看,國內(nèi)數(shù)字人相關(guān)政策的出臺可追溯至“十三五”時期。國家提出信息化發(fā)展戰(zhàn)略,并相繼發(fā)布人工智能技術(shù)發(fā)展規(guī)劃、虛擬現(xiàn)實產(chǎn)業(yè)發(fā)展規(guī)劃等重要政策。進(jìn)入“十四五”時期,國家進(jìn)一步深化“數(shù)字經(jīng)濟(jì)”發(fā)展規(guī)劃,全面推動社會數(shù)字化轉(zhuǎn)型,夯實數(shù)字人相關(guān)的核心技術(shù)體系,為該領(lǐng)域的創(chuàng)新發(fā)展提供了良好的政策環(huán)境和廣闊的未來空間。

總體來看,數(shù)字人產(chǎn)業(yè)的政策支持體系已從早期的信息化戰(zhàn)略逐步發(fā)展為覆蓋技術(shù)研發(fā)、產(chǎn)業(yè)創(chuàng)新、人才培養(yǎng)和場景應(yīng)用的全鏈條支持體系。在國家和地方政府的持續(xù)推動下,數(shù)字人產(chǎn)業(yè)正迎來前所未有的發(fā)展機遇。

2.3 AI賦能下數(shù)字人的核心技術(shù)

數(shù)字人的核心能力主要體現(xiàn)在形象建模、語言表達(dá)和多維度交互3個關(guān)鍵維度。如圖8所示,這3個維度協(xié)同作用,使數(shù)字人不僅外觀逼真,還能與用戶建立情感連接,提供個性化服務(wù)。目前這3個維度的研究進(jìn)展如下。


圖8 數(shù)字人構(gòu)建的關(guān)鍵要素

1)形象建模旨在通過高精度的3D建模、動作捕捉和渲染技術(shù),打造出逼真且富有表現(xiàn)力的虛擬形象,使數(shù)字人在外觀、表情和動作上與真人高度接近,甚至突破物理限制,創(chuàng)造出更具藝術(shù)性或功能性的視覺體驗。同時,在個性化情感交互方面,數(shù)字人應(yīng)綜合考慮用戶的長期偏好與實時情感狀態(tài),動態(tài)調(diào)整交互策略,從而提供更加自然、貼心和沉浸式的互動體驗。

2)語言表達(dá)旨在通過自然語言處理(NLP)和預(yù)訓(xùn)練模型,實現(xiàn)流暢、自然且富有情感的人機對話。通過深度學(xué)習(xí)和上下文理解,數(shù)字人能夠準(zhǔn)確捕捉語境、表達(dá)情感,并在多語言、多場景下提供精準(zhǔn)的交互服務(wù)。語音合成技術(shù)(TTS)與語音識別系統(tǒng)(ASR)的結(jié)合,使數(shù)字人能夠準(zhǔn)確理解人類語言并做出智能化響應(yīng)。在語音合成技術(shù)的基礎(chǔ)上,為提升數(shù)字人聲音的個性和情感表達(dá)能力,研究者采納了情緒檢測與語音變換技術(shù)。同時,為了適應(yīng)國際用戶群體,當(dāng)前的語音合成技術(shù)實現(xiàn)了對多語言及方言的兼容性。

傳統(tǒng)數(shù)字人已實現(xiàn)流暢的語言表達(dá),且大語言模型的突破性發(fā)展為數(shù)字人語言交互帶來了質(zhì)的飛躍。隨著數(shù)字孿生技術(shù)的深度應(yīng)用,數(shù)字人的語言表達(dá)正在經(jīng)歷從機械發(fā)聲到情感化交互的范式轉(zhuǎn)變。這一演進(jìn)主要體現(xiàn)在以下2個維度:首先,在語音生成層面,數(shù)字孿生技術(shù)通過整合多維用戶數(shù)據(jù),實現(xiàn)了高度個性化的語音合成。其次,在多模態(tài)協(xié)同層面,數(shù)字孿生建模技術(shù)構(gòu)建了語音、唇形與表情數(shù)據(jù)的動態(tài)關(guān)聯(lián)網(wǎng)絡(luò)。這種跨模態(tài)的精準(zhǔn)映射確保了數(shù)字人在語言表達(dá)時,口型動作、面部表情與語義內(nèi)容的高度一致性。

3)多維度表達(dá)。目標(biāo)是通過情感計算、個性化算法等技術(shù),賦予數(shù)字人獨特的行為模式、性格特質(zhì)和情感反饋能力,使其能夠在交互中展現(xiàn)出更豐富的層次感和真實感,實現(xiàn)多模態(tài)優(yōu)化轉(zhuǎn)向跨模態(tài)時序與語義一致性建模,從而為用戶提供沉浸式、個性化的體驗。

隨著大模型的出現(xiàn),大模型推動了多模態(tài)技術(shù)的深度融合,使數(shù)字人在視覺、聽覺、觸覺等多維度上實現(xiàn)協(xié)同表示,進(jìn)一步增強了其在虛擬環(huán)境中的真實感和沉浸感。隨著數(shù)字孿生的演進(jìn),數(shù)字人的多維度交互能力已實現(xiàn)從單向指令到情境感知的質(zhì)變突破。這一進(jìn)步主要體現(xiàn)在以下2個關(guān)鍵維度:

  • 首先,在環(huán)境感知層面,數(shù)字孿生技術(shù)通過構(gòu)建虛實融合的空間映射系統(tǒng),使數(shù)字人能夠?qū)崟r感知并理解物理環(huán)境狀態(tài)。

  • 其次,在情感交互維度,數(shù)字孿生系統(tǒng)整合了用戶生理數(shù)據(jù)(如心率、表情變化)與行為特征,構(gòu)建了閉環(huán)反饋機制。

2.4 數(shù)字人技術(shù)的典型應(yīng)用案例

1)傳媒領(lǐng)域中的應(yīng)用。

2024年,山東一千河數(shù)字科技開發(fā)的“海藍(lán)手語數(shù)字人”系統(tǒng)入選中國正能量傳播網(wǎng)絡(luò)AI精品案例,已在山東和寧夏廣播電視臺應(yīng)用;中國政府網(wǎng)推出2位AI集合多模態(tài)模型的數(shù)字人作為政策講解員,實現(xiàn)文字到視頻的自動生成;青島互聯(lián)文化傳媒通過數(shù)字人名片,提升了社交分享率和信息承載量;搜狐科技表示廣州虛擬動力推出的AIGC 3D數(shù)字人視頻創(chuàng)作方案,適用于新聞、綜藝等節(jié)目,如圖9所示;微軟小冰作為社交網(wǎng)絡(luò)虛擬伴侶,展示了AI數(shù)字人在社交互動中的潛力;粵傳媒制作的《五羊傳說》和《南粵水韻,前年龍行》短片,展示了AI技術(shù)在文化傳播中的創(chuàng)新應(yīng)用。


圖9 3D數(shù)字人進(jìn)行新聞播報

基于真實人物的數(shù)字人部分應(yīng)用包含:2025年,兩會期間,全國人大代表張敏的專屬數(shù)字人通過對接大模型(如 DeepSeek),提供智慧對話服務(wù),如圖10所示,助力履職能力提升,該數(shù)字人依托數(shù)字孿生和深度神經(jīng)網(wǎng)絡(luò)技術(shù),實現(xiàn)高度逼真的形象、音色和智能交互。


圖10 基于真實人物的數(shù)字化復(fù)制品提供對話服務(wù)

2)教育領(lǐng)域的應(yīng)用。

中阿衛(wèi)視使用數(shù)字人主播“畢諾?D”進(jìn)行阿拉伯語新聞播報,如圖11所示,顯著提升了遠(yuǎn)程教育的效率;部分高校利用數(shù)字人技術(shù)制作校園文化宣傳視頻,吸引了更多學(xué)生和家長的關(guān)注;風(fēng)平智能的數(shù)字人可以為教育培訓(xùn)提供更加個性化的學(xué)習(xí)和培訓(xùn)體驗。世優(yōu)科技的AI數(shù)字人系統(tǒng)幫助教師創(chuàng)建數(shù)字人分身,大幅提升了效率。任福繼研究團(tuán)隊構(gòu)建了一個較為主流的可實時交流的AI數(shù)字人,如圖12所示。數(shù)字人在教育領(lǐng)域的應(yīng)用涵蓋了從個性化學(xué)習(xí)到遠(yuǎn)程教育、從虛擬實驗到情感陪伴的多個場景。這些應(yīng)用不僅提升了教學(xué)效率和學(xué)習(xí)體驗,還推動了教育資源的公平分配和教育模式的創(chuàng)新。


圖11 春節(jié)期間數(shù)字人播報新聞


圖12 任福繼形象的高精度AI數(shù)字人形象

數(shù)字人技術(shù)的發(fā)展已形成2大主要方向,完全虛擬構(gòu)建的數(shù)字人和實體映射數(shù)字人。無論是純虛擬的數(shù)字人還是實體映射的數(shù)字人,其技術(shù)演進(jìn)和應(yīng)用深化都離不開數(shù)字孿生場景的關(guān)鍵支撐。這種虛實融合的技術(shù)生態(tài),正在推動數(shù)字人向更智能、更協(xié)同的方向發(fā)展。

3 “場”:物與人融合構(gòu)建的元宇宙生態(tài)

3.1 元宇宙的理論起源

元宇宙(metaverse)這一概念最早由美國作家尼爾·斯蒂芬森于1992年提出,描述了一種與現(xiàn)實世界平行存在的虛擬世界,人們可在其中擁有獨立身份并進(jìn)行社會交往、經(jīng)濟(jì)交易、文化活動等。元宇宙被認(rèn)為是一種虛擬與現(xiàn)實無縫鏈接、深度融合的數(shù)字世界。盡管目前尚無統(tǒng)一的權(quán)威定義,但在現(xiàn)有研究中普遍認(rèn)為元宇宙是通過科技手段創(chuàng)造的、與現(xiàn)實世界進(jìn)行映射交互的虛擬空間,并在此基礎(chǔ)上形成具有新型社會經(jīng)濟(jì)體系的數(shù)字生活環(huán)境。

從學(xué)術(shù)角度看,元宇宙研究體系通常被概括為6個主要方面,這6大技術(shù)的英文首字母組成“BIGANT”,被稱作元宇宙的“大螞蟻”。Ren等在此基礎(chǔ)上進(jìn)一步完善,加入了人工情感技術(shù),并提出了“A BIGANT”的元宇宙研究體系,如圖13所示。


圖13 元宇宙核心技術(shù)體系“A BIGANT”

元宇宙作為一種新興的概念和技術(shù)領(lǐng)域,其關(guān)鍵特征主要包括以下4個方面。

1)沉浸式體驗:在元宇宙的構(gòu)建中,高保真的虛擬現(xiàn)實技術(shù)帶來了沉浸式體驗,實現(xiàn)了超越現(xiàn)實的感官融合。

2)虛實交互融合:元宇宙不僅是一個虛擬世界,更是與現(xiàn)實世界的無縫對接。

3)社會性:元宇宙中的虛擬空間不僅是個人存在的場所,還是一個活躍的社交網(wǎng)絡(luò)。

4)經(jīng)濟(jì)系統(tǒng):元宇宙的經(jīng)濟(jì)體系以虛擬資產(chǎn)的創(chuàng)造、流通和交易為基礎(chǔ),構(gòu)建了一個完整的虛擬經(jīng)濟(jì)生態(tài)系統(tǒng)。

3.2 國家重大需求

全球各國均對元宇宙發(fā)展予以高度重視,并相繼出臺相關(guān)政策進(jìn)行引導(dǎo)。從政策維度而言,中國已針對元宇宙建設(shè)頒布了一系列具有指導(dǎo)意義的政策,旨在推動其實現(xiàn)健康且有序的發(fā)展。當(dāng)前,中國已有上海、武漢、合肥、無錫、杭州、南昌、廈門等近40個省市政府先后發(fā)布元宇宙建設(shè)規(guī)劃,提出重點發(fā)展元宇宙相關(guān)產(chǎn)業(yè),元宇宙成為各界矚目的焦點,新模式新業(yè)態(tài)層出不窮。國外政府已開始紛紛布局元宇宙。各國政策的頒布為教育的數(shù)字化轉(zhuǎn)型的實現(xiàn)提供了政策支持。

盡管各國政策走向各有側(cè)重,卻無不致力于元宇宙的有序化布局,旨在促進(jìn)其規(guī)范化的進(jìn)步??梢灶A(yù)見,大力發(fā)展元宇宙將成為未來數(shù)字經(jīng)濟(jì)的重要趨勢。

3.3 數(shù)字孿生技術(shù)在元宇宙場景構(gòu)建中的關(guān)鍵作用

數(shù)字孿生與元宇宙是近年來備受矚目的2個概念,二者既存在諸多相似之處,亦有不少差異。數(shù)字孿生是一項融合實際物理對象或系統(tǒng)數(shù)字模型與實時數(shù)據(jù)的技術(shù),旨在達(dá)成對實際對象或系統(tǒng)的實時監(jiān)測、預(yù)測及優(yōu)化。

從技術(shù)演進(jìn)維度審視,元宇宙的構(gòu)建可劃分為具有遞進(jìn)關(guān)系的3個技術(shù)層級,其中,數(shù)字孿生層作為基礎(chǔ)階段,在元宇宙架構(gòu)中占據(jù)著極為關(guān)鍵的底層支撐地位,其發(fā)揮的關(guān)鍵作用如表4所示。然而,要實現(xiàn)可交互的數(shù)字孿生和全面的元宇宙體驗,動態(tài)場景的數(shù)字孿生成為技術(shù)實現(xiàn)的核心突破。在此過程中,虛擬世界中的場景和環(huán)境能夠?qū)崟r響應(yīng)并調(diào)整以契合現(xiàn)實世界的動態(tài)變化,使得虛擬空間具備“自適應(yīng)”能力。動態(tài)場景的數(shù)字孿生技術(shù)為元宇宙中的交互性、真實性和沉浸感提供了強有力的技術(shù)保障。

表4 數(shù)字孿生技術(shù)在元宇宙場景構(gòu)建中的關(guān)鍵作用


3.4 數(shù)字人與元宇宙交互融合技術(shù)分析

隨著元宇宙技術(shù)架構(gòu)的迭代更新,數(shù)字人作為連接現(xiàn)實世界和虛擬空間的關(guān)鍵媒介,在提升虛擬角色交互性與沉浸感的同時,也為元宇宙社交場景中的情感計算與反饋機制提供了新的技術(shù)實現(xiàn)路徑。數(shù)字人在元宇宙中的應(yīng)用大大提升了用戶的參與感和沉浸感,成為構(gòu)建更加真實和互動的虛擬世界的關(guān)鍵要素(表5)。

表5 數(shù)字人在元宇宙場景構(gòu)建中的關(guān)鍵作用


3.5 “物?人?場”三元交互的數(shù)據(jù)流框架

在綜合分析“物”“人”“場”3個要素的基礎(chǔ)上,提出了“物?人?場”三元交互模型。該模型由3個核心模塊構(gòu)成:物理實體、人(自然人和數(shù)字人),以及虛實融合環(huán)境,構(gòu)建起一個多模態(tài)協(xié)同、動態(tài)響應(yīng)的交互系統(tǒng)框架,如圖14所示。


圖14 “物?人?場”三元交互的數(shù)據(jù)流框架

該模型中的交互網(wǎng)絡(luò)主要涉及3類關(guān)鍵數(shù)據(jù)流路徑。

1)“物”到“場”的數(shù)據(jù)流路徑主要體現(xiàn)在物理實體對虛擬環(huán)境的實時映射能力。

2)從“人”到“場”的數(shù)據(jù)流路徑聚焦于自然人、數(shù)字人與虛擬環(huán)境之間的智能交互過程。

3)從“場”反饋至“物”與“人”的數(shù)據(jù)流體現(xiàn)了虛擬環(huán)境的響應(yīng)能力與閉環(huán)控制特征。

3.6 國內(nèi)外典型元宇宙應(yīng)用案例

隨著“物?人?場”三元交互系統(tǒng)理論的逐步完善,虛實融合的元宇宙形態(tài)也正在由概念走向應(yīng)用。游戲領(lǐng)域是當(dāng)前元宇宙應(yīng)用最為成熟的領(lǐng)域之一,憑借其天然的交互性與沉浸性,為元宇宙的場景搭建、身份建構(gòu)與經(jīng)濟(jì)體系探索提供了理想試驗場。國外典型代表如Roblox和Fortnite,為用戶提供了高度自由的數(shù)字體驗空間。國內(nèi)方面,以《原神》《幻塔》等開放世界游戲為代表,推動游戲從傳統(tǒng)線性敘事向持續(xù)演化的沉浸式虛擬世界轉(zhuǎn)型。這些探索不僅展現(xiàn)了“物?人?場”融合下元宇宙實踐的活力,也為其他行業(yè)提供了跨界參考路徑。

教育場景成為元宇宙融合發(fā)展的重要延展方向之一,教育類元宇宙更強調(diào)教學(xué)功能性與學(xué)習(xí)效果的提升。其核心在于打破傳統(tǒng)教育中時間、空間和資源的限制,通過虛擬現(xiàn)實、增強現(xiàn)實等技術(shù)提供更具互動性和參與感的學(xué)習(xí)體驗。國外如Engage VR和Meta的Horizon Classrooms等平臺,借助VR/AR(虛擬現(xiàn)實/增強現(xiàn)實)技術(shù)構(gòu)建可多人實時互動的虛擬課堂,支持跨地域協(xié)作教學(xué)和學(xué)科資源共享;同時,沉浸式語言學(xué)習(xí)、虛擬科學(xué)實驗等應(yīng)用場景已被廣泛驗證其教學(xué)有效性。國內(nèi)高校和科技企業(yè)也積極響應(yīng)元宇宙發(fā)展潮流,推動其在教育領(lǐng)域的深度應(yīng)用,涌現(xiàn)出一批兼具本土特色與技術(shù)創(chuàng)新的示范項目。例如,清華大學(xué)打造了“元宇宙校園”,南開大學(xué)則開設(shè)了國內(nèi)首個本科層面的元宇宙選修課程,山東大學(xué)開發(fā)了虛擬校園導(dǎo)覽系統(tǒng),西北大學(xué)建設(shè)了陜西省首個元宇宙校園平臺。

隨著元宇宙的不斷成熟,商業(yè)領(lǐng)域的應(yīng)用日益豐富多樣,涵蓋了零售、房地產(chǎn)、制造、金融等多個行業(yè)。國外方面,耐克以“數(shù)字替身+虛擬產(chǎn)品+Nikeland”重構(gòu)品牌營銷要素;Matterport利用數(shù)字孿生技術(shù),為房地產(chǎn)經(jīng)紀(jì)公司和門戶網(wǎng)站打造虛擬3D看房體驗;西門子的虛擬協(xié)同仿真元宇宙實現(xiàn)產(chǎn)業(yè)鏈上下游各環(huán)節(jié)在統(tǒng)一虛擬環(huán)境中的實時動態(tài)模型調(diào)整;摩根大通成為華爾街首家進(jìn)軍元宇宙的銀行。國內(nèi)則涌現(xiàn)出阿里巴巴虛擬購物空間和數(shù)字藏品經(jīng)濟(jì)、碧桂園智慧社區(qū)數(shù)字孿生管理、華為智能工廠數(shù)字化升級,以及建設(shè)銀行在數(shù)字貨幣與虛擬資產(chǎn)交易上的創(chuàng)新實踐。

3.7 教育元宇宙生態(tài)的應(yīng)用案例

在教育元宇宙的構(gòu)建中,“物?人?場”三重交叉關(guān)系不僅使每個要素獨立發(fā)揮作用,更通過相互協(xié)同使得教育元宇宙能夠真正實現(xiàn)沉浸式、個性化、智能化的教育模式,從而突破傳統(tǒng)教育的時空限制,帶來前所未有的教育體驗,如圖15所示。


圖15 教育元宇宙的組成示例

1)物與人:物理環(huán)境和數(shù)字人的交互。在教育元宇宙架構(gòu)下,物品的數(shù)字映射與虛擬人物的交互構(gòu)成了教育活動的核心要素。一方面,虛擬教師與現(xiàn)實環(huán)境之間的互動表現(xiàn)為虛擬教師能在數(shù)字教室復(fù)制品中“實施”教學(xué)活動,并通過智能感知技術(shù)的應(yīng)用對教學(xué)素材進(jìn)行動態(tài)調(diào)整。另一方面,學(xué)生的虛擬化身(數(shù)字孿生)能夠直接與數(shù)字孿生實驗設(shè)備進(jìn)行交互。此外,為了實現(xiàn)更加真實與沉浸的教學(xué)體驗,教育元宇宙中的交互不應(yīng)僅局限于虛擬空間,還需進(jìn)一步拓展至現(xiàn)實用戶與物理場景的融合交互。

2)人與場:虛擬人與虛擬場景的融合與互動。在教育元宇宙的構(gòu)建中,“場”不再局限于靜態(tài)的教育場所,而演變?yōu)橐粋€集動態(tài)交互與智能技術(shù)于一體的動態(tài)環(huán)境。一方面,在虛擬教育環(huán)境中,學(xué)生得以通過其數(shù)字化身便捷地參與跨國界的虛擬課堂,并與來自世界各地的同齡人進(jìn)行實時交流。另一方面,“場”為學(xué)生營造出沉浸式的互動體驗。進(jìn)一步地,虛擬場景的智能響應(yīng)能力使其不僅作為教學(xué)的背景環(huán)境存在,更逐步演化為具備感知與反饋能力的主動教學(xué)參與體。

3)物與場:物理環(huán)境與虛擬教育場景的融合。在教育元宇宙的構(gòu)建中,物理環(huán)境的數(shù)字化映射與虛擬環(huán)境的融合構(gòu)筑了一種新型的虛實結(jié)合的教育互動空間。一方面,虛擬實驗室與實際設(shè)備的交互為學(xué)生提供了一個全新的實驗平臺。另一方面,實體教室與虛擬課堂的協(xié)同作用擴展了教育活動的邊界。

4 “物?人?場”交互視域下數(shù)字孿生技術(shù)的挑戰(zhàn)與趨勢

4.1 “物?人?場”交互面臨的研究挑戰(zhàn)

數(shù)字孿生技術(shù)經(jīng)歷了從傳統(tǒng)的“物”的單一對象仿真,到AI驅(qū)動的“人”的智能交互,再到虛擬融合的“場”生態(tài)建設(shè)的發(fā)展階段。但如圖16所示,在“物?人?場”融合的新范式下,仍面臨諸多共性技術(shù)挑戰(zhàn)。


圖16 “物?人?場”交互面臨的研究挑戰(zhàn)

1)多源異構(gòu)數(shù)據(jù)融合與實時交互挑戰(zhàn):在“物?人?場”深度融合的教育元宇宙與數(shù)字孿生系統(tǒng)中,實現(xiàn)高效、低延遲的多源異構(gòu)數(shù)據(jù)融合是系統(tǒng)智能化的基礎(chǔ)。為此,亟需構(gòu)建具備魯棒性的多模態(tài)數(shù)據(jù)處理架構(gòu),引入數(shù)據(jù)清洗與標(biāo)準(zhǔn)化機制,提升數(shù)據(jù)質(zhì)量的一致性與可靠性;同時,加強數(shù)據(jù)生命周期管理,借助加密存儲、訪問控制與聯(lián)邦學(xué)習(xí)等技術(shù),保障數(shù)據(jù)在使用過程中的隱私與安全。

2)虛實映射的精準(zhǔn)度與復(fù)雜度問題:高精度虛擬建模與實時仿真是數(shù)字孿生系統(tǒng)實現(xiàn)“真實世界映射—虛擬世界預(yù)測—現(xiàn)實控制反饋”閉環(huán)的核心能力。未來數(shù)字孿生系統(tǒng)的建設(shè)亟需探索輕量級建模方法、分布式渲染技術(shù)、多層次算力協(xié)同機制以及高效的數(shù)據(jù)壓縮與同步算法,才能在保持虛實映射精準(zhǔn)度的同時,實現(xiàn)系統(tǒng)運行的高效性、穩(wěn)定性與可擴展性。

3)AI交互技術(shù)的智能化與魯棒性挑戰(zhàn):在“物?人?場”交互融合體系中,人工智能交互技術(shù)作為數(shù)字人驅(qū)動、人機融合,以及環(huán)境適配的核心引擎,正日益發(fā)揮關(guān)鍵作用。未來,唯有在保持高精度交互的同時兼顧可解釋性與穩(wěn)定性,AI系統(tǒng)才能真正支撐“物?人?場”融合環(huán)境中的智能化、可持續(xù)的人機協(xié)作。

4)虛擬經(jīng)濟(jì)與治理標(biāo)準(zhǔn)缺失的問題:隨著元宇宙生態(tài)體系的不斷擴展,虛擬經(jīng)濟(jì)正逐步成為其核心支柱之一。未來需要從技術(shù)與制度2個維度同步推進(jìn):在技術(shù)層面,應(yīng)構(gòu)建可信身份認(rèn)證機制、可驗證數(shù)字資產(chǎn)標(biāo)準(zhǔn)以及跨平臺的資產(chǎn)互通協(xié)議;在制度層面,應(yīng)加快構(gòu)建虛擬經(jīng)濟(jì)相關(guān)法律體系與治理機制,推動建立面向元宇宙環(huán)境的國際通用標(biāo)準(zhǔn)與多邊監(jiān)管合作框架,從而實現(xiàn)虛擬經(jīng)濟(jì)的合規(guī)發(fā)展與風(fēng)險可控。

4.2 “物?人?場”交互視域下未來研究方向

1)構(gòu)建智能化且具備多層次架構(gòu)的數(shù)據(jù)融合框架。為實現(xiàn)多源數(shù)據(jù)的更優(yōu)融合,可從局部傳感器至全局?jǐn)?shù)字孿生模型設(shè)計多層次的數(shù)據(jù)融合架構(gòu)。

2)研究 AIGC(生成式人工智能)賦能的智能虛實映射與虛擬原生進(jìn)化。面對虛實映射的精度與復(fù)雜性挑戰(zhàn),AIGC能夠自主生成新的數(shù)字孿生;針對現(xiàn)有數(shù)字孿生在泛化能力上的不足,AIGC創(chuàng)造了全新的虛擬場景;AIGC能夠構(gòu)建出有助于深度理解的生動場景,從而增強用戶的沉浸體驗與互動熱情。

3)構(gòu)建新的虛擬經(jīng)濟(jì)與智能化治理體系。一方面,區(qū)塊鏈與智能合約的應(yīng)用有望解決虛擬資產(chǎn)的所有權(quán)界定及交易過程的透明度問題;另一方面,AIGC技術(shù)對虛擬資產(chǎn)交易數(shù)據(jù)的分析有助于自動揭示交互環(huán)節(jié)中的欺詐隱患。

未來,隨著大模型、聯(lián)邦學(xué)習(xí)、邊緣計算等技術(shù)的持續(xù)突破,AIGC+數(shù)字孿生將具備更強的自主學(xué)習(xí)、決策優(yōu)化和創(chuàng)造新環(huán)境的能力,在工業(yè)、醫(yī)療、教育、智慧城市等領(lǐng)域釋放更大的價值。

5 結(jié)論

數(shù)字孿生技術(shù)作為工業(yè)制造、人工智能和虛擬現(xiàn)實等多個領(lǐng)域高度關(guān)注的前沿技術(shù),正不斷推動虛擬與現(xiàn)實世界之間的深入融合,“物?人?場”的交互視域清晰地體現(xiàn)了數(shù)字孿生技術(shù)發(fā)展的完整路徑與演變趨勢。圍繞這一內(nèi)在的發(fā)展邏輯,我們的研究系統(tǒng)地綜述了數(shù)字孿生技術(shù)在不同發(fā)展階段的研究進(jìn)展與技術(shù)細(xì)節(jié),并總結(jié)了“物?人?場”交互視域下數(shù)字孿生技術(shù)所面臨的共性技術(shù)挑戰(zhàn),從技術(shù)發(fā)展趨勢視角進(jìn)行預(yù)測。

本文作者:游佳莉、鄧佳文、焦子韻、羅阿理、宋軼晗、邱波、任福繼

作者簡介:游佳莉,電子科技大學(xué)計算機科學(xué)與工程技術(shù)學(xué)院,博士研究生,研究方向為情感分析、大模型技術(shù)等;鄧佳文(通信作者),電子科技大學(xué)計算機科學(xué)與工程技術(shù)學(xué)院,助理研究員,研究方向為人工智能、大模型技術(shù)、情感計算等;任福繼(共同通信作者),電子科技大學(xué)計算機科學(xué)與工程技術(shù)學(xué)院,教授,日本工程院院士、歐盟科學(xué)院院士、俄羅斯工程院外籍院士,研究方向為先進(jìn)智能、情感計算、智能機器人等。

文章來 源 : 游佳莉, 鄧佳文, 焦子韻, 等. “物?人?場”交互視域下的數(shù)字孿生技術(shù)研究進(jìn)展[J]. 科技導(dǎo)報, 2025, 43(20): 62?84 .

本文有刪改,

內(nèi)容為【科技導(dǎo)報】公眾號原創(chuàng),歡迎轉(zhuǎn)載
白名單回復(fù)后臺「轉(zhuǎn)載」

《科技導(dǎo)報》創(chuàng)刊于1980年,中國科協(xié)學(xué)術(shù)會刊,主要刊登科學(xué)前沿和技術(shù)熱點領(lǐng)域突破性的研究成果、權(quán)威性的科學(xué)評論、引領(lǐng)性的高端綜述,發(fā)表促進(jìn)經(jīng)濟(jì)社會發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學(xué)文化、促進(jìn)科技創(chuàng)新和科技成果轉(zhuǎn)化的決策咨詢建議。常設(shè)欄目有院士卷首語、科技新聞、科技評論、專稿專題、綜述、論文、政策建議、科技人文等。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

科技導(dǎo)報 incentive-icons
科技導(dǎo)報
中國科協(xié)學(xué)術(shù)會刊
5086文章數(shù) 8341關(guān)注度
往期回顧 全部

專題推薦

洞天福地 花海畢節(jié) 山水饋贈里的“詩與遠(yuǎn)方

無障礙瀏覽 進(jìn)入關(guān)懷版