国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

紐約大學(xué)突破:AI實(shí)現(xiàn)多角色同步控制《我的世界》場景建模

0
分享至


這項(xiàng)由紐約大學(xué)主導(dǎo)的突破性研究發(fā)表于2026年2月,論文編號為arXiv:2602.22208v2,研究團(tuán)隊(duì)開發(fā)出了名為Solaris的多人游戲世界模型。有興趣深入了解的讀者可以通過該編號查詢完整論文。

在人工智能領(lǐng)域,讓機(jī)器學(xué)會(huì)"看懂"和"預(yù)測"虛擬世界一直是個(gè)巨大挑戰(zhàn)。以往的AI系統(tǒng)就像一個(gè)只能從單一窗口觀察房間的人,無法理解整個(gè)空間的全貌。而紐約大學(xué)的這項(xiàng)研究則讓AI獲得了"多重視角"的能力,就像同時(shí)擁有多雙眼睛,能夠從不同角度觀察和理解同一個(gè)虛擬世界。

研究團(tuán)隊(duì)選擇《我的世界》作為實(shí)驗(yàn)場所,這個(gè)選擇頗具智慧?!段业氖澜纭肪拖褚粋€(gè)巨大的數(shù)字樂高世界,玩家可以自由建造、挖掘、探索,而且支持多人同時(shí)游戲。這種復(fù)雜的三維環(huán)境對AI來說是個(gè)極好的測試場地,因?yàn)樗枰斫饪臻g關(guān)系、物體交互、以及多個(gè)玩家之間的協(xié)作行為。

傳統(tǒng)的AI視頻生成模型就像一個(gè)只會(huì)模仿單人表演的演員,雖然能夠生成看起來真實(shí)的視頻,但無法處理多人互動(dòng)的復(fù)雜場景。當(dāng)兩個(gè)或更多玩家在同一個(gè)虛擬世界中行動(dòng)時(shí),他們的行為會(huì)相互影響,就像現(xiàn)實(shí)世界中的蝴蝶效應(yīng)一樣,一個(gè)玩家放置一個(gè)方塊,另一個(gè)玩家的視野中就會(huì)出現(xiàn)這個(gè)方塊,這種視角一致性對AI來說是個(gè)巨大挑戰(zhàn)。

Solaris模型的核心創(chuàng)新在于它能夠同時(shí)理解和預(yù)測多個(gè)玩家的視角。當(dāng)玩家A在建造一面墻時(shí),模型不僅要準(zhǔn)確預(yù)測玩家A看到的建造過程,還要同時(shí)預(yù)測站在不同位置的玩家B會(huì)看到什么。這就像一個(gè)導(dǎo)演同時(shí)掌控多臺攝像機(jī),確保每個(gè)鏡頭都與其他鏡頭保持邏輯一致性。

為了訓(xùn)練這個(gè)復(fù)雜的模型,研究團(tuán)隊(duì)創(chuàng)建了一個(gè)名為SolarisEngine的數(shù)據(jù)收集系統(tǒng)。這個(gè)系統(tǒng)就像一個(gè)自動(dòng)化的電影攝制組,能夠讓虛擬的"演員"(游戲機(jī)器人)在《我的世界》中進(jìn)行各種活動(dòng),同時(shí)從多個(gè)角度記錄下所有的行為和視覺變化。這些機(jī)器人會(huì)進(jìn)行建造房屋、挖掘礦物、相互戰(zhàn)斗、追逐游戲等多種活動(dòng),就像真正的玩家一樣。

通過這個(gè)系統(tǒng),研究團(tuán)隊(duì)收集了超過1200萬幀的多人游戲畫面,相當(dāng)于數(shù)百小時(shí)的高質(zhì)量游戲錄像。這些數(shù)據(jù)就像是AI的"教科書",幫助它學(xué)會(huì)理解多人游戲中的各種復(fù)雜情況。

一、構(gòu)建虛擬世界的"攝影棚"

要讓AI學(xué)會(huì)理解多人游戲,首先需要大量高質(zhì)量的訓(xùn)練數(shù)據(jù)。研究團(tuán)隊(duì)面臨的第一個(gè)挑戰(zhàn)就像是要在《我的世界》中建立一個(gè)專業(yè)的電影攝制組,既要有"演員"(游戲機(jī)器人)來表演各種游戲行為,還要有"攝像師"來記錄整個(gè)過程。

現(xiàn)有的游戲AI平臺就像是為單人表演設(shè)計(jì)的簡陋舞臺,雖然能夠控制游戲角色進(jìn)行簡單動(dòng)作,但無法支持復(fù)雜的多人協(xié)作場景。研究團(tuán)隊(duì)發(fā)現(xiàn),要么是平臺支持多人游戲但無法精確控制角色行為,要么是能夠精確控制但不支持多人模式,更別說要記錄高質(zhì)量的視覺畫面了。

因此,研究團(tuán)隊(duì)從零開始構(gòu)建了SolarisEngine系統(tǒng)。這個(gè)系統(tǒng)的巧妙之處在于將每個(gè)虛擬玩家分解為兩個(gè)部分:一個(gè)"控制器"負(fù)責(zé)決定角色的行為,另一個(gè)"攝像機(jī)"負(fù)責(zé)記錄角色看到的畫面??刂破骶拖袷悄缓蟮哪九紟?,通過編程指令讓游戲角色執(zhí)行各種復(fù)雜的任務(wù),比如建造特定形狀的建筑物、與其他角色協(xié)作完成項(xiàng)目、或者進(jìn)行戰(zhàn)斗。

攝像機(jī)部分則更像是專業(yè)的攝影師,它會(huì)完全模仿控制器指揮的角色行為,確保記錄下的畫面與實(shí)際游戲狀態(tài)完全一致。這種設(shè)計(jì)解決了一個(gè)技術(shù)難題:如何確保記錄的視頻與游戲中的實(shí)際行為精確對應(yīng)。

為了讓這些虛擬"演員"能夠進(jìn)行真實(shí)有趣的游戲行為,研究團(tuán)隊(duì)創(chuàng)建了一個(gè)豐富的技能庫。這些技能就像是演員的臺詞本,包含了建造、挖掘、戰(zhàn)斗、探索等各種游戲活動(dòng)的具體執(zhí)行方案。更重要的是,這些技能支持多人協(xié)作,比如兩個(gè)機(jī)器人可以合作建造一座橋梁,一個(gè)負(fù)責(zé)搭建橋墩,另一個(gè)負(fù)責(zé)鋪設(shè)橋面。

整個(gè)系統(tǒng)采用容器化技術(shù)進(jìn)行部署,就像是把整個(gè)攝制組打包成一個(gè)個(gè)可以快速部署的單元。這樣做的好處是可以同時(shí)運(yùn)行多個(gè)"攝制組",大幅提高數(shù)據(jù)收集的效率。當(dāng)某個(gè)游戲場景出現(xiàn)問題或者卡住時(shí),系統(tǒng)會(huì)自動(dòng)檢測并重新開始,確保數(shù)據(jù)收集過程的連續(xù)性。

通過這個(gè)精心設(shè)計(jì)的系統(tǒng),研究團(tuán)隊(duì)成功收集了包含四大類游戲場景的數(shù)據(jù):建造場景包括房屋、塔樓、橋梁等結(jié)構(gòu)的建設(shè);戰(zhàn)斗場景涵蓋玩家間對戰(zhàn)和與怪物作戰(zhàn);移動(dòng)場景包括追逐、環(huán)繞、直線行走等各種運(yùn)動(dòng)模式;挖掘場景則包含地下探索、礦物開采、地形改造等活動(dòng)。

這些數(shù)據(jù)的珍貴之處在于它們完美捕捉了多人游戲中的互動(dòng)細(xì)節(jié)。當(dāng)一個(gè)玩家放置方塊時(shí),系統(tǒng)同時(shí)記錄了這個(gè)動(dòng)作在所有其他玩家視角中的表現(xiàn)。當(dāng)玩家們合作建造時(shí),每個(gè)人的貢獻(xiàn)都被準(zhǔn)確記錄下來。這種多視角同步記錄為訓(xùn)練多人世界模型提供了理想的數(shù)據(jù)基礎(chǔ)。

二、讓AI學(xué)會(huì)"多重視角"的思考

收集到海量數(shù)據(jù)后,下一個(gè)挑戰(zhàn)是設(shè)計(jì)能夠處理多人視角的AI架構(gòu)。傳統(tǒng)的視頻生成模型就像是只會(huì)畫肖像畫的畫家,雖然技藝精湛,但只能專注于單一對象。而Solaris需要成為一個(gè)能夠同時(shí)處理多個(gè)角色、多個(gè)視角的"全景畫家"。

研究團(tuán)隊(duì)的解決方案頗具巧思。他們沒有完全重新發(fā)明輪子,而是在已有的優(yōu)秀視頻生成模型基礎(chǔ)上進(jìn)行巧妙改造。這就像是給一臺單座跑車改裝成雙座車,既保持了原有的強(qiáng)大性能,又增加了新的功能。

核心的技術(shù)創(chuàng)新在于"視覺交錯(cuò)"機(jī)制。簡單來說,就是讓模型在處理視頻時(shí),將不同玩家的畫面按時(shí)間順序交錯(cuò)排列,就像編織毛衣時(shí)交替使用不同顏色的線一樣。這樣做的好處是模型可以同時(shí)"看到"所有玩家的視角,并且理解它們之間的關(guān)聯(lián)性。

為了讓模型能夠區(qū)分不同的玩家,研究團(tuán)隊(duì)為每個(gè)玩家分配了獨(dú)特的身份標(biāo)識,就像給每個(gè)演員戴上不同顏色的名牌。模型在處理每一幀畫面時(shí),都知道這是來自哪個(gè)玩家的視角,從而能夠做出相應(yīng)的預(yù)測和調(diào)整。

更巧妙的是,模型采用了"共享注意力"機(jī)制。這個(gè)機(jī)制就像是一個(gè)善于協(xié)調(diào)的指揮家,能夠讓交響樂團(tuán)中的不同樂器既保持各自的特色,又和諧統(tǒng)一。在視頻生成過程中,不同玩家的視角信息會(huì)相互交流和影響,確保生成的多個(gè)視角在邏輯上保持一致。

舉個(gè)具體例子來說,當(dāng)玩家A在建造一面墻時(shí),模型不僅要預(yù)測玩家A會(huì)看到墻體逐漸升高的過程,還要同時(shí)預(yù)測站在墻另一側(cè)的玩家B會(huì)看到什么。如果玩家B正好面對著正在建造的墻面,那么在玩家B的視角中也應(yīng)該看到相同的建造過程,只是角度不同。這種跨視角的一致性正是Solaris模型的核心能力。

模型的動(dòng)作處理部分也經(jīng)過了專門優(yōu)化。研究團(tuán)隊(duì)擴(kuò)展了原有模型的動(dòng)作空間,讓它能夠理解《我的世界》中的各種復(fù)雜操作,包括移動(dòng)、跳躍、放置方塊、挖掘、攻擊、物品切換等。這就像是給模型配備了一套完整的"游戲手冊",讓它知道每種動(dòng)作會(huì)產(chǎn)生什么樣的視覺效果。

三、循序漸進(jìn)的訓(xùn)練策略

訓(xùn)練這樣一個(gè)復(fù)雜的多人世界模型就像是培養(yǎng)一個(gè)全能的游戲玩家,需要循序漸進(jìn)的學(xué)習(xí)過程。研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)四階段的訓(xùn)練流程,就像是從幼兒園到大學(xué)的教育體系,每個(gè)階段都有明確的學(xué)習(xí)目標(biāo)和內(nèi)容。

第一階段是單人游戲的強(qiáng)化訓(xùn)練。雖然最終目標(biāo)是多人世界建模,但研究團(tuán)隊(duì)發(fā)現(xiàn)讓模型先徹底掌握單人游戲的各種情況是非常重要的基礎(chǔ)。這就像是學(xué)習(xí)舞蹈時(shí)要先練好基本功,掌握了單人的動(dòng)作要領(lǐng),才能更好地進(jìn)行雙人或群體舞蹈。

在這個(gè)階段,模型使用了大量的人類游戲數(shù)據(jù)進(jìn)行訓(xùn)練。這些數(shù)據(jù)來自VPT數(shù)據(jù)集,包含了超過2000小時(shí)的真實(shí)人類《我的世界》游戲記錄。通過學(xué)習(xí)人類的游戲行為,模型掌握了游戲的基本規(guī)律和常見模式,比如挖掘會(huì)讓方塊消失、放置會(huì)讓方塊出現(xiàn)、不同工具有不同效果等等。

第二階段開始引入多人場景。這時(shí)候模型就像是從獨(dú)奏轉(zhuǎn)向合奏的音樂家,需要學(xué)會(huì)在演奏自己部分的同時(shí),關(guān)注其他演奏者的表現(xiàn)。模型開始使用研究團(tuán)隊(duì)收集的多人游戲數(shù)據(jù)進(jìn)行訓(xùn)練,學(xué)習(xí)理解多個(gè)玩家同時(shí)行動(dòng)時(shí)的復(fù)雜交互。

這個(gè)階段的關(guān)鍵是讓模型建立起"全局視角"的概念。單人游戲時(shí),模型只需要關(guān)注一個(gè)視角的變化,但多人游戲時(shí),一個(gè)玩家的行為會(huì)同時(shí)影響多個(gè)視角。比如當(dāng)一個(gè)玩家點(diǎn)燃火把時(shí),不僅他自己會(huì)看到光亮,附近的其他玩家也會(huì)在各自的視角中看到相應(yīng)的光照變化。

第三階段是因果關(guān)系建模的訓(xùn)練。前兩個(gè)階段使用的是"雙向"訓(xùn)練方式,就像是讓學(xué)生既能從前往后讀課文,也能從后往前讀,這樣有助于更全面地理解內(nèi)容。但在實(shí)際應(yīng)用中,AI需要能夠基于當(dāng)前狀態(tài)預(yù)測未來,這需要"單向"的因果推理能力。

這個(gè)階段的訓(xùn)練就像是教會(huì)模型"時(shí)間的箭頭",讓它明白事件的先后順序和因果關(guān)系。當(dāng)玩家執(zhí)行某個(gè)動(dòng)作時(shí),模型需要能夠預(yù)測這個(gè)動(dòng)作會(huì)在未來的畫面中產(chǎn)生什么樣的變化,而不能"偷看"未來的信息來幫助當(dāng)前的預(yù)測。

第四階段是自我強(qiáng)化訓(xùn)練,這是整個(gè)訓(xùn)練過程中最具挑戰(zhàn)性的部分。傳統(tǒng)的訓(xùn)練方式就像是讓學(xué)生永遠(yuǎn)做課本上的練習(xí)題,雖然能學(xué)到很多知識,但缺乏應(yīng)對新情況的能力。自我強(qiáng)化訓(xùn)練則讓模型開始"做自己的練習(xí)題",使用自己生成的預(yù)測結(jié)果來進(jìn)行進(jìn)一步的訓(xùn)練。

這個(gè)過程中,研究團(tuán)隊(duì)引入了"檢查點(diǎn)自強(qiáng)化"技術(shù)。傳統(tǒng)的自強(qiáng)化訓(xùn)練就像是要求學(xué)生一邊寫作業(yè)一邊背誦所有做過的題目,內(nèi)存負(fù)擔(dān)極重。檢查點(diǎn)技術(shù)則像是允許學(xué)生把中間步驟寫在草稿紙上,需要時(shí)再查閱,大大降低了內(nèi)存使用量,使得更長時(shí)間的訓(xùn)練成為可能。

通過這四個(gè)階段的循序漸進(jìn)訓(xùn)練,Solaris模型最終獲得了穩(wěn)定生成長時(shí)間、多視角一致視頻的能力。整個(gè)訓(xùn)練過程就像是培養(yǎng)一個(gè)從業(yè)余愛好者成長為專業(yè)游戲主播的完整歷程。

四、測試AI的"游戲智商"

要驗(yàn)證Solaris模型是否真正掌握了多人世界建模的能力,研究團(tuán)隊(duì)設(shè)計(jì)了一套全面的測試體系,就像是為AI準(zhǔn)備的"游戲智商測試"。這些測試涵蓋了五個(gè)核心能力維度,每一個(gè)都對應(yīng)著多人游戲中的關(guān)鍵挑戰(zhàn)。

運(yùn)動(dòng)能力測試考察的是模型能否準(zhǔn)確理解和預(yù)測角色的移動(dòng)。在測試場景中,一個(gè)玩家會(huì)進(jìn)行各種運(yùn)動(dòng),比如向前走、轉(zhuǎn)身、跳躍等,而另一個(gè)玩家在旁邊觀察。模型需要準(zhǔn)確預(yù)測觀察者會(huì)看到運(yùn)動(dòng)玩家在不同位置的樣子。這就像是測試一個(gè)導(dǎo)演能否準(zhǔn)確預(yù)測從不同機(jī)位拍攝同一個(gè)演員時(shí)會(huì)得到什么樣的畫面。

定位能力測試更加復(fù)雜,它考驗(yàn)的是模型的空間記憶能力。在這個(gè)測試中,兩個(gè)玩家面對面站立,然后其中一個(gè)轉(zhuǎn)身看向別處,過一段時(shí)間后再轉(zhuǎn)回來。模型需要準(zhǔn)確預(yù)測轉(zhuǎn)身的玩家在轉(zhuǎn)回來時(shí)能否看到另一個(gè)玩家。這個(gè)測試的難點(diǎn)在于,當(dāng)玩家轉(zhuǎn)身時(shí),另一個(gè)玩家雖然從他的視野中消失了,但實(shí)際上仍然存在于虛擬世界中,模型需要"記住"這個(gè)空間關(guān)系。

記憶能力測試進(jìn)一步提升了難度。兩個(gè)玩家都會(huì)轉(zhuǎn)身看向別處,然后再同時(shí)轉(zhuǎn)回來。這要求模型不僅要記住單個(gè)玩家的位置,還要同時(shí)追蹤多個(gè)玩家的空間關(guān)系。就像是要求AI在玩"蒙眼抓人"游戲時(shí),即使看不見其他人,也能記住他們的大概位置。

建造能力測試關(guān)注的是模型能否理解環(huán)境變化。在測試場景中,一個(gè)玩家會(huì)建造簡單的結(jié)構(gòu),比如一面墻或一個(gè)小房子,而另一個(gè)玩家在旁邊觀察。模型需要準(zhǔn)確預(yù)測觀察者會(huì)看到建造過程的每個(gè)步驟,包括方塊的出現(xiàn)、結(jié)構(gòu)的形成等。這個(gè)測試的關(guān)鍵在于驗(yàn)證模型是否理解物理世界的基本規(guī)律,比如方塊不能懸空、建筑物需要有支撐等。

一致性測試是最具挑戰(zhàn)性的,它要求模型確保不同視角之間的邏輯一致性。兩個(gè)相鄰的玩家同時(shí)轉(zhuǎn)向同一個(gè)方向時(shí),他們應(yīng)該看到相似的景物。而當(dāng)他們轉(zhuǎn)向相反方向時(shí),看到的景物應(yīng)該完全不同。這個(gè)測試驗(yàn)證的是模型是否真正理解了三維空間的幾何關(guān)系。

為了客觀評估模型的表現(xiàn),研究團(tuán)隊(duì)采用了"AI評委"的方法。他們使用先進(jìn)的視覺語言模型作為評判員,讓它觀看模型生成的視頻,然后回答具體的問題。比如在運(yùn)動(dòng)測試中,AI評委會(huì)被問"視頻中的玩家是向左移動(dòng)還是向右移動(dòng)?"這種評估方法的優(yōu)勢在于能夠自動(dòng)化地處理大量測試樣本,同時(shí)保證評判標(biāo)準(zhǔn)的一致性。

測試結(jié)果表明,Solaris在各個(gè)維度都展現(xiàn)出了令人印象深刻的能力。在運(yùn)動(dòng)和一致性測試中,模型的表現(xiàn)接近完美,能夠準(zhǔn)確預(yù)測玩家移動(dòng)和視角變化的效果。在更復(fù)雜的記憶和建造測試中,雖然還有改進(jìn)空間,但已經(jīng)遠(yuǎn)超現(xiàn)有的單人世界模型。

特別值得注意的是,當(dāng)研究團(tuán)隊(duì)將Solaris與簡單的多視角拼接方法進(jìn)行比較時(shí),Solaris的優(yōu)勢更加明顯。簡單拼接就像是把兩個(gè)獨(dú)立的單人視頻硬性組合在一起,雖然每個(gè)視頻本身可能看起來不錯(cuò),但兩個(gè)視角之間缺乏邏輯關(guān)聯(lián),經(jīng)常出現(xiàn)不一致的情況。而Solaris生成的視頻則能保持多視角間的和諧統(tǒng)一。

五、從實(shí)驗(yàn)室到現(xiàn)實(shí)世界的可能性

Solaris模型展現(xiàn)出的能力遠(yuǎn)不止是技術(shù)演示,它為未來的多個(gè)應(yīng)用領(lǐng)域打開了新的可能性。就像早期的互聯(lián)網(wǎng)技術(shù)看似只是學(xué)術(shù)研究,但最終改變了整個(gè)世界一樣,多人世界建模技術(shù)也蘊(yùn)含著巨大的潛力。

在游戲開發(fā)領(lǐng)域,這項(xiàng)技術(shù)可能帶來革命性的變化。傳統(tǒng)的游戲測試就像是讓人類玩家在游戲中進(jìn)行各種嘗試,找出可能存在的問題和漏洞,這個(gè)過程既耗時(shí)又費(fèi)力。有了Solaris這樣的技術(shù),游戲開發(fā)者可以讓AI模擬成千上萬種不同的游戲場景,快速發(fā)現(xiàn)潛在問題,大大加速游戲開發(fā)和優(yōu)化的過程。

更進(jìn)一步,這種技術(shù)還能用于生成游戲內(nèi)容。設(shè)想一下,當(dāng)玩家進(jìn)入一個(gè)新的游戲區(qū)域時(shí),AI可以基于玩家的歷史行為和偏好,實(shí)時(shí)生成個(gè)性化的游戲內(nèi)容和挑戰(zhàn)。這就像是擁有一個(gè)永不疲倦的游戲設(shè)計(jì)師,能夠?yàn)槊總€(gè)玩家量身定制獨(dú)特的游戲體驗(yàn)。

在教育和培訓(xùn)領(lǐng)域,多人世界建模技術(shù)也展現(xiàn)出巨大價(jià)值。傳統(tǒng)的虛擬現(xiàn)實(shí)培訓(xùn)系統(tǒng)往往只能支持單人操作,或者多人場景的交互效果不夠真實(shí)。Solaris這樣的技術(shù)可以創(chuàng)建更加逼真的多人協(xié)作訓(xùn)練環(huán)境,讓學(xué)員在虛擬環(huán)境中練習(xí)團(tuán)隊(duì)合作、危機(jī)處理等復(fù)雜技能。

比如在醫(yī)療培訓(xùn)中,多名實(shí)習(xí)醫(yī)生可以在虛擬手術(shù)室中協(xié)作完成復(fù)雜手術(shù),每個(gè)人都能從自己的視角看到真實(shí)的操作環(huán)境和其他成員的行為。這種訓(xùn)練方式既安全又高效,能夠讓學(xué)員在沒有風(fēng)險(xiǎn)的環(huán)境中積累寶貴經(jīng)驗(yàn)。

在機(jī)器人技術(shù)領(lǐng)域,這項(xiàng)研究的意義同樣深遠(yuǎn)?,F(xiàn)實(shí)世界中的機(jī)器人往往需要相互協(xié)作完成任務(wù),比如工廠中的裝配線作業(yè)、倉庫中的貨物分揀等。Solaris展現(xiàn)的多智能體協(xié)調(diào)能力為開發(fā)更智能的機(jī)器人系統(tǒng)提供了重要啟示。

通過在虛擬環(huán)境中訓(xùn)練機(jī)器人的協(xié)作行為,可以大大降低現(xiàn)實(shí)世界測試的成本和風(fēng)險(xiǎn)。機(jī)器人可以在虛擬世界中學(xué)會(huì)如何與其他機(jī)器人協(xié)調(diào)配合,如何處理復(fù)雜的多任務(wù)場景,然后將這些經(jīng)驗(yàn)應(yīng)用到現(xiàn)實(shí)操作中。

當(dāng)然,這項(xiàng)技術(shù)目前還存在一些局限性。最主要的限制是訓(xùn)練數(shù)據(jù)完全來自虛擬環(huán)境,這可能導(dǎo)致模型在處理現(xiàn)實(shí)世界的復(fù)雜情況時(shí)表現(xiàn)不夠理想。虛擬世界雖然復(fù)雜,但仍然是簡化的現(xiàn)實(shí),缺少真實(shí)世界中的許多不確定因素和細(xì)微差別。

另一個(gè)挑戰(zhàn)是持久性記憶的缺乏。目前的模型雖然能在短時(shí)間內(nèi)保持多視角的一致性,但當(dāng)玩家長時(shí)間分離后再次相遇時(shí),模型可能無法準(zhǔn)確記住之前的互動(dòng)歷史。這就像是患有短期記憶障礙的人,雖然能夠應(yīng)對當(dāng)前的情況,但難以維持長期的關(guān)系和連續(xù)性。

盡管存在這些限制,Solaris代表的技術(shù)方向仍然具有巨大的發(fā)展?jié)摿ΑkS著計(jì)算能力的提升和算法的改進(jìn),這些限制有望逐步得到解決。更重要的是,這項(xiàng)研究為整個(gè)人工智能領(lǐng)域提供了一個(gè)重要的研究方向,即如何讓AI系統(tǒng)更好地理解和預(yù)測多智能體交互的復(fù)雜場景。

研究團(tuán)隊(duì)已經(jīng)將SolarisEngine系統(tǒng)和相關(guān)數(shù)據(jù)集開源,這意味著世界各地的研究者都可以在此基礎(chǔ)上進(jìn)行進(jìn)一步的探索和改進(jìn)。這種開放的研究態(tài)度有助于加速整個(gè)領(lǐng)域的發(fā)展,就像早期的開源軟件推動(dòng)了互聯(lián)網(wǎng)技術(shù)的快速普及一樣。

說到底,Solaris不僅僅是一個(gè)能夠生成多人游戲視頻的AI模型,更是向著理解復(fù)雜多智能體世界邁出的重要一步。在我們生活的現(xiàn)實(shí)世界中,幾乎所有有意義的活動(dòng)都涉及多個(gè)參與者的協(xié)作和互動(dòng)。讓AI學(xué)會(huì)理解和預(yù)測這種復(fù)雜的多方互動(dòng),將為構(gòu)建更智能、更有用的人工智能系統(tǒng)奠定重要基礎(chǔ)。

從某種意義上說,這項(xiàng)研究讓我們看到了AI技術(shù)發(fā)展的一個(gè)重要趨勢:從單一任務(wù)的優(yōu)化轉(zhuǎn)向復(fù)雜場景的理解,從孤立的智能體轉(zhuǎn)向協(xié)作的智能群體。這不僅僅是技術(shù)上的進(jìn)步,更是對智能本質(zhì)的更深層次探索。歸根結(jié)底,真正的智能往往體現(xiàn)在與他人的互動(dòng)和協(xié)作中,而Solaris正是朝著這個(gè)方向邁出的堅(jiān)實(shí)一步。對于那些關(guān)注AI技術(shù)發(fā)展趨勢的讀者,這項(xiàng)研究無疑提供了一個(gè)值得深思的視角:未來的AI系統(tǒng)將不再是孤立的智能個(gè)體,而是能夠理解、預(yù)測和參與復(fù)雜社會(huì)互動(dòng)的智能群體。

Q&A

Q1:Solaris模型和普通的視頻生成AI有什么區(qū)別?

A:普通的視頻生成AI就像只會(huì)畫單人肖像的畫家,只能處理單一視角的內(nèi)容。而Solaris是首個(gè)能夠同時(shí)處理多個(gè)玩家視角的世界模型,它能確保當(dāng)一個(gè)玩家在《我的世界》中放置方塊時(shí),其他玩家的視角中也會(huì)同步出現(xiàn)相應(yīng)的變化,實(shí)現(xiàn)真正的多視角一致性。

Q2:SolarisEngine數(shù)據(jù)收集系統(tǒng)是如何工作的?

A:SolarisEngine就像一個(gè)自動(dòng)化的電影攝制組,它讓虛擬機(jī)器人在《我的世界》中進(jìn)行各種游戲活動(dòng),包括建造、挖掘、戰(zhàn)斗、探索等,同時(shí)從多個(gè)角度同步記錄所有行為和視覺變化。通過這種方式,研究團(tuán)隊(duì)收集了超過1200萬幀的高質(zhì)量多人游戲數(shù)據(jù)。

Q3:這項(xiàng)技術(shù)除了游戲還能用在哪些地方?

A:這項(xiàng)技術(shù)的應(yīng)用前景很廣泛,包括虛擬現(xiàn)實(shí)培訓(xùn)(比如讓多名實(shí)習(xí)醫(yī)生在虛擬手術(shù)室協(xié)作)、機(jī)器人協(xié)作系統(tǒng)開發(fā)、教育培訓(xùn)環(huán)境構(gòu)建等。任何需要多個(gè)智能體協(xié)調(diào)配合的場景都可能受益于這種多視角世界建模技術(shù)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
奧迪A5L拆車:不管信不信,留給你買燃油車的時(shí)間不多了!

奧迪A5L拆車:不管信不信,留給你買燃油車的時(shí)間不多了!

大飆車
2026-01-17 14:49:50
黃巢兵敗被殺,10余名姬妾被俘,唐僖宗報(bào)復(fù)有多狠?史官都不敢寫

黃巢兵敗被殺,10余名姬妾被俘,唐僖宗報(bào)復(fù)有多狠?史官都不敢寫

掠影后有感
2026-03-01 10:09:20
若不出意外,2026年上半年開始,一半家庭都可能面臨“四大難題”

若不出意外,2026年上半年開始,一半家庭都可能面臨“四大難題”

貓叔東山再起
2026-03-01 12:40:03
上海富人家保姆狂偷戶主奢侈品,監(jiān)控流出評論區(qū)嚇傻了

上海富人家保姆狂偷戶主奢侈品,監(jiān)控流出評論區(qū)嚇傻了

不二表姐
2026-02-24 22:17:15
14年兒子坐馬航失聯(lián),多年后父親收到回信,堅(jiān)信兒子去了平行世界

14年兒子坐馬航失聯(lián),多年后父親收到回信,堅(jiān)信兒子去了平行世界

來科點(diǎn)譜
2026-02-17 11:05:42
反轉(zhuǎn)!內(nèi)賈德大難不死,伊朗反擊不設(shè)限,特朗普:美軍將死傷更多

反轉(zhuǎn)!內(nèi)賈德大難不死,伊朗反擊不設(shè)限,特朗普:美軍將死傷更多

阿芒娛樂說
2026-03-02 20:43:10
贏球僅1天,中國男籃壞消息傳來:將失去1個(gè)主場,沖4連勝難了

贏球僅1天,中國男籃壞消息傳來:將失去1個(gè)主場,沖4連勝難了

墨印齋
2026-03-02 19:24:09
港口被搶,李嘉誠清倉英國電網(wǎng),他用百億學(xué)費(fèi),換回一個(gè)殘酷真相

港口被搶,李嘉誠清倉英國電網(wǎng),他用百億學(xué)費(fèi),換回一個(gè)殘酷真相

村里一枝花人
2026-03-02 15:04:49
深圳男子突發(fā)心絞痛,人送到醫(yī)院心臟就停了!停跳整整兩天!醫(yī)生用ECMO搶回一命!罪魁禍?zhǔn)子质撬?>
    </a>
        <h3>
      <a href=深圳晚報(bào)
2026-03-02 21:00:39
美國精英想不通:為什么每次要打壓中國時(shí),總有意外發(fā)生?

美國精英想不通:為什么每次要打壓中國時(shí),總有意外發(fā)生?

聚焦真實(shí)瞬間
2026-01-26 10:19:09
中美一旦開戰(zhàn),美軍將全面轟炸中國?基辛格曾稱:中美正走向懸崖

中美一旦開戰(zhàn),美軍將全面轟炸中國?基辛格曾稱:中美正走向懸崖

李健政觀察
2026-03-02 12:49:07
河南洛陽一女子過年離家,智能馬桶17天耗水超200噸,當(dāng)事人:馬桶晝夜不停自動(dòng)工作

河南洛陽一女子過年離家,智能馬桶17天耗水超200噸,當(dāng)事人:馬桶晝夜不停自動(dòng)工作

黃河新聞網(wǎng)呂梁
2026-02-28 14:27:42
警惕!阿托伐他汀是好藥,但不可和4種藥聯(lián)用,否則不治病或致命

警惕!阿托伐他汀是好藥,但不可和4種藥聯(lián)用,否則不治病或致命

醫(yī)學(xué)科普匯
2026-03-02 19:45:03
以色列股市開盤大漲!美股指期貨走低

以色列股市開盤大漲!美股指期貨走低

證券時(shí)報(bào)e公司
2026-03-02 17:52:33
隨著一場奪冠 斯諾克最新排名:丁俊暉升第14 趙心童第5中國一哥

隨著一場奪冠 斯諾克最新排名:丁俊暉升第14 趙心童第5中國一哥

削桐作琴
2026-03-02 17:17:08
俄軍已經(jīng)動(dòng)了,中國幫不幫伊朗?中方三句話,沒一句是美國想聽的

俄軍已經(jīng)動(dòng)了,中國幫不幫伊朗?中方三句話,沒一句是美國想聽的

李健政觀察
2026-03-02 21:30:52
真相大白!王曼昱丟冠原因曝光,是打不過莎莎嗎?張繼科早有預(yù)言

真相大白!王曼昱丟冠原因曝光,是打不過莎莎嗎?張繼科早有預(yù)言

曹說體育
2026-03-01 22:16:15
汪小菲和張?zhí)m矛盾升級!張?zhí)m哭完不敢對鏡頭,大S當(dāng)年真沒說錯(cuò)他

汪小菲和張?zhí)m矛盾升級!張?zhí)m哭完不敢對鏡頭,大S當(dāng)年真沒說錯(cuò)他

夏末moent
2026-03-02 08:43:40
美以伊最新發(fā)聲

美以伊最新發(fā)聲

看看新聞Knews
2026-03-02 16:59:09
56歲大媽心梗離世,醫(yī)生:吃他汀時(shí)除了牛奶,這6種食物盡量少碰

56歲大媽心梗離世,醫(yī)生:吃他汀時(shí)除了牛奶,這6種食物盡量少碰

岐黃傳人孫大夫
2026-02-28 22:15:03
2026-03-02 22:11:00
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
7408文章數(shù) 553關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

伊朗公布最新戰(zhàn)況 通報(bào)還披露內(nèi)塔尼亞胡行蹤

頭條要聞

伊朗公布最新戰(zhàn)況 通報(bào)還披露內(nèi)塔尼亞胡行蹤

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

時(shí)尚
教育
旅游
健康
軍事航空

推廣|| 春天第一雙鞋!暴走不累、搭遍好看小裙子

教育要聞

免費(fèi)課后 上精品課

旅游要聞

AI 復(fù)活千年文物,元宵文旅再出圈

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

軍事要聞

美國中央司令部透露對伊朗動(dòng)武全部武器裝備清單

無障礙瀏覽 進(jìn)入關(guān)懷版