国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

西安工程大學(xué)與中科院AR3D-R1:強化學(xué)習(xí)實現(xiàn)AI類人3D建模思考

0
分享至


這項由西安工程大學(xué)的唐藝文、北京大學(xué)的朱凱欣、香港中文大學(xué)的郭若伊和張瑞等多位研究者組成的國際團隊完成的研究,于2024年12月發(fā)表在arXiv預(yù)印本平臺(論文編號:2512.10949),感興趣的讀者可以通過該編號查詢完整論文。

想象一下,如果讓一臺計算機像雕刻家一樣創(chuàng)造3D模型會是什么樣子?傳統(tǒng)的計算機生成3D模型就像一個只會按照固定模板工作的機器人,你給它一個描述,它就機械地拼湊出一個大概的樣子,但往往缺乏細節(jié)和美感。而這項研究就是要教會AI像真正的藝術(shù)家一樣思考和創(chuàng)作,先構(gòu)思整體輪廓,再精雕細琢每個細節(jié)。

這個研究團隊開發(fā)的系統(tǒng)叫做AR3D-R1,它采用了一種叫做"強化學(xué)習(xí)"的技術(shù)。簡單來說,強化學(xué)習(xí)就像教孩子學(xué)騎自行車一樣,通過不斷的嘗試、犯錯、改正來提升技能。但不同的是,這里的"孩子"是計算機,"自行車"是3D建模,而"教練"則是一套精心設(shè)計的評價系統(tǒng)。

研究的核心創(chuàng)新在于首次將強化學(xué)習(xí)系統(tǒng)性地應(yīng)用到文本生成3D模型的任務(wù)中。傳統(tǒng)的AI文本生成3D模型就像一個只會按部就班工作的工匠,收到指令后立即開始制作,往往顧此失彼。而AR3D-R1更像一個經(jīng)驗豐富的雕塑家,會先仔細思考整個作品的構(gòu)思,然后分步驟實施創(chuàng)作。

一、強化學(xué)習(xí)如何改變3D建模的游戲規(guī)則

在深入了解這項研究之前,我們需要理解什么是強化學(xué)習(xí),以及它為什么能夠革新3D建模。強化學(xué)習(xí)可以比作培養(yǎng)一個學(xué)徒工藝師的過程。傳統(tǒng)的機器學(xué)習(xí)就像給學(xué)徒一本詳細的教科書,讓他按照書本知識工作。而強化學(xué)習(xí)則更像是讓學(xué)徒在真實的工作坊中實踐,每完成一件作品,師傅就會給出評價和建議,學(xué)徒根據(jù)這些反饋不斷改進自己的技藝。

在3D建模領(lǐng)域,這種方法尤其重要。當(dāng)你對AI說"創(chuàng)建一個紅色的跑車"時,傳統(tǒng)AI可能會生成一個勉強像車的紅色物體,但缺乏跑車應(yīng)有的流線型設(shè)計和精致細節(jié)。而經(jīng)過強化學(xué)習(xí)訓(xùn)練的AI則會像一個經(jīng)驗豐富的設(shè)計師,首先理解什么是跑車的本質(zhì)特征,然后逐步添加符合美學(xué)和功能要求的細節(jié)。

這項研究的突破性在于,它是第一個系統(tǒng)性地將強化學(xué)習(xí)應(yīng)用到文本生成3D模型的自回歸生成任務(wù)中的工作。自回歸生成就像是逐筆繪畫,AI需要決定每一筆畫在哪里、畫什么,而每一筆都會影響后續(xù)的創(chuàng)作。這種逐步生成的特性使得強化學(xué)習(xí)的逐步優(yōu)化機制能夠發(fā)揮最大效用。

研究團隊發(fā)現(xiàn),3D模型的生成比2D圖像復(fù)雜得多,因為它涉及到空間的幾何一致性和精細的局部紋理。這就像在三維空間中雕刻,需要同時考慮從各個角度觀察的效果,確保整體協(xié)調(diào)統(tǒng)一。傳統(tǒng)的訓(xùn)練方法往往無法處理這種復(fù)雜性,而強化學(xué)習(xí)通過不斷的試錯和優(yōu)化,能夠逐步掌握這種空間感知能力。

二、分層思考:從粗糙輪廓到精美細節(jié)的創(chuàng)作哲學(xué)

研究團隊最重要的發(fā)現(xiàn)是,AI在創(chuàng)建3D模型時也會像人類藝術(shù)家一樣遵循"從整體到局部"的創(chuàng)作規(guī)律。他們觀察到,在訓(xùn)練過程中,AI首先學(xué)會構(gòu)建物體的整體幾何形狀,然后逐步添加材質(zhì)、顏色和精細紋理等細節(jié)。這種現(xiàn)象啟發(fā)了他們開發(fā)名為"Hi-GRPO"的分層強化學(xué)習(xí)方法。

Hi-GRPO的工作原理可以用建筑師設(shè)計房屋來類比。建筑師不會一開始就關(guān)注門把手的樣式,而是先確定房屋的整體布局、房間分配和結(jié)構(gòu)框架,然后再考慮裝修細節(jié)。同樣,Hi-GRPO將3D生成過程分為兩個階段:第一階段專注于全局幾何結(jié)構(gòu),第二階段專注于局部紋理和細節(jié)優(yōu)化。

在第一階段,系統(tǒng)接收到文本描述后,會先進行高層次的語義推理。比如收到"制作一個現(xiàn)代簡約風(fēng)格的椅子"這樣的指令時,系統(tǒng)首先分析椅子的基本組成部分:座椅、靠背、支撐腿等,確定它們的相對位置和比例關(guān)系。這個過程就像建筑師繪制平面圖,重點是整體布局的合理性。

第二階段則轉(zhuǎn)向細節(jié)優(yōu)化。系統(tǒng)會基于第一階段的整體框架,進行更精細的視覺推理,決定材質(zhì)紋理、顏色搭配、表面細節(jié)等。繼續(xù)以椅子為例,這個階段會決定椅面是皮質(zhì)還是布藝、靠背的曲線如何、腿部的連接方式等具體細節(jié)。

這種分層方法的優(yōu)勢在于,它符合人類的認知規(guī)律,也更適合計算機的處理方式。當(dāng)整體結(jié)構(gòu)確定后,細節(jié)的添加就有了明確的框架約束,避免了細節(jié)與整體不協(xié)調(diào)的問題。研究結(jié)果顯示,采用這種分層方法的AI生成的3D模型在幾何一致性和視覺質(zhì)量方面都有顯著提升。

三、多維度評價體系:教AI什么是"好看"和"準(zhǔn)確"

要訓(xùn)練一個能夠生成高質(zhì)量3D模型的AI,關(guān)鍵在于建立一套科學(xué)的評價標(biāo)準(zhǔn),就像培養(yǎng)一個藝術(shù)家需要有經(jīng)驗豐富的導(dǎo)師提供指導(dǎo)一樣。這項研究的另一個重要貢獻是構(gòu)建了一套全面的多維度評價體系,從不同角度判斷AI生成的3D模型質(zhì)量。

這套評價體系包含四個主要維度,每個維度就像一位專業(yè)評委,從不同角度審視AI的作品。第一個維度是"人類偏好",就像普通觀眾的美學(xué)感受。研究團隊使用了HPS(Human Preference Score)模型,這個模型基于大量人類對圖像的偏好數(shù)據(jù)訓(xùn)練而成,能夠模擬普通人看到3D模型渲染圖時的直覺反應(yīng)。

第二個維度是"提示對齊與美學(xué)質(zhì)量"。這就像檢查AI是否準(zhǔn)確理解并執(zhí)行了用戶的指令。當(dāng)用戶說要一個"藍色的小汽車"時,生成的模型確實應(yīng)該是藍色的,確實應(yīng)該是汽車的形狀。研究團隊使用了UnifiedReward等專業(yè)模型來評估這種對齊程度,同時也評估生成模型的整體美學(xué)質(zhì)量。

第三個維度是"3D一致性",這可能是最重要也是最具挑戰(zhàn)性的評價標(biāo)準(zhǔn)。3D模型不像平面圖像,它需要在從不同角度觀察時都保持合理和一致。就像一個真實的杯子,無論從正面、側(cè)面還是俯視角度看,都應(yīng)該是同一個杯子的不同視角,而不是幾個不相關(guān)的形狀拼湊在一起。研究團隊發(fā)現(xiàn),傳統(tǒng)的評價模型在這方面表現(xiàn)不佳,于是他們創(chuàng)新性地使用了先進的多模態(tài)大語言模型Qwen2.5-VL來評估3D一致性。

第四個維度是"組件完整性",這個評價標(biāo)準(zhǔn)關(guān)注的是生成的3D模型是否包含了應(yīng)有的所有部分。比如生成一輛汽車時,應(yīng)該有車輪、車門、擋風(fēng)玻璃等必要組件,而且這些組件的數(shù)量和位置應(yīng)該合理。為了準(zhǔn)確評估這一點,研究團隊將3D模型轉(zhuǎn)換為點云數(shù)據(jù),然后使用專門的3D理解模型ShapeLLM來檢測各個組件的存在和完整性。

這種多維度評價體系的巧妙之處在于,不同的評價維度在訓(xùn)練過程的不同階段發(fā)揮不同的作用。在粗糙建模階段,主要關(guān)注整體結(jié)構(gòu)和提示對齊;在細節(jié)優(yōu)化階段,則更重視美學(xué)質(zhì)量和組件完整性。這種分層評價策略確保了AI在每個階段都能接收到最相關(guān)和最有用的反饋。

四、算法優(yōu)化:讓AI學(xué)習(xí)更聰明、更穩(wěn)定

在技術(shù)實現(xiàn)層面,研究團隊對強化學(xué)習(xí)算法進行了針對性的改進,以適應(yīng)3D生成任務(wù)的特殊需求。他們的核心發(fā)現(xiàn)是,3D生成更適合"token級別"的優(yōu)化策略,而不是傳統(tǒng)的"序列級別"優(yōu)化。

要理解這個區(qū)別,可以把3D模型的生成過程想象成寫一篇文章。傳統(tǒng)的序列級別優(yōu)化就像對整篇文章進行評價和修改,而token級別優(yōu)化則像逐字逐句地精雕細琢。對于3D生成來說,每個token代表3D空間中的一個小塊,這種精細化的優(yōu)化能夠更好地捕捉空間結(jié)構(gòu)的細微差別。

研究團隊還發(fā)現(xiàn),一些看似簡單的技術(shù)改進能帶來顯著的效果提升。比如"動態(tài)采樣"技術(shù),這就像一個經(jīng)驗豐富的老師會根據(jù)學(xué)生的學(xué)習(xí)進度調(diào)整教學(xué)節(jié)奏。當(dāng)AI在某些類型的模型上表現(xiàn)良好時,系統(tǒng)會適當(dāng)增加這類樣本的訓(xùn)練;當(dāng)AI在某些方面還有不足時,系統(tǒng)會提供更多相關(guān)的訓(xùn)練機會。

另一個重要的改進是"解耦剪切"技術(shù)。在傳統(tǒng)的強化學(xué)習(xí)中,系統(tǒng)對好的和壞的嘗試采用相同的處理方式。而解耦剪切允許系統(tǒng)對低概率但可能有創(chuàng)意的嘗試給予更大的探索空間,同時對已經(jīng)表現(xiàn)良好的方案進行保守的調(diào)整。這就像給藝術(shù)家在創(chuàng)新和穩(wěn)定之間找到平衡點。

在數(shù)據(jù)規(guī)模和訓(xùn)練輪次的調(diào)優(yōu)方面,研究團隊發(fā)現(xiàn)了一個有趣的規(guī)律:增加訓(xùn)練數(shù)據(jù)的效果比增加訓(xùn)練輪次更顯著。具體來說,將數(shù)據(jù)規(guī)模擴大到1.5倍、2倍和3倍,分別帶來0.4、0.2和0.4的性能提升。而在訓(xùn)練輪次方面,適度增加(比如翻倍)能帶來0.9的顯著提升,但過度訓(xùn)練(比如增加三倍)反而會導(dǎo)致性能下降。這表明AI在3D生成任務(wù)中也會出現(xiàn)"過擬合"現(xiàn)象,就像一個學(xué)生過度練習(xí)某類題目反而影響了對其他題目的適應(yīng)能力。

五、全新評測標(biāo)準(zhǔn):MME-3DR讓AI面對真正的挑戰(zhàn)

傳統(tǒng)的3D生成評測基準(zhǔn)就像小學(xué)生的考試題,過于簡單,無法真正考察AI的能力。現(xiàn)有的測試大多關(guān)注物體的多樣性,比如能生成多少種不同的椅子、桌子等,但忽略了AI是否真正理解這些物體的本質(zhì)特征和復(fù)雜關(guān)系。

為了解決這個問題,研究團隊構(gòu)建了名為MME-3DR的全新評測基準(zhǔn),這就像為AI設(shè)計了一套更接近現(xiàn)實應(yīng)用的"高考試題"。MME-3DR包含249個精心挑選的復(fù)雜3D對象,分布在五個具有挑戰(zhàn)性的類別中。

第一類是"空間與結(jié)構(gòu)幾何",占比16.1%。這類對象具有復(fù)雜的空間布局和組件排列,就像需要理解建筑結(jié)構(gòu)的復(fù)雜性。比如一個多層書架,AI需要理解層板之間的間距關(guān)系、支撐結(jié)構(gòu)的穩(wěn)定性等。

第二類是"機械功能",占比21.5%。這類對象涉及物理功能和交互式機械組件,要求AI理解物體的工作原理。比如一把可折疊的梯子,AI需要理解關(guān)節(jié)的運動機制、支撐的力學(xué)原理等。

第三類是"生物與有機形狀",占比21.3%。這包括動物、植物等具有動態(tài)有機特征的生物體,要求AI理解自然形態(tài)的復(fù)雜性。比如一只鹿,AI需要掌握動物身體比例、肌肉線條、自然姿態(tài)等特征。

第四類是"世界知識稀有對象",占比15.4%。這類對象需要廣泛的現(xiàn)實世界知識,包括一些低頻出現(xiàn)的概念。比如某種特定的花卉品種,AI需要了解其獨特的形態(tài)特征和生長特點。

第五類是"風(fēng)格化表現(xiàn)",占比25.7%。這包括非照片寫實的形式,如卡通、抽象或風(fēng)格化的藝術(shù)詮釋,要求AI具備抽象思維能力。

在MME-3DR測試中,研究團隊發(fā)現(xiàn)了一個有趣的現(xiàn)象:現(xiàn)有的3D生成模型在機械結(jié)構(gòu)和生物形態(tài)方面表現(xiàn)相對較好,可能因為訓(xùn)練數(shù)據(jù)中這類樣本較多;但在其他三個類別上則顯得力不從心。這說明當(dāng)前的AI模型很大程度上還是依賴記憶而非真正的理解。

經(jīng)過強化學(xué)習(xí)訓(xùn)練的AR3D-R1在所有五個類別上都實現(xiàn)了顯著提升,特別是在風(fēng)格化表現(xiàn)方面進步最為明顯。這表明強化學(xué)習(xí)確實能夠增強AI的抽象推理能力,讓它不僅僅是復(fù)制訓(xùn)練過的樣本,而是真正理解和創(chuàng)新。

六、實戰(zhàn)表現(xiàn):AR3D-R1與現(xiàn)有技術(shù)的較量

為了驗證AR3D-R1的實際效果,研究團隊將其與目前最先進的幾個3D生成模型進行了全面比較,包括Trellis、ShapeLLM-Omni、LGM等知名系統(tǒng)。這就像讓不同風(fēng)格的藝術(shù)家同臺競技,看誰能更好地將文字描述轉(zhuǎn)化為精美的3D作品。

在傳統(tǒng)的Toys4K測試集上,AR3D-R1取得了令人矚目的成績。CLIP得分達到29.3分,相比基礎(chǔ)版本的ShapeLLM-Omni提升了6.6分,相比當(dāng)前最強的Trellis模型提升了2.5分。同時,在衡量生成質(zhì)量的核心指標(biāo)KD距離上,AR3D-R1達到了0.156,顯著優(yōu)于其他模型。這些數(shù)字背后的含義是,AR3D-R1生成的3D模型不僅更準(zhǔn)確地反映了文字描述的內(nèi)容,而且在視覺質(zhì)量上也更加出色。

更令人印象深刻的是在MME-3DR這個更具挑戰(zhàn)性的測試集上的表現(xiàn)。AR3D-R1的CLIP得分達到28.5分,大幅超越了Trellis的23.4分和ShapeLLM-Omni的19.8分。這個差距尤其說明問題,因為MME-3DR專門測試的是AI的推理和理解能力,而不是簡單的模式匹配。

從定性結(jié)果來看,AR3D-R1展現(xiàn)出了明顯的分層創(chuàng)作特征。在生成過程中,可以清楚地看到AI首先構(gòu)建出物體的基本輪廓和結(jié)構(gòu),然后逐步添加細節(jié)。比如在生成一個"明黃色車身、紅色駕駛室、大型灰色車輪的簡化自卸卡車"時,第一步AI會創(chuàng)建出基本的卡車形狀,確定各部分的比例關(guān)系;第二步則會添加正確的顏色、紋理細節(jié),甚至包括車燈、保險杠等精細部件。

這種分層創(chuàng)作方式的優(yōu)勢在處理復(fù)雜物體時特別明顯。傳統(tǒng)的AI往往在生成復(fù)雜物體時容易出現(xiàn)局部沖突,比如汽車的車輪和車身不協(xié)調(diào)、動物的身體比例失調(diào)等。而AR3D-R1由于采用了全局到局部的創(chuàng)作策略,能夠很好地避免這些問題,生成的物體整體和諧統(tǒng)一。

七、技術(shù)突破的深層意義與應(yīng)用前景

AR3D-R1的成功不僅僅是技術(shù)指標(biāo)的提升,更代表了AI創(chuàng)作領(lǐng)域的一個重要轉(zhuǎn)折點。傳統(tǒng)的AI生成技術(shù)更像一臺復(fù)雜的復(fù)印機,能夠基于訓(xùn)練數(shù)據(jù)重新組合出新的內(nèi)容,但缺乏真正的創(chuàng)造性思維。而引入強化學(xué)習(xí)后的AI開始具備了類似人類的創(chuàng)作思維模式:先構(gòu)思、再執(zhí)行,在創(chuàng)作過程中不斷思考和調(diào)整。

這種突破的意義遠超3D建模本身。它證明了強化學(xué)習(xí)可以被成功應(yīng)用到需要分層思考和長期規(guī)劃的創(chuàng)意任務(wù)中。這為未來的AI發(fā)展指明了一個新方向:不僅要讓AI學(xué)會模仿,更要讓AI學(xué)會思考和創(chuàng)新。

在實際應(yīng)用方面,AR3D-R1的技術(shù)可能會在多個領(lǐng)域產(chǎn)生深遠影響。游戲開發(fā)者可以利用這項技術(shù)快速創(chuàng)建游戲中的各種3D資產(chǎn),從建筑物到角色,大大降低開發(fā)成本和周期。建筑師和工業(yè)設(shè)計師可以通過簡單的文字描述快速生成設(shè)計原型,加速創(chuàng)意到實現(xiàn)的過程。

電商和廣告行業(yè)也能從中受益。商家可以通過文字描述快速生成產(chǎn)品的3D展示模型,為在線購物提供更直觀的體驗。教育領(lǐng)域也有廣闊的應(yīng)用前景,教師可以通過描述快速創(chuàng)建教學(xué)用的3D模型,讓抽象概念變得更加具體生動。

更重要的是,這項技術(shù)的分層思維方式可能會被應(yīng)用到其他需要復(fù)雜推理的AI任務(wù)中。無論是文章寫作、音樂創(chuàng)作,還是科學(xué)研究中的假設(shè)生成,都可能受益于這種"先整體構(gòu)思,再細節(jié)完善"的方法論。

八、面臨的挑戰(zhàn)與未來發(fā)展方向

盡管AR3D-R1取得了顯著成果,但研究團隊也坦誠地指出了當(dāng)前技術(shù)面臨的挑戰(zhàn)和限制。首先是計算資源的需求。強化學(xué)習(xí)本身就是一個計算密集型的過程,而3D生成又比2D圖像生成復(fù)雜得多,這意味著訓(xùn)練一個高質(zhì)量的模型需要大量的計算資源和時間。對于普通研究者或小公司來說,這可能是一個門檻。

其次是評價體系的主觀性問題。雖然研究團隊構(gòu)建了多維度的評價體系,但"什么是好看的3D模型"在很大程度上仍然是主觀的。不同文化背景、不同應(yīng)用場景下,人們對美學(xué)的標(biāo)準(zhǔn)可能存在顯著差異。如何讓AI適應(yīng)這種多樣性,是一個需要長期探索的問題。

訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性也是一個重要挑戰(zhàn)。目前的3D模型數(shù)據(jù)庫雖然規(guī)模不小,但相對于現(xiàn)實世界的復(fù)雜性仍然有限。特別是一些特殊領(lǐng)域或文化特色的物體,可能在訓(xùn)練數(shù)據(jù)中代表性不足,導(dǎo)致AI在處理這些內(nèi)容時表現(xiàn)不佳。

從技術(shù)角度來看,當(dāng)前的方法還有很多改進空間。比如如何更好地處理物體之間的相互關(guān)系,如何生成更復(fù)雜的場景而不僅僅是單個物體,如何讓AI理解和遵循物理定律等。這些都是未來研究的重要方向。

研究團隊特別提到,他們希望這項工作能夠為RL驅(qū)動的3D生成推理研究提供有價值的見解。他們認為,強化學(xué)習(xí)在3D生成領(lǐng)域的應(yīng)用還處于起步階段,有巨大的探索空間。未來可能會看到更多結(jié)合不同AI技術(shù)的混合方法,以及針對特定應(yīng)用場景優(yōu)化的專用模型。

另一個值得關(guān)注的發(fā)展方向是交互式生成。目前的AI模型主要基于靜態(tài)的文字描述進行生成,但在實際應(yīng)用中,用戶往往希望能夠?qū)崟r調(diào)整和修改。如何讓AI能夠理解用戶的修改意圖,并進行相應(yīng)的局部調(diào)整,是一個技術(shù)和用戶體驗層面的雙重挑戰(zhàn)。

說到底,AR3D-R1代表的不僅僅是3D生成技術(shù)的進步,更是AI從"模仿者"向"創(chuàng)造者"轉(zhuǎn)變的一個重要里程碑。就像人類從學(xué)會使用工具到學(xué)會思考一樣,AI也在逐步獲得更高層次的認知能力。雖然我們距離真正的AI創(chuàng)造者還有很長的路要走,但AR3D-R1已經(jīng)向我們展示了這條道路的可行性和前景。

對于普通人來說,這意味著未來我們與AI協(xié)作創(chuàng)作的方式將會更加自然和高效。也許在不久的將來,我們只需要用自然語言描述自己的創(chuàng)意,AI就能幫助我們將想法轉(zhuǎn)化為精美的3D作品,讓創(chuàng)造力的表達不再受限于技術(shù)門檻。這種人機協(xié)作的創(chuàng)作模式,可能會開啟一個全新的數(shù)字創(chuàng)意時代。

Q&A

Q1:AR3D-R1相比傳統(tǒng)3D生成模型有什么特別之處?

A:AR3D-R1最大的特點是采用了強化學(xué)習(xí)和分層思考方式。傳統(tǒng)AI像按固定模板工作的機器,而AR3D-R1更像真正的藝術(shù)家,會先構(gòu)思整體輪廓再精雕細琢。它首次將強化學(xué)習(xí)系統(tǒng)性應(yīng)用到文本生成3D模型中,通過不斷試錯和優(yōu)化來提升創(chuàng)作質(zhì)量。

Q2:什么是Hi-GRPO分層強化學(xué)習(xí)方法?

A:Hi-GRPO是研究團隊開發(fā)的分層學(xué)習(xí)方法,將3D生成分為兩個階段。第一階段專注于全局幾何結(jié)構(gòu),就像建筑師先畫平面圖;第二階段專注于局部紋理和細節(jié),像裝修師添加精美裝飾。這種方法符合人類創(chuàng)作規(guī)律,能生成更協(xié)調(diào)統(tǒng)一的3D模型。

Q3:MME-3DR評測基準(zhǔn)為什么更能考察AI能力?

A:MME-3DR包含249個復(fù)雜3D對象,涵蓋空間幾何、機械功能、生物形態(tài)、稀有對象和風(fēng)格化表現(xiàn)五大類別。與傳統(tǒng)只關(guān)注物體多樣性的測試不同,MME-3DR專門考察AI的推理和理解能力,就像從小學(xué)題升級到高考題,能真正檢驗AI是否理解物體本質(zhì)而非簡單記憶。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國攔截售臺武器,會發(fā)生什么?

“第三次世界大戰(zhàn)”導(dǎo)火索?如果中國攔截售臺武器,會發(fā)生什么?

扶蘇聊歷史
2025-12-27 10:30:21
俄羅斯運輸核反應(yīng)堆船只被擊沉,烏克蘭笑了

俄羅斯運輸核反應(yīng)堆船只被擊沉,烏克蘭笑了

史政先鋒
2025-12-31 21:38:56
下月起,看病開藥新規(guī)!6類藥超7天全自費,慢病一次開3個月

下月起,看病開藥新規(guī)!6類藥超7天全自費,慢病一次開3個月

蜉蝣說
2025-12-30 11:59:54
龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報的真相太炸裂

龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報的真相太炸裂

滄海一書客
2025-12-25 19:27:44
剛剛!濱江道、世紀鐘、解放橋跨年夜震撼一幕···

剛剛!濱江道、世紀鐘、解放橋跨年夜震撼一幕···

天津人
2025-12-31 22:59:53
攤牌了!徐帆回應(yīng)婚變傳聞才4個月左右 ,馮小剛就連演都懶得演了

攤牌了!徐帆回應(yīng)婚變傳聞才4個月左右 ,馮小剛就連演都懶得演了

阿廢冷眼觀察所
2025-12-10 06:53:04
孔令輝現(xiàn)身!乒乓王子如今的樣子變化巨大,國乒教練組競聘已結(jié)束

孔令輝現(xiàn)身!乒乓王子如今的樣子變化巨大,國乒教練組競聘已結(jié)束

三十年萊斯特城球迷
2025-12-31 22:34:39
浙江足協(xié)官方:寧波職業(yè)足球俱樂部成立,新賽季亮相中甲

浙江足協(xié)官方:寧波職業(yè)足球俱樂部成立,新賽季亮相中甲

懂球帝
2025-12-31 14:41:11
李川跟錘娜麗莎求婚成功!搞笑女終于遇到了同頻共振的那個人

李川跟錘娜麗莎求婚成功!搞笑女終于遇到了同頻共振的那個人

璀璨幻行者
2026-01-01 01:51:57
隨著快船5連勝原地杵,湖人慘敗東部第一,西部最新排名!

隨著快船5連勝原地杵,湖人慘敗東部第一,西部最新排名!

止境
2026-01-01 00:43:43
李在明動身訪華前,先給了中國一記下馬威,高市早苗卻笑不出來?

李在明動身訪華前,先給了中國一記下馬威,高市早苗卻笑不出來?

策前論
2025-12-31 18:05:08
美媒評各隊2025年最后悔決策:開拓者選瀚森在列 失誤比助攻還多

美媒評各隊2025年最后悔決策:開拓者選瀚森在列 失誤比助攻還多

羅說NBA
2025-12-31 21:38:12
姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

振華觀史
2025-12-31 09:33:49
洛克希德·馬丁生產(chǎn)線停了,是中國凍結(jié)了他們在華的全部資產(chǎn)。

洛克希德·馬丁生產(chǎn)線停了,是中國凍結(jié)了他們在華的全部資產(chǎn)。

百態(tài)人間
2025-12-31 16:18:36
36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

36歲男明星曬南極旅游!天天吃泡面,吐槽企鵝屎臭,網(wǎng)友:祛魅了

瓜汁橘長Dr
2025-12-29 17:52:06
在剛剛,28家公司發(fā)布重大利好利空消息,看看都有哪些個股受影響

在剛剛,28家公司發(fā)布重大利好利空消息,看看都有哪些個股受影響

股市皆大事
2025-12-31 20:52:15
回國后我才敢說:越南是我去過的所有國家中,最被低估的

回國后我才敢說:越南是我去過的所有國家中,最被低估的

阿纂看事
2025-12-29 09:43:52
被處決毒梟要水喝,3停5口是17年前教的暗號:我是臥底,有內(nèi)鬼!

被處決毒梟要水喝,3停5口是17年前教的暗號:我是臥底,有內(nèi)鬼!

星宇共鳴
2025-12-29 09:56:33
洗浴中心成跨年熱門目的地,KTV一房難求,長沙進入全國休閑玩樂交易規(guī)模前十城市

洗浴中心成跨年熱門目的地,KTV一房難求,長沙進入全國休閑玩樂交易規(guī)模前十城市

瀟湘晨報
2025-12-31 20:38:14
這4個器官“用得勤”的人,更長壽

這4個器官“用得勤”的人,更長壽

大象新聞
2025-05-20 19:23:04
2026-01-01 03:03:00
至頂AI實驗室 incentive-icons
至頂AI實驗室
一個專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實驗室。
895文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

老羅,演砸了,也封神了?

頭條要聞

日企代表團推遲原定訪華行程 外交部回應(yīng)

頭條要聞

日企代表團推遲原定訪華行程 外交部回應(yīng)

體育要聞

布基納法索2-0蘇丹,拉西納-特拉奧雷破門,阿爾塞納-夸西鎖定勝局

娛樂要聞

官宣才兩天就翻車?七七被連環(huán)爆料

財經(jīng)要聞

高培勇:分配制度改革是提振消費的抓手

汽車要聞

凱迪拉克純電中型SUV 售價不足24萬/33寸曲面屏

態(tài)度原創(chuàng)

家居
本地
教育
藝術(shù)
公開課

家居要聞

無形有行 自然與靈感詩意

本地新聞

即將過去的2025年,對重慶的影響竟然如此深遠

教育要聞

高考地理:修建水庫與拆除大壩

藝術(shù)要聞

中國博物館全書!看遍中國8000年頂流審美

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版