国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

RL加持3D生成時(shí)代!首個(gè)「R1 式」文本到3D推理大模型AR3D-R1登場(chǎng)

0
分享至



強(qiáng)化學(xué)習(xí)(RL)在大語(yǔ)言模型和 2D 圖像生成中大獲成功后,首次被系統(tǒng)性拓展到文本到 3D 生成領(lǐng)域!面對(duì) 3D 物體更高的空間復(fù)雜性、全局幾何一致性和局部紋理精細(xì)化的雙重挑戰(zhàn),研究者們首次系統(tǒng)研究了 RL 在 3D 自回歸生成中的應(yīng)用!

來(lái)自上海人工智能實(shí)驗(yàn)室、西北工業(yè)大學(xué)、香港中文大學(xué)、北京大學(xué)、香港科技大學(xué)等機(jī)構(gòu)的研究者提出了AR3D-R1,這是首個(gè)強(qiáng)化學(xué)習(xí)增強(qiáng)的文本到 3D 自回歸模型。該工作系統(tǒng)研究了獎(jiǎng)勵(lì)設(shè)計(jì)、RL 算法和評(píng)估基準(zhǔn),并提出Hi-GRPO——一種層次化強(qiáng)化學(xué)習(xí)范式,通過(guò)分離全局結(jié)構(gòu)推理與局部紋理精修來(lái)優(yōu)化 3D 生成。同時(shí)引入全新基準(zhǔn)MME-3DR,用于評(píng)估 3D 生成模型的隱式推理能力。

實(shí)驗(yàn)表明 AR3D-R1 在 Kernel Distance 和 CLIP Score 上均取得顯著提升,達(dá)到 0.156 和 29.3 的優(yōu)異成績(jī)。



  • 論文標(biāo)題:Are We Ready for RL in Text-to-3D Generation? A Progressive Investigation
  • 代碼鏈接:
  • https://github.com/Ivan-Tang-3D/3DGen-R1
  • 論文鏈接:https://arxiv.org/pdf/2512.10949



強(qiáng)化學(xué)習(xí)應(yīng)用于 3D 生成的挑戰(zhàn)



強(qiáng)化學(xué)習(xí)在大語(yǔ)言模型(如 DeepSeek-R1)和 2D 圖像生成中已被證明能夠有效提升模型性能,但將 RL 應(yīng)用于 3D 生成仍面臨獨(dú)特挑戰(zhàn):

  • 空間復(fù)雜性更高:3D 物體需要同時(shí)保持全局幾何一致性和局部紋理精細(xì)度,比 2D 圖像的空間復(fù)雜性高出一個(gè)維度。
  • 獎(jiǎng)勵(lì)設(shè)計(jì)困難:如何設(shè)計(jì)既能評(píng)估全局結(jié)構(gòu)又能捕捉局部細(xì)節(jié)的獎(jiǎng)勵(lì)函數(shù)是關(guān)鍵難題。
  • 現(xiàn)有基準(zhǔn)局限:當(dāng)前的文本到 3D 基準(zhǔn)主要關(guān)注物體多樣性,無(wú)法有效評(píng)估模型的隱式推理能力。
  • 算法敏感性:3D 生成對(duì)獎(jiǎng)勵(lì)設(shè)計(jì)和 RL 算法的選擇高度敏感,需要系統(tǒng)性的研究來(lái)指導(dǎo)實(shí)踐。

在此前的工作中,3D 模型大多停留在「預(yù)訓(xùn)練 + 微調(diào)」框架,真正將 RL 引入 3D 生成的一步,還無(wú)人系統(tǒng)邁出。

從「推理」到「造物」:

AR3D-R1 的整體框架

AR3D-R1 構(gòu)建在離散 3D 生成模型 ShapeLLM-Omni 之上,引入了一個(gè)推理驅(qū)動(dòng)的 3D 生成流程:

  • 先想一想:模型會(huì)先根據(jù)文本提示生成一段高層語(yǔ)義推理(類(lèi)似 CoT),規(guī)劃出物體的大致結(jié)構(gòu)、關(guān)系與風(fēng)格。

  • 再動(dòng)手造:隨后,推理結(jié)果會(huì)作為「中間規(guī)劃」,直接指導(dǎo)離散 token 的 3D 生成過(guò)程。

這讓 AR3D-R1 不再是「憑本能畫(huà) 3D」,而是先構(gòu)思、再搭骨架、最后上細(xì)節(jié)——真正把 RL 驅(qū)動(dòng)的「會(huì)想」能力,遷移到了「會(huì)造」的 3D 世界里。

獎(jiǎng)勵(lì)設(shè)計(jì)與 RL 算法的系統(tǒng)性研究


在獎(jiǎng)勵(lì)設(shè)計(jì)方面,研究者評(píng)估了多個(gè)獎(jiǎng)勵(lì)維度和模型選擇,得出以下關(guān)鍵發(fā)現(xiàn):



  • 人類(lèi)偏好對(duì)齊至關(guān)重要:與人類(lèi)審美偏好對(duì)齊的獎(jiǎng)勵(lì)信號(hào)能夠顯著提升生成質(zhì)量。

  • 通用多模態(tài)模型具有魯棒性:令人驚訝的是,通用多模態(tài)模型在評(píng)估 3D 相關(guān)屬性時(shí)表現(xiàn)出強(qiáng)大的魯棒性,有時(shí)甚至優(yōu)于專(zhuān)門(mén)的 3D 評(píng)估模型。



在 RL 算法研究方面,研究者深入分析了 GRPO 的多個(gè)變體,包括標(biāo)準(zhǔn) GRPO、引入 token 級(jí)平均與動(dòng)態(tài)采樣的 DAPO,和更偏序列級(jí)操作的 GSPO 等:

  • Token 級(jí)優(yōu)化更有效:相比響應(yīng)級(jí)優(yōu)化,token 級(jí)別的損失平均能更好地捕捉生成過(guò)程中的全局結(jié)構(gòu)差異。

  • 動(dòng)態(tài)采樣策略足以穩(wěn)定訓(xùn)練:對(duì)于文本到 3D 生成任務(wù),無(wú)需復(fù)雜的訓(xùn)練穩(wěn)定技術(shù)。

  • 數(shù)據(jù)規(guī)模和迭代次數(shù)的擴(kuò)展均能有效提升性能:但一味堆疊 RL 迭代反而可能引入過(guò)擬合或模式崩塌,需要精細(xì)校準(zhǔn)。

這些發(fā)現(xiàn)為 3D 生成中的 RL 應(yīng)用提供了系統(tǒng)性指導(dǎo)。

Hi-GRPO:

層次化強(qiáng)化學(xué)習(xí)范式





受 3D 生成自然層次結(jié)構(gòu)的啟發(fā)——模型首先構(gòu)建全局幾何,然后精修局部紋理(這與人類(lèi) 3D 感知過(guò)程一致),研究者提出了 Hi-GRPO(Hierarchical GRPO)層次化強(qiáng)化學(xué)習(xí)范式。

Hi-GRPO 的核心思想是在單次迭代中聯(lián)合優(yōu)化層次化 3D 生成:

  • 全局規(guī)劃階段:模型首先針對(duì)文本提示進(jìn)行全局結(jié)構(gòu)規(guī)劃,生成高層語(yǔ)義推理來(lái)指導(dǎo)粗糙形狀生成。

  • 局部精修階段:模型接收初始推理結(jié)果和原始文本提示,生成紋理精細(xì)化的 3D 物體。

  • 專(zhuān)用獎(jiǎng)勵(lì)集成:為粗糙階段和精修階段分別設(shè)計(jì)專(zhuān)門(mén)的獎(jiǎng)勵(lì)模型集成,計(jì)算組相對(duì)獎(jiǎng)勵(lì)來(lái)優(yōu)化兩個(gè)階段。

通過(guò)這種層次化設(shè)計(jì),Hi-GRPO 能夠在保證全局幾何一致性的同時(shí),精細(xì)優(yōu)化局部紋理細(xì)節(jié),實(shí)現(xiàn)從粗到精的漸進(jìn)式 3D 生成。

MME-3DR:

評(píng)估 3D 生成推理能力的新基準(zhǔn)





現(xiàn)有的文本到 3D 基準(zhǔn),更多考察的是物體多樣性,而不是推理能力。模型在簡(jiǎn)單 prompt 上表現(xiàn)不錯(cuò),但一遇到復(fù)雜要求就頻頻「翻車(chē)」。為此,論文提出了全新的推理型 3D 基準(zhǔn) MME-3DR,覆蓋五大高難類(lèi)別:

  • 空間與結(jié)構(gòu)幾何(復(fù)雜構(gòu)型、相對(duì)位置關(guān)系)
  • 機(jī)械可供性(能不能「看起來(lái)就能動(dòng)起來(lái)」)
  • 生物與有機(jī)形狀
  • 依賴(lài)世界知識(shí)的罕見(jiàn)物體
  • 風(fēng)格化表達(dá)(風(fēng)格、材質(zhì)、抽象度的綜合控制)

在這一更苛刻的場(chǎng)景下:傳統(tǒng) text-to-3D 模型普遍出現(xiàn)崩塌,要么結(jié)構(gòu)錯(cuò)亂,要么風(fēng)格跑偏。而 RL 訓(xùn)練之后的 AR3D-R1 在五大類(lèi)別上都有明顯提升,同時(shí)在多個(gè) benchmark 上超越 Trellis 等模型,展現(xiàn)出更強(qiáng)的隱式 3D 推理能力。

定性定量分析







定量實(shí)驗(yàn)結(jié)果表明,AR3D-R1 在多個(gè)指標(biāo)上取得了顯著提升:

  • Kernel Distance 達(dá)到 0.156,表明生成的 3D 物體分布與真實(shí)數(shù)據(jù)分布高度接近。

  • CLIP Score 達(dá)到 29.3,表明生成結(jié)果與文本提示的語(yǔ)義對(duì)齊質(zhì)量顯著提升。

  • 在 Toys4K 等現(xiàn)有數(shù)據(jù)集和新引入的 MME-3DR 基準(zhǔn)上均展現(xiàn)出優(yōu)越性能,在幾何一致性和紋理質(zhì)量方面均有明顯改進(jìn)。



定性實(shí)驗(yàn)中,研究者展示了 AR3D-R1 在推理過(guò)程中清晰的從粗到精進(jìn)展。模型首先構(gòu)建合理的全局幾何結(jié)構(gòu),然后逐步添加細(xì)節(jié)紋理,生成高質(zhì)量的 3D 物體。可視化結(jié)果驗(yàn)證了 Hi-GRPO 層次化范式和專(zhuān)用獎(jiǎng)勵(lì)集成策略在提升 3D 生成質(zhì)量方面的有效性。

AR3D-R1 的成功標(biāo)志著強(qiáng)化學(xué)習(xí)在文本到 3D 生成領(lǐng)域的首次系統(tǒng)性突破,為構(gòu)建更智能、更具推理能力的 3D 生成模型開(kāi)辟了新方向。未來(lái),這樣的能力可以自然延伸到:

  • 具身智能與機(jī)器人:從自然語(yǔ)言到 3D 場(chǎng)景再到交互決策。
  • 游戲與內(nèi)容創(chuàng)作:快速生成結(jié)構(gòu)合理、細(xì)節(jié)豐富的 3D 資源。
  • AR/VR 與數(shù)字孿生:在復(fù)雜約束和多模態(tài)反饋下進(jìn)行 3D 推理與生成。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
夫妻性生活的“黃金時(shí)長(zhǎng)”是多少?別再被電影騙了!

夫妻性生活的“黃金時(shí)長(zhǎng)”是多少?別再被電影騙了!

精彩分享快樂(lè)
2025-11-29 00:00:03
繼海南之后,廣西和云南多地也開(kāi)始驅(qū)趕房車(chē),究竟為哪般?

繼海南之后,廣西和云南多地也開(kāi)始驅(qū)趕房車(chē),究竟為哪般?

趣味萌寵的日常
2025-12-17 00:13:52
25km/h算狂飆?新國(guó)標(biāo)電動(dòng)車(chē)售賣(mài)按下暫停鍵,媒體又翻車(chē)為什么?

25km/h算狂飆?新國(guó)標(biāo)電動(dòng)車(chē)售賣(mài)按下暫停鍵,媒體又翻車(chē)為什么?

你食不食油餅
2025-12-22 12:11:37
凱恩輝煌一年!打破無(wú)冠魔咒,雙線狂轟60球,連創(chuàng)7大紀(jì)錄

凱恩輝煌一年!打破無(wú)冠魔咒,雙線狂轟60球,連創(chuàng)7大紀(jì)錄

奧拜爾
2025-12-22 02:40:55
“武漢?武漢”超級(jí)大環(huán)線高鐵!全長(zhǎng)800余公里,即將開(kāi)通運(yùn)營(yíng)!

“武漢?武漢”超級(jí)大環(huán)線高鐵!全長(zhǎng)800余公里,即將開(kāi)通運(yùn)營(yíng)!

另子維愛(ài)讀史
2025-12-22 16:46:40
工信部拍板:電動(dòng)車(chē)按老百姓需求造,速度、后座難題終于要解了?

工信部拍板:電動(dòng)車(chē)按老百姓需求造,速度、后座難題終于要解了?

今朝牛馬
2025-12-21 23:18:32
聽(tīng)說(shuō)有的央國(guó)企正在“嚴(yán)查”員工副業(yè)

聽(tīng)說(shuō)有的央國(guó)企正在“嚴(yán)查”員工副業(yè)

細(xì)說(shuō)職場(chǎng)
2025-12-22 10:07:09
反其道行之,江蘇各城市正在狂建新大學(xué),蘇州南京在建4所常州2所

反其道行之,江蘇各城市正在狂建新大學(xué),蘇州南京在建4所常州2所

輝哥說(shuō)動(dòng)漫
2025-12-22 12:33:21
雨轉(zhuǎn)雪,最低-8℃!今夜起山東再迎大范圍雨雪和降溫天氣

雨轉(zhuǎn)雪,最低-8℃!今夜起山東再迎大范圍雨雪和降溫天氣

齊魯壹點(diǎn)
2025-12-22 11:44:20
笑死!難怪醫(yī)生總會(huì)反復(fù)套話!網(wǎng)友:醫(yī)生面前絕不留隱私!

笑死!難怪醫(yī)生總會(huì)反復(fù)套話!網(wǎng)友:醫(yī)生面前絕不留隱私!

夜深?lèi)?ài)雜談
2025-12-22 16:01:23
23歲男碩士徒步雪山身亡,本來(lái)不用死,遇難細(xì)節(jié)曝光,領(lǐng)隊(duì)事大了

23歲男碩士徒步雪山身亡,本來(lái)不用死,遇難細(xì)節(jié)曝光,領(lǐng)隊(duì)事大了

云景侃記
2025-12-22 16:13:21
一塊不該出現(xiàn)的石頭,上面記載的若是真的,將徹底改寫(xiě)人類(lèi)歷史

一塊不該出現(xiàn)的石頭,上面記載的若是真的,將徹底改寫(xiě)人類(lèi)歷史

小豫講故事
2025-12-22 06:00:10
45集諜戰(zhàn)大劇來(lái)襲,開(kāi)播一天就沖上衛(wèi)視收視率第一,演員陣容雄厚

45集諜戰(zhàn)大劇來(lái)襲,開(kāi)播一天就沖上衛(wèi)視收視率第一,演員陣容雄厚

樂(lè)楓電影
2025-12-22 16:12:30
52歲顏丙燕官宣戀情兩個(gè)月,令人惡心一幕出現(xiàn),原來(lái)劉曉慶沒(méi)說(shuō)錯(cuò)

52歲顏丙燕官宣戀情兩個(gè)月,令人惡心一幕出現(xiàn),原來(lái)劉曉慶沒(méi)說(shuō)錯(cuò)

李健政觀察
2025-12-16 14:49:51
8800萬(wàn)的畫(huà)6800賣(mài)了?高中學(xué)歷的“館長(zhǎng)”,把博物館當(dāng)成了自己家

8800萬(wàn)的畫(huà)6800賣(mài)了?高中學(xué)歷的“館長(zhǎng)”,把博物館當(dāng)成了自己家

新銳消息
2025-12-22 17:00:25
苦等5年,蒙古熟鴨子還是飛了,中俄誰(shuí)也不讓步,坐視大項(xiàng)目泡湯

苦等5年,蒙古熟鴨子還是飛了,中俄誰(shuí)也不讓步,坐視大項(xiàng)目泡湯

科普100克克
2025-12-07 18:20:34
沒(méi)等俄解體,歐盟就準(zhǔn)備B計(jì)劃,馮德萊恩暗示美國(guó):中國(guó)才是敵人

沒(méi)等俄解體,歐盟就準(zhǔn)備B計(jì)劃,馮德萊恩暗示美國(guó):中國(guó)才是敵人

觸摸史跡
2025-12-22 17:34:47
至今無(wú)人敢翻拍的6部頂級(jí)古裝劇,最高評(píng)分高達(dá)9.8分

至今無(wú)人敢翻拍的6部頂級(jí)古裝劇,最高評(píng)分高達(dá)9.8分

小微看電影
2025-12-22 09:00:03
交易否決權(quán)成哈登“護(hù)身符”,狼隊(duì)熱火火箭三選一,下家即將揭曉

交易否決權(quán)成哈登“護(hù)身符”,狼隊(duì)熱火火箭三選一,下家即將揭曉

呂坾極限手工
2025-12-22 15:21:36
黃金,大漲!

黃金,大漲!

證券時(shí)報(bào)
2025-12-22 18:03:19
2025-12-22 19:27:01
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
11971文章數(shù) 142516關(guān)注度
往期回顧 全部

科技要聞

商湯聯(lián)創(chuàng)親自下場(chǎng) 痛批主流機(jī)器人技術(shù)大錯(cuò)

頭條要聞

東部戰(zhàn)區(qū)司令員楊志斌等2人晉升上將

頭條要聞

東部戰(zhàn)區(qū)司令員楊志斌等2人晉升上將

體育要聞

戴琳,中國(guó)足球的反向代言人

娛樂(lè)要聞

張柏芝不再隱瞞,三胎生父早有答案?

財(cái)經(jīng)要聞

央行信用新政:為失信者提供"糾錯(cuò)"通道

汽車(chē)要聞

可享88元抵2000元等多重權(quán)益 昊鉑A800開(kāi)啟盲訂

態(tài)度原創(chuàng)

家居
時(shí)尚
藝術(shù)
手機(jī)
公開(kāi)課

家居要聞

現(xiàn)代手法 詮釋東方文化

這是陳妍希?新劇開(kāi)播后居然長(zhǎng)這樣

藝術(shù)要聞

萬(wàn)年松樹(shù)開(kāi)花,震驚你的雙眼!

手機(jī)要聞

麒麟9系回歸!一圖讀懂華為nova 15系列:2699元起

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版