国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

NeurIPS 2025 | 效果拔群!GuideFlow3D:基于Rectified流的3D風(fēng)格遷移框架

0
分享至

隨著3D生成技術(shù)的迅猛發(fā)展,數(shù)字內(nèi)容創(chuàng)作在游戲開發(fā)、增強(qiáng)現(xiàn)實等領(lǐng)域的應(yīng)用愈加廣泛,尤其是將外觀(包括紋理和精細(xì)幾何細(xì)節(jié))遷移到3D資產(chǎn)的需求也日益迫切。然而,現(xiàn)有方法在輸入與參考對象幾何差異較大時,往往難以協(xié)調(diào)全局結(jié)構(gòu)保持與局部細(xì)節(jié)遷移之間的平衡,從而導(dǎo)致生成的結(jié)果失真

本文介紹了一項由斯坦福大學(xué)和巴黎高科等研究團(tuán)隊共同完成的工作,該工作已發(fā)表在2025年人工智能頂級會議NeurIPS上。研究團(tuán)隊提出了一種優(yōu)化引導(dǎo)的Rectified Flow方法GuideFlow3D,旨在無需微調(diào)預(yù)訓(xùn)練模型的情況下,在推理階段精確調(diào)控3D外觀的遷移效果。其核心創(chuàng)新在于構(gòu)建了兩種獨(dú)立且互補(bǔ)的引導(dǎo)損失信號

(1)部件感知外觀損失,確保外觀與語義部件對齊,嚴(yán)格控制幾何與外觀的不一致性;

(2)自相似結(jié)構(gòu)損失可以保持紋理與目標(biāo)幾何的適配性,增強(qiáng)細(xì)節(jié)的豐富性。

GuideFlow3D不僅有效地解決了外觀遷移中的幾何不一致問題,還賦予了用戶高度的可控性,使得用戶能夠根據(jù)外觀源模態(tài)(圖像/文本/3D模型)靈活選擇遷移策略。


論文題目: GuideFlow3D: Optimization-Guided Rectified Flow For Appearance Transfer 文章鏈接: https://www.arxiv.org/pdf/2510.16136 代碼地址: http://github.com/GradientSpaces/GuideFlow3D 項目鏈接: https://sayands.github.io/guideflow3d/
一、研究背景

在游戲開發(fā)、增強(qiáng)現(xiàn)實與數(shù)字內(nèi)容創(chuàng)作等領(lǐng)域,實現(xiàn)高質(zhì)量的三維外觀遷移已成為行業(yè)發(fā)展的迫切需求。盡管2D風(fēng)格遷移技術(shù)已相對成熟,但其在3D場景下的擴(kuò)展仍面臨多重挑戰(zhàn):

(1)三維數(shù)據(jù)表示(如點(diǎn)云、網(wǎng)格、隱式場)具有不規(guī)則性與結(jié)構(gòu)稀疏性,難以像二維圖像那樣進(jìn)行規(guī)整化處理;

(2)當(dāng)輸入模型與外觀源對象之間存在顯著幾何差異時,現(xiàn)有方法往往難以在保持目標(biāo)結(jié)構(gòu)一致性的同時,實現(xiàn)細(xì)節(jié)的完整遷移;

(3)外觀源本身具有多模態(tài)特性(如三維網(wǎng)格、二維圖像或文本描述),如何構(gòu)建統(tǒng)一框架以支持跨模態(tài)的高質(zhì)量遷移,仍是當(dāng)前研究中的關(guān)鍵難題。

此外,盡管目前已有不同的方法被提出以應(yīng)對上述挑戰(zhàn),但在實際應(yīng)用中仍存在明顯的局限性。基于多視圖的方法將3D問題轉(zhuǎn)化為多視角2D生成任務(wù),但由于不同視圖之間的生成結(jié)果難以保持幾何一致性,這常常導(dǎo)致結(jié)構(gòu)失真和不一致。而直接應(yīng)用預(yù)訓(xùn)練的3D生成模型則容易受到訓(xùn)練數(shù)據(jù)分布的限制,在輸入與外觀源幾何差異較大時,往往生成結(jié)果的質(zhì)量下降、泛化能力不足,難以實現(xiàn)細(xì)粒度控制。


本文的核心研究目標(biāo)是突破現(xiàn)有方法的瓶頸,提出了一種無需重新訓(xùn)練的3D外觀遷移框架GuideFlow3D。如上圖所示,在保持其整體幾何結(jié)構(gòu)的前提下,有效遷移外觀對象的紋理與局部幾何細(xì)節(jié),例如左上角桌子的圓角邊緣得以自然重現(xiàn),右上角床的底座與床墊之間的結(jié)構(gòu)特征也被準(zhǔn)確區(qū)分與保留。

二、本文方法

下圖展示了GuideFlow3D的整體框架。給定輸入3D對象網(wǎng)格 與外觀對象 ,GuideFlow3D旨在基于 修改 的外觀,同時嚴(yán)格保持 的幾何結(jié)構(gòu),其中 可表示為圖像-網(wǎng)格對或文本。


該框架引入了Rectified Flow來解決外觀遷移問題:首先構(gòu)造結(jié)構(gòu)化潛變量作為核心表示載體,通過部件感知外觀損失 和自相似結(jié)構(gòu)損失 對預(yù)訓(xùn)練Rectified Flow模型 的采樣過程進(jìn)行引導(dǎo),最終經(jīng)過解碼器 生成保留輸入幾何、融合外觀細(xì)節(jié)的3D模型。

2.1 結(jié)構(gòu)化潛在表示

本文基于Trellis模型[1]采用結(jié)構(gòu)化潛變量來表示3D對象 。其形式化定義為:

其中, 是指第 個活躍體素在3D網(wǎng)格中的位置坐標(biāo), 是與該體素相關(guān)聯(lián)的潛在特征。

2.2 兩種引導(dǎo)損失函數(shù)

為了實現(xiàn)更精細(xì)的生成和控制效果,作者分別定義了兩個不同的優(yōu)化目標(biāo),用于引導(dǎo)潛在特征在不同輸入條件下的更新方向。下圖(a)和(b)分別展示了部件感知外觀損失和自相似結(jié)構(gòu)損失這兩種優(yōu)化模式。


(1)部件感知外觀損失:當(dāng)外觀對象 以圖像-網(wǎng)格對的形式提供時,采用 PartField[2]方法對輸入網(wǎng)格 和外觀網(wǎng)格 進(jìn)行分割,將兩者分解為語義一致的部件。然后,基于這些部件標(biāo)簽,針對查詢對象的每個潛特征 ,在外觀對象的潛特征集 中尋找其對應(yīng)部件內(nèi)的最近鄰潛特征 ,其可以形式化表達(dá)為:

(2)自相似結(jié)構(gòu)損失當(dāng)外觀對象 僅以圖像或文本形式提供時,采用該目標(biāo)進(jìn)行優(yōu)化。其核心思想是在沒有明確的3D外觀參考情況下,依賴對象自身的結(jié)構(gòu)先驗。具體而言,通過幾何特征聚類將輸入網(wǎng)格的體素劃分為不同的部件,并利用對比損失確保同一部件內(nèi)體素特征相似,且不同部件間特征有區(qū)分度。為此,作者首先對輸入網(wǎng)格 進(jìn)行幾何聚類(例如,使用 PartField 特征進(jìn)行 K-means 聚類),將體素劃分為不同的簇 ,每個簇代表一個語義部件。分子項鼓勵同一部件內(nèi)體素特征相似(正樣本),分母項鼓勵不同部件間特征差異(負(fù)樣本)。

2.3 Rectified Flow的采樣過程

Rectified Flow通常由兩個過程組成:前向過程(將樣本從數(shù)據(jù)分布映射到噪聲)和反向過程(將噪聲樣本映射回數(shù)據(jù)分布)。GuideFlow3D在反向過程引入外觀和結(jié)構(gòu)的引導(dǎo)信號來優(yōu)化潛在空間。具體來說,框架采用以下更新規(guī)則:

其中, 是Rectified Flow模型的輸出, 是由引導(dǎo)函數(shù)提供的額外優(yōu)化項(包括部件感知外觀損失和自相似性結(jié)構(gòu)損失), 是時間步長。

三、實驗結(jié)果

針對現(xiàn)有公開數(shù)據(jù)集中缺乏專門面向跨幾何外觀遷移任務(wù)的benchmarks,作者首先構(gòu)建了一個全新的評估數(shù)據(jù)集。該數(shù)據(jù)集整合了程序化生成的簡單三維對象與來自ABO數(shù)據(jù)集的復(fù)雜模型,覆蓋床、櫥柜、椅子、桌子和沙發(fā)五類核心家具類別,并設(shè)計了四類遷移場景(同類/跨類、簡單-復(fù)雜/復(fù)雜-復(fù)雜),每類包含250組輸入-外觀對象配對。

在評估方法上,為解決缺乏真實標(biāo)注數(shù)據(jù)的問題,作者提出了基于GPT-5的人類排序體系,從風(fēng)格保真度、結(jié)構(gòu)清晰度、風(fēng)格整合度、細(xì)節(jié)質(zhì)量、形狀適應(yīng)性和整體質(zhì)量六個維度對生成結(jié)果進(jìn)行兩兩比較排序。這一評估機(jī)制的有效性通過了59人規(guī)模的用戶研究驗證,結(jié)果顯示其與人類審美判斷具有高度一致性。實驗選取了五類代表性基線方法進(jìn)行對比,包括基于基礎(chǔ)UV紋理映射的UV Nearest Neighbor、結(jié)合二維風(fēng)格遷移與三維重建的Image-to-3D、采用邊緣感知條件擴(kuò)散的EasiTex、無引導(dǎo)的流模型Trellis,以及文本引導(dǎo)的Text-to-3D模型,確保了對比實驗的全面性。

3.1 定量評估

上表展示了GuideFlow3D在圖像和文本兩種條件下外觀遷移任務(wù)中的綜合性能評估結(jié)果。在圖像條件(使用外觀損失)下,該方法在風(fēng)格保真度、結(jié)構(gòu)清晰度等所有六個評估指標(biāo)上均取得最佳排名,特別是在風(fēng)格整合和細(xì)節(jié)質(zhì)量方面表現(xiàn)突出。在文本條件(使用結(jié)構(gòu)損失)下,該方法同樣保持領(lǐng)先,顯示出其通過自相似性約束保持幾何合理性的能力。


上表展示了GuideFlow3D在簡單和復(fù)雜同類物體外觀遷移任務(wù)中基于GPT指標(biāo)的定量評估結(jié)果。該實驗設(shè)置了簡單-復(fù)雜、復(fù)雜-復(fù)雜兩種幾何組合,并分別測試了同類與跨類遷移場景。結(jié)果表明,該方法在所有設(shè)置下均保持最優(yōu)性能,特別是在幾何差異顯著的簡單-復(fù)雜跨類遷移中優(yōu)勢最為突出,驗證了其引導(dǎo)機(jī)制能有效解耦外觀與結(jié)構(gòu),對幾何和語義變化具有強(qiáng)魯棒性。

3.2 定性評估

圖通過定性對比直觀展示了不同方法在3D外觀遷移任務(wù)中的視覺表現(xiàn)。該圖包含同類物體遷移(椅子->椅子)和跨類物體遷移(柜->雙層床)兩個典型場景。結(jié)果顯示對比baseline方法均存在明顯缺陷,例如,MambaST出現(xiàn)紋理混合,EasiTex存在紋理缺失與重復(fù),Cross Image Attention遺漏關(guān)鍵細(xì)節(jié)。而GuideFlow3D在保持輸入物體原始幾何結(jié)構(gòu)(如床架側(cè)邊空洞、椅子扶手形態(tài))的同時,成功實現(xiàn)了外觀紋理的高質(zhì)量遷移。


上圖進(jìn)一步展示了GuideFlow3D在跨類別場景下的外觀遷移能力。GuideFlow3D能實現(xiàn)部件級語義映射(如將動物腿部特征對應(yīng)到家具腿部,柜子把手對應(yīng)到飛機(jī)螺旋槳),在保持目標(biāo)物體整體結(jié)構(gòu)的同時,完成既符合語義邏輯又保持視覺連貫的紋理與幾何細(xì)節(jié)遷移。通過與Trellis基線結(jié)果的直接對比(圖中小插圖),凸顯了GuideFlow3D高效的幾何感知能力。

四、總結(jié)

本文提出了一種無需重新訓(xùn)練的3D外觀遷移框架GuideFlow3D,通過優(yōu)化引導(dǎo)的Rectified Flow機(jī)制,實現(xiàn)了在推理階段對生成過程的精準(zhǔn)控制。在優(yōu)化過程中,框架引入了兩種互補(bǔ)的引導(dǎo)信號,部件感知外觀損失和自相似結(jié)構(gòu)損失,確保在保留輸入幾何形態(tài)的同時,精準(zhǔn)地遷移外觀細(xì)節(jié)。該方法支持多模態(tài)輸入(如網(wǎng)格、圖像、文本),并允許用戶靈活控制遷移的范圍,例如基于網(wǎng)格進(jìn)行“幾何+紋理”遷移,或基于圖像/文本進(jìn)行“僅紋理”遷移。為更好地評估遷移效果,本文還提出了一種符合人類感知的評估體系,有效解決了傳統(tǒng)指標(biāo)在無標(biāo)簽場景下的局限性。這一方法將推動3D內(nèi)容創(chuàng)作向更加高效和可控的方向發(fā)展。

參考

[1] Xiang, Jianfeng, et al. "Structured 3d latents for scalable and versatile 3d generation." Proceedings of the Computer Vision and Pattern Recognition Conference. 2025.

[2] Liu M, Uy M A, Xiang D, et al. Partfield: Learning 3d feature fields for part segmentation and beyond[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2025: 9704-9715.

llustration From IconScout By IconScout Store

-The End-

本周上新!

掃碼觀看!

“AI技術(shù)流”原創(chuàng)投稿計劃


TechBeat是由將門創(chuàng)投建立的AI學(xué)習(xí)社區(qū)(www.techbeat.net)。社區(qū)上線700+期talk視頻,3000+篇技術(shù)干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術(shù)人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質(zhì)量、知識型交流平臺,希望為AI人才打造更專業(yè)的服務(wù)和體驗,加速并陪伴其成長。


投稿內(nèi)容

// 最新技術(shù)解讀/系統(tǒng)性知識分享 //

// 前沿資訊解說/心得經(jīng)歷講述 //

投稿須知

稿件需要為原創(chuàng)文章,并標(biāo)明作者信息。

我們會選擇部分在深度技術(shù)解析及科研心得方向,對用戶啟發(fā)更大的文章,做原創(chuàng)性內(nèi)容獎勵

投稿方式

發(fā)送郵件到

michellechang@thejiangmen.com

或添加工作人員微信(michelle333_投稿,溝通投稿詳情

關(guān)于我“門”

將門是一家以專注于數(shù)智核心科技領(lǐng)域新型創(chuàng)投機(jī)構(gòu),也是北京市標(biāo)桿型孵化器。 公司致力于通過連接技術(shù)與商業(yè),發(fā)掘和培育具有全球影響力的科技創(chuàng)新企業(yè),推動企業(yè)創(chuàng)新發(fā)展與產(chǎn)業(yè)升級。

將門成立于2015年底,創(chuàng)始團(tuán)隊由微軟創(chuàng)投在中國的創(chuàng)始團(tuán)隊原班人馬構(gòu)建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術(shù)型創(chuàng)業(yè)公司。

如果您是技術(shù)領(lǐng)域的初創(chuàng)企業(yè),不僅想獲得投資,還希望獲得一系列持續(xù)性、有價值的投后服務(wù),歡迎發(fā)送或者推薦項目給我“門”:

bp@thejiangmen.com


點(diǎn)擊右上角,把文章分享到朋友圈

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
雨雪又要來了,鄭州暖氣會延期嗎?官方回應(yīng)

雨雪又要來了,鄭州暖氣會延期嗎?官方回應(yīng)

大象新聞
2026-03-12 21:25:02
假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費(fèi)者被坑慘,家長要警惕

假貨率高達(dá)70%!不銹鋼餐具造假黑幕,消費(fèi)者被坑慘,家長要警惕

趣文說娛
2026-03-10 16:47:22
綠聯(lián)NAS私有云與MiniMax深度合作,首發(fā)開箱即用的OpenClaw龍蝦

綠聯(lián)NAS私有云與MiniMax深度合作,首發(fā)開箱即用的OpenClaw龍蝦

IT之家
2026-03-13 15:06:15
江西一女子稱姐姐誤將價值150萬元黃金當(dāng)垃圾扔掉,全家人連夜翻10噸垃圾找回!當(dāng)?shù)鼗貞?yīng):確有此事

江西一女子稱姐姐誤將價值150萬元黃金當(dāng)垃圾扔掉,全家人連夜翻10噸垃圾找回!當(dāng)?shù)鼗貞?yīng):確有此事

深圳晚報
2026-03-13 15:02:37
請注意:以色列已開始派大量無人機(jī)在伊朗超低空狙殺和攻擊

請注意:以色列已開始派大量無人機(jī)在伊朗超低空狙殺和攻擊

邵旭峰域
2026-03-13 15:25:35
姑姑借我15萬買車從不提還,我張口要時她卻說:別總想占親戚便宜

姑姑借我15萬買車從不提還,我張口要時她卻說:別總想占親戚便宜

楓紅染山徑
2026-03-13 11:40:44
初春和仲春野釣鯽魚的4條規(guī)律

初春和仲春野釣鯽魚的4條規(guī)律

釣魚技巧和知識
2026-03-12 09:41:53
“12人吃燒烤花78元”,為拼兒子連生10胎,家長買燒烤都沒人敢吃

“12人吃燒烤花78元”,為拼兒子連生10胎,家長買燒烤都沒人敢吃

妍妍教育日記
2026-03-12 22:38:02
輸比利時采訪!楊舒予韓旭直指檢驗學(xué)習(xí),李月汝不滿防守與自責(zé)!

輸比利時采訪!楊舒予韓旭直指檢驗學(xué)習(xí),李月汝不滿防守與自責(zé)!

籃球資訊達(dá)人
2026-03-12 23:31:49
78年我值夜班,偷偷放走個發(fā)高燒的女囚,32年后她開紅旗車來報恩

78年我值夜班,偷偷放走個發(fā)高燒的女囚,32年后她開紅旗車來報恩

奶茶麥子
2026-03-11 22:09:03
開戰(zhàn)來首次!美國損失慘重

開戰(zhàn)來首次!美國損失慘重

亞太觀瀾
2026-03-12 20:50:06
華為養(yǎng)了十年的狼,帶著一群崽子把家偷了

華為養(yǎng)了十年的狼,帶著一群崽子把家偷了

老鷹哥
2026-03-13 11:31:52
喬冠華后人現(xiàn)狀:兒子子承父業(yè),女兒成軍醫(yī),繼女名字家喻戶曉

喬冠華后人現(xiàn)狀:兒子子承父業(yè),女兒成軍醫(yī),繼女名字家喻戶曉

林雁飛
2026-02-14 18:52:26
男子大鬧上海地鐵,在車廂內(nèi)放火!人被刑拘身份曝光,恐難受懲罰

男子大鬧上海地鐵,在車廂內(nèi)放火!人被刑拘身份曝光,恐難受懲罰

青梅侃史啊
2026-03-12 19:34:22
楊瀚森狂轟16+13+2,又創(chuàng)生涯新高!登陸NBA持續(xù)進(jìn)化,開拓者欣慰

楊瀚森狂轟16+13+2,又創(chuàng)生涯新高!登陸NBA持續(xù)進(jìn)化,開拓者欣慰

小火箭愛體育
2026-03-13 13:05:12
樓市大局已定:不出意外的話,2026年起中國房價或迎來3大變化

樓市大局已定:不出意外的話,2026年起中國房價或迎來3大變化

現(xiàn)代小青青慕慕
2026-03-12 11:13:37
WTT重慶冠軍賽-孫穎莎3-0完勝好姐妹 晉級女單八強(qiáng) 下輪迎來隊內(nèi)PK

WTT重慶冠軍賽-孫穎莎3-0完勝好姐妹 晉級女單八強(qiáng) 下輪迎來隊內(nèi)PK

云隱南山
2026-03-13 15:34:29
新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

南權(quán)先生
2026-01-26 15:41:26
五糧液首款光瓶酒上市,100%純糧定價399,樹立市場“新標(biāo)桿”

五糧液首款光瓶酒上市,100%純糧定價399,樹立市場“新標(biāo)桿”

影像渭南
2026-03-13 12:05:06
會如何?川普說沒啥可打了但會繼續(xù)、以攻擊伊全境稱直到實現(xiàn)目標(biāo)

會如何?川普說沒啥可打了但會繼續(xù)、以攻擊伊全境稱直到實現(xiàn)目標(biāo)

邵旭峰域
2026-03-12 15:00:07
2026-03-13 16:16:49
將門創(chuàng)投 incentive-icons
將門創(chuàng)投
加速及投資技術(shù)驅(qū)動型初創(chuàng)企業(yè)
2310文章數(shù) 596關(guān)注度
往期回顧 全部

科技要聞

《后廠村AI派》:帶你玩轉(zhuǎn)OpenClaw龍蝦

頭條要聞

民主黨連勝 特朗普鐵粉退場讓"最保守"選區(qū)現(xiàn)兩黨決選

頭條要聞

民主黨連勝 特朗普鐵粉退場讓"最保守"選區(qū)現(xiàn)兩黨決選

體育要聞

叕戰(zhàn)奧運(yùn),張雨霏要做回“小將”

娛樂要聞

小S復(fù)工錄制 感謝賈永婕陪大S走到最后

財經(jīng)要聞

"短劇"苦抄襲

汽車要聞

本田汽車全年業(yè)績由盈轉(zhuǎn)虧 高管們降薪3個月以擔(dān)責(zé)

態(tài)度原創(chuàng)

游戲
藝術(shù)
旅游
本地
教育

穿越迷霧,經(jīng)典再現(xiàn):《SILENT HILL 2》全球累積500萬銷量!

藝術(shù)要聞

吳冠中:歷代畫竹大都缺乏厚度與深度

旅游要聞

“影視IP+文旅破圈”激發(fā)消費(fèi)新活力 “新場景+新業(yè)態(tài)”正成為文化消費(fèi)新引擎

本地新聞

坐標(biāo)北京,過敏季反向遷徒

教育要聞

2026風(fēng)口專業(yè)! 高考志愿填報兩會定調(diào)子!

無障礙瀏覽 進(jìn)入關(guān)懷版