国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

面向具身場(chǎng)景的生成式渲染器TC-Light來了,代碼已開源

0
分享至



TC-Light 是由中科院自動(dòng)化所張兆翔教授團(tuán)隊(duì)研發(fā)的生成式渲染器,能夠?qū)呱碛?xùn)練任務(wù)中復(fù)雜和劇烈運(yùn)動(dòng)的長(zhǎng)視頻序列進(jìn)行逼真的光照與紋理重渲染,同時(shí)具備良好的時(shí)序一致性和低計(jì)算成本開銷,使得它能夠幫助減少 Sim2Real Gap 以及實(shí)現(xiàn) Real2Real 的數(shù)據(jù)增強(qiáng),幫助獲得具身智能訓(xùn)練所需的海量高質(zhì)量數(shù)據(jù)。

它是如何實(shí)現(xiàn)的呢?本文將為你揭秘 TC-Light 背后的黑科技!本工作已中稿 NeurIPS2025,論文與代碼均已公開,歡迎大家試用和體驗(yàn),也歡迎大家到 Project Page 體驗(yàn) Video Demo。



  • 論文題目:TC-Light: Temporally Coherent Generative Rendering for Realistic World Transfer
  • 項(xiàng)目主頁: https://dekuliutesla.github.io/tclight/
  • 論文鏈接: https://arxiv.org/abs/2506.18904
  • 代碼鏈接: https://github.com/Linketic/TC-Light

研究背景

光線及其與周圍環(huán)境的交互共同塑造了人類以及具身智能體感知數(shù)字世界和現(xiàn)實(shí)世界的基本方式,在不同光照條件下對(duì)世界的觀測(cè)使得我們理解光線與物質(zhì)的交互關(guān)系,使得我們形成對(duì)周邊環(huán)境物質(zhì)和幾何屬性的基本判斷,并且也使得我們能夠在不同的光照條件下都能夠魯棒且正確地完成與世界的交互。

然而,在現(xiàn)實(shí)環(huán)境中采集不同光照與場(chǎng)景條件下的數(shù)據(jù)代價(jià)高昂,而仿真環(huán)境中盡管可以獲得近乎無限的數(shù)據(jù),但受限于算力資源,通常需要對(duì)光線的多次折射衍射以及紋理精度進(jìn)行近似和簡(jiǎn)化,使得視覺真實(shí)性無可避免地受到損失,在視覺層面產(chǎn)生 Sim2Real Gap。而如果能夠借助生成式模型根據(jù)所需的光照條件對(duì)現(xiàn)實(shí)或仿真環(huán)境下采集到的視頻數(shù)據(jù)進(jìn)行重渲染,不僅能夠幫助獲得增加已有真實(shí)數(shù)據(jù)的多樣性,并且能夠彌合計(jì)算誤差帶來的 CG 感,使得從仿真器中得到視覺上高度真實(shí)的傳感器數(shù)據(jù),包括 RL-CycleGAN 在內(nèi)的許多工作已經(jīng)證實(shí),這一策略能夠幫助減少將具身模型遷移到真實(shí)環(huán)境中所需微調(diào)的數(shù)據(jù)量和訓(xùn)練量。

盡管這一任務(wù)意義重大,但實(shí)際解決過程面臨許多挑戰(zhàn)。用于訓(xùn)練的視頻數(shù)據(jù)往往伴隨復(fù)雜的運(yùn)動(dòng)以及前景物體的頻繁進(jìn)出,同時(shí)視頻序列有著較長(zhǎng)的長(zhǎng)度以及較高的分辨率。我們的定量和定性實(shí)驗(yàn)證據(jù)(參見論文實(shí)驗(yàn)部分及 Project Page)表明,在這些復(fù)雜且困難的輸入條件下,已有的算法要么受制于訓(xùn)練所用視頻數(shù)據(jù)的分布(如 COSMOS-Transfer1,Relighting4D),要么難以承受巨大的計(jì)算開銷(如 Light-A-Video, RelightVid),要么難以保證良好的時(shí)序一致性(如 VidToMe, RAVE 等)。



圖 1 TC-Light 效果展示

為了推動(dòng)這一問題的解決,我們提出了 TC-Light 算法,在提升視頻生成模型計(jì)算效率的同時(shí),通過兩階段在線快速優(yōu)化提升輸出結(jié)果的一致性,如圖 1 和視頻Demo所示所示,本算法在保持重渲染真實(shí)性的同時(shí),時(shí)序一致性和真實(shí)性相比于已有算法取得了顯著提高。下面對(duì)算法細(xì)節(jié)進(jìn)行詳細(xì)介紹。

二、TC-Light 算法介紹

零樣本時(shí)序模型擴(kuò)展

TC-Light 首先使用視頻擴(kuò)散模型根據(jù)文本指令對(duì)輸入視頻進(jìn)行初步的重渲染。這里我們基于預(yù)訓(xùn)練好的 SOTA 圖像模型 IC-Light 以及 VidToMe 架構(gòu)進(jìn)行拓展,同時(shí)引入我們所提出的 Decayed Multi-Axis Denoising 模塊增強(qiáng)時(shí)序一致性。具體而言,VidToMe 在模型的自注意力模塊前后分別對(duì)來自不同幀的相似 token 進(jìn)行聚合和拆分,從而增強(qiáng)時(shí)序一致性并減少計(jì)算開銷;如圖 2 中 (a) 所示,類似 Slicedit,Decayed Multi-Axis Denoising 模塊將輸入視頻分別視作圖像 (x-y 平面) 的序列和時(shí)空切片(y-t 平面)的序列,分別用輸入的文本指令和空文本指令進(jìn)行去噪,并對(duì)兩組噪聲進(jìn)行整合,從而使用原視頻的運(yùn)動(dòng)信息指導(dǎo)去噪過程。不同于 Slicedit,我們?cè)?AIN 模塊對(duì)兩組噪聲的統(tǒng)計(jì)特性進(jìn)行了對(duì)齊,同時(shí)時(shí)空切片部分的噪聲權(quán)重隨去噪步數(shù)指數(shù)下降,從而避免原視頻光照和紋理分布對(duì)重渲染結(jié)果的過度影響。



圖 2 TC-Light 管線示意圖

兩階段時(shí)序一致性優(yōu)化策略

盡管通過引入前一小節(jié)的模型,視頻生成式重渲染結(jié)果的一致性得到了有效改善,但輸出結(jié)果仍然存在紋理和光照的跳變。因此我們進(jìn)一步引入兩階段的時(shí)序一致性優(yōu)化策略,這同時(shí)也是 TC-Light 的核心模塊。在第一階段,如圖 2 中 (b) 所示,我們?yōu)槊恳粠?Appearance Embedding 以調(diào)整曝光度,并根據(jù) MemFlow 從輸入視頻估計(jì)的光流或仿真器給出的光流優(yōu)化幀間一致性,從而對(duì)齊全局光照。這一階段的優(yōu)化過程非??焖?,A100 上 300 幀 960x540 分辨率只需要數(shù)十秒的時(shí)間即可完成。





三、實(shí)驗(yàn)與分析



表 1 與主流算法的定量性能比較,其中 VidToMe 和 Slicedit 的基模型都換成了 IC-Light 以進(jìn)行公平比較。Ours-light 指不用 Multi-Axis Denoising 模塊的結(jié)果,相當(dāng)于對(duì) VidToMe 直接應(yīng)用兩階段優(yōu)化算法。

為了驗(yàn)證算法在長(zhǎng)動(dòng)態(tài)序列的重渲染表現(xiàn),我們從 CARLA、Waymo、AgiBot-DigitalWorld、DROID 等數(shù)據(jù)集收集了 58 個(gè)序列進(jìn)行綜合評(píng)測(cè),結(jié)果如表 1 所示??梢钥吹轿覀兊乃惴朔艘延兴惴ㄔ跁r(shí)序一致性和計(jì)算開銷等方面的問題,取得了最佳的綜合性能表現(xiàn)。圖 3 的可視化對(duì)比也表明,我們的算法在保持內(nèi)容細(xì)節(jié)的同時(shí)得到了高質(zhì)量的重渲染性能表現(xiàn)。



圖 3 一致性與生成質(zhì)量可視化對(duì)比。TC-Light 避免了 (a) 中像 Slicedit 和 COSMOS-Transfer1 那樣不自然的重渲染結(jié)果和 (b) 中展現(xiàn)出的模糊失真,或 (c) 中像 IC-Light 和 VidToMe 那樣的時(shí)序不一致性。

此外,我們也在有 GT 數(shù)據(jù)的仿真數(shù)據(jù)集 Virtual KITTI 上進(jìn)行了比較,從而可以使用 SSIM 和 LPIPS 等指標(biāo)替換 CLIP-T 等代理指標(biāo)獲得更客觀的性能評(píng)估。表 2 的結(jié)果同樣表明,我們的算法很好地取得了計(jì)算開銷和性能之間的平衡,取得了最佳的重渲染效果。



表 2 Virtual KITTI 數(shù)據(jù)集上與主流算法的定量性能比較

四、總結(jié)

TC-Light 作為一種新的生成式渲染器,克服了具身環(huán)境下視覺傳感器數(shù)據(jù)重渲染面對(duì)的時(shí)序一致性和長(zhǎng)序列計(jì)算開銷兩大挑戰(zhàn),在性能表現(xiàn)上優(yōu)于現(xiàn)有技術(shù),不僅為 Sim2Real 和 Real2Real 數(shù)據(jù)擴(kuò)展帶來了新的思路,也為視頻編輯領(lǐng)域帶來了新的模型范式。TC-Light 的論文和代碼均已開源,希望能夠相關(guān)領(lǐng)域帶來不同的思考和啟發(fā)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
擬并購行業(yè)獨(dú)角獸!800億市值光伏龍頭,明起停牌

擬并購行業(yè)獨(dú)角獸!800億市值光伏龍頭,明起停牌

每日經(jīng)濟(jì)新聞
2026-02-24 23:04:06
貝加爾湖慘案只報(bào)“救出一人”,本質(zhì)就是護(hù)著俄羅斯的臉面

貝加爾湖慘案只報(bào)“救出一人”,本質(zhì)就是護(hù)著俄羅斯的臉面

壹家言
2026-02-25 16:11:34
央視重磅官宣:殲16單機(jī)雙鎖兩架F-22,外軍隱身戰(zhàn)機(jī)嚇得再不敢來

央視重磅官宣:殲16單機(jī)雙鎖兩架F-22,外軍隱身戰(zhàn)機(jī)嚇得再不敢來

52赫茲實(shí)驗(yàn)室
2026-02-23 12:43:04
光線傳媒20CM跌停:來源于《飛馳人生3》的營(yíng)收約為4300萬元至5300萬元

光線傳媒20CM跌停:來源于《飛馳人生3》的營(yíng)收約為4300萬元至5300萬元

澎湃新聞
2026-02-24 22:08:26
“反向過年”爆火,一線城市誰最旺?

“反向過年”爆火,一線城市誰最旺?

時(shí)代周報(bào)
2026-02-24 21:35:13
比爾·蓋茨道歉!承認(rèn)與兩俄女子有婚外關(guān)系,“從未前往愛潑斯坦的私人島嶼”

比爾·蓋茨道歉!承認(rèn)與兩俄女子有婚外關(guān)系,“從未前往愛潑斯坦的私人島嶼”

上觀新聞
2026-02-25 15:37:09
歷史最大誤讀!千古只此一人,做成六百年沒人做到的事

歷史最大誤讀!千古只此一人,做成六百年沒人做到的事

毛豆論道
2026-02-24 23:15:02
試管男嬰出生右腳缺4根腳趾,31歲產(chǎn)婦號(hào)啕大哭,家屬稱大排畸未拍到右腳照片,當(dāng)?shù)匦l(wèi)健委已介入調(diào)查

試管男嬰出生右腳缺4根腳趾,31歲產(chǎn)婦號(hào)啕大哭,家屬稱大排畸未拍到右腳照片,當(dāng)?shù)匦l(wèi)健委已介入調(diào)查

極目新聞
2026-02-25 21:04:20
突發(fā)!香港一女警頭部中槍身亡,多名親友到場(chǎng)痛哭!港警重案組跟進(jìn),港警一哥周一鳴親到觀塘警署了解事件!

突發(fā)!香港一女警頭部中槍身亡,多名親友到場(chǎng)痛哭!港警重案組跟進(jìn),港警一哥周一鳴親到觀塘警署了解事件!

澳門月刊
2026-02-25 13:31:47
全網(wǎng)好奇,谷愛凌嘴里咬的東西是啥?

全網(wǎng)好奇,谷愛凌嘴里咬的東西是啥?

有意思報(bào)告
2026-02-25 12:25:30
廣東1歲男童大年初七家門口走失,當(dāng)?shù)鼗貞?yīng):在報(bào)警人家附近的魚塘中發(fā)現(xiàn)該兒童,已無生命體征,相關(guān)工作正在進(jìn)行中

廣東1歲男童大年初七家門口走失,當(dāng)?shù)鼗貞?yīng):在報(bào)警人家附近的魚塘中發(fā)現(xiàn)該兒童,已無生命體征,相關(guān)工作正在進(jìn)行中

大風(fēng)新聞
2026-02-25 21:35:04
恒大到底如何虧出八千億的?終于搞懂了!許家印不跑是有原因的!

恒大到底如何虧出八千億的?終于搞懂了!許家印不跑是有原因的!

歷史偉人錄
2026-02-25 18:17:16
平頂山再通報(bào)“夫妻毆打15歲女生”:如此囂張,離不開這三個(gè)原因

平頂山再通報(bào)“夫妻毆打15歲女生”:如此囂張,離不開這三個(gè)原因

英軍眼
2026-02-25 10:53:41
比爾蓋茨承認(rèn)出軌,與俄羅斯核物理學(xué)家有染,否認(rèn)與愛潑斯坦有關(guān)

比爾蓋茨承認(rèn)出軌,與俄羅斯核物理學(xué)家有染,否認(rèn)與愛潑斯坦有關(guān)

社會(huì)醬
2026-02-25 16:46:40
重慶一女子隨家人爬山深夜失聯(lián),10天后遺體被找到!家屬回應(yīng)“女子曾光腳走在前面,登頂后神情恐懼”

重慶一女子隨家人爬山深夜失聯(lián),10天后遺體被找到!家屬回應(yīng)“女子曾光腳走在前面,登頂后神情恐懼”

封面新聞
2026-02-25 16:37:09
60歲繼父摟腰親吻10歲女童最新進(jìn)展:涉事老年男子短視頻平臺(tái)賬號(hào)被禁止關(guān)注,內(nèi)容無法查看

60歲繼父摟腰親吻10歲女童最新進(jìn)展:涉事老年男子短視頻平臺(tái)賬號(hào)被禁止關(guān)注,內(nèi)容無法查看

大風(fēng)新聞
2026-02-25 21:35:03
洛克希德·馬丁的生產(chǎn)線突然停了,中國(guó)凍結(jié)了他們?cè)谌A的全部資產(chǎn)

洛克希德·馬丁的生產(chǎn)線突然停了,中國(guó)凍結(jié)了他們?cè)谌A的全部資產(chǎn)

百態(tài)人間
2026-02-25 15:33:21
不要了!再見胡明軒!中國(guó)男籃公布12人名單

不要了!再見胡明軒!中國(guó)男籃公布12人名單

籃球?qū)崙?zhàn)寶典
2026-02-25 19:31:33
網(wǎng)友偶遇《天天向上》主持人錢楓,頸部線條消失,身材胖到200斤

網(wǎng)友偶遇《天天向上》主持人錢楓,頸部線條消失,身材胖到200斤

師維
2026-02-25 19:43:51
鐵路部門回應(yīng)“半夜候補(bǔ)成功1700元車票作廢”報(bào)道

鐵路部門回應(yīng)“半夜候補(bǔ)成功1700元車票作廢”報(bào)道

大象新聞
2026-02-25 18:17:03
2026-02-25 23:15:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12362文章數(shù) 142569關(guān)注度
往期回顧 全部

科技要聞

“機(jī)器人只跳舞,沒什么用”

頭條要聞

美官員稱6個(gè)月內(nèi)三國(guó)政府或被親美政權(quán)取代 中方回應(yīng)

頭條要聞

美官員稱6個(gè)月內(nèi)三國(guó)政府或被親美政權(quán)取代 中方回應(yīng)

體育要聞

曝雄鹿計(jì)劃今夏追小卡 字母哥渴望與其并肩作戰(zhàn)

娛樂要聞

黃曉明新戀情!與小22歲美女同游新加坡

財(cái)經(jīng)要聞

上海樓市放大招,地產(chǎn)預(yù)期別太大

汽車要聞

750km超長(zhǎng)續(xù)航 2026款小鵬X9純電版將于3月2日上市

態(tài)度原創(chuàng)

藝術(shù)
健康
教育
時(shí)尚
公開課

藝術(shù)要聞

這位藝術(shù)家的馬賽克畫讓人驚嘆不已!

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

中考數(shù)學(xué)化簡(jiǎn)題,思路邏輯很重要

“復(fù)古甜心”穿搭突然大火!春天穿時(shí)髦又減齡

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版