国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

清華趙昊最新力作:0.4 秒完成4D高斯重建,自駕仿真新SOTA丨GAIR 2025

0
分享至



性能較現(xiàn)有 SOTA 提升 50%。

作者丨梁丙鑒

編輯丨馬曉寧


從工廠、礦區(qū)的封閉路段到更加開放的世界,自動駕駛技術(shù)面臨著來自真實(shí)交通環(huán)境的多重挑戰(zhàn)。變道超車的車輛、突然打開的車門、橫穿馬路的行人……當(dāng)自動駕駛系統(tǒng)學(xué)著給這些動態(tài)對象進(jìn)行4D建模、重建和再仿真時(shí),大多數(shù)解決方案仍然依賴于每場景優(yōu)化、已知的相機(jī)校準(zhǔn)或短幀窗口,這使得它們變得緩慢且不實(shí)用。

能否快速、低成本獲得動態(tài)駕駛場景下的仿真數(shù)據(jù),決定了自動駕駛系統(tǒng)在開放世界中的進(jìn)化速度。在這一背景下,長期深耕神經(jīng)渲染與仿真技術(shù)的趙昊老師團(tuán)隊(duì),提出了首個(gè)面向大型動態(tài)駕駛場景的無姿態(tài)(pose-free) 前饋三維重建框架——DGGT(Driving Gaussian Grounded Transformer)。

趙昊現(xiàn)任清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)助理教授,智源學(xué)者(BAAI Scholar)。他的研究聚焦計(jì)算機(jī)視覺領(lǐng)域,在三維場景理解、生成式仿真與神經(jīng)渲染等方向深耕多年,研究成果對于自動駕駛及具身智能仿真具有重要意義。

值得關(guān)注的是,趙昊老師將以組委會主席的身份,出席2025年GAIR全球人工智能與機(jī)器人大會,并主持世界模型分論壇,分享他在世界模型方面的最新探索。

GAIR大會聚焦人工智能的核心技術(shù)、前沿趨勢與產(chǎn)業(yè)落地,長期吸引來自全球的技術(shù)領(lǐng)袖和科研人士。本屆大會將于2025年12月12-13日在深圳·博林天瑞喜來登酒店舉行,與產(chǎn)業(yè)界和學(xué)術(shù)界的嘉賓共同研討人工智能的下一步發(fā)展。



論文地址:
https://arxiv.org/abs/2512.03004

01

自動駕駛仿真新 SOTA

DGGT最大的突破,是擺脫了傳統(tǒng)方案對逐場景優(yōu)化、相機(jī)標(biāo)定以及短幀窗口的依賴。通過多頭聯(lián)合預(yù)測結(jié)構(gòu),DGGT只需稀疏、無標(biāo)定圖像,單次前向即可同時(shí)輸出相機(jī)位姿、深度、動態(tài)實(shí)例與場景表示,重建長序列三維場景。

且該場景表示可直接在Gaussian層面進(jìn)行編輯,如移除或移動車輛,插入其他場景的新汽車或騎行者等實(shí)例。DGGT的高度可編輯性支持?jǐn)U散精修自動補(bǔ)洞,輸出可用于仿真與數(shù)據(jù)合成。

實(shí)驗(yàn)結(jié)果表明,DGGT在Waymo上達(dá)到了 27.41 PSNR,每場景推斷 0.39 秒(3 個(gè)視角,20 幀),超過了作為優(yōu)化基線的EmerNeRF、DeformableGS方案和前饋方法,同時(shí)保持了速度競爭力。換言之,DGGT比優(yōu)化類方案更迅速,比前饋方案更保真。


同樣令人驚喜的還有泛化性。DGGT將相機(jī)位姿從輸入轉(zhuǎn)為模型輸出,通過端到端預(yù)測內(nèi)外參并融入場景表示的方法,打破了跨數(shù)據(jù)集部署的校準(zhǔn)壁壘。DGGT模型在 Waymo 上訓(xùn)練,卻能在 nuScenes 與 Argoverse2 上實(shí)現(xiàn)強(qiáng)勁的零樣本泛化,在關(guān)鍵感知指標(biāo)上相比STORM提升超過50%。如在nuScenes上LPIPS從0.394降至0.152(下降 61.4%),在 Argoverse2上從0.326降至0.155(下降52.5%)。

值得注意的是,研究團(tuán)隊(duì)在nuScenes 和 Argoverse2 數(shù)據(jù)集上分別進(jìn)行了零樣本和從頭訓(xùn)練兩種設(shè)置的實(shí)驗(yàn)評估。在這兩種情況下,DGGT均表現(xiàn)出了SOTA級性能。


此外,系統(tǒng)通過lifespan head建模場景隨時(shí)間的外觀演變,并配合單步擴(kuò)散精修,可有效抑制運(yùn)動插值偽影,提升時(shí)空一致性與渲染自然度。在保證仿真質(zhì)量的前提下,DGGT為自動駕駛仿真推開了一扇邁向高速、可擴(kuò)展新階段的大門。

02

一次前向,完整 4D 場景

DGGT的核心設(shè)計(jì)理念,是一次性預(yù)測完整的4D場景狀態(tài),同時(shí)清晰地將靜態(tài)背景與動態(tài)實(shí)體分離,并保持時(shí)間上的連貫性。

具體來說,研究團(tuán)隊(duì)將相機(jī)位姿從輸入轉(zhuǎn)為模型輸出,每幀生成像素對齊的高斯映射,并添加一個(gè)壽命參數(shù),隨時(shí)間調(diào)制可見性以捕捉變化的外觀,隨后使用動態(tài)頭生成密集動態(tài)映射,使用運(yùn)動頭估計(jì)三維運(yùn)動,用于稀疏時(shí)間戳間插值,同時(shí)插入單步擴(kuò)散細(xì)化,抑制重影/遮蔽偽影并恢復(fù)細(xì)節(jié)。

這產(chǎn)生了單遍、無姿態(tài)的算法,能夠從未擺拍圖像重建動態(tài)驅(qū)動場景,自然支持高斯層級的實(shí)例級編輯。

在系統(tǒng)結(jié)構(gòu)上,DGGT 采用 ViT 編碼器融合 DINO 先驗(yàn),通過交替注意力得到共享特征,再由多個(gè)預(yù)測頭并行輸出:

  • 相機(jī)頭估計(jì)每一幀內(nèi)外參數(shù);

  • Gaussian 頭給出逐像素顏色/位置/旋轉(zhuǎn)/尺度/不透明度參數(shù);

  • lifespan 頭控制時(shí)間可見度;

  • 動態(tài)頭輸出運(yùn)動遮罩;

  • 運(yùn)動頭顯式估計(jì)動態(tài)物體的三維位移;

  • 天空頭穩(wěn)定建模遠(yuǎn)景背景。

03

動態(tài)駕駛場景仿真新路徑

長期以來,高精度標(biāo)定設(shè)備和固定路線采集方案,一直限制著動態(tài)駕駛場景訓(xùn)練數(shù)據(jù)的成本和采集效率,DGGT則提出了一種規(guī)避上述限制的全新方案。

將相機(jī)位姿轉(zhuǎn)為模型輸出的設(shè)計(jì)使DGGT具有了在真實(shí)、開放世界中的高度靈活性,同時(shí)其多頭聯(lián)合預(yù)測結(jié)構(gòu)支持任意數(shù)量的輸入視圖和長序列處理,克服了現(xiàn)有前饋方法在時(shí)序擴(kuò)展性上的瓶頸,為處理大規(guī)模自動駕駛?cè)罩咎峁┝丝尚新窂健?/p>

更可貴的是,DGGT能在Waymo、nuScenes等大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)SOTA級重建質(zhì)量的同時(shí),仍然保持亞秒級的推理速度。這種既快又好的特性,平衡滿足了工業(yè)界對速度與質(zhì)量的雙重需求,使其具有作為實(shí)時(shí)的預(yù)處理模塊,集成到自動駕駛系統(tǒng)的訓(xùn)練、仿真與評估流程中的潛力。

總體來看,0.4秒即可完成支持實(shí)例級編輯的4D重建,速度與質(zhì)量兼顧的動態(tài)場景建模,以及對跨數(shù)據(jù)集泛化瓶頸的突破,無一不意味著低成本生成動態(tài)駕駛場景訓(xùn)練數(shù)據(jù)的新范式,已經(jīng)距離我們更近一步。

首批 GAIR 2025 重磅大咖名單正式揭曉,還有更多行業(yè)領(lǐng)軍者將齊聚現(xiàn)場,共探智能的未來。


未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
長城汽車董事長魏建軍:隱藏式門把手不實(shí)用且危險(xiǎn),今后不再采用

長城汽車董事長魏建軍:隱藏式門把手不實(shí)用且危險(xiǎn),今后不再采用

財(cái)聞
2025-12-17 12:13:55
孫殿英風(fēng)評變好,這意味著什么?

孫殿英風(fēng)評變好,這意味著什么?

十柱
2025-12-18 15:14:26
王室與軍方的陽謀!泰王下旨"皇家庇護(hù)"兜底傷亡,讓泰軍放手去打

王室與軍方的陽謀!泰王下旨"皇家庇護(hù)"兜底傷亡,讓泰軍放手去打

李健政觀察
2025-12-17 16:45:21
太瘋狂!PC廠商為何要漲價(jià)了:16G內(nèi)存條從380元漲到899元

太瘋狂!PC廠商為何要漲價(jià)了:16G內(nèi)存條從380元漲到899元

快科技
2025-12-18 09:00:04
湖人本季關(guān)鍵時(shí)刻0負(fù)!東契奇轟45分大號三雙創(chuàng)4大神跡:隊(duì)史首人

湖人本季關(guān)鍵時(shí)刻0負(fù)!東契奇轟45分大號三雙創(chuàng)4大神跡:隊(duì)史首人

Emily說個(gè)球
2025-12-19 13:02:42
從澳大利亞探親回來,才敢說幾句真心話,移民真的不適合所有人嗎

從澳大利亞探親回來,才敢說幾句真心話,移民真的不適合所有人嗎

i書與房
2025-12-18 11:10:02
東北這晚,給王詩齡側(cè)身讓位的何超瓊,把人情世故體現(xiàn)得淋漓盡致

東北這晚,給王詩齡側(cè)身讓位的何超瓊,把人情世故體現(xiàn)得淋漓盡致

社會日日鮮
2025-12-18 11:44:39
這種碳水每天吃,4個(gè)月“洗掉”30%身體脂肪,讓70%的人悄悄瘦了

這種碳水每天吃,4個(gè)月“洗掉”30%身體脂肪,讓70%的人悄悄瘦了

時(shí)光派健康抗衰
2025-12-08 16:00:09
泰王又封00后“新妃”,王后素顏跑馬淡定!真宮斗冠軍不在怕的

泰王又封00后“新妃”,王后素顏跑馬淡定!真宮斗冠軍不在怕的

商務(wù)范
2025-12-18 14:16:58
中國U152-0韓國,東亞杯首輪比賽結(jié)果

中國U152-0韓國,東亞杯首輪比賽結(jié)果

李絙在北漂
2025-12-19 11:36:16
A股:大家要做好準(zhǔn)備了,下周一,沒有意外的話會這么走

A股:大家要做好準(zhǔn)備了,下周一,沒有意外的話會這么走

財(cái)經(jīng)大拿
2025-12-19 13:39:50
浙江多個(gè)縣(市、區(qū))委書記調(diào)整

浙江多個(gè)縣(市、區(qū))委書記調(diào)整

上觀新聞
2025-12-19 08:47:13
央視《老舅》被觀眾要求下架,理由:劇情太假,掛羊頭賣狗肉!

央視《老舅》被觀眾要求下架,理由:劇情太假,掛羊頭賣狗肉!

甜檸聊史
2025-12-17 09:23:55
許亞軍也沒想到,24歲兒子許何,如今成了他深陷罵聲中的“救贖”

許亞軍也沒想到,24歲兒子許何,如今成了他深陷罵聲中的“救贖”

叨嘮
2025-12-17 06:30:10
不出意外,中國未來超一半人口將流入到這幾個(gè)城市,房價(jià)將反彈

不出意外,中國未來超一半人口將流入到這幾個(gè)城市,房價(jià)將反彈

山丘樓評
2025-12-17 21:02:21
質(zhì)疑劉煒?新疆混血后衛(wèi)坐冷板凳后破防:我在替補(bǔ)席怎么打?

質(zhì)疑劉煒?新疆混血后衛(wèi)坐冷板凳后破防:我在替補(bǔ)席怎么打?

大嘴爵爺侃球
2025-12-19 10:13:37
日本首相:日方愿與中方開展包括領(lǐng)導(dǎo)層在內(nèi)的各層面對話

日本首相:日方愿與中方開展包括領(lǐng)導(dǎo)層在內(nèi)的各層面對話

俄羅斯衛(wèi)星通訊社
2025-12-18 15:27:23
中國農(nóng)歷有多厲害?王蒙:世界上沒有任何歷法同時(shí)知道太陽和月亮

中國農(nóng)歷有多厲害?王蒙:世界上沒有任何歷法同時(shí)知道太陽和月亮

芳芳?xì)v史燴
2025-12-08 19:17:49
加時(shí)力克東部第一!弗拉格23分10板,濃眉15+14,CC空砍20+10+9

加時(shí)力克東部第一!弗拉格23分10板,濃眉15+14,CC空砍20+10+9

無術(shù)不學(xué)
2025-12-19 12:56:43
南博盜賣國寶級文物!失蹤5件寶藏黑幕重重!新書記能否理舊賬?

南博盜賣國寶級文物!失蹤5件寶藏黑幕重重!新書記能否理舊賬?

大江看潮
2025-12-18 21:39:11
2025-12-19 14:51:00
AI科技評論 incentive-icons
AI科技評論
點(diǎn)評學(xué)術(shù),服務(wù)AI
7012文章數(shù) 20715關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

中戲院長郝戎被查 劉燁、章子怡、靳東等為其學(xué)生

頭條要聞

中戲院長郝戎被查 劉燁、章子怡、靳東等為其學(xué)生

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財(cái)經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
教育
公開課
軍事航空

藝術(shù)要聞

諸樂三的寫意花鳥

數(shù)碼要聞

三星Galaxy Book6 Pro筆記本電腦照片曝光

教育要聞

忘記密碼看這里!2025冬季學(xué)考(合格考)準(zhǔn)考證今起打?。〈蛴≈边_(dá)入口→

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進(jìn)入關(guān)懷版