国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

CVPR2026滿分論文:Proxy-GS為結構化3D高斯濺射引入統(tǒng)一遮擋先驗

0
分享至





在城市街景場景中,Proxy-GS在保持細粒度視覺細節(jié)的同時,實現(xiàn)了穩(wěn)定的實時渲染。我們的方法顯著減少了需要解碼的錨點(anchors)數(shù)量,從而在內(nèi)存效率和渲染速度兩方面都帶來了顯著提升。右上角的插圖展示了所有錨點的俯視可視化,其中以紅色高亮的錨點表示當前幀中被解碼器使用的錨點。

CVPR2026滿分論文:Proxy-GS為結構化 3D 高斯濺射引入統(tǒng)一遮擋先驗

  • 論文鏈接:
  • https://arxiv.org/abs/2509.24421
  • 項目主頁:
  • https://visionary-laboratory.github.io/Proxy-GS/

上海交通大學鐘志航團隊聯(lián)合上海人工智能實驗室、西北工業(yè)大學、四川大學等高校在 CVPR 2026 上提出Proxy-GS(Proxy-GS: Unified Occlusion Priors for Training and Inference in Structured 3D Gaussian Splatting),面向基于 MLP 的結構化 3D 高斯濺射(3DGS),用輕量級代理網(wǎng)格(proxy)把遮擋關系變成可用的可見性信號:在推理階段快速生成遮擋深度圖并剔除被遮擋的錨點以加速渲染;在訓練階段讓增密沿代理表面生長,減少遮擋區(qū)的無效生長,并通過偏移使從錨點解碼出的高斯更好地貼合代理幾何。在遮擋密集的城市街景(如 MatrixCity Streets)中,Proxy-GS 在保持甚至提升畫質(zhì)的同時,實現(xiàn)了2.5×以上的渲染加速。



背景與動機:

為什么結構化 3DGS 會越跑越慢?

3D 高斯濺射(3DGS)在高質(zhì)量新視角合成上已取得顯著進展,但原始 3DGS 往往產(chǎn)生大量冗余高斯,且忽視場景幾何結構。為此,Scaffold-GS、Octree-GS 等基于 MLP 的結構化方法將錨點(anchor)放在體素或八叉樹節(jié)點上,用 MLP 根據(jù)視角動態(tài)解碼高斯屬性,在提升細節(jié)與魯棒性的同時,也帶來了可觀的解碼開銷。在大規(guī)模城市場景中,錨點與高斯數(shù)量急劇增加,解碼與渲染成本成為瓶頸。

現(xiàn)有工作通過剪枝或 LOD(Level of Detail)來減少冗余,但剪枝易損傷畫質(zhì),LOD 主要針對“遠處少畫”,對被遮擋區(qū)域的無效計算關注不足。真實場景——尤其是城市街道、多房間室內(nèi)——遮擋密集,若錨點選擇不顯式考慮遮擋,大量解碼會浪費在被遮擋的錨點上。論文通過可視化發(fā)現(xiàn):當前幀實際參與解碼的錨點與“直覺上需要”的錨點之間存在明顯錯位,大量錨點落在嚴重遮擋區(qū)域,既增加解碼負擔又不貢獻最終畫面。因此,引入遮擋感知的錨點篩選有望顯著降低計算量。

此外,消費級 GPU 的硬件光柵化能力很強,若能用其快速得到遮擋深度,再與現(xiàn)有視錐剔除等策略結合,即可在幾乎不增加時延的前提下實現(xiàn)遮擋剔除。Proxy-GS 即圍繞“輕量 proxy + 硬件光柵化 + 訓練/推理一致使用遮擋先驗”這一思路展開。



Figure 1. 總覽:冗余錨點、剔除效果,以及 PSNR/FPS 對比。

如上圖所示,Proxy-GS在現(xiàn)有 MLP-based LOD 框架(如 Octree-GS)之上,通過遮擋感知的錨點選擇,既減少了解碼量,又改善了畫質(zhì),在遮擋豐富的場景中可實現(xiàn)約的渲染加速。

方法概覽:

Proxy 在訓練與推理中的雙重角色

方法核心是構建一個輕量代理網(wǎng)格,使其能在1000×1000 分辨率下于 1ms 內(nèi)得到遮擋深度圖,并服務于兩件事:推理時的錨點/高斯剔除訓練時的 proxy-guided 增密



Figure 2. Proxy-GS 框架:推理期遮擋剔除 + 訓練期 proxy-guided 增密。

代理網(wǎng)格的獲取:室外大場景常用 COLMAP 等得到稠密點云;室內(nèi)紋理弱、SfM 易失敗時,文中采用 MapAnything 等大模型,以 COLMAP 位姿與 RGB 圖像為輸入得到稠密點云并轉為網(wǎng)格。對網(wǎng)格做表面簡化,只保留較粗的幾何結構,用于表達遮擋關系即可,無需精細幾何細節(jié)。

推理階段:對 proxy 做僅深度的硬件光柵化,得到當前視角下的深度圖;將錨點投影到像平面,與深度圖做深度比較,落在 proxy 之后的錨點視為被遮擋并剔除,再與原有視錐剔除等在單一 CUDA kernel 中融合,避免 GPU-CPU-GPU 往返。深度圖常駐 GPU,并施加小安全裕度 γ 以兼顧數(shù)值與幾何誤差。為加速,還對網(wǎng)格做細粒度分塊并采用層次化深度(Hi-Z)剔除、Early-Z 等,使高分辨率深度生成耗時控制在約 1ms 內(nèi)。

訓練階段:若僅在推理時做遮擋剔除而訓練時仍對所有錨點一視同仁,會導致“訓練時見過的錨點—高斯綁定”與“測試時被剔除的錨點”不一致,畫質(zhì)下降。因此 Proxy-GS 在訓練時同樣使用 proxy 深度做遮擋剔除,使訓練與推理的可見性一致。此外,原增密策略在梯度大的地方生長新錨點,容易在 proxy 后方長出無效錨點。文中提出proxy-guided densification:在渲染誤差持續(xù)較大的圖像塊上,取塊內(nèi)像素對應的 proxy 深度,反投影到 3D 得到新錨點位置,使新錨點落在 proxy 表面附近;并用 proxy-grid 控制每個網(wǎng)格格內(nèi)錨點數(shù)量,避免 3D 上的過密重復。這樣,增密更貼合表面幾何,遮擋區(qū)無效生長減少,畫質(zhì)與速度更平衡。

推理耗時從哪里省下來?

論文在 MatrixCity上對比了 Proxy-GS 與 Octree-GS 各推理環(huán)節(jié)的耗時占比。Proxy 的深度渲染僅約 1ms,幾乎可忽略;錨點篩選因待處理錨點變少而更快;節(jié)省主要來自渲染階段:更少的錨點意味著更少的 MLP 解碼和更少的高斯光柵化,從而帶來顯著的 FPS 提升。



Figure 3. 各推理環(huán)節(jié)時間占比:Proxy-GS 的深度渲染約 1ms,主要節(jié)省來自更少的解碼與渲染。

實驗結果

數(shù)據(jù)集與指標:在大型城市場景 MatrixCity、以及不同遮擋程度與尺度的真實場景(Small City 街景、Berlin、CUHK-LOWER 航拍、Zip-NeRF 室內(nèi))上評估。指標包括 PSNR、SSIM、LPIPS 和 FPS。

MatrixCity 街道:按官方劃分將 Small City 的 8477 張街景分為 5 個 block,在 Block 1&2、Block 3&4、Block 5 上匯報平均指標。Proxy-GS 在各 block 上均在畫質(zhì)(PSNR/SSIM/LPIPS)和 FPS 上優(yōu)于或持平 3DGS、Scaffold-GS、Hierarchical-GS、Octree-GS 等基線。尤其在 Block 5,Octree-GS 約 48 FPS,Proxy-GS 達到151 FPS,同時 PSNR 更高。



Table 1. MatrixCity Street:Proxy-GS 與 3DGS / Scaffold-GS / Hierarchical-GS / Octree-GS 的定量對比。

跨數(shù)據(jù)集泛化:在 Small City(遮擋較強)、Berlin、CUHK-LOWER(遮擋相對較弱、尺度較?。┥?,Proxy-GS 均取得最佳或次佳的畫質(zhì)與速度。遮擋越強的街景(如 Small City),加速與畫質(zhì)收益越明顯;遮擋較弱或場景較小時仍有穩(wěn)定收益,且未帶來額外負擔。



Table 2. 跨數(shù)據(jù)集:不同遮擋強度與尺度的場景。

定性對比:在建筑物窗戶、紋理、路面結構等細節(jié)上,Proxy-GS 相比基線能更好地保持清晰度與結構一致性。



Figure 4. 定性對比:窗戶、紋理、路面等細節(jié)。

訓練與推理策略的消融:在 Block 5 上對比四種設置。ID1:Octree-GS 原流程(baseline)。ID2:僅在推理時做 proxy 遮擋剔除,訓練不變;FPS 提升超過 3×,但畫質(zhì)明顯下降,因訓練時的錨點—高斯綁定與推理時可見性不一致。ID3:訓練與推理均使用 proxy 遮擋剔除(遮擋一致性);畫質(zhì)超過 baseline,F(xiàn)PS 較 ID2 略降(因更多錨點在訓練中生長后才被剔除)。ID4:在 ID3 基礎上加入 proxy-guided densification;畫質(zhì)與速度達到最佳平衡。說明僅推理剔除不夠,訓練階段也需與遮擋先驗一致,并配合 proxy 引導的增密。



Table 3. 不同訓練與推理策略的消融(Block 5)。

對 Proxy 質(zhì)量的依賴:通過兩類消融衡量對 proxy 精度的敏感度。(1)網(wǎng)格分辨率:從較細(約 108MB)到較粗(約 824KB),PSNR 變化不大。城市場景以建筑立面、道路等大面為主,較粗的 proxy 仍能保留遮擋結構,故分辨率影響有限。(2)頂點噪聲:對網(wǎng)格頂點施加隨機擾動后,遮擋邊界被破壞,PSNR 明顯下降;噪聲越大,偽結構越多、畫面越糊。

結論是:Proxy 可以粗,但不能亂——只要遮擋結構正確,分辨率的降低影響有限;而幾何/頂點噪聲會破壞遮擋邊界,對畫質(zhì)影響更大。另外,由于錨點與解碼高斯之間存在固有偏移,在小擾動(如 5% 以內(nèi))下方法仍有一定魯棒性。這種抗擾動性主要是來源于剔除anchor后,Gaussian本身還會相對于anchor學習一個offsets,這也是為什么需要Proxy-GS的訓練階段,這樣每個不完美或者有瑕疵的proxy都會通過訓練階段,得到最適合他的Gaussian分布。?下圖進一步展示了不同分辨率與噪聲設置下的 proxy 網(wǎng)格可視化,以及對應的 PSNR 變化曲線。

Figure 5. 不同分辨率與不同頂點噪聲下的 proxy 網(wǎng)格可視化:分辨率降低時整體遮擋結構基本保持;噪聲增大時遮擋邊界被破壞,出現(xiàn)偽結構。





Figure 6. PSNR 隨 proxy 分辨率和噪聲變化的曲線:分辨率影響有限,而噪聲增大帶來明顯的 PSNR 下降。

與其它加速方案的組合:Proxy-GS 主要減少參與渲染的錨點與高斯數(shù)量,因此可與 FlashGS、硬件光柵化 3DGS 等原有 3DGS 渲染加速技術疊加。在 Block 1 上的實驗表明,在默認 3DGS 渲染器基礎上替換為 FlashGS 或硬件 3DGS 渲染器,可進一步提速;使用硬件 3DGS 時 FPS 提升明顯,畫質(zhì)略有 trade-off。說明該方法與現(xiàn)有渲染管線兼容,便于落地。

結論

Proxy-GS 為基于 MLP 的結構化 3D 高斯濺射提供了統(tǒng)一的遮擋先驗:在推理端通過輕量 proxy 與硬件光柵化在約 1ms 內(nèi)得到遮擋深度并剔除被遮擋錨點;在訓練端通過遮擋一致的渲染與 proxy-guided 增密,使錨點生長更貼合表面、減少無效計算。在遮擋豐富的場景中,Proxy-GS在畫質(zhì)與速度上均優(yōu)于現(xiàn)有方法,可實現(xiàn)約2.5×的渲染加速,提升了 MLP-based 3DGS 在 VR/AR 等應用中的實用性,為高效 3D 場景表示建立了新的標桿。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
突發(fā)!上海最大商場砸的62億懸了!

突發(fā)!上海最大商場砸的62億懸了!

新浪財經(jīng)
2026-03-26 00:14:57
郜林:來銘途一個月沒開過會;當總經(jīng)理和踢球不同

郜林:來銘途一個月沒開過會;當總經(jīng)理和踢球不同

懂球帝
2026-03-26 22:00:56
中國最有名的9條家訓,讀懂一條旺家三代,建議收藏反復背誦

中國最有名的9條家訓,讀懂一條旺家三代,建議收藏反復背誦

長風文史
2026-03-25 17:58:23
中美衛(wèi)星導航用戶數(shù)量懸殊:GPS用戶數(shù)超60億,中國北斗令人意外

中美衛(wèi)星導航用戶數(shù)量懸殊:GPS用戶數(shù)超60億,中國北斗令人意外

混沌錄
2026-03-18 23:54:31
伊朗新最高領袖莫賈塔巴哈梅內(nèi)伊已同意與美國進行談判并達成協(xié)議

伊朗新最高領袖莫賈塔巴哈梅內(nèi)伊已同意與美國進行談判并達成協(xié)議

深度報
2026-03-25 22:47:08
華為、商湯等873家機構遭AI頂會“封殺”,中國學界怒了

華為、商湯等873家機構遭AI頂會“封殺”,中國學界怒了

智東西
2026-03-26 20:49:23
巴基斯坦把稀土賣給美國,以為捏住中國“七寸”,其實在玩火自焚

巴基斯坦把稀土賣給美國,以為捏住中國“七寸”,其實在玩火自焚

通文知史
2026-03-24 08:35:03
宋美齡書法對比:鋼筆字似小學生,英文手稿如中學生!

宋美齡書法對比:鋼筆字似小學生,英文手稿如中學生!

書畫相約
2026-03-26 07:49:18
先被里瓦爾多全面逆襲,后遭齊達內(nèi)強勢碾壓,全能戰(zhàn)士時運不濟

先被里瓦爾多全面逆襲,后遭齊達內(nèi)強勢碾壓,全能戰(zhàn)士時運不濟

足籃大世界
2026-03-26 10:52:09
三次精準躲過斬首行動,卡尼突然現(xiàn)身反轉劇情,伊朗這局水太深了

三次精準躲過斬首行動,卡尼突然現(xiàn)身反轉劇情,伊朗這局水太深了

盛夏微涼
2026-03-24 18:10:08
卡爾森:壞了!原來小丑不是特朗普,而是我自己

卡爾森:壞了!原來小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
真的太孤獨了!山東47歲母親稱已懷胎8月,兩女遠嫁卻極力反對…

真的太孤獨了!山東47歲母親稱已懷胎8月,兩女遠嫁卻極力反對…

火山詩話
2026-03-25 13:41:56
張近東資產(chǎn)清零,張朝陽手握百億現(xiàn)金:兩種人生,一個忠告

張近東資產(chǎn)清零,張朝陽手握百億現(xiàn)金:兩種人生,一個忠告

老特有話說
2026-03-26 14:31:44
一天蒸發(fā)6200億!谷歌算法黑科技擊潰存儲股,華爾街痛批市場“不懂技術”

一天蒸發(fā)6200億!谷歌算法黑科技擊潰存儲股,華爾街痛批市場“不懂技術”

每日經(jīng)濟新聞
2026-03-26 19:00:13
中國摩托在越南被日本本田打的慘??!現(xiàn)在又一路翻盤,太解氣!

中國摩托在越南被日本本田打的慘敗!現(xiàn)在又一路翻盤,太解氣!

萬物知識圈
2026-03-26 15:19:33
蘋果受追捧,國產(chǎn)手機漲價基本失敗了,正在悄悄降價

蘋果受追捧,國產(chǎn)手機漲價基本失敗了,正在悄悄降價

柏銘銳談
2026-03-24 15:38:55
馬英九親自下場后,藍營大佬集體回應,臺媒體人:罪在馬英九

馬英九親自下場后,藍營大佬集體回應,臺媒體人:罪在馬英九

DS北風
2026-03-25 18:50:17
iPhone半夜自動打電話,蘋果官網(wǎng)發(fā)文回應

iPhone半夜自動打電話,蘋果官網(wǎng)發(fā)文回應

界面新聞
2026-03-26 15:46:22
公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

公積金新調(diào)整!4月1日起,職工可自愿提高繳存比例

另子維愛讀史
2026-03-25 22:28:47
穎兒太敢了!素顏曝光臉頰凹陷,做醫(yī)美全程不藏著,疼到五官扭曲

穎兒太敢了!素顏曝光臉頰凹陷,做醫(yī)美全程不藏著,疼到五官扭曲

圓夢的小老頭
2026-03-26 21:31:03
2026-03-27 00:00:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12608文章數(shù) 142594關注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

房產(chǎn)
健康
本地
教育
公開課

房產(chǎn)要聞

突發(fā),三亞又有大批征遷補償方案出爐!

轉頭就暈的耳石癥,能開車上班嗎?

本地新聞

救命,這只醬板鴨已經(jīng)在我手機復仇了一萬遍

教育要聞

天天學習|走進課堂的“大朋友”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版