国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小紅書AIGC團(tuán)隊(duì)提出圖像和視頻換臉新算法DynamicFace

0
分享至



本論文主要作者來自小紅書 AIGC 團(tuán)隊(duì)(Dynamic-X-Lab),Dynamic?X?LAB 是一個(gè)專注于 AIGC 領(lǐng)域的研究團(tuán)隊(duì),致力于推動(dòng)姿態(tài)驅(qū)動(dòng)的人像生成與視頻動(dòng)畫技術(shù)。他們以高質(zhì)量、高可控性的生成模型為核心,圍繞文生圖(t2i)、圖像生成(i2i)、圖像轉(zhuǎn)視頻(i2v)和風(fēng)格遷移加速等方向展開研究,并通過完整的開源方案分享給開發(fā)者與研究者社區(qū)。



  • 論文標(biāo)題:DynamicFace: High-Quality and Consistent Face Swapping for Image and Video using Composable 3D Facial Priors
  • 論文鏈接:
  • https://arxiv.org/abs/2501.08553
  • 項(xiàng)目主頁:
  • https://dynamic-face.github.io/

近年來,擴(kuò)散模型在圖像與視頻合成領(lǐng)域展現(xiàn)出前所未有的生成能力,為人臉生成與編輯技術(shù)按下了加速鍵。特別是一張靜態(tài)人臉驅(qū)動(dòng)任意表情、姿態(tài)乃至光照的夢想,正在走向大眾工具箱,并在三大場景展現(xiàn)巨大潛力:

  • 影視行業(yè):導(dǎo)演只需一張定妝照,即可讓演員「數(shù)字替身」在綠幕里實(shí)時(shí)完成高難度的表情捕捉與重打光,后期不再為補(bǔ)拍鏡頭而燒預(yù)算,真正進(jìn)入「先拍臉、后拍景」的降本增效時(shí)代。

  • 游戲行業(yè):捏臉系統(tǒng)將不再局限于預(yù)設(shè)模板。玩家上傳一張自拍,即刻生成 360° 可旋轉(zhuǎn)、可眨眼、可微表情的個(gè)性化角色;配合實(shí)時(shí)語音驅(qū)動(dòng),NPC 的口型與情緒可隨劇情即時(shí)變化,沉浸式體驗(yàn)再升一級。

  • 自媒體與電商:短視頻創(chuàng)作者無需真人出鏡,一張品牌代言照即可批量產(chǎn)出不同光線、不同角度的口播視頻;虛擬主播更可 7x24 小時(shí)直播帶貨,表情自然、光影一致,告別「恐怖谷」效應(yīng)。

人臉視頻生成的核心難題在于,如何在根據(jù)參考圖像和外部動(dòng)作序列,嚴(yán)謹(jǐn)?shù)乇3衷磪⒖既四樕矸萏卣鞑槐粨p傷的同時(shí),還要維持目標(biāo)人臉動(dòng)作的一致性。現(xiàn)有方法在追求真實(shí)動(dòng)態(tài)表現(xiàn)時(shí),通常會遭遇以下三大挑戰(zhàn):

  • 空間與時(shí)間建模的內(nèi)在矛盾:許多聚焦于身份一致性的圖像生成模型在空間特征提取方面已足夠優(yōu)秀,然而由于在注入運(yùn)動(dòng)信息時(shí)耦合了目標(biāo)身份特征,進(jìn)而導(dǎo)致運(yùn)動(dòng)信息不準(zhǔn)確,一旦需要建模時(shí)間變化的視頻擴(kuò)散模型時(shí),不準(zhǔn)確的運(yùn)動(dòng)建模會被逐幀放大,最終陷入身份還原能力和運(yùn)動(dòng)一致難以兩全的問題。

  • 身份一致性降低:在復(fù)雜或大幅度動(dòng)作變化情況下,面部區(qū)域極易出現(xiàn)形變、失真,難以保證人物獨(dú)特的面貌特征能隨時(shí)保留。這種問題直接影響動(dòng)畫人物的個(gè)體識別度和可信度,也是用戶接受數(shù)字人像動(dòng)畫的首要阻礙。

  • 整體視頻質(zhì)量受損:當(dāng)前最優(yōu)秀的人像動(dòng)畫生成模型雖然在動(dòng)畫效果層面取得進(jìn)展,但往往還需借助外部換臉后處理工具以改善關(guān)鍵幀細(xì)節(jié)??上В@類后處理雖能暫時(shí)修復(fù)細(xì)節(jié),卻往往損傷了整段視頻在視覺上的統(tǒng)一性和自然度,導(dǎo)致畫面出現(xiàn)割裂感和不連貫的現(xiàn)象。

小紅書提出 DynamicFace,讓視頻人臉交換邁入「電影級」工業(yè)流水線!

方法介紹

本研究提出了一種創(chuàng)新性的人臉置換方法DynamicFace,針對圖像及視頻領(lǐng)域的人臉融合任務(wù)實(shí)現(xiàn)了高質(zhì)量與高度一致性的置換效果。

與傳統(tǒng)人臉置換方法相比,DynamicFace 獨(dú)創(chuàng)性地將擴(kuò)散模型(Diffusion Model)與可組合的 3D 人臉先驗(yàn)進(jìn)行深度融合,針對人臉運(yùn)動(dòng)與身份信息進(jìn)行了精細(xì)化解耦,以生成更一致的人臉圖像和視頻。



可組合三維面部先驗(yàn)的顯式條件解耦

針對現(xiàn)有方法在身份與運(yùn)動(dòng)表征中普遍存在的耦合冗余問題,DynamicFace 提出將人臉條件顯式分解為身份、姿態(tài)、表情、光照及背景五個(gè)獨(dú)立的表征,并基于 3DMM 重建模型獲取對應(yīng)參數(shù)。

具體而言,利用源圖像提取身份形狀參數(shù) α,目標(biāo)視頻逐幀提取姿態(tài) β 與表情 θ,隨后渲染生成形狀–姿態(tài)法線圖,減少目標(biāo)人臉身份泄露,最大程度保留源身份;表情信息從二維關(guān)鍵點(diǎn)中提取,建模更精準(zhǔn)的表情信息,僅保留眉毛、眼球及口唇區(qū)域的運(yùn)動(dòng)先驗(yàn),避免引入目標(biāo)身份特征;光照條件由 UV 紋理圖經(jīng)模糊處理得到,僅保留低頻光照分量;背景條件采用遮擋感知掩碼與隨機(jī)位移策略,實(shí)現(xiàn)訓(xùn)練–推理階段的目標(biāo)臉型對齊。

四條條件并行輸入 Mixture-of-Guiders,每組由 3×3 卷積與零初始化卷積末端構(gòu)成輕量級條件注入模塊,在注入網(wǎng)絡(luò)前經(jīng)過 FusionNet 融合四個(gè)條件特征后注入到擴(kuò)散模型中,可在保持 Stable Diffusion 預(yù)訓(xùn)練先驗(yàn)的同時(shí)實(shí)現(xiàn)精準(zhǔn)控制。


身份–細(xì)節(jié)雙流注入機(jī)制

為實(shí)現(xiàn)高保真身份保持,DynamicFace 設(shè)計(jì)了雙流并行注入架構(gòu)。高層身份流由 Face Former 完成:首先利用 ArcFace 提取 ID Embedding,再通過可學(xué)習(xí) Query Token 與 U-Net 各層 Cross-Attention 交互,確保全局身份一致性;細(xì)節(jié)紋理流由 ReferenceNet 實(shí)現(xiàn),該網(wǎng)絡(luò)為 U-Net 的可訓(xùn)練副本,將 512×512 源圖潛變量經(jīng) Spatial-Attention 注入主網(wǎng)絡(luò),實(shí)現(xiàn)細(xì)粒度的紋理遷移。


即插即用時(shí)序一致性模塊

針對時(shí)序一致性問題,DynamicFace 會在訓(xùn)練中插入時(shí)序注意力層來優(yōu)化幀間穩(wěn)定性,但時(shí)序?qū)釉谔幚黹L視頻生成時(shí)會出現(xiàn)幀間跳動(dòng)的現(xiàn)象。為此,我們提出了 FusionTVO,將視頻序列劃分為若干段,并為每段設(shè)置融合權(quán)重,在相鄰段的重疊區(qū)域?qū)嵭屑訖?quán)融合;并在潛變量空間引入總變差(Total Variation)約束,抑制幀與幀之間的不必要波動(dòng);對于人臉之外的背景區(qū)域,在每一步去噪迭代過程中采用目標(biāo)圖像中的背景潛變量空間進(jìn)行替換,維持了場景的高保真度。

生成結(jié)果展示








https://mp.weixin.qq.com/s/gt94VPIuKvN_ZU2KyT0UqA?click_id=1


https://mp.weixin.qq.com/s/gt94VPIuKvN_ZU2KyT0UqA?click_id=1

與 SOTA 方法的定性對比實(shí)驗(yàn)









DynamicFace 可以很好地保持身份(例如,形狀和面部紋理信息)和動(dòng)作(包括表情和姿勢等),并且生成結(jié)果維持了更好的背景一致性。

具體來說,基于 GAN 的方法往往會生成較為模糊、視覺上并不真實(shí)且身份一致性較差的結(jié)果,但可以維持不錯(cuò)的運(yùn)動(dòng)一致性;其他基于擴(kuò)散模型的方法能生成分辨率更高且更真實(shí)的結(jié)果,但運(yùn)動(dòng)一致性保持較差(如表情不一致,眼神朝向不同等)。

DynamicFace 通過精細(xì)化解耦的條件注入可以保證更優(yōu)的表情一致、眼神一致和姿勢一致性。

與 SOTA 方法的定量對比實(shí)驗(yàn)



為全面評估 DynamicFace 的性能,研究團(tuán)隊(duì)在 FaceForensics++(FF++)和 FFHQ 數(shù)據(jù)集上進(jìn)行系統(tǒng)性的定量實(shí)驗(yàn),并與當(dāng)前最具代表性的 6 種換臉方法進(jìn)行對比,包括 Deepfakes、FaceShifter、MegaFS、SimSwap、DiffSwap 以及 Face Adapter。

實(shí)驗(yàn)遵循先前論文的參數(shù)設(shè)置:從每個(gè)測試視頻中隨機(jī)抽取 10 幀作為評估樣本,并另取連續(xù) 60 幀用于視頻級指標(biāo)計(jì)算。所有方法均使用官方開源權(quán)重或公開推理腳本,在輸入分辨率(512×512)下復(fù)現(xiàn)結(jié)果。定量結(jié)果如表中所示:DynamicFace 同時(shí)在身份一致性(ID Retrieval)和運(yùn)動(dòng)一致性(Mouth&Eye Consistency)達(dá)到了最優(yōu)的結(jié)果。

整體而言,實(shí)驗(yàn)結(jié)果充分證明了 DynamicFace 在身份保真與運(yùn)動(dòng)還原方面的綜合優(yōu)勢,驗(yàn)證了其在高質(zhì)量人臉可控生成中的卓越性能。

更多應(yīng)用樣例





我們也展示了一些其他的應(yīng)用示例,DynamicFace 可以對身份保持和人體驅(qū)動(dòng)等生成結(jié)果進(jìn)行后處理,顯著提升生成結(jié)果的人臉 ID 一致性和表情控制,更多效果展示可以在項(xiàng)目主頁中進(jìn)行查看。期望這種精細(xì)化解耦條件注入的方法能為可控生成的后續(xù)工作提供新思路。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全新奧迪Q5L預(yù)售:31.3萬-38.5萬元,第五代EA888+華為輔助駕駛

全新奧迪Q5L預(yù)售:31.3萬-38.5萬元,第五代EA888+華為輔助駕駛

IT之家
2025-12-20 16:46:09
烏度卡太死板!無法讓火箭發(fā)揮最大化 火煤:為何不重用謝潑德?

烏度卡太死板!無法讓火箭發(fā)揮最大化 火煤:為何不重用謝潑德?

驚奇侃球
2025-12-21 03:37:20
深圳跌出幸福感!曾經(jīng)1000萬的房子,我500萬抄底!

深圳跌出幸福感!曾經(jīng)1000萬的房子,我500萬抄底!

樓市滅霸
2025-12-19 14:20:44
上海這里人氣爆棚,多款商品“骨折價(jià)”!許多市民滿載而歸,真正享受到紅利

上海這里人氣爆棚,多款商品“骨折價(jià)”!許多市民滿載而歸,真正享受到紅利

新民晚報(bào)
2025-12-20 15:05:21
3-0,穆帥前東家3連勝+登頂,塔利斯卡腳后跟妙傳+29歲皇馬舊將傳射

3-0,穆帥前東家3連勝+登頂,塔利斯卡腳后跟妙傳+29歲皇馬舊將傳射

凌空倒鉤
2025-12-21 01:00:25
明著吃軟飯?多次上春晚竟然全是老婆的功勞,結(jié)婚多年被拿捏死

明著吃軟飯?多次上春晚竟然全是老婆的功勞,結(jié)婚多年被拿捏死

小熊侃史
2025-12-13 10:14:47
洪瑪奈:全面升級與美國的軍事、經(jīng)貿(mào)合作,構(gòu)建戰(zhàn)略伙伴關(guān)系。

洪瑪奈:全面升級與美國的軍事、經(jīng)貿(mào)合作,構(gòu)建戰(zhàn)略伙伴關(guān)系。

百態(tài)人間
2025-12-20 05:10:05
黃磊孫莉二女兒近照曝光!眼睛旁邊兩顆淚痣好獨(dú)特

黃磊孫莉二女兒近照曝光!眼睛旁邊兩顆淚痣好獨(dú)特

情感大頭說說
2025-12-21 01:25:47
A股:不出意外 下周一 市場很有可能會迎來更大級別的反彈?

A股:不出意外 下周一 市場很有可能會迎來更大級別的反彈?

夜深愛雜談
2025-12-20 16:32:16
馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個(gè)孩子

馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個(gè)孩子

豐譚筆錄
2025-12-12 11:16:23
萬萬沒想到!南博8800萬藏品未平,川博又現(xiàn)“姚元之扇面”迷蹤…

萬萬沒想到!南博8800萬藏品未平,川博又現(xiàn)“姚元之扇面”迷蹤…

火山詩話
2025-12-19 17:35:08
《水滸傳》里的“水滸”是什么意思?

《水滸傳》里的“水滸”是什么意思?

國家人文歷史
2025-12-18 15:33:26
寧波5月大女嬰手術(shù)后去世,家屬:尸檢報(bào)告稱未檢見冠狀竇型房間隔缺損

寧波5月大女嬰手術(shù)后去世,家屬:尸檢報(bào)告稱未檢見冠狀竇型房間隔缺損

紅星新聞
2025-12-20 15:16:15
海綿寶寶抑郁癥被封殺了

海綿寶寶抑郁癥被封殺了

毒舌扒姨太
2025-12-20 22:26:40
大反轉(zhuǎn)!拉什福德竟征服巴薩,3000萬買斷和阿爾瓦雷斯交易成真?

大反轉(zhuǎn)!拉什福德竟征服巴薩,3000萬買斷和阿爾瓦雷斯交易成真?

奶蓋熊本熊
2025-12-21 01:26:51
輸吉林發(fā)布會!劉煒將防守甩鍋納托爾,不滿籃板,西爾扎提談失誤

輸吉林發(fā)布會!劉煒將防守甩鍋納托爾,不滿籃板,西爾扎提談失誤

籃球資訊達(dá)人
2025-12-21 02:56:57
生態(tài)環(huán)境部副部長于會文任內(nèi)蒙古黨委常委、呼和浩特市委書記

生態(tài)環(huán)境部副部長于會文任內(nèi)蒙古黨委常委、呼和浩特市委書記

澎湃新聞
2025-12-20 19:26:26
看劉奕君兒子和成毅飆戲,才知觀眾不是煩星二代,而是丑還沒演技

看劉奕君兒子和成毅飆戲,才知觀眾不是煩星二代,而是丑還沒演技

動(dòng)物奇奇怪怪
2025-12-20 13:34:16
日菲南海聯(lián)手,中方果斷行動(dòng)擊沉兩艘菲方船只

日菲南海聯(lián)手,中方果斷行動(dòng)擊沉兩艘菲方船只

孤城落葉
2025-12-17 11:44:16
中亞四國領(lǐng)導(dǎo)人姍姍來遲!托卡耶夫支持日本入常,只看重經(jīng)濟(jì)合作

中亞四國領(lǐng)導(dǎo)人姍姍來遲!托卡耶夫支持日本入常,只看重經(jīng)濟(jì)合作

李博世財(cái)經(jīng)
2025-12-20 14:34:58
2025-12-21 03:55:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142515關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來

頭條要聞

臺北致4人身亡嫌犯被指是"大陸籍" 蔣萬安回應(yīng)

頭條要聞

臺北致4人身亡嫌犯被指是"大陸籍" 蔣萬安回應(yīng)

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

2026央視跨年晚會陣容曝光,豪華陣仗

財(cái)經(jīng)要聞

求解“地方財(cái)政困難”

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測試 已完成11萬公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

親子
本地
游戲
時(shí)尚
數(shù)碼

親子要聞

邊牧和德牧帶娃在外面挖坑,三個(gè)小朋友加起來800個(gè)心眼子!

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

逆天!LCK頒獎(jiǎng)Faker無緣獎(jiǎng)項(xiàng),LPL解說炮轟開罵直播間差點(diǎn)被封

最顯腿細(xì)的騎士靴,誰穿誰是腿精

數(shù)碼要聞

一屏多用:華為Mate X7 / XTs折疊屏手機(jī)“變身”智能手卡

無障礙瀏覽 進(jìn)入關(guān)懷版