国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

新加坡國立大學與百度聯(lián)手開發(fā)ONE-SHOT

0
分享至

在電影特效和虛擬現(xiàn)實日益普及的今天,一項由新加坡國立大學和百度公司聯(lián)合開展的研究正在悄然改變我們對視頻制作的認知。這項發(fā)表于2026年4月arXiv預印本平臺(編號:arXiv:2604.01043v1)的研究,提出了一個名為ONE-SHOT的創(chuàng)新框架,能夠讓計算機像導演一樣,將真人的動作、表情和環(huán)境背景巧妙地融合在一起,創(chuàng)造出逼真的視頻內容。

要理解這項研究的意義,不妨把它想象成一種全新的"數(shù)字魔法"。傳統(tǒng)的視頻制作就像搭積木一樣,需要先準備好所有的零件,然后費力地將它們拼裝在一起。而ONE-SHOT更像是一位經驗豐富的廚師,能夠同時處理多種食材,讓每種食材都保持自己獨特的味道,最終烹制出一道和諧美味的大餐。


研究團隊面臨的核心挑戰(zhàn)類似于讓一位京劇演員在歐洲古堡中表演太極,同時還要確保演員的服裝、動作和周圍環(huán)境都顯得自然協(xié)調。在傳統(tǒng)方法中,這需要大量復雜的前期準備工作,就像為了做一道菜而要先建造整個廚房一樣繁瑣。更糟糕的是,一旦過度依賴這些復雜的準備工作,整個系統(tǒng)就像被束縛住的藝術家,失去了創(chuàng)造力和靈活性。

ONE-SHOT的獨特之處在于它采用了一種"分而治之"的策略。就像一位出色的管弦樂指揮能夠讓小提琴、大提琴和鋼琴各自發(fā)揮特長,同時又能完美融合成一首交響樂一樣,這個系統(tǒng)將人物動作、環(huán)境背景和攝像機運動這三個要素分開處理,然后巧妙地將它們組合起來。

研究的創(chuàng)新點體現(xiàn)在三個關鍵技術突破上。首先是"標準空間動作注入"機制,這就像為每位演員提供了一個專門的表演舞臺。無論演員要在什么樣的環(huán)境中表演,他們都可以在這個標準舞臺上練習動作,然后系統(tǒng)再將這些動作無縫地轉移到真實環(huán)境中。這種方法避免了傳統(tǒng)技術中常見的"水土不服"問題。

其次是"動態(tài)基礎旋轉位置編碼"技術,聽起來復雜,但實際上就像一個智能的空間翻譯器。當演員在標準舞臺上的動作需要轉移到真實環(huán)境時,這個翻譯器能夠自動調整空間對應關系,確保演員的每個動作在新環(huán)境中都顯得自然合理。

第三個突破是"混合上下文集成"機制,這相當于給系統(tǒng)配備了長期記憶和短期記憶兩套記憶系統(tǒng)。短期記憶負責記住演員的面部特征和基本外貌,而長期記憶則能追蹤整個表演過程中環(huán)境和人物的變化,確保長達數(shù)分鐘的視頻內容保持一致性。

在技術實現(xiàn)層面,ONE-SHOT采用了一種類似"學徒制"的訓練方式。研究團隊沒有從頭開始訓練一個全新的系統(tǒng),而是基于已經成熟的Wan2.1視頻生成模型進行改進。這就像一位經驗豐富的師傅帶著徒弟,只需要教授一些特定的新技能,而不必從基礎開始。這種方法大大提高了效率,同時保持了原有系統(tǒng)的創(chuàng)造力。

系統(tǒng)的工作流程可以比作制作一部舞臺劇。首先,導演(系統(tǒng))會根據劇本(文本提示)選擇合適的舞臺背景,這是通過分析三維點云數(shù)據和設定攝像機軌跡來實現(xiàn)的。然后,演員(虛擬人物)會根據編排好的動作序列在舞臺上表演。最有趣的是,這個系統(tǒng)能夠讓同一位演員在不同的舞臺上表演不同的劇目,或者讓不同的演員在同一個舞臺上表演相同的動作。

研究團隊在訓練這個系統(tǒng)時采用了多樣化的數(shù)據來源,就像讓學生同時學習多門課程一樣。他們使用了包含動態(tài)攝像機運動的EMDB2數(shù)據集、以人體動作為主的MotionX數(shù)據集子集、提供三維環(huán)境信息的ARKitScenes數(shù)據集,以及自行收集的網絡視頻。這種多元化的訓練方式讓系統(tǒng)具備了更強的適應能力和創(chuàng)造性。

在實驗驗證階段,研究團隊進行了兩類關鍵測試。第一類是"自我重現(xiàn)"測試,就像讓學生復述剛學過的課文一樣,檢驗系統(tǒng)能否準確重現(xiàn)已有的視頻內容。第二類是"創(chuàng)新組合"測試,這更像是讓學生進行創(chuàng)作,檢驗系統(tǒng)能否將不同來源的人物、動作和環(huán)境創(chuàng)造性地組合在一起。

實驗結果顯示,ONE-SHOT在多個重要指標上都超越了現(xiàn)有的頂級方法。在視覺質量方面,它獲得了16.88的FID分數(shù)和181.17的FVD分數(shù),明顯優(yōu)于其他競爭方法。更重要的是,在動作流暢性、背景一致性和人物相似性等關鍵指標上,ONE-SHOT都展現(xiàn)出了更好的平衡性。這就像一位全能運動員,不僅在單項上表現(xiàn)出色,在綜合能力上也超越了專項選手。

特別值得一提的是,ONE-SHOT還展現(xiàn)出了強大的文本指導編輯能力。用戶可以通過簡單的文字描述,讓系統(tǒng)將視頻中的人物或物體進行創(chuàng)意替換。比如,可以將一個普通人替換成卡通角色哆啦A夢,或者將寵物狗替換成發(fā)光的小龍。這種能力源于系統(tǒng)很好地保持了原始視頻生成模型的創(chuàng)造性,沒有因為增加控制功能而犧牲靈活性。

研究團隊還特別關注了長時間視頻生成的挑戰(zhàn)。傳統(tǒng)方法往往只能處理十秒左右的短視頻,而ONE-SHOT通過其混合記憶機制,能夠生成長達數(shù)分鐘的連貫視頻內容。這就像讓一位演員能夠完成一整部短劇的表演,而不僅僅是幾個片段。

在技術細節(jié)的消融實驗中,研究團隊驗證了每個核心組件的重要性。當移除動態(tài)基礎旋轉位置編碼功能時,系統(tǒng)在動作控制上的精確度明顯下降,生成的人物動作會出現(xiàn)偏移和不協(xié)調。當移除面部參考信息時,人物的身份保持能力顯著減弱,容易在長視頻中出現(xiàn)"換臉"現(xiàn)象。這些實驗結果證實了研究團隊設計的每個技術組件都有其不可替代的作用。

從實際應用的角度來看,ONE-SHOT的意義遠不止于技術突破本身。在電子商務領域,它可以讓商家輕松創(chuàng)建不同模特在各種場景下展示產品的視頻,大大降低拍攝成本。在教育領域,教師可以讓歷史人物在特定的歷史場景中"復活",為學生提供更加生動直觀的學習體驗。在娛樂產業(yè),內容創(chuàng)作者可以快速制作各種創(chuàng)意視頻,而無需復雜的拍攝和后期制作流程。

當然,這項技術也面臨著一些挑戰(zhàn)和限制。系統(tǒng)的效果很大程度上依賴于輸入的三維場景點云數(shù)據的質量,如果場景重建不夠精確,可能會影響最終的視頻質量。此外,在一些極端的邊界框定位情況下,系統(tǒng)可能會出現(xiàn)人物位置不準確的問題。對于超長時間的視頻生成,仍然可能出現(xiàn)一些細微的時間漂移現(xiàn)象。

研究團隊也坦誠地討論了這項技術可能帶來的社會影響。雖然ONE-SHOT為創(chuàng)意表達和內容制作提供了強大的工具,但它也可能被用于制作誤導性內容或虛假信息。因此,研究團隊強調了負責任使用這項技術的重要性,建議在實際部署時需要考慮隱私保護和偏見問題。

從技術發(fā)展的趨勢來看,ONE-SHOT代表了視頻生成技術向更加智能化和可控化方向發(fā)展的重要一步。它不僅解決了現(xiàn)有技術在精確控制方面的不足,還保持了人工智能系統(tǒng)的創(chuàng)造性和靈活性。這種平衡對于人工智能技術的實用化具有重要意義。

說到底,ONE-SHOT就像是給了我們一支神奇的畫筆,讓我們能夠在數(shù)字世界中隨心所欲地創(chuàng)作視頻內容。它不僅讓技術變得更加精確和可控,還讓創(chuàng)意表達變得更加自由和多樣。雖然這項技術還有改進的空間,但它已經為我們展示了人工智能在視頻制作領域的巨大潛力。對于那些對技術細節(jié)感興趣的讀者,可以通過論文編號arXiv:2604.01043v1查閱完整的研究內容,深入了解這項令人興奮的技術突破。

Q&A

Q1:ONE-SHOT技術是什么?

A:ONE-SHOT是新加坡國立大學和百度聯(lián)合開發(fā)的視頻生成技術,能夠讓計算機將真人動作、環(huán)境背景和攝像機運動智能地組合在一起,創(chuàng)造出逼真的視頻內容,就像讓虛擬演員在任何環(huán)境中自然表演。

Q2:ONE-SHOT比現(xiàn)有技術有什么優(yōu)勢?

A:ONE-SHOT最大的優(yōu)勢是解決了傳統(tǒng)方法的三個問題:減少了復雜的3D預處理工作,保持了系統(tǒng)的創(chuàng)造力和靈活性,還能生成長達數(shù)分鐘的連貫視頻。它就像一位全能導演,既能精確控制又保持創(chuàng)意自由。

Q3:普通人能使用ONE-SHOT技術嗎?

A:目前ONE-SHOT還是研究階段的技術,普通用戶暫時無法直接使用。不過這項技術未來可能會集成到視頻制作軟件中,讓內容創(chuàng)作者、教育工作者和商家都能輕松制作專業(yè)級的視頻內容。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
江蘇南京與安徽馬鞍山跨省地鐵開通運營

江蘇南京與安徽馬鞍山跨省地鐵開通運營

環(huán)球網資訊
2026-04-22 18:26:08
女籃世界杯分組出爐!中國隊下下簽,難進8強,日本韓國抽到好簽

女籃世界杯分組出爐!中國隊下下簽,難進8強,日本韓國抽到好簽

閱微札記
2026-04-22 11:47:33
稱重112斤!江蘇男子釣獲巨型鰱鳙,這種魚究竟能長多大?

稱重112斤!江蘇男子釣獲巨型鰱鳙,這種魚究竟能長多大?

魚窩魚窩
2026-04-21 11:29:59
國家一級女演員陳麗云被逮捕!

國家一級女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
百萬粉絲女博主在線相親:誰替我還12萬我就嫁給誰!

百萬粉絲女博主在線相親:誰替我還12萬我就嫁給誰!

映射生活的身影
2026-04-22 12:12:25
9分鐘3球!國米逆轉背后:齊沃賭上生涯的兩次換人!

9分鐘3球!國米逆轉背后:齊沃賭上生涯的兩次換人!

落夜足球
2026-04-22 15:36:11
38.6億落槌:王健林欠的錢,已經讓永輝快撐不住了

38.6億落槌:王健林欠的錢,已經讓永輝快撐不住了

BT財經
2026-04-22 07:00:03
一個收入不高的人,可以偽精致到什么程度?網友:天天為賬單發(fā)愁

一個收入不高的人,可以偽精致到什么程度?網友:天天為賬單發(fā)愁

另子維愛讀史
2026-04-20 09:36:56
8億大并購,光纖獨角獸,無可替代!

8億大并購,光纖獨角獸,無可替代!

飛鯨投研
2026-04-22 18:54:21
乘聯(lián)分會:4月1—19日全國乘用車市場零售62.7萬輛 同比下降26%

乘聯(lián)分會:4月1—19日全國乘用車市場零售62.7萬輛 同比下降26%

證券時報
2026-04-22 17:04:34
中央明確了!社保最低繳費年限要提高,70、80后得早做準備

中央明確了!社保最低繳費年限要提高,70、80后得早做準備

云鵬敘事
2026-04-12 16:36:39
博主:國安隊將于今晚抵京,恩科洛洛和鄭圖羅今天在基地康復

博主:國安隊將于今晚抵京,恩科洛洛和鄭圖羅今天在基地康復

懂球帝
2026-04-22 16:47:02
歐洲人終于發(fā)現(xiàn)了:俄烏鬧4年了,合著是華強北在打代理人戰(zhàn)爭?

歐洲人終于發(fā)現(xiàn)了:俄烏鬧4年了,合著是華強北在打代理人戰(zhàn)爭?

用冷眼洞悉世界
2026-04-22 02:23:19
何潤東突然火了,全網扒他國籍和立場,結果發(fā)現(xiàn)根本不是那么回事

何潤東突然火了,全網扒他國籍和立場,結果發(fā)現(xiàn)根本不是那么回事

情感大頭說說
2026-04-22 15:14:49
時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

時長超過蘇德戰(zhàn)爭,俄羅斯該點到為止了

新車知多少
2026-04-21 18:28:58
反向換車的人越來越多了,不是沒錢了,而是終于想通了

反向換車的人越來越多了,不是沒錢了,而是終于想通了

侃故事的阿慶
2026-04-16 11:16:17
錢是有靈性的,記住以下六點,你會越來越有錢

錢是有靈性的,記住以下六點,你會越來越有錢

金沛的國學筆記
2026-04-21 18:53:07
林峰追了她4年,她嫁給別人只花了4天,還連生三娃!如今被曝婚變,全網心碎:女神這是被騙了?

林峰追了她4年,她嫁給別人只花了4天,還連生三娃!如今被曝婚變,全網心碎:女神這是被騙了?

LULU生活家
2026-04-22 15:07:00
十五部門:加強青年婚戀觀引導,深入實施育兒補貼制度,探索住房、出行、消費等多領域聯(lián)動的生育支持政策

十五部門:加強青年婚戀觀引導,深入實施育兒補貼制度,探索住房、出行、消費等多領域聯(lián)動的生育支持政策

每日經濟新聞
2026-04-22 15:16:09
白人女性與黑人女性的體味差異,網友真實分享引發(fā)熱議

白人女性與黑人女性的體味差異,網友真實分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
2026-04-22 19:32:49
科技行者 incentive-icons
科技行者
科技正在如何變革商業(yè)世界
8088文章數(shù) 562關注度
往期回顧 全部

科技要聞

對話梅濤:沒有視頻底座,具身智能走不遠

頭條要聞

三甲醫(yī)院科主任被舉報"巨額財產來源不明" 舉報人發(fā)聲

頭條要聞

三甲醫(yī)院科主任被舉報"巨額財產來源不明" 舉報人發(fā)聲

體育要聞

網易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

汽車要聞

純電續(xù)航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

藝術
數(shù)碼
家居
房產
健康

藝術要聞

無花不風景

數(shù)碼要聞

Beats發(fā)布3米USB-C數(shù)據線:售229元 最高240W快充

家居要聞

極簡繪夢 克制和諧

房產要聞

狂搶284輪!中海??谠倌弥匕跽?!

干細胞抗衰4大誤區(qū),90%的人都中招

無障礙瀏覽 進入關懷版