国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不兒,這誰還能看出是AI演的視頻啊

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

這一次,我真的分不清視頻到底是不是AI生成的了。

來,咱們先來看一下這段演技飆升的視頻片段:



視頻地址:https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

  • Prompt:女子泣不成聲,說臺詞:“江辰……你一定要活著回來,好嗎?……答應(yīng)我”。女子邊說話邊將右手抬起撫摸男子的臉。背景音樂傷感。影視級。

這臺詞、這演技、這眼神、這口型,不說是AI生成的,一般人絕對會以為是哪個電影里的片段。

但重點還不是效果的逼真——

因為這10s的片段,人物對白配音、視頻背景音樂和音效,統(tǒng)統(tǒng)都是通過上面的Prompt一鍋出的。

這就是剛剛火山引擎在FORCE原動力大會上推出的最新豆包視頻生成模型Seedance 1.5 Pro。

主打的就是音畫高精同步,一鏡入戲



就這個功能一出,打造一個有趣好玩的小短片,那真是分分鐘的事情了。

例如我們以這位AI女主角為原型:



然后就可以用Seedance 1.5 Pro搞一個“川劇”——《至辣園》



視頻地址:https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

從這兩個實測案例中,我們不難看出,這次豆包視頻生成模型Seedance 1.5 Pro整體亮點可以總結(jié)為:

  • 音畫高精度同步:不論是背景音樂、音效還是人物對話,都能按照劇情發(fā)展保持高度一致。
  • 支持多人多方言:原生支持如四川話、粵語、上海話、臺灣腔等多種方言,并且精準(zhǔn)捕捉方言獨特的韻律和情感張力 。
  • 影視級效果:不論是視覺、敘事張力、鏡頭語言,都已經(jīng)達(dá)到了真假難辨的程度。
  • 語義理解更強:對于鏡頭敘事的理解更加準(zhǔn)確,有利于專業(yè)級內(nèi)容的創(chuàng)作;同時,抽卡率也更低了。

目前,Seedance 1.5 Pro已經(jīng)上線即夢AI豆包APP火山方舟體驗中心,大家都可以去體驗哦~

企業(yè)用戶自12月23日起,也可以在火山引擎使用該模型API。

那么接下來,我們就通過進(jìn)一步、多角度的實測,來考驗一下Seedance 1.5 Pro的水平。

不僅好看,還挺好用

AI視頻生成到底夠不夠真,其實最主要需要關(guān)注的就是音畫會不會出現(xiàn)bug、夠不夠一致性,運鏡是否夠?qū)I(yè),以及涉及到方言等內(nèi)容時,是否能夠精準(zhǔn)表達(dá)等。

因此,接下來的進(jìn)一步實測,我們就主要圍繞這幾個維度來展開。

音畫夠同步:不會穿幫的那種

我們以即夢為例,Seedance 1.5 Pro生成視頻的操作方式是首尾幀的方式



在這個測試中,我們先上傳這張圖片:



然后附上這么一句Prompt:

  • 緩緩拉遠(yuǎn),鏡頭帶輕微震顫,指尖微蜷(隱帶殺勢),衣服隨風(fēng)飄動。表情眼瞼半垂又驟抬。隨后,急速推近面部特寫,嘴角扯出極淡的冷笑,壓迫感滿滿,并且冰冷蔑視地說話:“憑你也敢挑釁我的權(quán)威!”

來看下生成的效果:



視頻地址:https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

不難看出,Seedance 1.5 Pro完全get到了Prompt要表達(dá)的核心要素,并且音畫同步得非常精準(zhǔn),是有點電影里東方不敗的氣場了。

同樣的方法,我們再來一句這樣的Prompt:

  • 黑客帝國風(fēng)格的發(fā)布會。純黑背景,只有一束頂光。 穿著黑色高領(lǐng)衫的 科技狂人,手里把玩著一枚小小的 AI Pin, 他舉起AI pin,用冷靜且極具煽動力的男聲:“For the last decade, our smartest devices have demanded our eyes. ……” 緩慢推鏡頭(Dolly In),直到AI Pin 占據(jù)整個畫面。



視頻地址:
https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

周潤發(fā)百萬級運鏡也能復(fù)刻

AI視頻生成的另一個要素便是運鏡的效果了。

在這次實測中,我們就來實測一下Seedance 1.5 Pro是否可以復(fù)刻前不久周潤發(fā)在MAMA頒獎典禮中的名場面——百萬級運鏡。

我們的首幀和尾幀分別是:





復(fù)刻周潤發(fā)百萬運鏡的Prompt是這樣的:

  • 西裝男子從舞臺深處一直往前走,鏡頭從遠(yuǎn)推近到人物的面部,鏡頭環(huán)繞切到人物背面,再慢慢往遠(yuǎn)處推。



視頻地址:https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

嗯,是有那個feel了~

多個人、多語言,統(tǒng)統(tǒng)都能hold住

正如我們剛才提到的,Seedance 1.5 Pro現(xiàn)在可以支持多個人、多個方言“一鍋出”,現(xiàn)在你需要做的就是告訴她“誰,說了什么”。

例如下面的Prompt:

  • 畫面中的3個角色對話的情節(jié):首先右邊熊貓用憨厚的四川話說:“我來自中國四川。” 然后左邊的小男孩用西班牙語說:“Yo soy de Espa?a”。接著右邊的熊貓用憨厚的四川話問:“為什么我們說著不一樣的語言,卻能對話呢?”最后中間的小女孩用可愛、開心的音色,微笑著說英語:“Because the AI world is full of magic!” 女孩說完后,停頓一下,3個角色相互看著彼此,開心的笑了起來。 全程緩慢的環(huán)繞運鏡。奇幻的背景音樂。



視頻地址:https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

從上述多個深度實測來看,Seedance 1.5 Pro確實是做到了音畫精準(zhǔn)同步、影視級鏡頭和理解、支持多人對話和方言。

總體體驗下來,方便、快,或許就是最直接的感受了,只要不是過于復(fù)雜的場景,基本都是“一條過”。

不過目前Seedance 1.5 Pro還不支持參考圖生成的方式,不然在操作上會更加靈活。

但除此之外,火山引擎總裁譚待今天在現(xiàn)場還劇透了一個即將推出的新功能——Draft樣片

這個功能要解決的還是AI視頻生成中的一個老大難的問題:抽卡。

簡單來說,就是在真正出成片之前,你可以先生成一個低分辨率的草稿版視頻,用來快速試效果、調(diào)方向;同時還能把畫面里的關(guān)鍵元素先鎖住,確保和最終成片在內(nèi)容上高度一致。

這樣每一次修改,反饋都更明確,也更可控,基本能做到“你看到的,就是最后會得到的”。

按照官方給出的數(shù)據(jù),Draft樣片能把整體創(chuàng)作效率提升約65%,同時減少60%無效創(chuàng)作成本。

技術(shù)底牌也公開了

在AI視頻生成領(lǐng)域,過去我們常說聲畫兩張皮,也就是視頻歸視頻,音頻歸音頻,后期強行縫合。

但Seedance 1.5 pro之所以能做到一鏡入戲,核心在于它把視覺和聽覺從底層邏輯上進(jìn)行了徹底的同構(gòu)。

從技術(shù)角度來看,主要包含四個方面的工作創(chuàng)新。



△Seedance 1.5 pro 訓(xùn)推框架圖

首先是原生音視頻聯(lián)合生成架構(gòu)

不同于傳統(tǒng)的串聯(lián)式架構(gòu)(先視頻后音頻),Seedance 1.5 pro 采用了一套基于 MMDiT(Multi-Modal Diffusion Transformer) 的原生聯(lián)合生成框架。

它建立了一個雙分支的DiT架構(gòu),通過深度跨模態(tài)信息交互機(jī)制,讓視覺流和聽覺流在潛在空間(Latent Space)里實時通信。

這意味著,當(dāng)模型生成角色說話的口型時,它同時就在計算對應(yīng)的音頻波形。這種“雙向奔赴”的架構(gòu),從底層消滅了音畫不同步的違和感。

其次是高質(zhì)量音視頻數(shù)據(jù)框架。

火山方舟團(tuán)隊設(shè)計了一個極其復(fù)雜的多階段數(shù)據(jù)Pipeline。他們不僅篩選了數(shù)以億計的高清視頻,還特別注重音視頻的一致性配比。

通過自動化標(biāo)注系統(tǒng),為視頻注入了豐富的視覺描述和匹配的音頻語義信息。這套框架不僅能識別“一個男人在說話”,還能精確標(biāo)注出“四川話、憨厚音色、帶有環(huán)境回聲”等極具細(xì)節(jié)的特征,為模型打下了深厚的數(shù)據(jù)底子。

還有一套精細(xì)化的后訓(xùn)練優(yōu)化流程

為了讓生成的視頻更有靈性,團(tuán)隊在預(yù)訓(xùn)練之外,引入了針對音視頻場景定制的RLHF(人類反饋強化學(xué)習(xí)) 算法。通過建立多維度的獎勵模型(Reward Model),從視覺美感、運動連貫性、音頻保真度以及最重要的音畫匹配度進(jìn)行全方位調(diào)優(yōu)。

一言蔽之,就是反復(fù)磨練它在微表情、運鏡張力以及聲音情感表達(dá)上的處理能力。

最后就是高效推理加速技術(shù)。

視頻生成一向是巨燒算力的任務(wù),但Seedance 1.5 pro在落地體驗上玩了一把大的。

通過多階段蒸餾技術(shù)和高效推理加速框架,團(tuán)隊成功將推理速度提升了 10倍以上。

這意味著專業(yè)創(chuàng)作者在即夢或豆包上點擊生成,不再需要漫長的進(jìn)度條折磨,真正實現(xiàn)了所見即所得。

從實驗和評測結(jié)果上來看,也是印證了上述四項技術(shù)創(chuàng)新的正確性。



在針對視頻與音頻能力的綜合評測中,Seedance 1.5 pro 在審美(Aesthetics)、運動質(zhì)量(Motion)以及音畫對齊(Alignment) 等核心指標(biāo)上均處于行業(yè)領(lǐng)先地位。

特別是在挑戰(zhàn)性極高的多語言對白和方言口型匹配任務(wù)中,其表現(xiàn)顯著優(yōu)于目前的開源及閉源主流模型。



AI視頻生成,到了真可以上崗時刻

除了Seedance 1.5 pro之外,國內(nèi)外大模型玩家近期也是密集交卷,視頻生成賽道早已進(jìn)入周更模式。

但觀察這些密集發(fā)布的新作,不難發(fā)現(xiàn)一個共同趨勢:它們不再追求單純的像素級高清,而是在向“夠好用”和“夠逼真”這兩個實用維度急速進(jìn)化。

豆包視頻生成模型Seedance 1.5 pro正是這一趨勢的集大成者。

它不僅解決了演技問題(更細(xì)膩的表情和動作),更通過原生的音畫同步,解決了臺詞和情緒的融合問題。

這種從單一模態(tài)向全模態(tài)創(chuàng)作的跨越,讓AI視頻真正具備了低成本制作短劇、廣告片甚至輔助影視創(chuàng)作的實戰(zhàn)能力。



視頻地址:https://mp.weixin.qq.com/s/_jOBSONTopASkhpZcxVitg

或許在不久的將來,我們不需要尋找昂貴的配音演員,不需要復(fù)雜的后期對口型,甚至連方言的韻律和環(huán)境音的質(zhì)感,AI都能一次性給到。

AI視頻直接上崗時刻,已至。

火山方舟體驗中心地址:
https://exp.volcengine.com/ark/vision?launch=seedance

Seedance 1.5 Pro論文地址:
https://arxiv.org/pdf/2512.13507

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
87歲TVB綠葉搬進(jìn)養(yǎng)老院生活,老來喪子長年獨居,稱不想打擾家人

87歲TVB綠葉搬進(jìn)養(yǎng)老院生活,老來喪子長年獨居,稱不想打擾家人

喜歡歷史的阿繁
2025-12-19 14:02:27
曾凡博官宣續(xù)約回歸首鋼 CBA最豪華本土陣容出爐

曾凡博官宣續(xù)約回歸首鋼 CBA最豪華本土陣容出爐

體壇周報
2025-12-19 14:51:27
河南美女“大晨”去世,年僅28歲,日常開奧迪,一口能喝三兩白酒

河南美女“大晨”去世,年僅28歲,日常開奧迪,一口能喝三兩白酒

寶哥精彩賽事
2025-12-16 08:40:55
第一個力挺中國的戰(zhàn)友出現(xiàn)!只要日本敢出兵,立馬使出一大絕招

第一個力挺中國的戰(zhàn)友出現(xiàn)!只要日本敢出兵,立馬使出一大絕招

凡知
2025-11-19 21:28:17
潮汕大佬賴海民:30年只守深圳,憑“慢工”熬成500億舊改王

潮汕大佬賴海民:30年只守深圳,憑“慢工”熬成500億舊改王

林子說事
2025-12-19 10:14:00
演員張澍:許亞軍為她放棄買第二套房子,何晴兒子對她稱呼太有愛

演員張澍:許亞軍為她放棄買第二套房子,何晴兒子對她稱呼太有愛

古希臘掌管月桂的神
2025-12-17 19:24:57
印度首富300斤兒子款待梅西,邀球星去動物園,漂亮妻胯是真寬

印度首富300斤兒子款待梅西,邀球星去動物園,漂亮妻胯是真寬

可樂談情感
2025-12-18 12:19:49
公園深夜親密失控:女方被動迎合,男方粗魯急躁引眾怒

公園深夜親密失控:女方被動迎合,男方粗魯急躁引眾怒

公子麥少
2025-12-19 15:28:51
18+14!數(shù)據(jù)狂飆!han solo(瀚森),歸來大戰(zhàn)國王

18+14!數(shù)據(jù)狂飆!han solo(瀚森),歸來大戰(zhàn)國王

體育新角度
2025-12-19 09:35:34
感謝《江南春》,它好像正在坐實“G宮一件我一件”這個梗

感謝《江南春》,它好像正在坐實“G宮一件我一件”這個梗

阿陸
2025-12-18 20:26:36
女性絕經(jīng)后,還能進(jìn)行夫妻生活嗎?下面干巴巴的,究竟該怎么辦?

女性絕經(jīng)后,還能進(jìn)行夫妻生活嗎?下面干巴巴的,究竟該怎么辦?

醫(yī)者榮耀
2025-12-11 12:05:05
全國4.3億車主注意!2026車船稅精準(zhǔn)到排量,大排量車主哭了!

全國4.3億車主注意!2026車船稅精準(zhǔn)到排量,大排量車主哭了!

老特有話說
2025-12-18 22:05:48
海南“封關(guān)”,也不可能是“下一個深圳”

海南“封關(guān)”,也不可能是“下一個深圳”

鄭子蒙
2025-12-19 06:04:56
被沒收150億美元,在美國翻大跟頭后,洪森父子又開始轉(zhuǎn)向中國

被沒收150億美元,在美國翻大跟頭后,洪森父子又開始轉(zhuǎn)向中國

南宗歷史
2025-11-19 18:02:15
澳大利亞奪槍救人男子在病床上獲贈250萬澳元支票,約合人民幣1160萬元

澳大利亞奪槍救人男子在病床上獲贈250萬澳元支票,約合人民幣1160萬元

極目新聞
2025-12-19 11:04:25
2012年,廣東老板參加宴請后失蹤,13年后托夢妻子:車庫里找我

2012年,廣東老板參加宴請后失蹤,13年后托夢妻子:車庫里找我

農(nóng)村情感故事
2025-12-06 07:32:53
賴清德將被正式提案彈劾

賴清德將被正式提案彈劾

觀察者網(wǎng)
2025-12-19 08:38:06
比利時首相:若烏克蘭資金援助失敗將是歐盟之恥,某些勢力會樂意看到“歐洲徹底分裂”

比利時首相:若烏克蘭資金援助失敗將是歐盟之恥,某些勢力會樂意看到“歐洲徹底分裂”

呼呼歷史論
2025-12-19 10:27:51
當(dāng)代“和珅”劉特佐,酷愛女明星,搬空國庫,奢靡生活似皇帝

當(dāng)代“和珅”劉特佐,酷愛女明星,搬空國庫,奢靡生活似皇帝

午夜故事會
2024-05-30 12:47:23
馬刺新模式!文班3場替補場均17分鐘場均17分 GDP新玩法

馬刺新模式!文班3場替補場均17分鐘場均17分 GDP新玩法

槍炮籃球 PiU
2025-12-19 11:50:04
2025-12-19 16:11:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11882文章數(shù) 176340關(guān)注度
往期回顧 全部

科技要聞

2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

頭條要聞

剎車失靈時速115飆490公里司機(jī):下車后渾身抖無法說話

頭條要聞

剎車失靈時速115飆490公里司機(jī):下車后渾身抖無法說話

體育要聞

沒有塔圖姆,還有塔禿姆

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

非法集資911億!"金融大鱷"終審被判無期

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

本地
房產(chǎn)
健康
藝術(shù)
公開課

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

房產(chǎn)要聞

猛降1.65億!大唐集團(tuán),再次出售三亞核心資產(chǎn)!

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

諸樂三的寫意花鳥

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版