国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

硬剛Sora2,萬相2.6輕松定制角色、控制分鏡,普通人也能當(dāng)導(dǎo)演

0
分享至

編輯|+0

2025 年即將畫上句號,回望這一年的視頻生成領(lǐng)域,用「突飛猛進」來形容毫不為過,甚至可以說,視頻內(nèi)容創(chuàng)作的范式正在悄然發(fā)生改變。

9 月,OpenAI 發(fā)布的 Sora 2 憑借「客串(Cameo)」功能,打破了困擾行業(yè)已久的「角色一致性」瓶頸,首創(chuàng)的「角色扮演功能」玩法讓 AI 視頻從充滿不確定性的「盲盒抽卡」進化為可控的「導(dǎo)演游戲」。

與此同時,商業(yè)落地的速度快得驚人:在 B 端,大量 AI 短劇、漫劇上線,制作成本大幅降低;在 C 端,社交平臺上不僅有「粘土濾鏡」這樣的爆款特效,更有大量博主開始常態(tài)化使用 AI 制作劇情短片。

然而,面對這些頂尖技術(shù),普通用戶的心情往往是「又愛又恨」。愛的是,各家 SOTA 模型生成的畫面在光影質(zhì)感與物理規(guī)律上已臻化境,甚至讓人恍惚感嘆「現(xiàn)實與虛擬的界限已然消失」;恨的是,體驗的門檻依舊存在,要么是高不可攀的內(nèi)測資格,要么是每月不菲的訂閱賬單。

前段時間,驚喜降臨。阿里千問 APP 接入了 Wan 2.5(萬相 2.5),讓我們感受到了移動端創(chuàng)作的自由與暢快,這種在手機上免費生成「有聲視頻」的體驗,確實很香。在權(quán)威大模型評測集 LMArena 上,萬相 2.5 的圖生視頻能力曾位居國內(nèi)第一。

而這份驚喜在年底迎來了重磅加碼。12 月 16 日,阿里趁熱打鐵,正式發(fā)布了新一代萬相 2.6 系列模型。如果說 2.5 版本是幫大家推開了視頻創(chuàng)作的門,那么此次面向?qū)I(yè)影視制作和圖像創(chuàng)作場景全面升級的 2.6 版本,則是把專業(yè)影棚搬到了每個人面前,人人都能當(dāng)電影主角或是導(dǎo)演。



  1. 體驗入口:https://tongyi.aliyun.com/wan/generate/video/starring-roles?model=wan2.6

先看一段官方提供的視頻,電影質(zhì)感爆棚。



此次發(fā)布的萬相 2.6 系列涵蓋文生視頻、圖生視頻和參考生視頻,圖像生成和文生圖共 5 款模型,是目前全球功能覆蓋最全面的視頻生成模型家族之一。它是國內(nèi)首個具備聲畫一致性角色定制能力的模型,這意味著你不僅能通過「角色參考」固定住視頻中人或物的 IP 形象,還能參考輸入視頻中的音色,實現(xiàn)從畫面到聲音的完美復(fù)刻,無論是單人獨白還是雙人對手戲都能輕松拿捏。

更重要的是,此次發(fā)布的版本進一步提升了畫質(zhì)、音效和指令遵循能力,單次視頻生成時長實現(xiàn)了國內(nèi)最高的 15 秒(參考生視頻為 10 秒),還帶來了「分鏡控制」功能,能自動拆解并實現(xiàn)多鏡頭切換等專業(yè)任務(wù),讓 AI 不再只是生成零碎的片段,而是開始懂得構(gòu)建完整的故事線。目前,萬相 2.6 已同步上線阿里云百煉和萬相官網(wǎng),企業(yè)用戶可直接調(diào)用 API,千問 APP 也將于近期上線該模型。



簡單來說,阿里這次不僅把畫質(zhì)拉滿了,更是把攝影師、燈光師、動作指導(dǎo)和錄音師打包塞進了你的手機和云端。

為了驗證萬相 2.6 是否真的這么厲害,我們決定不玩虛的,直接上手實測。

多角色聲畫同步的極限挑戰(zhàn)

AI 視頻最難的是什么?不是生成絢麗的畫面,而是在動態(tài)變化中保持「保真」與「一致」。

大家應(yīng)該都還記得 Sora 2 發(fā)布時被瘋傳的「百變奧特曼」:山姆·奧特曼(Sam Altman)在各種場景下做炸雞、吃炒飯,雖然動作離譜,但那張臉和神態(tài)卻始終如一?,F(xiàn)在,萬相 2.6 成了全球唯二,國內(nèi)首個具備這種「參考生視頻」能力的模型。

這是面向?qū)I(yè)影視創(chuàng)作的一次全面升級。全新的視頻參考生成功能,允許將任意人或物設(shè)定為主角,不僅能一鍵完成單人、多人、人與物合拍的視頻,還能在多鏡頭絲滑切換的過程中保持核心主體、場景布局和環(huán)境氛圍的統(tǒng)一。



從技術(shù)層面解析,通義萬相在模型結(jié)構(gòu)上集成了多項創(chuàng)新技術(shù),可對輸入?yún)⒖家曨l進行多模態(tài)聯(lián)合建模與學(xué)習(xí)。它不僅能參考具有時序信息的主體情緒、姿態(tài)和多角度全面視覺特征,更能同時提取音色、語速等聲學(xué)特征,在生成階段作為參考條件控制,實現(xiàn)從視覺到聽覺的全感官、全維度一致性遷移。

而「分鏡控制」則面向?qū)I(yè)敘事場景,模型通過高層語義理解,將用戶簡單的提示詞轉(zhuǎn)換為多分鏡腳本,生成包含多個鏡頭的連貫敘事視頻,確保全片在內(nèi)容、節(jié)奏和氛圍上的高一致性。



為了驗證這一能力,我們直接上傳了奧特曼、哈薩比斯和黃仁勛的過往視頻片段作為參考素材。萬相 2.6 能夠精準(zhǔn)提取視頻中主體的形象特征、聲音聲線乃至慣用神態(tài),并允許我們通過提示詞將他們「傳送」進全新的劇情中。



這一次,我們讓這三位科技圈頂流在一個極具電影質(zhì)感的平行宇宙里,來了一場關(guān)于 GPT-5.2 和 Gemini 3 的「現(xiàn)場互懟」。我們在對話框中輸入設(shè)定臺詞和畫面,分多次生成最后拼接畫面。話不多說,直接來看正片:



英文版完美復(fù)刻了他們原本的聲線與語調(diào),效果令人咋舌。

為了讓大家更直觀地感受音頻生成的實力,我們再看一個中文配音版,雖然語種跨越增加了難度,音頻效果略遜色于英文版,但依然不僅形似,更是神似。

仔細(xì)觀察三位主角的眉眼微表情、肢體語言乃至習(xí)慣性動作,還原度極高,幾位「AI 演員」可以說是演技滿滿。Sam 從首日身體后仰的「跑分王」傲慢,到次日瘋狂刷屏?xí)r的眼神閃爍、戰(zhàn)術(shù)喝水,情緒轉(zhuǎn)折絲滑流暢;Demis 那股從緊張防御到端著咖啡「貼臉開大」的戲謔笑意,簡直靈魂附體。當(dāng)然,最絕的還得是「皮衣教主」黃仁勛,那仰天大笑的一攤手,仿佛直接穿透屏幕在說:「爭什么爭?最后不都得靠我?」

為了方便大家復(fù)刻同款大片,官方貼心提供了兩套核心提示詞模板:

針對「參考生視頻」,模型支持人物、萌寵或道具等任意類型主角(最多 3 個),并能完美復(fù)刻其外觀、動態(tài)及音色。只需套用公式「@主角 + 動作 + 臺詞 + 場景」:通過 @ 符號精準(zhǔn)引用參考素材,描述動作情緒、臺詞內(nèi)容及所處環(huán)境即可。例如:在一個童話場景中,@A(參考視頻為兔子)在草地玩耍,@B(參考視頻為狗)在樹下彈琴被蘋果砸中,@A 開心地說:「你要變成科學(xué)家了!」

而在「多鏡頭敘事」方面,萬相 2.6 能將原始輸入構(gòu)建為具備敘事張力的專業(yè)級多鏡頭段落。無論是啟用智能多鏡還是手動精控,推薦使用公式「總體描述 + 鏡頭序號 + 時間戳 + 分鏡內(nèi)容」。先概括故事主題與基調(diào),再通過時間戳(如 [0-3 秒])劃分結(jié)構(gòu),詳細(xì)描述每個分鏡的運鏡與表演。例如:講述一個重拾希望的短劇。第 1 鏡頭 [0-3 秒] 男孩看著信紙嘆氣;第 2 鏡頭 [3-5 秒] 特寫眼角淚光;第 3 鏡頭 [5-10 秒] 場景切換,女孩微笑著走近安慰他。

當(dāng) AI 擁有了長敘事能力與「演技」

短視頻時代,能不能火全看「?!购汀笐颉?,面向廣告設(shè)計、短劇制作等專業(yè)場景,萬相 2.6 展現(xiàn)出了驚人的潛力。通過輸入連續(xù)提示詞,它能生成一段完整敘事的短片,讓人人都能當(dāng)導(dǎo)演。下面我們測試一下它在細(xì)節(jié)把控和情緒表達上的「演技」。

為了驗證模型在極端條件下的細(xì)節(jié)把控能力,我們嘗試了一組高難度的特寫鏡頭測試。

提示詞:日式電影感,中近景:26 歲亞洲女性,黑色齊肩短發(fā),清淡妝容,戴銀邊細(xì)框眼鏡,穿著米白色寬松針織毛衣。她站在溫馨昏黃的廚房里,手里端著一碗剛煮好的米線。特寫鏡頭:碗中升騰起濃郁的白色蒸汽,熱氣瞬間撲在她的臉上,熏白了她的眼鏡片,形成一層白霧。她微微一愣,透過模糊的鏡片眨了眨眼,表情呆萌而治愈,背景是虛化的充滿生活氣息的冰箱和櫥柜。



畫面聚焦于一位剛下班的都市女性,她端著一碗熱氣騰騰的面條準(zhǔn)備享用。令人驚嘆的是,當(dāng)熱氣上涌,水霧瞬間在她的眼鏡鏡片上凝結(jié)成一層細(xì)密而真實的白霜,視野的模糊與清晰交界處處理得極其自然,光影在水霧上的折射顯得通透而生動。

在如此近距離的微距鏡頭審視下,人物皮膚細(xì)節(jié)展現(xiàn)出了電影級的高保真度:鼻翼兩側(cè)因熱氣熏蒸而泛起的微紅、眼角極其細(xì)微的疲憊干紋,甚至是皮膚未施粉黛的細(xì)膩顆粒感和毛孔的「呼吸感」,都被完美捕捉和呈現(xiàn),完全打破了以往 AI 生成人物常見的「塑料感」。

更絕妙的是人物的神態(tài)動作,當(dāng)眼鏡被蒙住的瞬間,她下意識地瞇起眼睛,鼻頭輕微皺縮,嘴角卻又不自覺地掛著即將被美食治愈的滿足笑意。

我們進一步嘗試讓「大宋第一狠人」蘇軾穿越回來,錄制「敬自己一杯」的 Vlog。

我們只需給模型設(shè)定一個首幀,輸入提示詞,模型就能快速完成分鏡設(shè)計、角色演繹和畫面配音。



提示詞: (蘇東坡舉著酒杯,滿臉通紅,微醺狀態(tài)) 第三杯!敬我的「大宋窮游指南」!皇帝把我貶到黃州,我發(fā)明了東坡肉;把我貶到惠州,我日啖荔枝三百顆;最后把我扔到海南島(當(dāng)時那是未開化之地),以為我會哭死?不好意思,我發(fā)現(xiàn)那邊的生蠔真的太好吃了,還寫信讓兒子別告訴別人,怕朝廷那幫人跑來跟我搶。把流放活成《舌尖上的中國》,就問你服不服!喝!

來看看效果如何:

可以看到,視頻不僅高度還原了我們設(shè)定的視覺風(fēng)格,更在細(xì)節(jié)上經(jīng)得起推敲:聲畫同步率極高,面部微表情隨著臺詞層層遞進。模型展現(xiàn)出了類似專業(yè)導(dǎo)演的運鏡意識,通過推拉搖移和景深變化有效掌控了敘事節(jié)奏。視頻中的蘇軾全程以一種舉重若輕的姿態(tài)講述跌宕人生,既重現(xiàn)了「一蓑煙雨任平生」的豪邁豁達,又精準(zhǔn)拿捏了「微醺吐槽」時的詼諧與松弛,感染力十足。

不容忽視的平面「基本功」

在大家的目光都被視頻生成的「演技」吸引時,萬相 2.6 在靜態(tài)圖像生成領(lǐng)域也悄然完成了版本迭代。對于一個多模態(tài)大模型而言,高質(zhì)量的平面圖像生成能力依然是其重要的「基本功」。

此次 2.6 版本的圖像生成能力升級,主要體現(xiàn)在對畫面細(xì)節(jié)的控制力和實用場景的覆蓋,可以說是在「高美學(xué)」與「強可控」上同時邁出了一大步。

在基礎(chǔ)的文生圖方面,新模型實現(xiàn)了對藝術(shù)風(fēng)格的「靈魂捕捉」。從提供的測試案例來看,模型對「肌理、色彩、筆觸」等細(xì)節(jié)的刻畫更為到位。無論是需要特定筆觸感的東方水墨、拉斐爾藝術(shù)風(fēng)格,還是偏向現(xiàn)代設(shè)計的數(shù)字插圖、毛氈卡通風(fēng)格,模型都能精準(zhǔn)還原。更有趣的是它的「風(fēng)格融合」能力,比如將「印象派」與「涂鴉」結(jié)合,模型能處理得過渡平滑且自然,創(chuàng)作出獨具一格的視覺作品。



針對容易「翻車」的人物寫實照片,2.6 版本綜合優(yōu)化了構(gòu)圖與光影,在一定程度上削弱了以往常見的「AI 塑料感」。實測中,人物神態(tài)更加自然,膚質(zhì)真實感大幅提升,即便是復(fù)雜的環(huán)境情緒攝影,也能呈現(xiàn)出極具表現(xiàn)力的光影細(xì)節(jié)。



更具實用價值的是其在復(fù)雜排版和精準(zhǔn)控制方面的提升。新版本改善了在圖片中生成中英文文本的能力,這意味著制作帶文字的海報、帶有數(shù)據(jù)信息的圖表變得更加直接。同時,模型不僅涵蓋了廣泛的歷史文化 IP 元素,還新增了諸如「圖文混排輸出」和「多圖融合生成」等功能,能夠依據(jù)邏輯創(chuàng)作出具有敘事性的繪本或復(fù)雜的商品組合場景。



對于有特定需求的設(shè)計或商業(yè)場景,萬相 2.6 提供了更細(xì)致的控制選項。例如,在需要保持商品或角色形象統(tǒng)一時,它提供了商用級的一致性保持能力;在調(diào)整畫面氛圍時,用戶可以更精確地控制鏡頭的遠近視角和光影效果。



提示詞:給這個男生和狗拍一張寫真,男生摟著這只狗,人和狗都很開心,攝影棚柔和燈光,藍色紋理背景。

如果說視頻生成是在探索 AI 動態(tài)表達的上限,那么圖像生成板塊的更新,則是在夯實 AI 平面創(chuàng)作的地基,提供了一套更為穩(wěn)健、多樣的工具集。目前,萬相模型家族已支持文生圖、圖像編輯、文生視頻、圖生視頻、人聲生視頻、動作生成、角色扮演及通用視頻編輯等 10 多種視覺創(chuàng)作能力,已廣泛應(yīng)用于 AI 漫劇、廣告設(shè)計和短視頻創(chuàng)作等領(lǐng)域。

結(jié)語

萬相 2.6 的發(fā)布,某種程度上標(biāo)志著 AI 視頻生成正式告別了單純的「抽卡」時代,邁向了精準(zhǔn)可控的電影級創(chuàng)作新階段。

過去,我們驚嘆于 AI 的畫質(zhì),卻苦惱于它的不可控。而現(xiàn)在,萬相 2.6 用國內(nèi)首創(chuàng)的角色扮演功能讓「演員」聽話懂戲,不僅能鎖住容貌,更能演繹情緒;用智能分鏡控制讓敘事有了邏輯,從單點畫面進化為連貫的故事篇章。它將曾經(jīng)昂貴的影視工業(yè)特權(quán),折疊進了手機和云端,徹底消除了技術(shù)對創(chuàng)意的阻隔。

當(dāng)燈光、攝影、演員和剪輯都聽命于你的指尖,技術(shù)不再是門檻。無論是想做一部「賽博大片」,還是只想發(fā)一條朋友圈惡搞 Vlog,都能找到順手的工具。

門檻已經(jīng)塌陷,工具就在手邊。從此刻起,你的想象力,就是你的生產(chǎn)力。

體驗鏈接:

  1. 萬相官網(wǎng):https://tongyi.aliyun.com/wan/
  2. 阿里云百煉 API:https://bailian.console.aliyun.com/?tab=model#/model-market/all?providers=wan

文中視頻鏈接:https://mp.weixin.qq.com/s/tgVN9ByxXn5NKDX8bArcgw

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
馬未都為龐家后人發(fā)聲,犀利點出關(guān)鍵,揭開南京博物院“遮羞布”

馬未都為龐家后人發(fā)聲,犀利點出關(guān)鍵,揭開南京博物院“遮羞布”

好賢觀史記
2025-12-19 16:40:00
全國統(tǒng)一體制內(nèi)口頭禪,一出口就知道,網(wǎng)友:味太正了!

全國統(tǒng)一體制內(nèi)口頭禪,一出口就知道,網(wǎng)友:味太正了!

另子維愛讀史
2025-12-18 16:59:41
明星全家福,誰丑遺傳誰,丑基因是一點沒浪費,白瞎了好基因

明星全家福,誰丑遺傳誰,丑基因是一點沒浪費,白瞎了好基因

翰林濤濤
2025-12-19 10:01:23
“這樣廉價的母愛,還是別曬了”,家長給女兒補襪子,被網(wǎng)友群嘲

“這樣廉價的母愛,還是別曬了”,家長給女兒補襪子,被網(wǎng)友群嘲

妍妍教育日記
2025-12-18 18:55:22
日本自衛(wèi)隊飛機惡意滋擾遼寧艦編隊、沖闖中方演訓(xùn)區(qū),現(xiàn)場細(xì)節(jié)公布

日本自衛(wèi)隊飛機惡意滋擾遼寧艦編隊、沖闖中方演訓(xùn)區(qū),現(xiàn)場細(xì)節(jié)公布

極目新聞
2025-12-19 12:52:04
謝逸楓:顫抖吧!前十一月全國賣地收入史無前例下跌,怎么辦?

謝逸楓:顫抖吧!前十一月全國賣地收入史無前例下跌,怎么辦?

謝逸楓看樓市
2025-12-19 10:25:32
遼寧省沈陽市大東區(qū)委原副書記劉大威被開除黨籍和公職

遼寧省沈陽市大東區(qū)委原副書記劉大威被開除黨籍和公職

界面新聞
2025-12-19 21:43:27
中國男人,正在美國化

中國男人,正在美國化

茶狐看世界本尊
2025-12-19 23:45:04
別瞧不起200萬存款:在中國,能拿出這筆錢你已是富人

別瞧不起200萬存款:在中國,能拿出這筆錢你已是富人

流蘇晚晴
2025-12-18 18:34:22
臺灣網(wǎng)友:大陸若是國民黨掌握政權(quán),中國肯定不是今天這么強大。

臺灣網(wǎng)友:大陸若是國民黨掌握政權(quán),中國肯定不是今天這么強大。

百態(tài)人間
2025-12-20 05:20:05
剛剛,歐盟通過決議,為烏克蘭未來兩年提供900億歐元援助

剛剛,歐盟通過決議,為烏克蘭未來兩年提供900億歐元援助

山河路口
2025-12-19 13:10:42
中小學(xué)將改“522學(xué)制”?官方最新回應(yīng)來了,落地時間表明確

中小學(xué)將改“522學(xué)制”?官方最新回應(yīng)來了,落地時間表明確

慧眼看世界哈哈
2025-12-19 11:50:03
600多元天津飛北京,中轉(zhuǎn)30多個小時“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機票火出圈

600多元天津飛北京,中轉(zhuǎn)30多個小時“特種兵”游成都,無錫飛常州中轉(zhuǎn)重慶跨年省錢近一半,“回旋鏢”機票火出圈

極目新聞
2025-12-19 07:21:26
勇記:庫湯追今年2月曾共進晚餐,庫里認(rèn)為這徹底終結(jié)了克萊離隊的事件

勇記:庫湯追今年2月曾共進晚餐,庫里認(rèn)為這徹底終結(jié)了克萊離隊的事件

懂球帝
2025-12-20 01:02:20
中國農(nóng)業(yè)銀行內(nèi)蒙古自治區(qū)分行副巡視員姜文俊接受審查調(diào)查

中國農(nóng)業(yè)銀行內(nèi)蒙古自治區(qū)分行副巡視員姜文俊接受審查調(diào)查

界面新聞
2025-12-19 15:01:49
53歲吳越單身生活曝光,為父親買上海大平層,坦言孤獨是種福報

53歲吳越單身生活曝光,為父親買上海大平層,坦言孤獨是種福報

仙味少女心
2025-12-19 03:16:58
新王已立!砍下43+11+9,特雷楊離開倒計時,再見了,老鷹

新王已立!砍下43+11+9,特雷楊離開倒計時,再見了,老鷹

球童無忌
2025-12-20 01:12:11
43歲香港著名星二代和外籍男友已經(jīng)生了孩子,但至今都沒有結(jié)婚

43歲香港著名星二代和外籍男友已經(jīng)生了孩子,但至今都沒有結(jié)婚

阿廢冷眼觀察所
2025-12-19 10:26:40
77年我把公社會計肚子搞大,她被調(diào)回省再沒消息,我以為緣分盡了

77年我把公社會計肚子搞大,她被調(diào)回省再沒消息,我以為緣分盡了

蕭竹輕語
2025-12-11 18:42:00
“贗品”《江南春》,為何能被神秘“顧客”以6800元買走?

“贗品”《江南春》,為何能被神秘“顧客”以6800元買走?

木蹊說
2025-12-19 14:07:19
2025-12-20 06:07:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142513關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

頭條要聞

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

體育要聞

“惡龍”埃托奧,正在毀滅喀麥隆足球

娛樂要聞

曲協(xié)表態(tài)僅6天,郭德綱擔(dān)心的事還是發(fā)生

財經(jīng)要聞

日元加息,恐慌來了?貨幣三國殺

汽車要聞

“一體壓鑄”再引熱議 一旦受損真的修不起嗎?

態(tài)度原創(chuàng)

房產(chǎn)
本地
游戲
數(shù)碼
軍事航空

房產(chǎn)要聞

廣州有態(tài)度,一座國際化社區(qū)給出的城市答案

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

網(wǎng)易!你把棋盤掀了那我玩什么!

數(shù)碼要聞

機械大師E06臥式ITX機箱上市:支持200mm長半高顯卡,298元

軍事要聞

媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

無障礙瀏覽 進入關(guān)懷版