国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

人人都能當(dāng)電影導(dǎo)演?萬(wàn)相 2.6 殺瘋了:角色扮演、分鏡控制,硬剛 Sora2

0
分享至

AI新浪潮觀察

12min read

人人都能當(dāng)電影導(dǎo)演?萬(wàn)相 2.6 殺瘋了:角色扮演、分鏡控制,硬剛 Sora2

極客老友2025/12/18


摘要

有創(chuàng)意,就能人人當(dāng)導(dǎo)演的時(shí)代真的來(lái)了。

作者|Cynthia

編輯| 鄭玄

還記得國(guó)慶期間朋友圈被 Sora 2 APP 支配的恐懼嗎?

那時(shí)候,一定沒(méi)人想到,這個(gè)出場(chǎng)即炸場(chǎng)的產(chǎn)品,同樣出道即巔峰。

向來(lái)以天為單位不斷刷新 sota 表現(xiàn)的大模型市場(chǎng),唯獨(dú)在視頻生成上,此后足足兩個(gè)多月,無(wú)論是谷歌 veo3.1 還是 Runway 推出的模型,都沒(méi)能再現(xiàn) Sora 2 在多人物不崩臉這個(gè)小細(xì)節(jié)上的穩(wěn)定表現(xiàn)。

直到 12 月 16 日阿里萬(wàn)相 2.6 正式發(fā)布。在追齊 Sora 2 體驗(yàn),并且推出獨(dú)有的音頻驅(qū)動(dòng)生視頻能力之外;萬(wàn)相 2.6 的這次升級(jí)更是將視角對(duì)準(zhǔn)了多模態(tài)內(nèi)容創(chuàng)作中多鏡頭切換、內(nèi)容一致性的各種真實(shí)痛點(diǎn),做到了讓專(zhuān)業(yè)創(chuàng)作的乙方少加幾次班,普通的 C 端內(nèi)容創(chuàng)作愛(ài)好者 0 成本上手。

那么萬(wàn)相 2.6 體驗(yàn)究竟如何?它能否和 Sora2 一戰(zhàn)?一定程度上,回答了這些問(wèn)題,也就回答了未來(lái)多模態(tài)大模型究竟去往何方的核心命題。


01

萬(wàn)相 2.6 究竟做對(duì)了什么?

12 月 16 日,阿里旗下萬(wàn)相 2.6 正式發(fā)布,我們第一時(shí)間拿到了內(nèi)測(cè)資格。

我們發(fā)現(xiàn),這個(gè)涵蓋文生視頻、圖生視頻和角色扮演功能,圖像生成和文生圖共 5 款模型的組合拳產(chǎn)品,從功能亮點(diǎn)和功能豐富度角度來(lái)看,萬(wàn)相 2.6 已經(jīng)是當(dāng)之無(wú)愧國(guó)內(nèi)的佼佼者 , 根據(jù)權(quán) 威大模型評(píng)測(cè)集 LMArena 的測(cè)試數(shù)據(jù)顯示,萬(wàn)相圖生視頻位居國(guó)內(nèi)第一 。

因?yàn)橄啾壤蠈?duì)手 Sora 通過(guò)寫(xiě)實(shí)生成效果引發(fā)全球轟動(dòng)的野心;萬(wàn)相這次 2.6 版本的能力升級(jí)其實(shí)主打就一個(gè)詞,實(shí)用,并且把所有升級(jí)點(diǎn)砸向了影視制作、廣告設(shè)計(jì)、短視頻創(chuàng)作的真實(shí)痛點(diǎn)。

內(nèi)容創(chuàng)作圈最頭疼的,莫過(guò)于一致性崩塌。在傳統(tǒng)動(dòng)畫(huà)行業(yè),吉卜力工作室為了保證角色形象不跑偏、風(fēng)格一致,會(huì)為了一部電影,幾百位畫(huà)師耗時(shí)兩年畫(huà)十幾萬(wàn)張畫(huà)稿,4 秒鏡頭能磨 1 年。而 AI 生成的噩夢(mèng),恰恰是前一秒主角還是圓臉,下一秒變成錐子臉,說(shuō)話時(shí)嘴型和臺(tái)詞完全脫節(jié)。

針對(duì)這個(gè)痛點(diǎn),萬(wàn)相 2.6 這次升級(jí)直接把聲畫(huà)一致性拉滿,成為國(guó)內(nèi)首個(gè)支持角色定制 + 音色同步的模型 :用戶輸入一段視頻,AI 就能精準(zhǔn)復(fù)刻角色的五官、動(dòng)作甚至說(shuō)話語(yǔ)氣,就算是雙人合拍,也不會(huì)出現(xiàn)臉飄到別人頭上、鏡頭切換主角直接變臉的烏龍。

解決了一致性,下一個(gè)攔路虎是復(fù)雜場(chǎng)景的多角色呈現(xiàn)。

目前 Sora 2 與萬(wàn)相 2.6,是全球唯二實(shí)現(xiàn)該功能的模型。并且,萬(wàn)相 2.6 還能結(jié)合剛才提到的角色、聲音一致性能力,讓 AI 真正具備了一定的復(fù)雜畫(huà)面生成能力。

而建立在一致性、多角色的基礎(chǔ)之上,鏡頭調(diào)度和燈光審美往往是人類(lèi)高質(zhì)量視頻內(nèi)容的靈魂。

被奉為經(jīng)典的宮廷劇《金枝欲孽》片頭,導(dǎo)演通過(guò)一段不到 5 秒的鏡頭切換里,以及演員站位的變化,就說(shuō)明了五個(gè)主要人物之間的關(guān)系與感情糾葛,二十多年過(guò)去,至今仍被奉為神級(jí)鏡頭調(diào)度。

王家衛(wèi)電影的氛圍感與幽微的人物情緒流動(dòng),也有一半功勞要?dú)w給燈光師的精準(zhǔn)控光。

但以前 AI 生成視頻,要么鏡頭銜接生硬,要么角色突然瞬移,上一鏡在左邊,下一鏡直接出現(xiàn)在右邊,更不用提各種精美的打光,以及氛圍的塑造。

萬(wàn)相 2.6 的「智能分鏡調(diào)度」很好地解決了以上問(wèn)題,通過(guò)支持「總體描述 + 鏡頭序號(hào) + 時(shí)間戳 + 分鏡內(nèi)容」的公式化輸入,比如「第 1 鏡 [0-3 秒] 遠(yuǎn)景推近,第 2 鏡 [3-5 秒] 特寫(xiě)」,AI 不僅能?chē)?yán)格執(zhí)行,還能保證跨鏡的場(chǎng)景、角色、氛圍統(tǒng)一,再也不會(huì)出現(xiàn)「上一鏡穿紅衣,下一鏡變藍(lán)裙」的低級(jí)錯(cuò)誤。

其實(shí),萬(wàn)相早從 2.2 版本起,就已經(jīng)能通過(guò)精細(xì)的燈光控制、環(huán)境細(xì)節(jié)呈現(xiàn),支持日光、月光、硬光、柔光等精細(xì)調(diào)節(jié),讓 AI 生成的內(nèi)容從「能看」升級(jí)到有「審美」,具備專(zhuān)業(yè)級(jí)內(nèi)容生成能力。

光說(shuō)不練假把式,我們帶著挑刺的心態(tài)實(shí)測(cè)了整整三天,從角色定制到多鏡敘事,從視頻生成到圖片創(chuàng)作,摸清了它「讓人人皆可做導(dǎo)演」的真實(shí)水平,以及 技術(shù) demo 與生產(chǎn)級(jí)工具之間的差距。


02

視頻能力實(shí)測(cè):

人人都能生成神級(jí)鏡頭

過(guò)去很多行業(yè)測(cè)試,為了保證效果,經(jīng)常會(huì)讓 AI 生成一些無(wú)聲視頻,或者畫(huà)面簡(jiǎn)單的動(dòng)畫(huà)風(fēng)素材,再或者干脆就是一個(gè)幾乎靜止的背景中,只有一個(gè)小幅度動(dòng)作的簡(jiǎn)單運(yùn)動(dòng)主體(甚至都不敢把主體設(shè)置為人或者動(dòng)物這樣有復(fù)雜肌理和動(dòng)作的形象)。

這次對(duì)萬(wàn)相 2.6 的測(cè)試,我們不搞虛的,把一致性、多鏡頭、音畫(huà)同步、長(zhǎng)視頻、審美,這些真實(shí)行業(yè)痛點(diǎn)、難點(diǎn)全都測(cè)一遍。

測(cè)試一:多鏡頭敘事

一直以來(lái),多鏡頭敘事都是電影高級(jí)感的核心來(lái)源之一。這里我參考《哪吒》的畫(huà)風(fēng),給了一段復(fù)雜場(chǎng)景、多主體的多鏡頭切換的提示詞:

鏡頭一:低角度遠(yuǎn)景,鏡頭快速推進(jìn) 3s

畫(huà)面內(nèi)容:仙境般的云端建筑群在云霧中若隱若現(xiàn),一群白鶴自左向右舒展翅膀,掠過(guò)層層樓閣的屋檐

視覺(jué)效果:疊加中強(qiáng)度動(dòng)態(tài)模糊,伴隨輕微追焦微顫,焦點(diǎn)鎖定鶴群與建筑輪廓

鏡頭二:中近景中速推進(jìn) + 追焦微顫 3s

畫(huà)面內(nèi)容:近距離捕捉白鶴羽翼貼近檐角的流暢軌跡,鏡頭緊跟鶴群運(yùn)動(dòng)方向。視覺(jué)效果的動(dòng)態(tài)模糊逐漸減弱,追焦微顫幅度保持輕微,強(qiáng)化畫(huà)面銜接感

鏡頭三:無(wú)縫轉(zhuǎn)場(chǎng),特寫(xiě),鏡頭恒定不動(dòng) 0.3s

畫(huà)面內(nèi)容:白鶴羽翼擦過(guò)最外側(cè)屋檐翹角的瞬間,以檐角硬輪廓完全遮擋畫(huà)面。無(wú)額外特效,保留自然光影,確保轉(zhuǎn)場(chǎng)干凈利落

鏡頭四:主體聚焦,從近景→特寫(xiě),鏡頭緩慢推近 3s

畫(huà)面內(nèi)容:轉(zhuǎn)場(chǎng)后聚焦檐角頂端,橘貓端坐舔爪(近景),隨后推至特寫(xiě),呈現(xiàn)舔爪細(xì)膩動(dòng)作與毛發(fā)質(zhì)感。畫(huà)面清晰,焦點(diǎn)全程鎖定橘貓

鏡頭五:特寫(xiě)變中近景中速推進(jìn) + 追焦微顫 4s

畫(huà)面內(nèi)容:橘貓被打擾,停止舔毛,看了一眼鏡頭后,跳下屋檐,動(dòng)作輕巧,追焦微顫幅度保持輕微,強(qiáng)化畫(huà)面銜接感。

這里的難點(diǎn)在于:首先是畫(huà)面足夠復(fù)雜,畫(huà)面中主體來(lái)回切換,從飛翔的白鶴到舔毛的橘貓,再到跳下屋檐的橘貓,而伴隨主體的動(dòng)作變化,鏡頭也在同步于遠(yuǎn)景-中景-特寫(xiě)-中景中來(lái)回切換。

可以看到,生成的視頻里,生成的視頻里,《哪吒》式的東方寫(xiě)意美學(xué)被精準(zhǔn)落地:云霧是漸變的水墨質(zhì)感,云端建筑的飛檐翹角帶著古風(fēng)的韻味。白鶴運(yùn)動(dòng)的鏡頭即使高速推進(jìn)沒(méi)有絲毫卡頓,動(dòng)態(tài)模糊恰好放大了闖入仙境的沉浸感;后續(xù)橘貓?zhí)蜃Φ拿l(fā)細(xì)節(jié)栩栩如生,鏡頭也會(huì)隨著橘貓的眼神變化而出現(xiàn)畫(huà)面的移動(dòng)。

最難能可貴的是,三次大的鏡頭切換(白鶴→舔爪橘貓→跳檐橘貓)沒(méi)有出現(xiàn)任何突兀感:鶴群的飛行軌跡是天然的視覺(jué)引導(dǎo)線,檐角轉(zhuǎn)場(chǎng)是承上啟下的視覺(jué)橋梁,橘貓的動(dòng)作變化則成為鏡頭運(yùn)動(dòng)的點(diǎn)睛之筆。整體完全復(fù)刻電影級(jí)無(wú)縫銜接,沒(méi)有任何卡頓或脫節(jié)。

測(cè)試二:長(zhǎng)視頻+審美

一直以來(lái),AI 生成視頻都不難,但生成穩(wěn)定、漂亮、可用的長(zhǎng)視頻卻一直是困擾依舊的痛點(diǎn)。

萬(wàn)相 2.6 支持最長(zhǎng) 15 秒生成(角色扮演功能 10 秒),這個(gè)時(shí)長(zhǎng)看似不長(zhǎng),但剛好戳中核心場(chǎng)景:短視頻場(chǎng)景,15 秒是黃金時(shí)長(zhǎng)、廣告片場(chǎng)景,30 秒廣告可拆成 2 個(gè) 15 秒片段、而在短劇片段,10-15 秒就能完成男主歪嘴一笑、龍王歸位,一眾吃瓜群眾從白眼鄙視瞬間切換驚恐討好的爽劇經(jīng)典套路。

這里我們測(cè)試一個(gè)專(zhuān)業(yè)服裝拍攝的商用級(jí)場(chǎng)景,提示詞如下:

鏡頭一:0-3 秒,中景→近景。林間光斑透過(guò)樹(shù)葉灑落,美女身著米白色棉麻長(zhǎng)裙,緩步走在鋪滿落葉的小徑,裙擺隨步伐輕晃 暖調(diào)柔光,畫(huà)面靜謐,聚焦棉麻面料的垂墜感,輕柔風(fēng)聲、樹(shù)葉沙沙聲

鏡頭二:3-7 秒,特寫(xiě)→中近景。風(fēng)拂過(guò),特寫(xiě)衣角翻飛的弧度,棉麻紋理清晰可見(jiàn);鏡頭拉回,松鼠蹲在她腳邊啄食。自然光影,無(wú)多余特效,突出面料透氣飄逸。風(fēng)聲漸柔,加入輕微呼吸聲

鏡頭三:7-12 秒,近景→特寫(xiě)。美女抬手輕拂額前碎發(fā),笑容舒展,小鹿從林間探出頭,與她對(duì)視;鏡頭聚焦面料貼膚的舒適狀態(tài)畫(huà)面柔和,焦點(diǎn)在面料與人物神態(tài)之間切換, 背景音漸弱,預(yù)留口號(hào)空間

鏡頭四:12-15 秒,中景定格。美女站在林間轉(zhuǎn)身,裙擺隨風(fēng)輕揚(yáng),小動(dòng)物環(huán)繞身旁,畫(huà)面定格在面料飄動(dòng)的瞬間 暖光漸變?nèi)岷?,?huà)面干凈治愈。背景音清晰女聲:「好面料,會(huì)呼吸」。

這里的難點(diǎn)在于,除了美之外,棉麻質(zhì)感難還原纖維肌理,還要考慮自然垂墜與光影通透感,否則容易顯塑料感,此外,畫(huà)面中的小動(dòng)物互動(dòng)增加了整體畫(huà)面復(fù)雜度,而森林光影也需要在光斑、光線折射等細(xì)節(jié)做到真實(shí)且有美感。

行業(yè)人都懂,過(guò)去這種級(jí)別的畫(huà)面,以前要找外景、模特、燈光師,拍攝 + 后期至少 3 天,現(xiàn)在用萬(wàn)相 2.6,輸入提示詞幾分鐘生成,直接能當(dāng)成片交付。

此外,值得一提的是,萬(wàn)相 2.6 除了生成的視頻質(zhì)感高,操作門(mén)檻還極低。寫(xiě)出以上專(zhuān)業(yè)級(jí)分鏡腳本,其實(shí)只要按照官方給出的【總體描述 + 鏡頭序號(hào) + 時(shí)間戳 + 分鏡內(nèi)容提示詞】指令指引,就能實(shí)現(xiàn)智能分鏡調(diào)度功能。而這種能精準(zhǔn)控制每個(gè)角色的動(dòng)作順序和畫(huà)面鏡頭調(diào)配的能力,在短視頻劇情創(chuàng)作、IP 衍生內(nèi)容生產(chǎn)中簡(jiǎn)直是降維打擊。

測(cè)試三:基于參考視頻的人物,搞定人物一致性+音畫(huà)同步。

這里我選用的輸入素材是一段林黛玉的特寫(xiě),以及模版中已有的關(guān)羽形象,來(lái)一段名著大亂燉。

提示詞如下: 暮春清晨,隆中茅廬外竹林青翠,薄霧如紗,屋內(nèi)隱約傳來(lái)?yè)崆僦?。鏡頭先以全景定格——諸葛亮身著月白道袍,臨窗而坐,指尖撥弄琴弦,琴聲悠揚(yáng);

鏡頭突然切換為快速跟拍,@ 關(guān)羽走進(jìn)柴門(mén),鏡頭推進(jìn)至中近景,大步流星到諸葛亮面前,,說(shuō)「我回來(lái)了了」

鏡頭隨著諸葛亮的眼光移動(dòng)橫切,@ 林黛玉 中近景緩緩入畫(huà)。特寫(xiě)中眼眸流轉(zhuǎn)著幾分嗔怨與疏離:「早知他來(lái),我便不來(lái)了。」

最終鏡頭切回諸葛亮收尾。

這里的難點(diǎn)在于:我給出了兩個(gè)需要參考的主角,以及一個(gè)沒(méi)有任何參考只有文字描述構(gòu)建的諸葛亮形象,并且每個(gè)主角都多次引用在提示詞不同位置,需要 AI 保持一致的情況下,精準(zhǔn)控制主角行為。

可以看到,借助模態(tài)聯(lián)合建模能力,萬(wàn)相 2.6 生成的視頻里,時(shí)序動(dòng)態(tài)(比如關(guān)羽的走路姿勢(shì))、情緒變化(比如林黛玉嗔怪的神情)全都和參考視頻幾乎一致,最驚艷的是:人物的嘴型和臺(tái)詞嚴(yán)絲合縫,聲音質(zhì)感沒(méi)有半點(diǎn) AI 塑料感。

另外,相同的人物角色,我又嘗試直接給 AI 一段參考的黛玉的聲音,讓它自主生成視頻,可以看到,我把背景音樂(lè)以及黛玉的語(yǔ)氣改變之后,她整個(gè)人的神態(tài)也會(huì)隨之變得生動(dòng)活潑,并且口型與聲音完全匹配。

而這段視頻里,對(duì)比 Sora2,萬(wàn)相 2.6 的差異化優(yōu)勢(shì)也很明顯:前者雖然支持長(zhǎng)視頻,但缺乏音頻驅(qū)動(dòng)生視頻的功能,你沒(méi)法讓 Sora2 參考一段人聲,生成對(duì)應(yīng)角色的說(shuō)話視頻。而萬(wàn)相 2.6 直接把聲音 + 畫(huà)面綁定的能力,對(duì)于廣告片、短劇、虛擬人直播等商用場(chǎng)景來(lái)說(shuō),實(shí)用性直接拉滿。


03

圖像能力實(shí)測(cè):

設(shè)計(jì)圈的效率革命來(lái)了

如果說(shuō)萬(wàn)相 2.6 的視頻功能已經(jīng)有了初步踏足專(zhuān)業(yè)影視圈的能力,那其圖像能力可以說(shuō)已經(jīng)足以精準(zhǔn)拿捏設(shè)計(jì)圈。

圖像層面,萬(wàn)相 2.6 的核心升級(jí),都圍繞商用級(jí)展開(kāi):解決企業(yè)用戶最關(guān)心的圖文一體化排版、多圖創(chuàng)意融合、商用級(jí)一致性、美學(xué)要素遷移與鏡頭光影精確控制等細(xì)節(jié)。

我們用兩個(gè)真實(shí)商業(yè)場(chǎng)景做了實(shí)測(cè),結(jié)果發(fā)現(xiàn):以前需要設(shè)計(jì)師、插畫(huà)師、排版師協(xié)作一周的活兒,現(xiàn)在一個(gè)人用萬(wàn)相 2.6 輸入指令,幾小時(shí)甚至幾分鐘就能搞定,而且細(xì)節(jié)精準(zhǔn)到可以直接商業(yè)交付。

測(cè)試一:基于多張圖片的圖文混排

過(guò)去,內(nèi)容創(chuàng)作圈的三重折磨在于:寫(xiě)文案的不懂設(shè)計(jì),做設(shè)計(jì)的不懂文案,排版的夾在中間反復(fù)拉扯。比如出版社做繪本,要找作家寫(xiě)故事、插畫(huà)師畫(huà)配圖、排版師調(diào)格式,三者風(fēng)格要統(tǒng)一、內(nèi)容要契合,光溝通修改就要耗半個(gè)月。

現(xiàn)在用萬(wàn)相 2.6,只要寫(xiě)這樣一段提示詞:

創(chuàng)作一本關(guān)于環(huán)保的兒童繪本,插畫(huà)風(fēng)格為治愈系水彩風(fēng),色彩以藍(lán)白為主,每頁(yè)插畫(huà)要和文字內(nèi)容精準(zhǔn)對(duì)應(yīng),整體風(fēng)格統(tǒng)一。故事內(nèi)容:1、在遙遠(yuǎn)的北極,小北極熊樂(lè)樂(lè)發(fā)現(xiàn)冰面越來(lái)越小;2、樂(lè)樂(lè)遇見(jiàn)了迷路的鯨魚(yú),鯨魚(yú)告訴它「人類(lèi)在保護(hù)地球」;3、樂(lè)樂(lè)決定到處走走看;4、一年后,樂(lè)樂(lè)回到家鄉(xiāng),冰面變寬了,還多了很多小伙伴。

提示詞背后的難點(diǎn)在于考驗(yàn) AI 的邏輯理解 + 設(shè)計(jì)統(tǒng)籌能力:①要先拆解長(zhǎng)文本的敘事結(jié)構(gòu),4 個(gè)段落之間劇情不能張冠李戴;②要保持插畫(huà)風(fēng)格、色彩、角色形象的高度統(tǒng)一,不能第一頁(yè)是圓耳朵,第三頁(yè)變成尖耳朵。


可以看到,生成的繪本不僅風(fēng)格、色彩、角色完全一致,就連提示詞中沒(méi)有寫(xiě)到的文字意境也做了精準(zhǔn)表達(dá),比如第一頁(yè)的小北極熊站在破碎的冰面上,眼神迷茫;第四頁(yè)的冰面寬闊,小伙伴一起玩耍,氛圍溫暖。

而這也意味著,不管是繪本創(chuàng)作、公眾號(hào)推文還是知識(shí)付費(fèi)課件,后續(xù)都能實(shí)現(xiàn)文案輸入→成品輸出的一步到位,省去了找圖 + 修圖 + 排版的全流程,效率提升至少 10 倍。

測(cè)試二:商用級(jí)一致性 + 多圖創(chuàng)意融合

過(guò)去,品牌方的物料噩夢(mèng)在于,真人拍攝,經(jīng)常因?yàn)楦鞣N情況耽誤拍攝進(jìn)度,需要場(chǎng)地加錢(qián)、模特加錢(qián)、各種設(shè)備重新報(bào)批申請(qǐng);而用 AI 批量生成宣傳圖,AI 又像在開(kāi)盲盒,只是想把產(chǎn)品圖、背景圖、參考風(fēng)格圖融合成一張海報(bào),也會(huì)出現(xiàn)產(chǎn)品比例失調(diào),背景和風(fēng)格割裂,嚴(yán)重影響品牌識(shí)別度的問(wèn)題。

針對(duì)這些,我們?cè)O(shè)計(jì)一段針對(duì)性測(cè)試。提示詞: 生成美妝品牌宣傳圖,要求:①核心產(chǎn)品為上傳的口紅(參考圖 1),保持產(chǎn)品外觀、logo、包裝細(xì)節(jié)完全一致;②融合上傳的花的照片(參考圖 2),背景為花瓣飄落的場(chǎng)景;③產(chǎn)品垂直擺放在畫(huà)面中央,周?chē)⒙?3-5 朵花,花瓣紋理清晰;④色調(diào)光影有大片質(zhì)感。


生成一張之后,我們?cè)僖笃浯钆湟粋€(gè)模特,試用產(chǎn)品。


提示詞背后的難點(diǎn)在于,讓 AI 同時(shí)實(shí)現(xiàn)精準(zhǔn)控制 + 創(chuàng)意融合的雙重考驗(yàn):既要要確保產(chǎn)品的外觀、logo、包裝細(xì)節(jié)在兩張圖里分毫不差(這里我專(zhuān)門(mén)選擇了 YSL 這樣的復(fù)雜 logo,并且 YSL 的口紅膏體為相對(duì)少見(jiàn)的方形,其他 AI 在生成時(shí),很容易把膏體變成常見(jiàn)的圓形);還要保證多圖融合難在要把產(chǎn)品圖、背景圖、風(fēng)格圖有機(jī)結(jié)合,不能讓產(chǎn)品像貼在背景上。

可以看到,生成的兩張宣傳圖直接達(dá)到商用級(jí)標(biāo)準(zhǔn)。不僅所有要素之間也融合自然,并且做到了花朵背景和大片風(fēng)格完美銜接完全不搶?xiě)颍黧w產(chǎn)品突出,甚至金屬包裝會(huì)反射花瓣的光影這樣的細(xì)節(jié)都做到了完美還原,毫無(wú) AI 的痕跡。

這對(duì)品牌方來(lái)說(shuō),這意味著「一次設(shè)定,無(wú)限復(fù)用」,不僅可以做無(wú)限的創(chuàng)意搭配,還能保證品牌形象的統(tǒng)一性,效率革命近在眼前。


04

尾聲

當(dāng)然,萬(wàn)相 2.6 不是完美的。我們實(shí)測(cè)中發(fā)現(xiàn)幾個(gè)小問(wèn)題:比如視頻最長(zhǎng)只能 15 秒,對(duì)于需要長(zhǎng)敘事的場(chǎng)景還是不夠;非常復(fù)雜動(dòng)作,比如翻跟頭 + 復(fù)雜舞蹈動(dòng)作,偶爾會(huì)出現(xiàn)肢體變形。但這幾乎也是全行業(yè)目前亟需解決的問(wèn)題。

但萬(wàn)相 2.6 乃至 Sora2 們微小的不足,掩蓋不了一個(gè)行業(yè)真相:AI 視頻生成正在從技術(shù)炫技進(jìn)入落地加速階段。AI 帶來(lái)的,本質(zhì)上是對(duì)內(nèi)容創(chuàng)作生產(chǎn)關(guān)系的重構(gòu):不僅有大量專(zhuān)業(yè)影視制作平臺(tái)在用 AI 制作漫劇、短劇,社交平臺(tái)更是涌現(xiàn)了一批博主用 AI 制作的小貓打架、小說(shuō)動(dòng)畫(huà)小短片在各種平臺(tái)爆火。

基于萬(wàn)相 2.6 模型核心能力,千問(wèn) APP 上線「AI 小劇場(chǎng)」玩法,國(guó)內(nèi)首次實(shí)現(xiàn)「角色合拍」能力,用戶可與朋友或名人輕松同框出演 AI 短片。

而在這一過(guò)程中,人類(lèi)只需保留想象力、審美以及創(chuàng)意,而剩余的執(zhí)行細(xì)節(jié),可以全部交給 AI。

這一次,有創(chuàng)意,就能人人當(dāng)導(dǎo)演的時(shí)代真的來(lái)了。

萬(wàn)相 2.6Sora2千問(wèn) APP

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

快扔掉!戴一天,輻射量相當(dāng)于拍117次胸片

FM93浙江交通之聲
2025-10-28 00:01:43
廣東兩小將喜憂參半!王洪澤打成籃板癡漢,陳家政鎖防守卻拒投!

廣東兩小將喜憂參半!王洪澤打成籃板癡漢,陳家政鎖防守卻拒投!

細(xì)話籃球
2025-12-23 22:27:20
著名女主持前前夫的瓜

著名女主持前前夫的瓜

微微熱評(píng)
2025-12-22 02:16:11
中國(guó)乒協(xié)突然出手,多位日本球員的來(lái)華訓(xùn)練申請(qǐng)被按下暫停鍵。

中國(guó)乒協(xié)突然出手,多位日本球員的來(lái)華訓(xùn)練申請(qǐng)被按下暫停鍵。

荊楚寰宇文樞
2025-12-22 22:21:28
足球報(bào):山東泰山2007年齡段的大部分球員有望踢“蘇超”

足球報(bào):山東泰山2007年齡段的大部分球員有望踢“蘇超”

懂球帝
2025-12-22 13:03:20
中央定調(diào),退休新規(guī)實(shí)施,為何1975年之前出生的更加受益?

中央定調(diào),退休新規(guī)實(shí)施,為何1975年之前出生的更加受益?

一只番茄魚(yú)
2025-11-18 10:34:58
日本將向?yàn)蹩颂m提供60億美元的財(cái)政援助,以支持其對(duì)俄的自衛(wèi)

日本將向?yàn)蹩颂m提供60億美元的財(cái)政援助,以支持其對(duì)俄的自衛(wèi)

桂系007
2025-12-22 01:56:32
過(guò)春節(jié)為何沒(méi)有以前那種濃濃的年味了?這是我見(jiàn)過(guò)最簡(jiǎn)明易懂回答

過(guò)春節(jié)為何沒(méi)有以前那種濃濃的年味了?這是我見(jiàn)過(guò)最簡(jiǎn)明易懂回答

另子維愛(ài)讀史
2025-12-22 16:55:55
震驚!呂梁博物館征集文物公告,評(píng)論區(qū)遭網(wǎng)友“慰問(wèn)”,被迫刪除

震驚!呂梁博物館征集文物公告,評(píng)論區(qū)遭網(wǎng)友“慰問(wèn)”,被迫刪除

火山詩(shī)話
2025-12-21 11:17:28
母親是著名演員,父親上億家產(chǎn),他卻跑龍?zhí)?0年,終成實(shí)力派

母親是著名演員,父親上億家產(chǎn),他卻跑龍?zhí)?0年,終成實(shí)力派

白面書(shū)誏
2025-11-18 18:33:41
這幾個(gè)指標(biāo)正常,證明你的心臟基本沒(méi)啥大問(wèn)題,不要再亂檢查了

這幾個(gè)指標(biāo)正常,證明你的心臟基本沒(méi)啥大問(wèn)題,不要再亂檢查了

紙上的心語(yǔ)
2025-12-23 21:06:10
突發(fā)!移民局緊急“封殺”三個(gè)特殊綠卡通道,嚴(yán)厲打擊假結(jié)婚

突發(fā)!移民局緊急“封殺”三個(gè)特殊綠卡通道,嚴(yán)厲打擊假結(jié)婚

大洛杉磯LA
2025-12-24 01:59:51
廣東險(xiǎn)勝?gòu)V州!賽后又傳來(lái)3個(gè)好消息3個(gè)壞消息 徐杰真強(qiáng) 焦泊喬差

廣東險(xiǎn)勝?gòu)V州!賽后又傳來(lái)3個(gè)好消息3個(gè)壞消息 徐杰真強(qiáng) 焦泊喬差

體壇熱消息
2025-12-23 21:31:40
發(fā)現(xiàn)一個(gè)奇怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會(huì)有這3種命運(yùn),并非迷信

發(fā)現(xiàn)一個(gè)奇怪現(xiàn)象:喜歡把家里打掃得很干凈的人,往往會(huì)有這3種命運(yùn),并非迷信

二胡的歲月如歌
2025-12-23 18:33:19
遼寧省委書(shū)記、省長(zhǎng)會(huì)見(jiàn)李想

遼寧省委書(shū)記、省長(zhǎng)會(huì)見(jiàn)李想

新京報(bào)政事兒
2025-12-22 22:02:09
一場(chǎng)針對(duì)普通人的金融大收割,正在卷土重來(lái)!

一場(chǎng)針對(duì)普通人的金融大收割,正在卷土重來(lái)!

米宅
2025-12-22 07:24:40
牡丹花下死,做鬼也風(fēng)流!37歲“縱欲過(guò)度”的王思聰,再陷大丑聞

牡丹花下死,做鬼也風(fēng)流!37歲“縱欲過(guò)度”的王思聰,再陷大丑聞

可樂(lè)談情感
2025-12-24 00:02:17
朱珠一家過(guò)冬至!和老公在新家擺一大桌請(qǐng)客,喝到臉微醺依舊很美

朱珠一家過(guò)冬至!和老公在新家擺一大桌請(qǐng)客,喝到臉微醺依舊很美

黃謀仕
2025-12-23 16:05:24
河南一男孩遭同學(xué)打臉還被老師踢,涉事保育員已被辭退,幼兒園正接受整頓

河南一男孩遭同學(xué)打臉還被老師踢,涉事保育員已被辭退,幼兒園正接受整頓

都市快報(bào)橙柿互動(dòng)
2025-12-22 19:04:06
華南五虎全軍覆沒(méi)

華南五虎全軍覆沒(méi)

霹靂炮
2025-12-23 21:14:11
2025-12-24 06:31:00
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11693文章數(shù) 78744關(guān)注度
往期回顧 全部

科技要聞

慘烈90分鐘!快手驚魂:遭遇最強(qiáng)黑產(chǎn)攻擊

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

頭條要聞

與多名女子在泳池大尺度照片披露 克林頓最新回應(yīng)

體育要聞

楊瀚森連續(xù)5場(chǎng)DNP!開(kāi)拓者遭活塞雙殺

娛樂(lè)要聞

朱孝天回應(yīng)阿信感謝,自曝沒(méi)再收到邀約

財(cái)經(jīng)要聞

祥源系百億產(chǎn)品爆雷 浙金中心18人被拘

汽車(chē)要聞

四款新車(chē)集中發(fā)布 星途正式走進(jìn)3.0時(shí)代

態(tài)度原創(chuàng)

房產(chǎn)
教育
旅游
時(shí)尚
公開(kāi)課

房產(chǎn)要聞

獨(dú)家猛料!16.1億,浙江老板搶下雅居樂(lè)清水灣261畝重磅宅地!

教育要聞

班級(jí)太浮躁,該怎么辦?

旅游要聞

冰雪游熱度高 南北游客“雙向奔赴”帶動(dòng)機(jī)票銷(xiāo)售

今年流行“毛衣+外套”,這樣穿時(shí)髦又好看!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版