国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,阿里發(fā)了款能“捏臉”的新模型

0
分享至


智東西
作者 陳佳
編輯 心緣

智東西4月1日?qǐng)?bào)道,剛剛,阿里正式發(fā)布新一代圖像生成與編輯統(tǒng)一模型Wan2.7-Image,一舉將文生圖、圖生組圖、圖像指令編輯和交互式編輯整合進(jìn)同一套模型架構(gòu)。

新模型主打四大能力:可自由定制五官骨相的“千人千面”捏臉功能、能精準(zhǔn)提取和控制色彩配比的“調(diào)色盤”功能、最高支持3K token超長(zhǎng)文字渲染的印刷級(jí)排版能力,以及支持框選區(qū)域精準(zhǔn)操作的像素級(jí)交互式編輯能力。

我們重點(diǎn)測(cè)試了該模型“千人千面”、交互式編輯和多主體一致性三個(gè)方面的能力。

在人物生成測(cè)試中,無(wú)需精細(xì)控制提示詞,該模型已能在同一組輸出中呈現(xiàn)臉型輪廓、顴骨位置、下頜線各異的差異化人像,告別批量同臉問(wèn)題。加入臉型關(guān)鍵詞后,不同輪廓的響應(yīng)可感知,但方臉、長(zhǎng)臉等強(qiáng)特征的精準(zhǔn)度仍有提升空間。


在交互式編輯測(cè)試中,我們以《唐頓莊園》電影劇照為素材執(zhí)行人物位置互換,模型在保留服飾特征和背景環(huán)境的前提下完成了對(duì)調(diào)。


在多主體一致性測(cè)試中,我們基于參考人物要求模型生成咖啡館、戶外街拍、正式會(huì)議室三大場(chǎng)景共12張圖像,模型精準(zhǔn)保留了參考人物的面部特征、發(fā)型輪廓與整體氣質(zhì),跨場(chǎng)景辨識(shí)度穩(wěn)定,同時(shí)對(duì)不同場(chǎng)景的光影邏輯和環(huán)境氛圍適配良好,是三項(xiàng)測(cè)試中表現(xiàn)最為亮眼的一項(xiàng)。


同步上線的Wan2.7-Image-pro在構(gòu)圖穩(wěn)定性和語(yǔ)義理解上進(jìn)一步提升。

從官方盲測(cè)結(jié)果來(lái)看,Wan2.7-Image多項(xiàng)能力已位列國(guó)內(nèi)第一,整體水平接近Nano Banana Pro。


目前,兩款模型均已在阿里云百煉平臺(tái)開放API調(diào)用,萬(wàn)相官網(wǎng)也支持直接體驗(yàn)。

萬(wàn)相官網(wǎng):https://tongyi.aliyun.com/wan

百煉國(guó)內(nèi)站:https://bailian.console.aliyun.com/cn-beijing?tab=api#/api/?type=model&url=3026980

百煉國(guó)際站:https://modelstudio.console.alibabacloud.com/ap-southeast-1?tab=api#/api/?type=model&url=3026980

一、告別“AI標(biāo)準(zhǔn)臉”,還能寫滿一頁(yè)A4紙

AI生成人像“千篇一律”是業(yè)界長(zhǎng)期的痛點(diǎn),Wan2.7-Image強(qiáng)化了虛擬形象“捏臉”功能,支持從骨相到五官細(xì)節(jié)的全方位定制——臉型可在鵝蛋臉、圓臉、方臉、長(zhǎng)方臉之間切換。

在人物生成能力上,我們使用了一條基礎(chǔ)的提示詞進(jìn)行測(cè)試:“一個(gè)年輕女性肖像,半身照,電影感光影,高清細(xì)節(jié),真實(shí)皮膚質(zhì)感”。

在未加入任何臉型、五官或身份限定的情況下,Wan2.7-Image一次生成了4張人像。從結(jié)果來(lái)看,這組圖已經(jīng)明顯不同于以往常見(jiàn)的“AI標(biāo)準(zhǔn)臉”,人物之間呈現(xiàn)出較為自然的差異。


四張圖中的人物在臉型輪廓、顴骨位置和下頜線條上各不相同,并非簡(jiǎn)單的“同一張臉微調(diào)”。

同時(shí),皮膚紋理、毛孔及輕微瑕疵(如泛紅、肌理不均)均被真實(shí)保留,未出現(xiàn)過(guò)度磨皮的失真感。

在光影控制與整體氛圍營(yíng)造方面,Wan2.7-Image表現(xiàn)出色。四張圖像均采用自然窗光作為主光源,形成強(qiáng)烈的明暗對(duì)比與電影化質(zhì)感,背景環(huán)境元素虛實(shí)得當(dāng),未對(duì)主體造成干擾,且不同圖像間的人物特征保持了較高的一致性。

整體來(lái)看,在無(wú)精細(xì)控制提示詞的情況下,Wan2.7-Image已經(jīng)可以生成風(fēng)格統(tǒng)一但人物不同的人像結(jié)果,相比以往容易出現(xiàn)的“批量同臉”問(wèn)題,有明顯改善。

在基礎(chǔ)人像生成測(cè)試后,我們進(jìn)一步加入明確的臉型約束,對(duì)Wan2.7-Image的“捏臉能力”進(jìn)行驗(yàn)證。測(cè)試提示詞在原有基礎(chǔ)上增加:鵝蛋臉/圓臉/方臉/長(zhǎng)臉。


從實(shí)測(cè)結(jié)果來(lái)看,Wan2.7-Image模型能夠?qū)δ樞吞卣髯龀霾町惢憫?yīng),不同生成樣本中,人物面部輪廓呈現(xiàn)出從鵝蛋臉到圓臉、方臉的明顯區(qū)分,下頜線、顴骨寬度、面部長(zhǎng)寬比等核心臉型指標(biāo)存在可感知的差異。

在皮膚質(zhì)感、電影感光影等方面,限定臉型后生成的圖片畫面細(xì)節(jié)保留度基本穩(wěn)定。但該模型的臉型控制仍存在精度與一致性的不足。部分圖片存在特征模糊、臉型特征不典型的問(wèn)題,難以完全匹配“方臉”“長(zhǎng)臉”等強(qiáng)特征的嚴(yán)格定義。

對(duì)比未添加臉型關(guān)鍵詞的基礎(chǔ)生成版本,限定臉型后生成的圖片人物面部占比整體偏大,臉部視覺(jué)尺寸有所擴(kuò)增,頭身比例、半身構(gòu)圖的原有平衡被打破。

在官方演示案例當(dāng)中,Wan2.7-Image模型生成的圖片人物眼部特征支持杏仁眼、深邃眼窩、圓眼、丹鳳眼等多種選項(xiàng),并能跨越國(guó)籍與年齡生成差異化人像。


另一大亮點(diǎn)是“調(diào)色盤”功能。用戶可一鍵提取參考圖的顏色及其占比,并以此為基礎(chǔ)生成同色系圖片,同時(shí)自由調(diào)控各顏色的數(shù)量和比例,構(gòu)建個(gè)性化配色方案。無(wú)論是馬蒂斯?jié)庥舻募t色系、梵高明媚的黃色系,還是畢加索清冷的藍(lán)色系,都可作為輸入?yún)⒖迹敵錾{(diào)高度一致的全新畫面。


在文字渲染方面,Wan2.7-Image支持12種語(yǔ)言,最高可處理3K token的超長(zhǎng)文字輸入,輸出效果達(dá)到印刷級(jí)質(zhì)量。這一能力讓其在信息圖、教育插畫、旅游攻略長(zhǎng)圖海報(bào)等場(chǎng)景中頗具實(shí)用價(jià)值——理論上可以一口氣生成排滿一頁(yè)A4紙的論文。


二、一次生成12張圖,還能“哪里不爽改哪里”

Wan2.7-Image的編輯能力也迎來(lái)了顯著升級(jí),其“交互式編輯”功能支持用戶在指定區(qū)域內(nèi)精準(zhǔn)框選,對(duì)框內(nèi)元素進(jìn)行添加、對(duì)齊、移動(dòng)操作,也可進(jìn)行Logo插入和人物位置互換,實(shí)現(xiàn)像素級(jí)意圖對(duì)齊。

實(shí)測(cè)中,我們用《唐頓莊園》電影劇照?qǐng)D片執(zhí)行“兩人位置調(diào)換”的編輯指令,Wan2.7-Image成功將原圖中左側(cè)藍(lán)裙人物與右側(cè)黃裙人物的站位進(jìn)行了對(duì)調(diào)。


人物主體、服飾特征(藍(lán)/黃緞面禮服、頭飾、項(xiàng)鏈、長(zhǎng)手套)均完整保留,未出現(xiàn)主體丟失、嚴(yán)重變形等致命問(wèn)題,整體場(chǎng)景的背景環(huán)境(宴會(huì)廳裝飾、背景人物、花藝陳設(shè))也基本維持了原圖的一致性,實(shí)現(xiàn)了編輯指令的核心訴求。

官方演示中,用戶框選圖中兩個(gè)人物后輸入“互換位置”指令,模型準(zhǔn)確完成了人物交換,且背景及其他元素保持不變。


在另一官方案例中,用戶通過(guò)框選區(qū)域、指定對(duì)話氣泡風(fēng)格和文字內(nèi)容,直接生成了毛氈風(fēng)格的對(duì)話場(chǎng)景,文字與畫面風(fēng)格統(tǒng)一。


多主體一致性是圖像生成中難度較高的任務(wù)。Wan2.7-Image在這一方向支持最多9圖的風(fēng)格與特征統(tǒng)一,可用于合影生成、電影海報(bào)及家具組合圖等場(chǎng)景。官方展示了AI女團(tuán)海報(bào)和家具組合圖的生成效果,多人物之間的風(fēng)格一致性較高。


我們基于參考人物進(jìn)行多場(chǎng)景生成測(cè)試,發(fā)現(xiàn)Wan2.7-Image在核心人物特征的一致性還原上展現(xiàn)出較高水準(zhǔn)。模型根據(jù)提示詞“基于參考人物,生成3張圖:(1)咖啡館內(nèi)看書;(2)戶外街拍;(3)正式會(huì)議室”,輸出了一組共12張圖像。

從輸出結(jié)果來(lái)看,模型精準(zhǔn)保留了參考人物的核心面部特征、發(fā)型輪廓與整體氣質(zhì),在咖啡館、戶外街拍、正式會(huì)議室三大場(chǎng)景中,人物主體的辨識(shí)度始終穩(wěn)定,未出現(xiàn)五官變形缺陷。

同時(shí),模型對(duì)場(chǎng)景環(huán)境的適配性表現(xiàn)優(yōu)異,不同場(chǎng)景的光影邏輯、環(huán)境氛圍與人物狀態(tài)高度匹配,咖啡館的暖光、戶外的自然光、會(huì)議室的室內(nèi)冷光均符合場(chǎng)景邏輯,人物服飾、姿態(tài)也與場(chǎng)景屬性高度契合。



三、不只會(huì)畫圖,還開始“理解圖”

從技術(shù)層面看,Wan2.7-Image有三個(gè)維度的升級(jí)。

在訓(xùn)練數(shù)據(jù)上,模型底座整合了超大規(guī)模異構(gòu)視覺(jué)素材,并額外加入了理解類數(shù)據(jù),使模型不止于像素級(jí)擬合,還具備底層語(yǔ)義認(rèn)知能力。

在模型架構(gòu)上,Wan2.7-Image采用生成與理解統(tǒng)一的模型架構(gòu),在共享隱空間(Latent Space)內(nèi)實(shí)現(xiàn)語(yǔ)義映射——文字緊挨著畫面,模型不需要費(fèi)力推斷文字對(duì)應(yīng)的畫面區(qū)域。同時(shí),訓(xùn)練流程中引入了多模態(tài)指令(文字+圖片),進(jìn)一步強(qiáng)化了從“像素?cái)M合”到“語(yǔ)義認(rèn)知”的跨越。

此外,模型還支持調(diào)用WanImage Skill工具,據(jù)官方介紹可實(shí)現(xiàn)“讓龍蝦畫畫”等創(chuàng)意指令編排。

在人類偏好盲測(cè)中,Wan2.7-Image多項(xiàng)能力位列全國(guó)第一,綜合成績(jī)接近Nano Banana Pro。同步上線的Wan2.7-Image-pro版本在訓(xùn)練數(shù)據(jù)規(guī)模和模型尺寸上進(jìn)一步擴(kuò)大,構(gòu)圖穩(wěn)定性和語(yǔ)義理解精準(zhǔn)度更高。

四、從電商到短劇,圖像模型開始全面落地

Wan2.7-Image在多個(gè)垂直場(chǎng)景展示了行業(yè)落地潛力。

在短劇制作方向,模型支持角色生成中的“一人分飾多角”,通過(guò)多主體一致性能力保持同一角色在不同場(chǎng)景中的特征穩(wěn)定;分鏡生成可將人物自然融入場(chǎng)景,并通過(guò)交互式編輯精準(zhǔn)調(diào)整人物位置和大小。



在電商廣告場(chǎng)景,模型支持從單張模特圖一鍵裂變出多張不同角度、不同場(chǎng)景的展示圖,并可按電商上架格式自動(dòng)輸出場(chǎng)景圖、特寫圖、尺寸圖和賣點(diǎn)圖等套圖組合。


顏色變裝(通過(guò)調(diào)色盤功能切換服裝色彩)、四季拼圖生成以及“拯救廢片”(消除閉眼)等功能,可滿足小紅書、B站等社交平臺(tái)的內(nèi)容創(chuàng)作需求。OOTD穿搭生成和不露臉?lè)b替換也在演示中效果穩(wěn)定。

該模型可生成圖文并茂的知識(shí)卡片和教育插畫,內(nèi)容創(chuàng)作方向支持B站封面、小紅書封面、種草圖文等常見(jiàn)內(nèi)容格式。


結(jié)語(yǔ):圖像模型正在走向“可控化”和“生產(chǎn)力工具”

從Wan2.7-Image的技術(shù)突破中可見(jiàn),圖像模型的技術(shù)競(jìng)賽已轉(zhuǎn)向更深層的維度。其核心價(jià)值不再局限于“畫得像不像”的表象還原,而是能否精準(zhǔn)控制人物形象、顏色搭配和畫面布局,能否深入理解文本與語(yǔ)義內(nèi)涵,能否無(wú)縫融入設(shè)計(jì)、電商、內(nèi)容創(chuàng)作等工作流程。

隨著長(zhǎng)文本渲染能力的突破、交互式編輯的靈活操作以及多主體風(fēng)格一致性的顯著提升,圖像模型正從輔助性的“創(chuàng)意工具”蛻變成為驅(qū)動(dòng)產(chǎn)業(yè)效率的“高效生產(chǎn)力工具”?!扒饲妗焙汀罢{(diào)色盤”這類能力,也意味著AI生成內(nèi)容開始走向個(gè)性化與可控化。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
以色列,終成人類公敵!

以色列,終成人類公敵!

燕梳樓頻道
2026-04-10 15:02:39
歐爾班選舉慘敗,馬扎爾黨獲141席,執(zhí)政16年恐結(jié)束

歐爾班選舉慘敗,馬扎爾黨獲141席,執(zhí)政16年恐結(jié)束

璀璨幻行者
2026-04-11 03:13:24
岳父送了桶自釀酒,我嫌棄送給了領(lǐng)導(dǎo),半個(gè)月后領(lǐng)導(dǎo)叫我去辦公室

岳父送了桶自釀酒,我嫌棄送給了領(lǐng)導(dǎo),半個(gè)月后領(lǐng)導(dǎo)叫我去辦公室

奶茶麥子
2026-04-11 00:42:05
現(xiàn)在才明白,全紅嬋被網(wǎng)暴三年多,一直沒(méi)人敢報(bào),原來(lái)央視記者就是那282人里的一個(gè)

現(xiàn)在才明白,全紅嬋被網(wǎng)暴三年多,一直沒(méi)人敢報(bào),原來(lái)央視記者就是那282人里的一個(gè)

娛樂(lè)洞察點(diǎn)點(diǎn)
2026-04-11 03:16:04
伊朗媒體披露伊方代表團(tuán)首日日程

伊朗媒體披露伊方代表團(tuán)首日日程

新華社
2026-04-11 06:35:02
是時(shí)候攤牌了,中方明確信號(hào):要打,戰(zhàn)火必須燒進(jìn)美國(guó)本土!

是時(shí)候攤牌了,中方明確信號(hào):要打,戰(zhàn)火必須燒進(jìn)美國(guó)本土!

史說(shuō)方休
2026-04-11 01:23:59
這才叫海戰(zhàn)!擊沉5艘航空母艦,擊落346架戰(zhàn)機(jī)

這才叫海戰(zhàn)!擊沉5艘航空母艦,擊落346架戰(zhàn)機(jī)

地圖帝
2026-04-09 23:03:52
以軍在教室開槍,打死正在上課的9歲加沙女孩

以軍在教室開槍,打死正在上課的9歲加沙女孩

瀟湘晨報(bào)
2026-04-10 14:59:14
命中了!以色列徹底失控了!

命中了!以色列徹底失控了!

財(cái)經(jīng)要參
2026-04-11 05:50:03
霍爾木茲海峽開了,又關(guān)了

霍爾木茲海峽開了,又關(guān)了

中國(guó)新聞周刊
2026-04-10 18:41:40
洗臉熊一夜成名!公司聊天記錄流出,網(wǎng)友:500萬(wàn)花出5億的效果

洗臉熊一夜成名!公司聊天記錄流出,網(wǎng)友:500萬(wàn)花出5億的效果

火山詩(shī)話
2026-04-11 07:38:12
標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號(hào)

標(biāo)120W的充電器實(shí)際功率僅22.5W,商家:120W是產(chǎn)品型號(hào)

極目新聞
2026-04-11 00:53:31
"我不要活了!"上海一阿婆崩潰,買了近30年的保險(xiǎn)全被退!警方:若繼續(xù)持有價(jià)值百萬(wàn)

"我不要活了!"上海一阿婆崩潰,買了近30年的保險(xiǎn)全被退!警方:若繼續(xù)持有價(jià)值百萬(wàn)

臺(tái)州交通廣播
2026-04-09 22:32:54
高市不演了,東京降級(jí)對(duì)華關(guān)系,向全球告狀,稱中國(guó)欠日本兩筆賬

高市不演了,東京降級(jí)對(duì)華關(guān)系,向全球告狀,稱中國(guó)欠日本兩筆賬

書紀(jì)文譚
2026-04-10 16:17:03
文班40+13+5榜眼超越魔術(shù)師,弗拉格33分難救主,馬刺橫掃獨(dú)行俠

文班40+13+5榜眼超越魔術(shù)師,弗拉格33分難救主,馬刺橫掃獨(dú)行俠

釘釘陌上花開
2026-04-11 10:18:30
?;饍芍艿纳嫣魬?zhàn):革命衛(wèi)隊(duì)如何保障伊朗九千萬(wàn)人的吃喝?

停火兩周的生存挑戰(zhàn):革命衛(wèi)隊(duì)如何保障伊朗九千萬(wàn)人的吃喝?

高博新視野
2026-04-10 06:30:09
關(guān)于兩岸和平統(tǒng)一,鄭麗文正式表態(tài),國(guó)民黨三人罕見(jiàn)支持,不簡(jiǎn)單

關(guān)于兩岸和平統(tǒng)一,鄭麗文正式表態(tài),國(guó)民黨三人罕見(jiàn)支持,不簡(jiǎn)單

DS北風(fēng)
2026-04-10 17:16:33
照顧患癌母親的24歲女研究生確診腸癌晚期:已收到愛(ài)心捐款10余萬(wàn)元,病情穩(wěn)定期盼返校

照顧患癌母親的24歲女研究生確診腸癌晚期:已收到愛(ài)心捐款10余萬(wàn)元,病情穩(wěn)定期盼返校

紅星新聞
2026-04-10 16:55:18
“趙一鳴”被指918間諜:愛(ài)國(guó)不是“降智”的擋箭牌

“趙一鳴”被指918間諜:愛(ài)國(guó)不是“降智”的擋箭牌

虔青
2026-04-10 13:53:06
鄭麗文女保鏢火了!她的眼神讓全場(chǎng)震驚。

鄭麗文女保鏢火了!她的眼神讓全場(chǎng)震驚。

小貓娛樂(lè)叭叭
2026-04-09 21:03:31
2026-04-11 10:27:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
11555文章數(shù) 117026關(guān)注度
往期回顧 全部

科技要聞

三星中國(guó)被曝大調(diào)整:黑白電、顯示器淡出市場(chǎng)

頭條要聞

牛彈琴:伊朗很悲壯 向美國(guó)提高了"要價(jià)"

頭條要聞

牛彈琴:伊朗很悲壯 向美國(guó)提高了"要價(jià)"

體育要聞

17歲賺了一百萬(wàn)美元,25歲被CBA裁員

娛樂(lè)要聞

黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

教育
健康
時(shí)尚
藝術(shù)
本地

教育要聞

“窮到吃豆豉,還生呢?”農(nóng)村家長(zhǎng)曬5兒3女,大兒子眼神好可怕

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

推廣中獎(jiǎng)名單-更新至2026年3月31日推廣

藝術(shù)要聞

你絕對(duì)想不到,毛主席的書法珍品竟然被遺棄過(guò)!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版