国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

國(guó)產(chǎn)AI視頻炸了!SkyReels-V3三大功能重磅開源,1張圖生成逼真視頻

0
分享至


新智元報(bào)道

編輯:犀牛 KingHZ

【新智元導(dǎo)讀】超越主流商業(yè)模型!SkyReels-V3在參考一致性、視頻質(zhì)量上碾壓對(duì)手,構(gòu)建200組測(cè)試基準(zhǔn),影視、電商、廣告場(chǎng)景全覆蓋,真正降維打擊。

起猛了!

馬斯克和孫悟空同框了。


更離譜的是:這種「真假難辨」的視頻,現(xiàn)在一張圖 + 幾句話就能做出來。

不僅普通創(chuàng)作者能直接上手,而且開發(fā)者也能二次開發(fā)。

作為迭代自V1(AI短劇創(chuàng)作)、V2(無限時(shí)長(zhǎng)電影生成)的重磅版本,昆侖天工SkyworkAI團(tuán)隊(duì)正式開源了多模態(tài)視頻生成模型SkyReels-V3:

論文:https://arxiv.org/abs/2601.17323

開源:https://github.com/SkyworkAI/SkyReels-V3

API鏈接(限時(shí)免費(fèi)):https://www.apifree.ai/model/skywork-ai/skyreels-v3/standard/single-avatar

這不僅僅是一個(gè)模型的發(fā)布,更像是一場(chǎng)對(duì)現(xiàn)有AI視頻工具的「降維打擊」。

AI視頻創(chuàng)作三大難事,

一次做全了

以前做AI視頻,你需要在A模型生圖、B模型動(dòng)效、C模型對(duì)口型之間反復(fù)橫跳。

而SkyReels-V3這次主打一個(gè)全能通吃,在一個(gè)架構(gòu)里搞定三大核心能力:

1)參考圖像轉(zhuǎn)視頻:給1–4張圖+文本指令,生成多主體視頻。重點(diǎn)是: 主角不亂變,告別抽卡式創(chuàng)作。

2)視頻延長(zhǎng):把5秒鏡頭擴(kuò)到30秒,還能加轉(zhuǎn)場(chǎng)。重點(diǎn)是: 畫面連續(xù)、動(dòng)作不「抽幀」。

3)音頻驅(qū)動(dòng)虛擬形象:一張肖像+一段音頻,生成分鐘級(jí)視頻。重點(diǎn)是: 嘴型對(duì)得上、人物穩(wěn)得住 。

AI視頻的門檻正在被鏟平:創(chuàng)作者拿到的是趁手的工具,開發(fā)者拿到的是萬能的模塊。

參考圖像轉(zhuǎn)視頻:主角就是主角

如果一個(gè)電商運(yùn)營(yíng)今晚就要把新品視頻上架,但他現(xiàn)在手里只有三張圖:商品主圖、模特上身圖、品牌Logo。

傳統(tǒng)做法?要么找外包燒錢,要么自己用剪輯軟件硬搓。

SkyReels-V3的玩法則是:1到4張參考圖+一句文本指令,等待幾分鐘,一條15秒的高保真產(chǎn)品廣告就生成了。

直出一段多主體、高連貫的視頻。

你可以這么下指令:

  • 模特拿起商品轉(zhuǎn)身展示,鏡頭從近景推到中景,背景保持干凈明亮。

  • Logo始終在右下角,商品紋理要清晰,動(dòng)作別抽搐。

它要解決的不是「會(huì)動(dòng)」,而是更難的事:「像同一個(gè)人、同一個(gè)商品、在同一個(gè)世界里連續(xù)發(fā)生」。

在SkyReels-V3眼里,參考圖像不再只是靈感,而是一份「身份合同」——主角簽了字,就別想臨場(chǎng)變臉。

其參考一致性得分高達(dá)0.6698,視覺質(zhì)量0.8119,這兩個(gè)核心指標(biāo),直接超越了市面上的主流商業(yè)模型。

比如,讓馬斯克免費(fèi)給你帶貨,或者生成一段極具質(zhì)感的運(yùn)動(dòng)鞋廣告:

沒有任何詭異的形變,只有絲滑的商業(yè)級(jí)質(zhì)感。

1簡(jiǎn)潔明亮的展區(qū)內(nèi),柔和的燈光均勻?yàn)⒙,周圍擺放著一些運(yùn)動(dòng)相關(guān)的小物件。一位身穿黑色上衣的男士正仔細(xì)地向大家展示一雙設(shè)計(jì)簡(jiǎn)潔、配色亮麗的運(yùn)動(dòng)鞋。

之前,Gemini 3生成的硅谷巨頭大合照,很火很逼真:


現(xiàn)在,SkyReel-V3直接讓圖片動(dòng)起來了──

這質(zhì)量,這還原度,這一致性,真不是吹!

視頻延長(zhǎng):5秒變30秒, AI 學(xué)會(huì)了「導(dǎo)演思維」

做過視頻的人都知道,視頻延長(zhǎng)是個(gè)技術(shù)活。

你有一個(gè)5秒的空鏡頭,氛圍很好,但太短了。

傳統(tǒng)做法要么重拍,要么靠后期「魔法」——變速、復(fù)制幀、加特效遮掩,但怎么弄都有點(diǎn)假。

SkyReels-V3的視頻延長(zhǎng)功能,不僅可以把5秒的素材平滑擴(kuò)展到30秒,更絕的是,它「懂鏡頭語言」。

它內(nèi)置了5種專業(yè)轉(zhuǎn)場(chǎng)效果切入、切出、多角度切換、正反鏡頭、切離。

比如,第一個(gè)視頻延長(zhǎng)到15秒:

你不只是在「拉長(zhǎng)」視頻,而是在即時(shí)即興剪輯。

比如,將一段小姐姐騎車的3秒視頻延長(zhǎng)到9秒:


視頻延展后,無論小姐姐的主體還是視頻背景,都完美保持一致,仿佛攝影師真的扛著攝像機(jī)跟拍了一路。


再比如,我們將這個(gè)林妹妹與魯智深對(duì)話的腦洞視頻,加入「多角度切換」的轉(zhuǎn)場(chǎng)。


The two people sat facing each other and talked.

這種人物一致性,簡(jiǎn)直絕了。


Switch to a long shot, with the two people talking face to face.

從技術(shù)上說,這得益于它的「統(tǒng)一多分段位置編碼」和「魯棒時(shí)空建!。

聽起來很硬核,本質(zhì)上就是讓AI理解了視頻里的「時(shí)間邏輯」和「空間關(guān)系」,所以延長(zhǎng)出來的內(nèi)容才會(huì)順滑如絲,沒有那種AI常見的時(shí)空扭曲感。

一句話:SkyReels-V3把素材不足從一場(chǎng)災(zāi)難,變成了一個(gè)可控的工程問題。

音頻驅(qū)動(dòng)虛擬形象:一張圖+一段聲就能「開口說話」

這是SkyReels-V3最讓人興奮的能力之一。

輸入一張人像照片,再配上一段音頻——

可以是你的錄音,可以是AI合成的語音,甚至可以是一段采訪素材。

模型會(huì)生成一段視頻,讓照片里的人瞬間「活過來」:

嘴唇動(dòng)作和音頻精準(zhǔn)同步,表情自然變化,頭部還有輕微的擺動(dòng),仿佛真人在鏡頭前呼吸。

比如,一張小姐姐的圖片加上一小段音頻,就能生成小姐姐唱歌的片段。

最厲害的是,它不挑食。

不只是真人照片,卡通角色、動(dòng)物形象、二次元立繪,統(tǒng)統(tǒng)可以驅(qū)動(dòng)。

比如,使用一張小狗照片+一段音頻,就可以一步生成「小狗深情演唱」的視頻,時(shí)長(zhǎng)甚至支持分鐘級(jí)生成。

你甚至可以讓兩個(gè)角色在同一個(gè)畫面里對(duì)話。

只需上傳一張圖片加上幾段音頻,SkyReels-V3便能夠自行判斷出音頻對(duì)應(yīng)的人物,在說話和聆聽狀態(tài)之間自然切換。

SkyReels-V3這項(xiàng)能力的音視頻同步性得分高達(dá)8.18,視覺質(zhì)量4.60,比肩甚至超越了行業(yè)頂尖的OmniHuman 1.5。

為什么是SkyReels-V3?

領(lǐng)先三大維度

在AI視頻生成領(lǐng)域,「全能選手」向來稀缺。

SkyReels-V3的出現(xiàn),打破了這一格局——它是目前少數(shù)能在單一架構(gòu)內(nèi)同時(shí)實(shí)現(xiàn)參考圖像生成視頻、視頻延展、音頻驅(qū)動(dòng)虛擬人三大核心能力的模型。

SkyReels-V3敢稱行業(yè)標(biāo)桿,底氣何在?

在最考驗(yàn)硬實(shí)力的參考圖像轉(zhuǎn)視頻領(lǐng)域,SkyReels研究團(tuán)隊(duì)構(gòu)建了一個(gè)包含200組測(cè)試數(shù)據(jù)的評(píng)估基準(zhǔn),涵蓋影視、電商、廣告等多元場(chǎng)景,參考圖像類型覆蓋人物、動(dòng)物、物體和背景。

結(jié)果顯示,在參考一致性、視頻質(zhì)量這兩個(gè)核心指標(biāo)上,SkyReels-V3直接超越了市面上的主流商業(yè)模型。

作為一個(gè)開源模型,這是對(duì)閉源陣營(yíng)的一次強(qiáng)力挑戰(zhàn)。


視頻延展是SkyReels-V3的另一大殺手锏。

為實(shí)現(xiàn)這一能力,研究團(tuán)隊(duì)開發(fā)了鏡頭切換檢測(cè)器,可分析長(zhǎng)視頻中是否存在轉(zhuǎn)場(chǎng)及其類型。

配合統(tǒng)一的多片段位置編碼和分層數(shù)據(jù)訓(xùn)練,模型能夠精準(zhǔn)建模運(yùn)動(dòng)軌跡,在復(fù)雜的多片段視頻延展中實(shí)現(xiàn)平滑過渡。

輸出支持720p分辨率,單鏡頭延展時(shí)長(zhǎng)可達(dá)30秒,支持1:1、3:4、4:3、16:9、9:16等多種畫幅比例。

在音頻驅(qū)動(dòng)虛擬形象生成領(lǐng)域,SkyReels-V3同樣表現(xiàn)亮眼。

音視頻同步性得分8.18,視覺質(zhì)量4.60。這些數(shù)據(jù)比肩甚至在部分指標(biāo)上超越了行業(yè)頂尖的OmniHuman 1.5。


虛擬形象生成的難點(diǎn)在于唇形同步長(zhǎng)時(shí)序穩(wěn)定性。

SkyReels-V3支持720p、24fps的高清視頻輸出,唇部動(dòng)作能夠精準(zhǔn)對(duì)齊音素級(jí)別的音頻動(dòng)態(tài)。

更關(guān)鍵的是,它支持分鐘級(jí)視頻的單次生成——不是靠多段拼接,而是一次性前向推理完成,全程保持身份一致、動(dòng)作連貫、表情穩(wěn)定。這使它天然適用于教學(xué)視頻、新聞播報(bào)、長(zhǎng)篇故事等場(chǎng)景。

值得一提的是,SkyReels-V3還支持多人場(chǎng)景

在對(duì)話場(chǎng)景中,角色能夠正確響應(yīng)對(duì)話音頻,在說話和聆聽狀態(tài)之間自然切換。

SkyReels-V3是真開源

市面上做AI視頻生成的模型不少,但SkyReels-V3是真開源。

很多所謂的「開源」模型,要么只開放部分權(quán)重,要么限制商用,要么文檔稀爛根本跑不起來。

SkyReels-V3是完整開源,代碼托管在GitHub,支持個(gè)人和企業(yè)自由下載、本地部署、定制改造。

對(duì)于中小團(tuán)隊(duì)來說,這意味著零成本獲得頂級(jí)AI視頻能力的可能。無需支付高昂的API調(diào)用費(fèi)用,無需擔(dān)心數(shù)據(jù)隱私問題,完全可以在自己的服務(wù)器上跑通全流程。

如果你是開發(fā)者:你要的可能不是「看Demo」,而是把能力接進(jìn)流程。

把SkyReels-V3當(dāng)成一個(gè)模塊,接到你的腳本生成、素材管理、投放系統(tǒng)里——這就是開源生態(tài)的意義。

最后,真正能把開源模型做成「生態(tài)」的,從來不是發(fā)布那一刻,而是你把作品發(fā)出來的那一刻。

下載、跑通、生成第一條視頻,然后把你的prompt和結(jié)果分享出來——

讓更多人站在你的肩膀上繼續(xù)迭代。

視頻創(chuàng)作的「奇點(diǎn)」時(shí)刻

從V1的短劇嘗試,到V2的電影夢(mèng)想,再到今天V3的全能爆發(fā),SkyworkAI團(tuán)隊(duì)正在用技術(shù)填平專業(yè)視頻制作的溝壑。

SkyReels-V3的出現(xiàn),標(biāo)志著高保真、長(zhǎng)時(shí)長(zhǎng)、多模態(tài)的視頻生成能力正式從「嘗鮮」走向「實(shí)用」。它把原本屬于專業(yè)工作室的權(quán)利,交還給了每一個(gè)有故事要講的人。

在AI的輔助下,未來的斯皮爾伯格可能就誕生在你的代碼倉(cāng)庫里。

工具已經(jīng)備好,現(xiàn)在,請(qǐng)開始你的表演。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
擔(dān)心的事還是發(fā)生!劉強(qiáng)東發(fā)年貨剛開始,老父親就走上大衣哥老路

擔(dān)心的事還是發(fā)生!劉強(qiáng)東發(fā)年貨剛開始,老父親就走上大衣哥老路

探史
2026-01-29 11:53:49
深圳重挖110米垃圾山,把歐美看呆了:中國(guó)已經(jīng)陷入“垃圾荒”了

深圳重挖110米垃圾山,把歐美看呆了:中國(guó)已經(jīng)陷入“垃圾荒”了

墨蘭史書
2026-01-29 05:35:03
郎平也沒想到,當(dāng)年留給前夫在美國(guó)長(zhǎng)大的女兒,如今成了她的驕傲

郎平也沒想到,當(dāng)年留給前夫在美國(guó)長(zhǎng)大的女兒,如今成了她的驕傲

科學(xué)發(fā)掘
2026-01-29 13:40:48
兩年了,為何許家印遲遲不判刑?真相比你想象的更復(fù)雜!

兩年了,為何許家印遲遲不判刑?真相比你想象的更復(fù)雜!

李云飛Afey
2026-01-20 11:43:34
“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

巧手曉廚娘
2025-12-30 18:59:18
智駕救不了電車,失去補(bǔ)貼之后,全球電車銷量都在倒退!

智駕救不了電車,失去補(bǔ)貼之后,全球電車銷量都在倒退!

柏銘銳談
2026-01-27 23:43:30
張?zhí)m不聽勸,又曬孫子孫女,小玥兒太像大S,外套7000元 個(gè)子很高

張?zhí)m不聽勸,又曬孫子孫女,小玥兒太像大S,外套7000元 個(gè)子很高

有范又有料
2026-01-27 15:42:10
又曝3大瓜!婚前一夜情、張杰官宣退出、女明星知三當(dāng)三,太離譜

又曝3大瓜!婚前一夜情、張杰官宣退出、女明星知三當(dāng)三,太離譜

最美的巧合
2026-01-29 01:49:07
2-1逆轉(zhuǎn)進(jìn)八強(qiáng)!中國(guó)女網(wǎng)17歲1米80小花蛻變:追趕鄭欽文王欣瑜?

2-1逆轉(zhuǎn)進(jìn)八強(qiáng)!中國(guó)女網(wǎng)17歲1米80小花蛻變:追趕鄭欽文王欣瑜?

李喜林籃球絕殺
2026-01-29 10:18:00
還差67席,高市流淚求支持,第一繼任者呼之欲出,中國(guó)收重大信號(hào)

還差67席,高市流淚求支持,第一繼任者呼之欲出,中國(guó)收重大信號(hào)

阿傖說事
2026-01-29 16:09:02
沉默24小時(shí)后,卡尼終于發(fā)聲,與中國(guó)協(xié)議作廢,美財(cái)長(zhǎng)得寸進(jìn)尺

沉默24小時(shí)后,卡尼終于發(fā)聲,與中國(guó)協(xié)議作廢,美財(cái)長(zhǎng)得寸進(jìn)尺

隨遇而安之心
2026-01-28 21:58:43
熱火對(duì)維金斯要價(jià)至少一首輪 鄧?yán)S操作思路參考去年巴特勒交易

熱火對(duì)維金斯要價(jià)至少一首輪 鄧?yán)S操作思路參考去年巴特勒交易

北青網(wǎng)-北京青年報(bào)
2026-01-29 20:30:02
韓媒:中國(guó)足球表現(xiàn)出根除“假賭黑”的決心;孫準(zhǔn)浩卻仍含糊其辭

韓媒:中國(guó)足球表現(xiàn)出根除“假賭黑”的決心;孫準(zhǔn)浩卻仍含糊其辭

懂球帝
2026-01-29 20:49:51
李亞鵬再現(xiàn)身!稱將取消直播處理醫(yī)院事務(wù),粉絲數(shù)已破千萬

李亞鵬再現(xiàn)身!稱將取消直播處理醫(yī)院事務(wù),粉絲數(shù)已破千萬

南方都市報(bào)
2026-01-29 16:17:55
回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

回顧探花大神:害人害己,多位女主被親戚認(rèn)出當(dāng)場(chǎng)“社死”

就一點(diǎn)
2025-10-09 12:19:42
烏外長(zhǎng):澤連斯基愿與普京會(huì)面!俄方回應(yīng):可以邀請(qǐng)他來莫斯科,并保障其安全

烏外長(zhǎng):澤連斯基愿與普京會(huì)面!俄方回應(yīng):可以邀請(qǐng)他來莫斯科,并保障其安全

每日經(jīng)濟(jì)新聞
2026-01-28 22:11:06
5球員落選首發(fā)!郭艾倫時(shí)代結(jié)束,周琦意外出局,趙繼偉被頂替

5球員落選首發(fā)!郭艾倫時(shí)代結(jié)束,周琦意外出局,趙繼偉被頂替

體壇大事記
2026-01-29 16:39:00
美國(guó)航母未到,伊朗導(dǎo)彈先到,盟友基地被炸,五角大樓徹底慌了

美國(guó)航母未到,伊朗導(dǎo)彈先到,盟友基地被炸,五角大樓徹底慌了

來科點(diǎn)譜
2026-01-29 08:55:15
DO:水晶宮和狼隊(duì)就拉森轉(zhuǎn)會(huì)接近達(dá)成協(xié)議,基礎(chǔ)轉(zhuǎn)會(huì)費(fèi)4500萬鎊

DO:水晶宮和狼隊(duì)就拉森轉(zhuǎn)會(huì)接近達(dá)成協(xié)議,基礎(chǔ)轉(zhuǎn)會(huì)費(fèi)4500萬鎊

懂球帝
2026-01-29 18:07:04
綿陽女首富被帶走,媒體翻出老底,20年前曾低價(jià)買走國(guó)有資產(chǎn)

綿陽女首富被帶走,媒體翻出老底,20年前曾低價(jià)買走國(guó)有資產(chǎn)

壹只灰鴿子
2026-01-28 14:04:21
2026-01-29 21:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14438文章數(shù) 66547關(guān)注度
往期回顧 全部

科技要聞

周亞輝的AI新賭局:國(guó)內(nèi)太卷 出海另起爐灶

頭條要聞

正部級(jí)孫紹騁被查 去年卸任內(nèi)蒙古自治區(qū)黨委書記

頭條要聞

正部級(jí)孫紹騁被查 去年卸任內(nèi)蒙古自治區(qū)黨委書記

體育要聞

詹姆斯哭了!騎士視頻致敬41歲超巨

娛樂要聞

曝金晨涉嫌交通肇事逃逸 本人尚未回應(yīng)

財(cái)經(jīng)要聞

崔東樹:中國(guó)汽車未來年銷或達(dá)5000萬輛

汽車要聞

車長(zhǎng)超5米還帶后輪轉(zhuǎn)向 比亞迪海豹08/海獅08將亮相

態(tài)度原創(chuàng)

本地
健康
時(shí)尚
教育
公開課

本地新聞

云游中國(guó)|撥開云霧,巫山每幀都是航拍大片

耳石癥分類型,癥狀大不同

“過年紅”就這么穿,真不俗!

教育要聞

教育家精神萬里行|彭向:扎根鄉(xiāng)村講臺(tái) 以愛為炬育新苗

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版