国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

像修圖一樣修視頻?實(shí)測快手可靈 O1,這才是創(chuàng)作者想要的神器

0
分享至



文 / 道哥

來源 / 智百道

年關(guān)將至,AI行業(yè)的熱鬧不減反增,快手旗下視頻生成大模型可靈放出大招,直接端上靈感周,從12月1號(hào)到5號(hào)每天都要上新。

仔細(xì)來看,這次更新涵蓋了多模態(tài)圖片、視頻大模型、數(shù)字人、音效生成、主體庫等新品。

特別的是第一天更新的可靈AI視頻“O1模型”,更是號(hào)稱“全球首個(gè)統(tǒng)一多模態(tài)視頻模型”。

熟悉的人都知道之前可靈大模型名稱都是以數(shù)字命名,比如,可靈1.6、2.5turbo,這次卻起名為O系列,這里的O是OMNI的O,意思就是全部、所有。

在海外網(wǎng)友更是用“insane”來大贊可靈O1。



那么具體體驗(yàn)究竟如何?

01 實(shí)測可靈O1多模態(tài)模型

在我看來,相比起之前的可靈2.5turbo,可靈O1最凸顯的特點(diǎn)是交互性的便捷度再提升——之前可靈圖片2.1圖片模型與視頻2.5模型都是在不同的頁面,當(dāng)你想圖片編輯和視頻編輯時(shí)需要不停切換,現(xiàn)在有了O1,用戶只需要通過O1一個(gè)入口就可以實(shí)現(xiàn)跨模態(tài)任務(wù)創(chuàng)作,無需在不同工具間切換。

難怪有人評(píng)價(jià),該技術(shù)實(shí)現(xiàn)了“像P圖一樣P視頻”的操作體驗(yàn)。

點(diǎn)進(jìn)去O1入口后,你可以在底部選擇切換視頻或圖片模型。

假如我們切到視頻模型,會(huì)發(fā)現(xiàn)有四個(gè)負(fù)責(zé)提升內(nèi)容一致性的快捷功能,被羅列在了可靈O1界面頂部。我們可以先選功能再生成,AI會(huì)更有針對(duì)性,生成效果也更穩(wěn)健流暢。

敲黑板,這個(gè)功能是創(chuàng)作者的福音。

專業(yè)創(chuàng)作者動(dòng)輒創(chuàng)作長達(dá)數(shù)十分鐘的內(nèi)容,對(duì)內(nèi)容的可控性要求一直很高。沒有人臉一致性,廣告商、電影制作人等商業(yè)創(chuàng)作者就難以將視頻生成模型當(dāng)作可靠工具使用。

其中一個(gè)快捷功能為主體庫。這就好比內(nèi)容生成的參考系,讓AI別隨意發(fā)揮,而是按照主體庫的樣本進(jìn)行創(chuàng)作。你不光可以選擇官方主體也可以自行創(chuàng)建主體庫。

先從官方主體庫來看,包含各種熱門素材,人物欄里,直接給了魯迅和林黛玉的影視形象,動(dòng)物則有這兩年在網(wǎng)上很火的安卓貓、水豚、香蕉貓等。繼續(xù)翻,主體還延伸到了道具、服飾、場景和特效,基本把一支視頻里會(huì)需要用到的主要元素,都整理成了可復(fù)用的素材。

對(duì)創(chuàng)作者來說,可以把制作好的素材存儲(chǔ)起來,方便隨時(shí)調(diào)用,而不是從文件夾里從新上傳素材,再制作,效率大有改善。

這次更新最實(shí)用的功能,是視頻編輯,分別是指令變化和視頻參考。因?yàn)橐郧暗目伸`,是完全沒有辦法對(duì)視頻進(jìn)行編輯或參考的,但是這次,終于解決了這個(gè)痛點(diǎn)。

那么,可靈作為編輯的能力如何?



以視頻生成這是創(chuàng)作者實(shí)際場景中十分實(shí)用的功能,我們以日常生活場景為例,輸入指令,“布偶貓和兔子玩鬧,卡通版”,可靈可以按照指令生成順滑的視頻。

以視頻增加與修改來看,我還想將視頻中的兔子元素替換成《瘋狂動(dòng)物城》中的朱迪,還是這個(gè)界面,我直接導(dǎo)入視頻,與朱迪兔的圖片,輸入指令“把視頻里的兔子換成朱迪”即可。



整體體驗(yàn)下來,O1多主體元素的鏡頭切換里確實(shí)能穩(wěn)住一致性,局部編輯也很自然,日常修瑕疵完全夠用,還能生成10s長視頻,對(duì)長視頻創(chuàng)作者非常友好。特別的是,生成視頻時(shí)長可以從3秒到10秒,比例也包含9:16、1:1、16:9。

圖片生成的話,只需要在頁面底部切換模型即可。

讓小編十分欣喜的是,可靈生成模式支持1K、2k,涵蓋主流常用比例,當(dāng)然為了避免開盲盒,你也可以選擇生成的數(shù)量,從中選取自己最滿意的即可。





02 音畫同步,告別無聲視頻

這次靈感周的重磅更新還有可靈2.6主打音效同步,也就是說,我們終于不用只看無聲視頻了!

現(xiàn)在用可靈2.6,輸入文字不僅能生成畫面,還能自動(dòng)配上雙語對(duì)話、環(huán)境音效甚至背景音樂!小編想讓伏地魔臣服于九頭蛇組織,輸入prompt“伏地魔拿著魔杖打斗,然后站立,大喊九頭蛇萬歲”,最后實(shí)際效果如下。你會(huì)發(fā)現(xiàn)伏地魔中文發(fā)音字正腔圓,整個(gè)畫面也比較流暢,細(xì)膩。

很多人會(huì)拿可靈和國外的Sora 2比,但對(duì)我們來說,可靈2.6有兩個(gè)本土化優(yōu)勢。

第一、就像剛才說的中文能力好。

相比 Sora 對(duì)中文支持的捉襟見肘,常出現(xiàn)發(fā)音錯(cuò)誤,作為土生土長的中國模型,可靈2.6 對(duì)中文語境和發(fā)音的把控游刃有余。

第二、成本更低:生成10秒1080P視頻,可靈只要2元,Sora要5元,相當(dāng)于打了4折。

據(jù)了解,未來,可靈還會(huì)支持4K超高清和自定義聲音,說不定明年,普通人就能以很低的成本將自己的創(chuàng)意落地為一部AI電影。

當(dāng)然,還有讓品牌與主播看到新機(jī)遇的數(shù)字人模型Avatar 2.0。

以往做個(gè)數(shù)字人視頻,或許得找專業(yè)的數(shù)字人團(tuán)隊(duì),成本也高。現(xiàn)在只需一張人物照片、一段音樂音頻,就能一鍵生成長達(dá)5分鐘的唱歌視頻。

從可靈官方發(fā)布的視頻來看,和以前那些只會(huì)僵硬對(duì)口型的數(shù)字人相比,現(xiàn)在的數(shù)字人更活靈活現(xiàn),能隨著旋律自然地?fù)P眉、眼神含笑、肢體起伏。

此外,Avatar 2.0在表情控制上有了進(jìn)步。以前AI人物的表情更像一個(gè)假人,現(xiàn)在的數(shù)字人能流露自然情緒。動(dòng)作設(shè)計(jì)也更靈活了,不只是頭部唇同步,全身表演,像肩膀聳動(dòng)、手勢強(qiáng)調(diào),都能和音樂完美契合。測試基準(zhǔn)顯示,在375個(gè)“參考圖–音頻–文本提示”樣例中,該模型在復(fù)雜歌唱場景下的響應(yīng)準(zhǔn)確率高達(dá)90%以上,不管是真人、AI生成圖像,還是動(dòng)物或卡通角色都能支持。

從背后的技術(shù)細(xì)節(jié)來拆分,Avatar 2.0的厲害之處在于它的多模態(tài)導(dǎo)演模塊(MLLM Director)。這個(gè)模塊把多模態(tài)大語言模型(MLLMs)融合在一起,能把用戶輸入的圖像、音頻和文本提示這三要素,變成一條連貫的故事線。系統(tǒng)先從音頻里提取語音內(nèi)容和情感軌跡,同時(shí),從單張照片里識(shí)別人像特征和場景元素,再結(jié)合用戶給的文本,最后,通過文本跨注意力層把信息注入視頻擴(kuò)散模型,生成全局一致的“視頻”。

03 可靈——快手的新增長曲線

PMF一直是AI行業(yè)的熱詞,資本市場有關(guān)AI技術(shù)能否賺錢,何時(shí)賺錢的爭論從未停歇。

程一笑今年早些時(shí)候曾判斷,科技行業(yè)的競爭,關(guān)鍵就在于誰能夠把AI技術(shù)和具體應(yīng)用場景結(jié)合得更好??焓帜芊駥I質(zhì)地打磨得更加扎實(shí),自然也就成了檢驗(yàn)其演進(jìn)方向的重要標(biāo)尺。

與阿里、騰訊、字節(jié)偏向構(gòu)建基礎(chǔ)設(shè)施的策略不同,快手展現(xiàn)出了更強(qiáng)的實(shí)用主義色彩。 去年,快手便聚焦視頻生成發(fā)布了可靈AI,發(fā)布時(shí)間甚至比字節(jié)的即夢AI早了兩個(gè)月。

也正是因?yàn)楦鼊?wù)實(shí)的戰(zhàn)略預(yù)判,這場AI燒錢競賽中,一直積極布局AI技術(shù)的快手仿佛是個(gè)“局外人”,因?yàn)橐呀?jīng)在AI視頻賽道見到了真金白銀。

在快手三季報(bào)中,AI更是貫穿全篇,被提及多達(dá)48次,頻率遠(yuǎn)超前兩個(gè)季度。

除了B端創(chuàng)作者,可靈 AI大模型目前已深入應(yīng)用于廣告素材生成、短劇制作、智能客服等多個(gè)核心業(yè)務(wù)場景,并持續(xù)創(chuàng)造可觀收入。

財(cái)務(wù)數(shù)據(jù)直觀地印證了這一增長態(tài)勢,可靈AI的收入呈現(xiàn)爆發(fā)式增長,2025年第一季度收入為1.5億元,第二季度躍升至超2.5億元,第三季度更突破3億元??焓诸A(yù)計(jì),該業(yè)務(wù)全年收入有望逼近10億元,較年初目標(biāo)4.3 億元實(shí)現(xiàn)翻倍增長。

這清晰地表明,AI 技術(shù)與快手主營業(yè)務(wù)之間已形成強(qiáng)大的協(xié)同效應(yīng),其商業(yè)化路徑日益清晰。

從機(jī)構(gòu)的看法來看,AI已經(jīng)不再是一個(gè)單點(diǎn)工具,更像是一個(gè)影響全生態(tài)的發(fā)動(dòng)機(jī)。

西部證券認(rèn)為,在生成式AI應(yīng)用加速落地的背景下,快手基于多模態(tài)大模型技術(shù)積極迭代軟硬件,或?qū)⑦M(jìn)一步促進(jìn)公司主營業(yè)務(wù)持續(xù)增長,同時(shí),公司生成式AI應(yīng)用不斷推進(jìn)技術(shù)落地和商業(yè)化也有望為公司帶來新的增量空間。

12月2日,港股上市公司快手盤初沖高超5%,表現(xiàn)強(qiáng)勁,截至發(fā)稿前,65.35港元/股。這一積極市場反應(yīng)的背后,是公司在人工智能領(lǐng)域的持續(xù)進(jìn)步獲得市場認(rèn)可。

在AI敘事祛魅的當(dāng)下,市場不再盲目迷信概念,而是開始審視落地能力與商業(yè)回報(bào)。

快手可靈O1的發(fā)布,不僅是一次產(chǎn)品迭代,更像是對(duì) AI 視頻賽道進(jìn)入深水區(qū)的一種回應(yīng),企業(yè)追求的不僅要技術(shù)炫酷,更要從交互、成本、應(yīng)用場景上解決實(shí)際痛點(diǎn)。 在這場關(guān)于未來的競賽中,堅(jiān)持實(shí)用主義的快手,在AI視頻賽道已經(jīng)領(lǐng)先一個(gè)身位。

*題圖由AI生成

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
帶娃出國的中產(chǎn)后悔了:想回來,但回國失敗

帶娃出國的中產(chǎn)后悔了:想回來,但回國失敗

視覺志
2026-03-24 10:36:13
回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

就一點(diǎn)
2025-11-22 10:36:39
舊手機(jī)回收價(jià)狂漲五六倍!回收商:開不了機(jī)的照樣高價(jià)收

舊手機(jī)回收價(jià)狂漲五六倍!回收商:開不了機(jī)的照樣高價(jià)收

快科技
2026-03-25 14:53:24
東契奇43分創(chuàng)紀(jì)錄,湖人逆轉(zhuǎn)勝步行者穩(wěn)西部第三

東契奇43分創(chuàng)紀(jì)錄,湖人逆轉(zhuǎn)勝步行者穩(wěn)西部第三

李絙在北漂
2026-03-26 13:20:36
51歲孔令輝:為生活奔波,與劉國梁9年未見面,一個(gè)電話讓他落淚

51歲孔令輝:為生活奔波,與劉國梁9年未見面,一個(gè)電話讓他落淚

夢史
2026-03-25 11:33:08
王勵(lì)勤動(dòng)真格了!倫敦世乒賽陣容有變,陳夢調(diào)整,2人被冷落

王勵(lì)勤動(dòng)真格了!倫敦世乒賽陣容有變,陳夢調(diào)整,2人被冷落

不似少年游
2026-03-25 17:03:59
你知道我在床上有多厲害嗎?

你知道我在床上有多厲害嗎?

果粉之家
2026-03-20 12:35:16
從歐爾班行為,看北約當(dāng)年拒絕俄羅斯的遠(yuǎn)見

從歐爾班行為,看北約當(dāng)年拒絕俄羅斯的遠(yuǎn)見

民間胡扯老哥
2026-03-23 18:53:38
破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭什么?

破防!小縣城殯儀館大屏流出,中年人扎堆離世,網(wǎng)友:還爭什么?

川渝視覺
2026-03-23 19:26:44
喪夫僅5個(gè)月,49歲翁帆突傳“喜訊”高調(diào)露面,狀態(tài)好到出人意料

喪夫僅5個(gè)月,49歲翁帆突傳“喜訊”高調(diào)露面,狀態(tài)好到出人意料

冷紫葉
2026-03-24 19:12:36
勇士逆轉(zhuǎn)橫掃送籃網(wǎng)9連敗 桑托斯31分大爆發(fā)波杰姆斯基22分

勇士逆轉(zhuǎn)橫掃送籃網(wǎng)9連敗 桑托斯31分大爆發(fā)波杰姆斯基22分

醉臥浮生
2026-03-26 12:45:06
第六險(xiǎn)來了!一文讀懂“長護(hù)險(xiǎn)”

第六險(xiǎn)來了!一文讀懂“長護(hù)險(xiǎn)”

極目新聞
2026-03-26 07:21:00
張雪峰猝死后,盧克文也不敢跑步了,曾每年跑1千公里,身體垮了

張雪峰猝死后,盧克文也不敢跑步了,曾每年跑1千公里,身體垮了

水晶的視界
2026-03-26 09:28:29
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

四川高縣村支書暴打殘疾村婦致輕傷 法院判決免于刑事處罰引爭議

律法刑道
2026-03-26 10:55:03
2.4億成全你!詹姆斯降薪2000萬?雙詹合體咋辦!

2.4億成全你!詹姆斯降薪2000萬?雙詹合體咋辦!

柚子說球
2026-03-25 11:44:10
薩巴倫卡贏鄭欽文后吃100美元漢堡 頂奢!魚子醬+金箔碎她說超好吃

薩巴倫卡贏鄭欽文后吃100美元漢堡 頂奢!魚子醬+金箔碎她說超好吃

勁爆體壇
2026-03-26 08:10:23
4000噸稀土被轉(zhuǎn)運(yùn)美國?大陸停供臺(tái)灣稀土!臺(tái)學(xué)者:不如直接統(tǒng)一

4000噸稀土被轉(zhuǎn)運(yùn)美國?大陸停供臺(tái)灣稀土!臺(tái)學(xué)者:不如直接統(tǒng)一

小舟談歷史
2026-03-19 17:27:44
RMC記者:姆巴佩在發(fā)布會(huì)上說謊了,我1000%確認(rèn)他被誤診了

RMC記者:姆巴佩在發(fā)布會(huì)上說謊了,我1000%確認(rèn)他被誤診了

懂球帝
2026-03-26 06:43:05
伊拉克民兵無人機(jī)出擊!炸了美軍的雷達(dá),又擊中黑鷹直升機(jī)

伊拉克民兵無人機(jī)出擊!炸了美軍的雷達(dá),又擊中黑鷹直升機(jī)

戰(zhàn)風(fēng)
2026-03-25 11:44:25
2026-03-26 13:55:00
節(jié)點(diǎn)AI incentive-icons
節(jié)點(diǎn)AI
專注于人工智能領(lǐng)域的產(chǎn)業(yè)媒體
107文章數(shù) 2關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時(shí)限4到5天

頭條要聞

伊朗議長和外長暫被移出美以清除名單 時(shí)限4到5天

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
旅游
游戲
公開課
軍事航空

教育要聞

2027屆注意:暑期實(shí)習(xí)=秋招通行證,錯(cuò)過等一年

旅游要聞

明起全面實(shí)行線上實(shí)名預(yù)約購票!云臺(tái)山景區(qū)發(fā)布公告

IGN認(rèn)為Xbox機(jī)會(huì)來了!新主機(jī)要轉(zhuǎn)守為攻 重塑自我

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版