国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

阿里HappyHorse突然上線!實測讓馬斯克和奧爾特曼法庭開撕,還手搓了GTA6

0
分享至


智東西
作者 陳駿達
編輯 心緣

智東西4月27日報道,今天,阿里ATH創(chuàng)新事業(yè)部的最新視頻生成與編輯模型HappyHorse 1.0(官方譯名:快樂小馬)開啟灰度測試。創(chuàng)作者可在阿里云百煉平臺和HappyHorse官網(wǎng)注冊使用,大眾用戶可在千問App中體驗。


在盲測平臺Arena.ai上,HappyHorse 1.0在文生視頻、圖生視頻、視頻編輯三個榜單上均排名第二,僅次于前段時間爆火的字節(jié)Seedance 2.0。為驗證HappyHorse 1.0的真實效果,我們進行了多維度的實測。


只需輸入簡單的文字描述,用戶就可用HappyHorse 1.0生成一段3s-15s長度的視頻,視頻中可以實現(xiàn)多鏡頭切換、連貫劇情等要素。

官網(wǎng)顯示,HappyHorse 1.0分辨率最高支持1080p,最多可同時生成4個視頻,生成720P和1080P視頻的刊例價分別為0.9元/s及1.6元/s,Pro套餐包月價格疊加限時折扣后為0.44元/s和0.78元/s。


同時,HappyHorse 1.0也出現(xiàn)在阿里旗下多款產(chǎn)品中,如阿里悟空、MuleRun和JVS Claw等Agent平臺。千問App預(yù)告,近期將上線“測一測”視頻玩法,測出用戶在短劇宇宙的本名角色后,通過HappyHorse 1.0生成用戶本人“出演”的角色短劇片段。

在這次實測中,我們發(fā)現(xiàn)了HappyHorse 1.0在指令遵循、生成速度方面的明顯優(yōu)勢,也看到了它在畫面物理準(zhǔn)確性、音畫同步等方面仍有提升空間。以下是我們提煉出的核心體驗要點:

(1)生成速度快:體驗過程中,生成一段視頻僅需約2-5分鐘,與其他視頻生成模型相比有一定競爭力。

(2)指令遵循能力強:能準(zhǔn)確理解并執(zhí)行復(fù)雜的提示詞要求,包括鏡頭運動、畫面構(gòu)圖、風(fēng)格氛圍等。

(3)多元素參考還原度高:圖生視頻中能準(zhǔn)確呈現(xiàn)所有上傳的參考元素,包括人物、場景、道具等。

(4)音畫同步仍有提升空間:人聲、音效等同步效果較好,但是在樂器演奏等復(fù)雜場景中,模型生成的手部動作與音頻節(jié)奏存在明顯錯位。

(5)長敘事易穿幫:10s以上的較長視頻中,容易出現(xiàn)物理bug,比如無外力物體自移動等等。

(6)文字渲染錯誤:畫面中出現(xiàn)的文字常出現(xiàn)亂碼或錯誤。

以下是我們的完整實測過程:

一、能理解800詞超長提示詞,物理真實性還有提升空間

我們的首批實測任務(wù)聚焦文生視頻能力。在這一場景中,模型的指令遵循能力、生成結(jié)果的物理準(zhǔn)確性、音畫同步效果等都是值得關(guān)注的能力點。

案例1:復(fù)雜動作與音畫同步

提示詞: 街頭音樂表演,鼓手敲擊節(jié)奏、吉他手彈奏旋律,觀眾圍成半圈隨節(jié)奏拍手并輕微擺動身體,氛圍熱烈,拉美風(fēng)格,傍晚暖色燈光,鏡頭緩慢推進。

HappyHorse 1.0的生成速度是一大亮點,下方視頻生成的耗時大概在2分鐘左右。從生成結(jié)果上來看,HappyHorse 1.0生成的人像沒有出現(xiàn)肢體異常、扭曲等問題,鏡頭運動、畫面燈光等元素符合提示詞要求。

音畫同步效果是這段視頻中的缺憾。吉他手的演奏和視頻里的音樂節(jié)奏不同步,尤其在某些快速掃弦和重拍落點上,畫面中的手部動作與音頻中的音符出現(xiàn)錯位,破壞了演奏的真實感與沉浸感。

案例2:物理真實性

提示詞: 海邊懸崖上,海浪猛烈拍打巖石,水花飛濺,天空烏云密布,風(fēng)吹動人物衣服和頭發(fā),電影級真實感,慢動作。

在這一案例中,HappyHorse 1.0需要完成對物理世界的模擬,其難點在于對水體、風(fēng)這些元素的呈現(xiàn)。

最終,HappyHorse 1.0的生成結(jié)果很好地還原了波濤洶涌的效果,海浪與巖石的撞擊、海面上的泡沫都較為符合物理規(guī)律。

切換到人物后,主角頭發(fā)的飄動方向和衣服的飄動方向基本一致。美中不足的是,近景畫面中水滴滑落的速度不太符合物理規(guī)律,顯得略微慢了半拍。

案例三:超長提示詞

提示詞:

在這一案例中,我們考察了HappyHorse 1.0對復(fù)雜提示詞的理解能力。這段提示詞長達800詞,描述的是一個類似知名游戲《GTA》的實機演示畫面。

我們的提示詞對畫面中幾乎所有元素都進行了定義,包括人物、天氣、環(huán)境、建筑等等,HappyHorse 1.0對這些元素都做到了準(zhǔn)確呈現(xiàn)。

不過,開頭的第一個畫面出現(xiàn)了物理bug,車門在沒有受到外力的情況下自己關(guān)閉了。最后一個鏡頭中,主角出現(xiàn)了變化,這顯示出HappyHorse在這一案例中的一致性方面還有提升空間。


案例四:鏡頭語言與敘事感

提示詞: 夜晚城市街道,一名偵探在雨中行走,霓虹燈反射在濕漉漉的地面上,鏡頭從遠(yuǎn)景緩慢拉近到特寫,電影黑色風(fēng)格。

上方提示詞對運鏡方式、畫面風(fēng)格都做了細(xì)致的規(guī)定,這對HappyHorse 1.0的指令遵循能力提出要求。

最終,HappyHorse 1.0準(zhǔn)確呈現(xiàn)了從遠(yuǎn)景緩慢拉近到特寫的鏡頭要求,電影風(fēng)格呈現(xiàn)準(zhǔn)確,霓虹燈的光線和反射都較為自然,但畫面中的中文文字渲染有明顯錯誤。

在這一案例中,我們還采用了1080P的分辨率和最長的15s時長,可以看到,放大后的畫面細(xì)節(jié)依然較為清晰。


從這幾個案例來看,在提示詞要求較為詳細(xì)時,HappyHorse 1.0可以較好地理解并執(zhí)行復(fù)雜的畫面構(gòu)圖、鏡頭運動和風(fēng)格氛圍要求,生成的人物形體與基礎(chǔ)物理交互也相對穩(wěn)定;但在高精度音畫同步、微觀物理細(xì)節(jié)以及畫面中的文字渲染方面仍有提升空間。

二、最多支持9圖參考,實測讓奧爾特曼和馬斯克“對簿公堂”

除了文生視頻之外,HappyHorse 1.0也支持圖生視頻與視頻編輯,這些場景對一致性、穩(wěn)定性提出了較高要求。不過,在今天的實際測試過程中,我們始終未能成功體驗視頻編輯能力。

案例一:首幀模式

我們首先嘗試了圖生視頻功能中的首幀模式,所上傳的圖片是OpenAI聯(lián)合創(chuàng)始人兼CEO薩姆·奧爾特曼和Anthropic聯(lián)合創(chuàng)始人兼CEO達里奧·阿莫迪前段時間的合影。

不過,可能是因為畫面中涉及多位真實人物,模型拒絕了這一生成請求。


之后我們上傳了奧爾特曼的單人照,要求模型生成他喝咖啡的畫面。這次嘗試最后成功了,畫面中人物與真人照片的相似度應(yīng)該能達到8成左右,并且隨著光線和背景的變化,人物的樣貌沒有出現(xiàn)改變。

案例二:多人物參考

多圖參考中,我們上傳了馬斯克與奧爾特曼的圖像,要求HappyHorse 1.0提前想象一下這兩位人物對簿公堂、激烈爭吵的畫面。

這次HappyHorse 1.0也沒有拒絕我們的生成請求,它給出的首版生成結(jié)果中,并沒能體現(xiàn)出二人爭吵的效果,主要是“馬斯克”在單方面輸出。此外,模型似乎不理解這兩位人物的母語都是英語,畫面中“馬斯克”操著一口流利的中文。

再進一步細(xì)化要求后,HappyHorse 1.0能夠生成二人用英語爭論的畫面,其中人物的表情豐富,但是與參考圖相比出現(xiàn)了較為明顯的偏差。

案例三:多元素參考

除了上傳多個人物之外,多圖參考也允許用戶對視頻模型生成畫面的背景、具體元素等提供素材。我們便上傳了Sora核心人物Bill Peebles、OpenAI辦公室、紙箱等元素,要求HappyHorse 1.0生成一個離職的畫面。

在這一案例中,HappyHorse 1.0做得較高的方面是它準(zhǔn)確呈現(xiàn)了我們上傳的所有參考元素,人物、環(huán)境等都基本一致。

然而畫面中出現(xiàn)了不少物理bug,比如紙箱自動合上,門自動打開等等。

三、1080P、生成速度成HappyHorse亮點

在HappyHorse 1.0開始測試之際,智東西等部分媒體與多位參與HappyHorse 1.0測試的業(yè)內(nèi)人士與探討了這一模型目前的表現(xiàn),及其在行業(yè)中的競爭站位。

出海一站式AI電商營銷平臺麥斯國際的技術(shù)合伙人李明認(rèn)為,3s-15s的生成長度、較快的生成速度、支持1080P是HappyHorse 1.0的亮點功能。同時,在提示詞較為明確的情況下,模型的產(chǎn)出效果“還可以”。

然而,在實踐中,HappyHorse 1.0也展現(xiàn)出一些問題,比如生成視頻結(jié)果的一致性、生成語音內(nèi)容的機械感等等。李明認(rèn)為,HappyHorse 1.0與字節(jié)Seedance 2.0、OpenAI Sora 2等模型相比,“還有一些再提升的空間”。

我們向李明提及實測過程中遇到的音畫同步、文字渲染等問題。李明稱,字幕等文字內(nèi)容的渲染其實是當(dāng)前AI視頻生成模型的通病,目前業(yè)內(nèi)很少靠大模型直接生成,而是會借助后期工具進行補充,這種模式也給調(diào)整留有余地。

音畫同步方面,李明觀察到通過更好的提示詞工程,可以提升HappyHorse 1.0、Seedance 2.0等模型的音畫同步效果,但這些模型目前在音畫同步維度多少還存在一些問題。

李明判斷,對企業(yè)而言,當(dāng)前視頻生成模型的生成質(zhì)量仍是一個普遍存在的痛點,部分創(chuàng)作團隊的“抽卡率”甚至高達50%-60%。生成的時效性也還有提升空間。

相比之下,價格反而是用戶更容易接受的維度。如果能做到又快又好,用戶對價格的接受度自然會隨之提高。

參與內(nèi)測的AI視頻創(chuàng)作平臺FLOVA相關(guān)團隊認(rèn)為,HappyHorse 1.0模型在真實感與敘事能力上表現(xiàn)不錯,尤其適合敘事性內(nèi)容、紀(jì)錄片風(fēng)格的題材。

同時,HappyHorse 1.0的焦段運用接近實拍,減輕了視頻的“AI感”,讓觀感更加真實,其鏡頭運動也比較自然。

結(jié)語:一匹有潛力的“快樂小馬”

從我們的體驗感受來看,HappyHorse 1.0可以是一款不錯的的視頻生成模型,其較強的指令遵循能力為專業(yè)創(chuàng)作者提供了更多的精細(xì)化控制的空間,一定程度上降低了反復(fù)抽卡、試錯帶來的資源浪費。

然而,HappyHorse 1.0的畫面還有不少可提升的空間,比如畫面的“油膩感”、物理準(zhǔn)確性等等。隨著HappyHorse進一步迭代,這一模型有望在真實生產(chǎn)場景中發(fā)揮更大作用。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
如今回歸上海申花的他,已順利入選國足名單,未婚妻身份不一般

如今回歸上海申花的他,已順利入選國足名單,未婚妻身份不一般

科學(xué)發(fā)掘
2026-04-27 11:00:37
李嘉欣美貌不再,和許晉亨一同看演唱會,近照疑醫(yī)美過度缺點盡顯

李嘉欣美貌不再,和許晉亨一同看演唱會,近照疑醫(yī)美過度缺點盡顯

娛樂團長
2026-04-27 20:27:36
85 歲何守信回港!TVB 頂級飯局曝光,港圈半壁江山齊聚

85 歲何守信回港!TVB 頂級飯局曝光,港圈半壁江山齊聚

橙星文娛
2026-04-27 13:23:53
4月27日人民幣對美元中間價調(diào)升95個基點

4月27日人民幣對美元中間價調(diào)升95個基點

證券時報
2026-04-27 09:44:06
你的星座咋定的?12個比內(nèi)娛還狗血的故事

你的星座咋定的?12個比內(nèi)娛還狗血的故事

混知
2026-04-21 16:17:16
51歲周迅變樣:滿頭白發(fā)臉?biāo)煽澹T嘴像老奶奶,無兒無女成遺憾

51歲周迅變樣:滿頭白發(fā)臉?biāo)煽,癟嘴像老奶奶,無兒無女成遺憾

悅君兮君不知
2026-03-20 12:19:00
太瘆人!男子曬小區(qū)電梯圖,網(wǎng)友調(diào)侃豪華火化爐,評論區(qū)毛骨悚然

太瘆人!男子曬小區(qū)電梯圖,網(wǎng)友調(diào)侃豪華火化爐,評論區(qū)毛骨悚然

譚談社會
2026-04-23 01:58:02
克魯斯堡不眠夜!世界前二領(lǐng)跑,吳宜澤壓著塞爾比打

克魯斯堡不眠夜!世界前二領(lǐng)跑,吳宜澤壓著塞爾比打

羅納爾說個球
2026-04-27 10:53:31
民進黨高層竟敢偷偷離臺,大陸火速行動!美國不仁,鄭麗文就不義

民進黨高層竟敢偷偷離臺,大陸火速行動!美國不仁,鄭麗文就不義

潮鹿逐夢
2026-04-27 16:00:04
兵敗如山倒!國產(chǎn)新能源或已經(jīng)證明:中國壓根不需要二線豪華品牌

兵敗如山倒!國產(chǎn)新能源或已經(jīng)證明:中國壓根不需要二線豪華品牌

詩酒趁的年華
2026-04-24 18:12:26
張雪峰離世一個月,多位愛將接連離職,真相扎心:情懷不能當(dāng)飯吃

張雪峰離世一個月,多位愛將接連離職,真相扎心:情懷不能當(dāng)飯吃

天馬幸福的人生
2026-04-27 00:16:15
馬加爵死刑背后:女同學(xué)透露一個難以啟齒的秘密

馬加爵死刑背后:女同學(xué)透露一個難以啟齒的秘密

深度報
2026-04-27 22:10:57
4個去中國化最徹底的國家,一個已全盤西化,一個正試圖恢復(fù)漢字

4個去中國化最徹底的國家,一個已全盤西化,一個正試圖恢復(fù)漢字

你是我心中最美星空
2026-04-26 07:15:09
國家電網(wǎng)第二批錄了10500人,清華才7個,一所你沒聽過的學(xué)校進了444人

國家電網(wǎng)第二批錄了10500人,清華才7個,一所你沒聽過的學(xué)校進了444人

老滿說高考
2026-04-24 20:13:49
美光科技、閃迪、西部數(shù)據(jù)、希捷科技等美股存儲股,盤前均漲約2%

美光科技、閃迪、西部數(shù)據(jù)、希捷科技等美股存儲股,盤前均漲約2%

每日經(jīng)濟新聞
2026-04-27 18:35:09
綠軍128-96狂勝76人,恩比德該被交易!東部懸念不大,騎士很絕望

綠軍128-96狂勝76人,恩比德該被交易!東部懸念不大,騎士很絕望

毒舌NBA
2026-04-27 09:47:46
寶媽花近20萬,住月子中心,月子餐是油炸食品,嬰兒床很多小蟲子

寶媽花近20萬,住月子中心,月子餐是油炸食品,嬰兒床很多小蟲子

川渝視覺
2026-04-27 22:30:05
一個正處級干部退休后的真實生活:落差比想象中大

一個正處級干部退休后的真實生活:落差比想象中大

細(xì)說職場
2026-04-27 14:11:52
6月新規(guī)來了!3類常見病三甲不再接診,今后看病別再跑錯地方

6月新規(guī)來了!3類常見病三甲不再接診,今后看病別再跑錯地方

復(fù)轉(zhuǎn)這些年
2026-04-26 18:48:03
亞冠冠軍次數(shù)榜:新月4冠歷史第一;韓國球隊共12次奪冠最多

亞冠冠軍次數(shù)榜:新月4冠歷史第一;韓國球隊共12次奪冠最多

懂球帝
2026-04-27 12:29:18
2026-04-27 23:16:49
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11700文章數(shù) 117048關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

財經(jīng)要聞

Meta 140億收購Manus遭中國發(fā)改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態(tài)度原創(chuàng)

本地
時尚
游戲
公開課
軍事航空

本地新聞

云游中國|逛世界風(fēng)箏都 留學(xué)生探秘中國傳統(tǒng)文化

絲巾的10種系法,愛美的女人必看

寶可夢新作Switch2版強鎖30幀!官方回應(yīng):我們太難了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外長折返伊斯蘭堡內(nèi)情披露

無障礙瀏覽 進入關(guān)懷版