国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

它沒有名字,沒有團(tuán)隊(duì)—卻在一周內(nèi)擊敗了全球最強(qiáng)的AI視頻模型

0
分享至


4月7日,一個(gè)沒有公司署名、沒有官方聲明、連GitHub倉庫都指向"即將上線"的視頻生成模型,悄悄出現(xiàn)在了全球最權(quán)威的AI視頻競技場Artificial Analysis的排行榜上。

七天之后,它登上了榜首。

它的名字叫HappyHorse-1.0。在Artificial Analysis的盲測體系中,文生視頻方向Elo分1333、圖生視頻方向Elo分1392,兩個(gè)榜單雙料第一,將字節(jié)跳動(dòng)的Seedance 2.0、快手的Kling 3.0、谷歌的Veo 3.1遠(yuǎn)遠(yuǎn)甩在身后。這是迄今為止圖生視頻方向的歷史最高分。

讓這件事更耐人尋味的是:在奪得榜首之前,沒有人知道它是誰做的。

這個(gè)排行榜,為什么騙不了人

大多數(shù)AI基準(zhǔn)測試都有同一個(gè)漏洞:發(fā)布數(shù)字的,正是做出模型的人。

Artificial Analysis不一樣。它的Video Arena采用的是盲測加Elo積分制——用戶提交一個(gè)提示詞,系統(tǒng)同時(shí)用兩個(gè)匿名模型生成視頻,用戶在不知道來源的情況下選出更好的那個(gè),票數(shù)按Elo算法(與國際象棋等級分相同的數(shù)學(xué)邏輯)累計(jì)成最終排名。60分的Elo差距,意味著一個(gè)模型在兩兩對決中大約有58%到59%的勝率。而HappyHorse-1.0在文生視頻方向領(lǐng)先第二名整整60分。

這個(gè)分?jǐn)?shù)是數(shù)萬個(gè)人類真實(shí)偏好投票的結(jié)果,沒有實(shí)驗(yàn)室的自我匯報(bào),沒有精心挑選的演示樣本。Artificial Analysis在宣布這個(gè)模型進(jìn)入競技場時(shí),用了一個(gè)詞:"pseudonymous"(匿名投稿)。換句話說,連平臺自己都不知道背后是誰。

那段時(shí)間,榜單上的排名每天都在變。HappyHorse-1.0短暫從榜單消失了一次,然后又回來了。事后復(fù)盤,那很可能不是技術(shù)故障,而是一次刻意的停頓——在確認(rèn)公開聲明之前,先暫時(shí)撤下。

在最好的時(shí)機(jī),踢開了最脆弱的門

4月10日,阿里巴巴旗下淘天集團(tuán)的Future Life Lab正式承認(rèn):HappyHorse-1.0是他們做的,隸屬ATH AI創(chuàng)新部門,技術(shù)負(fù)責(zé)人張迪,此前是快手副總裁、Kling AI的技術(shù)主導(dǎo)者。

這個(gè)時(shí)機(jī),幾乎算是精準(zhǔn)踩點(diǎn)。

就在HappyHorse出現(xiàn)前后,AI視頻生成賽道兩個(gè)最強(qiáng)的西方選手接連出了問題。OpenAI在2026年初關(guān)閉了Sora的獨(dú)立應(yīng)用和平臺,給出的理由是算力成本過高、戰(zhàn)略重心轉(zhuǎn)向AGI和企業(yè)工具;而字節(jié)跳動(dòng)的Seedance 2.0雖然憑借自帶剪輯分鏡的視頻效果引爆了AI漫劇行業(yè)(甚至有制作公司把上班時(shí)間改到凌晨三點(diǎn),只為搶占低峰期的算力),卻在全球推廣中撞上了好萊塢主要制片廠和流媒體平臺的版權(quán)投訴,被迫暫停國際擴(kuò)張。

兩強(qiáng)同時(shí)空出位置,留下了一個(gè)等待被填補(bǔ)的真空。用一位觀察者的話說:"HappyHorse不是打贏了對手,是對手在同一時(shí)間倒下了,而它剛好站在那里。"

當(dāng)然,"剛好站在那里"本身就需要過硬的東西。Elo分不會說謊。

一個(gè)架構(gòu)決定,讓音頻不再是"后期"

視頻生成領(lǐng)域長期存在一個(gè)隱性的分裂:生成視頻是一件事,配上聲音是另一件事,二者由不同的模型或工具完成,然后拼接在一起。這套流程的代價(jià)是明顯的——嘴型對不上,環(huán)境音突兀,配樂像是粘貼進(jìn)去的。

HappyHorse-1.0的架構(gòu)選擇打破了這個(gè)分裂。

它采用的是單流統(tǒng)一Transformer結(jié)構(gòu),40層自注意力網(wǎng)絡(luò),文字、圖像、視頻幀、音頻四種模態(tài)的token從始至終在同一個(gè)序列里處理,沒有專門的跨模態(tài)注意力模塊。官方的說法是"三明治架構(gòu)":首尾各4層模態(tài)專屬層,中間32層全模態(tài)共享層。音頻和視頻在生成過程中始終是同一次前向傳播(forward pass)的產(chǎn)物,不是事后合成的。

結(jié)果是什么?口型精確對上了語音,腳步聲踩在地面接觸的那一幀,背景噪音隨著場景切換自然過渡。它目前支持7種語言的音視頻同步生成,包括英語、普通話、粵語、日語、韓語、德語和法語。在"有音頻"類別的排行上,HappyHorse-1.0位列第二,僅次于谷歌Veo 3.1。

這個(gè)排名有意思的地方在于:在傳統(tǒng)上最難做好的維度,一個(gè)"神秘新來者"的表現(xiàn)接近了調(diào)動(dòng)了谷歌全部多模態(tài)研究積累的Veo系列。

開源的承諾,和一個(gè)"即將上線"的空鏈接

故事到這里有一個(gè)裂縫,值得直接說清楚。

HappyHorse-1.0官網(wǎng)上寫著:基礎(chǔ)模型、蒸餾模型、超分辨率模塊、推理代碼,全部開源,Apache 2.0授權(quán),允許商用。這在技術(shù)圈引發(fā)了大量轉(zhuǎn)發(fā)和期待。

截至4月14日,HuggingFace的模型頁已經(jīng)存在,README文檔在當(dāng)天仍在持續(xù)更新——但文件列表里只有兩個(gè)文件:.gitattributes 和 README.md。沒有模型權(quán)重,沒有推理代碼,沒有任何可以實(shí)際運(yùn)行的東西。比起此前各家官網(wǎng)指向的"coming soon"空鏈接,這是一個(gè)進(jìn)步,但距離"真正可用的開源"還差最關(guān)鍵的一步。

"名義上開源"和"真正可用的開源"之間,有一道需要被跨過的門。

對開發(fā)者來說,開源意味著能下載權(quán)重、運(yùn)行推理代碼、基于它做微調(diào)。目前這些都還不存在。阿里巴巴承諾了API接入的計(jì)劃,但時(shí)間表不明確。

這不是要否定這個(gè)模型的技術(shù)成就。Elo排名是真實(shí)的人類偏好數(shù)據(jù),跑不掉。但如果把HappyHorse-1.0納入實(shí)際產(chǎn)品決策,現(xiàn)在需要的不是Elo分,而是一個(gè)可以調(diào)用的接口或可以運(yùn)行的權(quán)重文件。兩者都還不在。

快手出走的人,在阿里做出了什么

前快手副總裁、Kling AI技術(shù)主導(dǎo)者張迪,是這個(gè)項(xiàng)目公開身份中可見度最高的名字。

Kling系列是快手在視頻生成賽道的代表作,2024年以流暢的人物動(dòng)作生成在業(yè)內(nèi)建立了口碑。張迪之后加入阿里巴巴淘天集團(tuán),主導(dǎo)了Future Life Lab。HappyHorse-1.0的推理速度優(yōu)化思路——用DMD-2蒸餾將去噪步驟壓縮到8步,配合自研的MagiCompiler推理編譯器——在Kling系列的工程迭代中能看到類似的脈絡(luò)。

這條人員流動(dòng)線索,某種程度上解釋了為什么一個(gè)"神秘模型"能在上線一周內(nèi)就達(dá)到歷史最高Elo分:做模型的人,不是第一次做模型了。

不過阿里的"認(rèn)領(lǐng)"聲明里有一句話耐人尋味:項(xiàng)目"仍在開發(fā)中"。這通常意味著眼前的版本不是終態(tài)——它更像是一次技術(shù)摸底,用真實(shí)榜單驗(yàn)證架構(gòu)方向是否正確,然后決定下一步怎么走。

當(dāng)Sora退出,戰(zhàn)場變成了中國公司的主場

更大的背景是:AI視頻生成這條賽道,正在快速變成一場中國公司之間的競爭。

OpenAI關(guān)閉Sora之后,其他主要選手還剩Runway Gen-4和Luma Dream Machine。但這兩家的Elo分與頭部中國模型的差距在過去三個(gè)月內(nèi)持續(xù)擴(kuò)大。字節(jié)的Seedance 2.0雖然遭遇版權(quán)風(fēng)波,但技術(shù)底子依然扎實(shí)。阿里的HappyHorse橫空出世,把Wan 2.7系列的既有積累與新架構(gòu)整合,直接沖到榜首。還有快手Kling 3.0、PixVerse V6持續(xù)迭代。

這不是一兩個(gè)爆款模型的偶然,而是整個(gè)中國視頻生成研究群體在過去兩年密集積累之后的集中浮現(xiàn)。

一個(gè)值得關(guān)注的價(jià)格信號:中國AI視頻工具目前的商用定價(jià),普遍在每秒生成內(nèi)容約4美分左右,而西方同類服務(wù)的價(jià)格高出數(shù)倍。如果HappyHorse-1.0的API如期開放,開發(fā)者將面臨一個(gè)真實(shí)的選擇:在畫質(zhì)和速度接近甚至超越的前提下,是否愿意把視頻生成底層依托在一個(gè)中國公司提供的接口上?

這個(gè)問題,答案不會只有一種。

Q&A

Q1:HappyHorse-1.0的Elo排名是否可信,會不會是刷榜?

Artificial Analysis Video Arena的機(jī)制本身針對刷榜做了設(shè)計(jì)——用戶看不到是哪個(gè)模型生成的,投票基于真實(shí)偏好,Elo算法會根據(jù)對手強(qiáng)度加權(quán)。另一個(gè)佐證是,HappyHorse在"有音頻"類別中排名第二,如果是刷榜優(yōu)化,通常會針對全部類別同時(shí)拉高,而非在某些維度有明顯落差。短期內(nèi)憑借某類生成風(fēng)格的優(yōu)化偶爾占優(yōu)是可能的,但持續(xù)領(lǐng)先60+ Elo分需要大量比賽場次的穩(wěn)定勝出,這不是短期操縱能做到的。

Q2:HappyHorse-1.0最核心的技術(shù)突破是什么?

最值得關(guān)注的是單流統(tǒng)一Transformer對音視頻的聯(lián)合建模。傳統(tǒng)模型把視頻和音頻分開生成再合并,導(dǎo)致同步誤差。HappyHorse把所有模態(tài)放進(jìn)同一個(gè)token序列,在一次推理過程中同時(shí)輸出視頻幀和同步音頻,這從根本上消除了"拼接"帶來的對不上問題。配合DMD-2蒸餾(8步去噪)和MagiCompiler加速,在H100上生成1080p視頻約38秒,比同級別模型快30%。

Q3:現(xiàn)在能用HappyHorse-1.0做項(xiàng)目嗎?

目前只能通過官方在線平臺試用,沒有公開的API接口,也沒有可下載的模型權(quán)重。HuggingFace頁面已上線,文檔持續(xù)在更新,但模型權(quán)重和推理代碼尚未發(fā)布。對需要接入實(shí)際產(chǎn)品或工作流的開發(fā)者和制作團(tuán)隊(duì)來說,HappyHorse-1.0現(xiàn)在的價(jià)值更多在于"了解技術(shù)方向",而非立刻可以落地部署的工具。

END本文來自至頂AI實(shí)驗(yàn)室,一個(gè)專注于對AI計(jì)算機(jī)、工作站及各類AI相關(guān)硬件設(shè)備,開展基于真實(shí)使用場景評測的研究機(jī)構(gòu)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
廣州提醒:快尋找安全室內(nèi)暫避!

廣州提醒:快尋找安全室內(nèi)暫避!

南方都市報(bào)
2026-04-17 11:25:20
名記:勇士騎士愿用中產(chǎn)或底薪簽詹姆斯

名記:勇士騎士愿用中產(chǎn)或底薪簽詹姆斯

體壇周報(bào)
2026-04-17 09:40:15
何小鵬:小鵬GX銷量目標(biāo)是行業(yè)TOP3以內(nèi),做汽車已很痛苦,不會涉足家電領(lǐng)域

何小鵬:小鵬GX銷量目標(biāo)是行業(yè)TOP3以內(nèi),做汽車已很痛苦,不會涉足家電領(lǐng)域

紅星資本局
2026-04-16 10:41:06
零食包裝上寫著“勿忘國恥是每個(gè)中國人的出廠設(shè)置”,廠家回應(yīng):這是老板的情懷,希望傳達(dá)正能量

零食包裝上寫著“勿忘國恥是每個(gè)中國人的出廠設(shè)置”,廠家回應(yīng):這是老板的情懷,希望傳達(dá)正能量

極目新聞
2026-04-17 09:51:27
武大楊某媛曬工作照被認(rèn)出!改名換姓被揭穿,品牌連夜切割跑路

武大楊某媛曬工作照被認(rèn)出!改名換姓被揭穿,品牌連夜切割跑路

奇思妙想草葉君
2026-04-17 01:45:38
古巴認(rèn)為美國可能發(fā)動(dòng)軍事侵略,五角大樓被曝正加緊制訂干預(yù)計(jì)劃

古巴認(rèn)為美國可能發(fā)動(dòng)軍事侵略,五角大樓被曝正加緊制訂干預(yù)計(jì)劃

上觀新聞
2026-04-17 03:28:16
張雪峰接班人自曝只睡三小時(shí),壓力很大,但公司穩(wěn)定!網(wǎng)友:現(xiàn)代版諸葛亮...

張雪峰接班人自曝只睡三小時(shí),壓力很大,但公司穩(wěn)定!網(wǎng)友:現(xiàn)代版諸葛亮...

品牌新
2026-04-16 20:03:27
恭喜!官方確認(rèn)東契奇坎寧安申訴成功獲評獎(jiǎng)資格 華子申訴被駁回

恭喜!官方確認(rèn)東契奇坎寧安申訴成功獲評獎(jiǎng)資格 華子申訴被駁回

醉臥浮生
2026-04-17 00:00:52
靈隱寺事件,遠(yuǎn)非低智表象那么簡單

靈隱寺事件,遠(yuǎn)非低智表象那么簡單

林中木白
2026-04-16 17:34:07
震驚!面館“免費(fèi)加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

震驚!面館“免費(fèi)加”被指性暗示,網(wǎng)友:99%的人不知哪有性暗示

火山詩話
2026-04-17 07:28:41
28.2%貧困率:米萊這瘋子,真把阿根廷從鬼門關(guān)拉回來了?

28.2%貧困率:米萊這瘋子,真把阿根廷從鬼門關(guān)拉回來了?

娛樂圈見解說
2026-04-16 19:54:32
“靈隱寺僧人是日本人、間諜”?抖音通報(bào)

“靈隱寺僧人是日本人、間諜”?抖音通報(bào)

觀察者網(wǎng)
2026-04-16 17:58:07
中國出生和死亡人口差距越來越大:2025年出生人口跌破800萬,凈減少339萬人

中國出生和死亡人口差距越來越大:2025年出生人口跌破800萬,凈減少339萬人

互聯(lián)網(wǎng)大觀
2026-04-16 12:37:44
匈牙利新總理馬扎爾將取消國營媒體!稱其為“謊言工廠”

匈牙利新總理馬扎爾將取消國營媒體!稱其為“謊言工廠”

項(xiàng)鵬飛
2026-04-16 19:28:44
小米會產(chǎn)10萬元以內(nèi)的汽車嗎?雷軍坐在新SU7上回應(yīng):10年以內(nèi)很難做到

小米會產(chǎn)10萬元以內(nèi)的汽車嗎?雷軍坐在新SU7上回應(yīng):10年以內(nèi)很難做到

極目新聞
2026-04-17 10:34:14
特寫:蘇林的十小時(shí)中國高鐵深度體驗(yàn)

特寫:蘇林的十小時(shí)中國高鐵深度體驗(yàn)

澎湃新聞
2026-04-17 08:57:38
中國代表:中方否決涉霍爾木茲海峽決議草案避免了局勢升級

中國代表:中方否決涉霍爾木茲海峽決議草案避免了局勢升級

環(huán)球網(wǎng)資訊
2026-04-17 08:15:23
最新:同濟(jì)大學(xué)已成立調(diào)查組

最新:同濟(jì)大學(xué)已成立調(diào)查組

南方都市報(bào)
2026-04-16 16:57:13
三級歐戰(zhàn)4強(qiáng)全出爐:英超4隊(duì)成大贏家!意甲全軍覆沒,創(chuàng)7年恥辱

三級歐戰(zhàn)4強(qiáng)全出爐:英超4隊(duì)成大贏家!意甲全軍覆沒,創(chuàng)7年恥辱

我愛英超
2026-04-17 06:35:13
生涯第一次!村神村上悠華的首次感謝祭來啦!

生涯第一次!村神村上悠華的首次感謝祭來啦!

吃瓜黨二號頭目
2026-04-17 09:13:32
2026-04-17 12:03:00
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
3306文章數(shù) 170關(guān)注度
往期回顧 全部

科技要聞

Anthropic推出Opus 4.7,坦言依不及Mythos

頭條要聞

牛彈琴:中東好消息來了 特朗普可能要親自去巴基斯坦

頭條要聞

牛彈琴:中東好消息來了 特朗普可能要親自去巴基斯坦

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

埃安N60預(yù)售11.58萬起 標(biāo)配激光雷達(dá)/零重力座椅

態(tài)度原創(chuàng)

本地
游戲
時(shí)尚
親子
軍事航空

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

臨時(shí)工喜加一?末日廢土RPG免費(fèi)領(lǐng)!PC主機(jī)都能玩

爆火的前額葉梗,讓多少年輕人主動(dòng)確診「腦殘」?

親子要聞

老婆夜里羊水突然破裂,連忙帶著去醫(yī)院檢查

軍事要聞

美宣布黎以?;?0天 以方稱不會撤軍

無障礙瀏覽 進(jìn)入關(guān)懷版