国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Pixverse悄悄上線世界模型R1,我做的AI視頻能無限實時交互了

0
分享至

AI視頻的下一步會是什么?

更快?更清晰?更可控?這些點都很明確了,

但我確實兒沒想到,我26年先看到的會是這樣一個,

能夠一邊打字一邊實時生成的新視頻生成模型,也可以叫實時世界模型,

Pixverse R1

可能我這么說,大家還感受不太到,直接給大家看一個case。

試玩demo https://realtime.pixverse.ai/

這個過程最頭皮發(fā)麻的地方在于,世界是連續(xù)的。

不是重新生成了一個新視頻,而是在剛剛那個世界的基礎(chǔ)上,實時地為林克裝備了一把武器。這感覺就像你在玩游戲時,突然擁有了開發(fā)者權(quán)限,可以隨時用語言為游戲增加新的元素。

這段演示里還有一個細節(jié),當指令變得復(fù)雜,比如讓怪物追趕林克時,怪物的行為會有些笨拙。


這種不完美反而證明了它不是一段預(yù)設(shè)好生成好拼接好的AI動畫,

而是一個真的擁有初步物理和行為邏輯的世界。

可能它的清晰度還不太完美,

但仔細想想從360p的AI視頻畫質(zhì)到穩(wěn)定低價的1080p,我們只用了18個月。

所以我根本不擔心這個問題,我關(guān)心的是它在根據(jù)我的指令,實時地進行演算。

這種可被觀察的演算過程,正是它與傳統(tǒng)AI視頻最大的不同。

修的都不是同一個體系,而且從他們技術(shù)報告上看,這個視頻能自己無限期演下去。


技術(shù)報告 https://pixverse.ai/en/blog/pixverse-r1-next-generation-real-time-world-model

R1叫世界模型,3D模型也叫世界模型,Banana2也叫世界模型,

用人話來說,世界知識就是給生成內(nèi)容裝上一個能自洽的底層引擎,讓它不止能把畫面長得像,還得把因果,物理,常識都對上號。

經(jīng)得起推敲的,不會穿幫的,能按照你模糊的提示語補充細節(jié)的。

打開Demo,打開麥克風,就這樣一邊說話,R1一邊就把劇情全出了。


聲畫一體的Sora和Veo都很強大,創(chuàng)作流程基本上也都是許愿-等待-開獎。

當我寫下一段幾百字的咒語,點擊生成,然后就是盯著進度條等。幾分鐘,甚至十幾分鐘后,才能打開那個盲盒。運氣好,開出神作;運氣不好,人物崩了,物理飛了,只能自認倒霉,回頭再去改那段天知道哪里不對的咒語,然后開始新一輪的抽卡。

Veo3.1還可以用json約束一下,但很多別的視頻模型還是要慢慢磨自然語言。


Pixverse這個就給我一個很新的感受,

它的整個過程其實有點像是導(dǎo)演在現(xiàn)場指揮演員。

你可以設(shè)想一下,在一個電視劇或電影的片場,演員在表演時,導(dǎo)演有時會在畫外音中進行一些實時指導(dǎo),告訴演員如何去演、做哪些動作,或者表情哪里不到位。

這樣的實時指導(dǎo)就非常像我現(xiàn)在用PixVerse R1的感覺,通過打字告訴視頻,我需要接下來的這個人物去進行怎樣的動作,或者進入到什么樣的場景。

這種交互體驗真的蠻能圓我導(dǎo)演夢的。

比如這個太空駕駛的場景,

一連串的文字像寫劇本一樣,實時駕駛著飛船逃離地球、飛向月球、遭遇神秘光線、最后被巨大的土星所震撼。我感覺自己不再是觀眾,而是第一人稱的導(dǎo)演。我輸入的每一個字,都像是在給飛船添加燃料,驅(qū)動著它飛向我想象中的下一幀。

再比如這個,直升機飛越巴黎時,輸入突然天空轉(zhuǎn)暗,電閃雷鳴,畫面立刻風云突變;接著輸入“遠處一個巨大的煙花綻放”,天空中真的就升起了一朵煙花,天氣也隨之轉(zhuǎn)晴。整個環(huán)境和特效都能配合著指令實時做出互動,是一個非常連續(xù)性的展示。

你就看這個Pixverse實機操作的錄屏界面,我感覺這玩意兒根本不只是一個視頻生成器,更像是一個可以被語言實時編程的微型世界。

我就好奇了,這背后到底是怎么做出來?為什么要做一個跟別人不一樣的?

我去啃了一下他們的技術(shù)論文,

用人話翻譯一下,R1能做到這個實時生成的效果,主要靠這三樣:

第一個是叫Omni的原生多模態(tài)大模型。

你可以把它想象成一個從小就同時學(xué)習了看、聽、說三種語言的天才。它不像別的模型需要把音視頻翻譯成文本才能懂,它天生就能在一個系統(tǒng)里,同時理解視頻、音頻和文字。這讓它的反應(yīng)快得像是本能。


第二個零件是一種叫自回歸的機制。

這東西就像一個擁有超強短期記憶的說書人,它永遠記得自己上一秒講了什么,所以下一秒的故事,總能和前面無縫銜接。這保證了視頻可以像一條無限的河流一樣,持續(xù)地連貫地生成下去。


最后,也是最關(guān)鍵的,是一種叫即時響應(yīng)引擎(IRE)的技術(shù)。

如果說傳統(tǒng)AI視頻生成,像是搭樂高,需要一步步拼接(幾十步的采樣),IRE就像是變魔術(shù),它能直接預(yù)測出最終成品的輪廓,然后用極少的步驟(一到四步)就把它變出來。


這些正是它能實現(xiàn)實時交互的秘密武器。

所以,它到底用在哪?

我個人是感覺,PixVerse R1這類實時模型,并非要取代Veo們在敘事性短片創(chuàng)作上的作用。它們其實可以并駕齊驅(qū),Sora們在追求成為頂級的電影工作流,

而R1正在努力成為一個充滿無限可能的互動娛樂引擎。

它真正開疆拓土的地方,在于那些極度依賴實時交互的領(lǐng)域。

比方游戲, 想象一下你走到NPC面前,不需要幾周目才能引導(dǎo)變化,不再是從預(yù)設(shè)的三個選項里選一句對話。你可以自由輸入任何你想說的話,NPC會根據(jù)他的性格和你們之前的經(jīng)歷,實時生成獨一無二的表情和互動場景,

我甚至可以開個上帝模式,對游戲世界本身下指令,

我希望我這個賽博釣魚佬可以回回上魚,那我真的要笑到合不上嘴了


也就是說,游戲,將從一個玩家只能被動體驗的故事,變成一個真正可參與的世界。

再再比方說互動電影,

現(xiàn)在去大商場體驗4D電影都要out了,我大膽想象一下,我可以擺脫A/B選項式的偽互動,隨時暫停,給主角下達一個全新的指令,別相信他,先看看他口袋里藏了什么,

然后電影會為你即時地生成一段新的故事脈絡(luò),我就經(jīng)常在想要是故事不會結(jié)束就好了。


盜夢空間這個陀螺我是真希望能看到它停下來,被一個新的幕后之人拿起來

寫到這里,

我突然想到了一個可能離我們每個人都更近的使用場景。

你有沒有過這樣的經(jīng)歷?

做了一個無比清晰的奇幻夢,畫面感強到你自己都起雞皮疙瘩,

但我醒來后想跟朋友描述,搜腸刮肚用了無數(shù)的形容詞,要不就發(fā)現(xiàn)忘了,要不就是形容不出來,

什么叫我在鰲太線拿著四塊壓縮餅干在大爺海煮火鍋?。ㄎ抑两裥稳莶怀鰜砩衩貓@究竟在我腦子里留下了什么)。

這還能聯(lián)系上一個科學(xué)名詞,

夢境遺忘(dream amnesia)

夢大多發(fā)生在REM期(快速眼動睡眠)或臨近醒來的過渡階段,醒來屬于從一個腦狀態(tài)跳到另一個腦狀態(tài),所以會出現(xiàn)一種典型的感覺,

就是我知道我剛剛看到了什么,但現(xiàn)在就是想不起來。

因為在夢里體驗的是視覺,空間,情緒,氛圍,象征感,但醒來我要把它壓縮成線性的句子的話,這個過程中會出現(xiàn)一種夢的不可言說感(dream ineffability)。

這時候想要最大程度保證夢不被遺忘,可以先寫關(guān)鍵詞,不要追求完整敘事,比如,銀色樓梯,潮濕的風,我逃跑的時候踩空了,也可以用感官描述替代抽象形容詞,光像浸水的霓虹、空氣里有鐵銹甜味、遠處的聲音像倒放的合唱。


說實話,我每天都在跟這種轉(zhuǎn)達的損耗作斗爭。

但R1這類實時模型的出現(xiàn),

或許為我們提供了一種全新的表達方式。

它能讓我能把那個轉(zhuǎn)瞬即逝的夢境,用一種更直觀,更無損的方式復(fù)現(xiàn)出來。

它將創(chuàng)作的反饋周期從數(shù)小時甚至數(shù)天,壓縮到了零。

而這種即時反饋極大地釋放了我的實驗精神和表達欲望。

現(xiàn)在已經(jīng)可以排隊內(nèi)測了,

目前能體驗360p了,

過幾天還能用上720p,

趁著還沒收費之前,

我要多跑五六七八九十個。

@ 作者 / 卡爾

最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉(zhuǎn)發(fā)|評論

如果想要第一時間收到推送,不妨給我個星標

如果你有更有趣的玩法,歡迎在評論區(qū)和我聊聊

更多的內(nèi)容正在不斷填坑中……


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
綠皮車上坐滿了“限高”的創(chuàng)業(yè)者

綠皮車上坐滿了“限高”的創(chuàng)業(yè)者

芥末堆看教育
2026-04-20 10:37:31
離婚2年,郭晉安帶兒子住澳門35萬一晚的酒店,18歲兒子出鏡帥氣

離婚2年,郭晉安帶兒子住澳門35萬一晚的酒店,18歲兒子出鏡帥氣

離離言幾許
2026-04-19 12:27:03
大數(shù)據(jù)分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

大數(shù)據(jù)分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

深度報
2026-04-18 23:37:27
西方媒體:就算中國全力以赴,也不可能按時建成這樣龐大的工程

西方媒體:就算中國全力以赴,也不可能按時建成這樣龐大的工程

泠泠說史
2026-04-20 20:17:23
最近你發(fā)現(xiàn)沒有,好多城市的路口、天橋底下,突然冒出一群怪人。

最近你發(fā)現(xiàn)沒有,好多城市的路口、天橋底下,突然冒出一群怪人。

阿振觀點
2026-04-20 06:02:48
終其一生,滿是遺憾

終其一生,滿是遺憾

青蘋果sht
2026-04-08 05:13:36
AI藝人庫引爭議的愛奇藝:CEO曾稱AI降低影視制作成本

AI藝人庫引爭議的愛奇藝:CEO曾稱AI降低影視制作成本

南方都市報
2026-04-20 21:13:04
英海事分析公司:過去36小時有35艘船只在駛出霍爾木茲海峽途中掉頭

英海事分析公司:過去36小時有35艘船只在駛出霍爾木茲海峽途中掉頭

界面新聞
2026-04-20 08:43:33
曼聯(lián)5000萬歐報價皇馬中場:卡里克需要這張牌嗎

曼聯(lián)5000萬歐報價皇馬中場:卡里克需要這張牌嗎

熱血體育社
2026-04-21 05:33:56
恭喜!曾春蕾當選,成中國女排接應(yīng)第一人,江川給她做副手

恭喜!曾春蕾當選,成中國女排接應(yīng)第一人,江川給她做副手

跑者排球視角
2026-04-20 22:01:45
隨著巴黎圣日耳曼爆大冷門1-2,法甲最新積分榜出爐:爭冠白熱化

隨著巴黎圣日耳曼爆大冷門1-2,法甲最新積分榜出爐:爭冠白熱化

側(cè)身凌空斬
2026-04-20 07:55:12
馬英九基金會風暴,李德維怒了,向馬英九開火,蕭旭岑回應(yīng)亮了

馬英九基金會風暴,李德維怒了,向馬英九開火,蕭旭岑回應(yīng)亮了

DS北風
2026-04-20 16:48:04
法國掠奪中國的十大代表文物(附高清大圖),未來能否歸還?

法國掠奪中國的十大代表文物(附高清大圖),未來能否歸還?

文史道
2026-04-17 15:33:28
賠了夫人又折兵!以為能“毀掉”全紅嬋,不料自己先被扒個底朝天

賠了夫人又折兵!以為能“毀掉”全紅嬋,不料自己先被扒個底朝天

樂享人生風雨
2026-04-15 20:41:09
胡歌沒有后悔過嗎,這么曼妙的腿誰舍得放手?

胡歌沒有后悔過嗎,這么曼妙的腿誰舍得放手?

草莓解說體育
2026-04-21 00:54:24
61歲女子每天早上牛奶配雞蛋,1年后去體檢,身體各項指標咋樣了

61歲女子每天早上牛奶配雞蛋,1年后去體檢,身體各項指標咋樣了

芹姐說生活
2026-04-20 14:11:04
油價大暴跌!今天4月20日調(diào)整后,全國加油站92、95汽油最新售價

油價大暴跌!今天4月20日調(diào)整后,全國加油站92、95汽油最新售價

娛樂圈的筆娛君
2026-04-21 01:58:23
對標優(yōu)衣庫,干翻宜家?這家“摳門”會員店,憑什么讓中產(chǎn)上癮

對標優(yōu)衣庫,干翻宜家?這家“摳門”會員店,憑什么讓中產(chǎn)上癮

青眼財經(jīng)
2026-04-20 14:48:46
狂跌90%!造假成風,中產(chǎn)追捧的網(wǎng)紅飲品淪為“智商稅”!

狂跌90%!造假成風,中產(chǎn)追捧的網(wǎng)紅飲品淪為“智商稅”!

青眼財經(jīng)
2026-04-20 15:03:39
大風突襲,山東一飯店老板霸氣喊話“不用結(jié)賬,直接回家”!老板娘:損失兩三千,不心疼錢,只想讓顧客安全到家

大風突襲,山東一飯店老板霸氣喊話“不用結(jié)賬,直接回家”!老板娘:損失兩三千,不心疼錢,只想讓顧客安全到家

大象新聞
2026-04-20 17:43:06
2026-04-21 06:23:00
卡爾的AI沃茨 incentive-icons
卡爾的AI沃茨
前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學(xué)習體系,讓1萬人通過Al提高生產(chǎn)力
250文章數(shù) 126關(guān)注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

親子
本地
家居
房產(chǎn)
公開課

親子要聞

居家防夾刻不容緩,多名兒童在家玩鬧時手指被夾斷

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

家居要聞

自然慢調(diào) 慢享時光

房產(chǎn)要聞

大規(guī)模商改?。『?谖骱0叮@波項目要贏麻了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版