国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

老黃萬億美元夢(mèng)成真,英偉達(dá)版「世界模型」震撼問世

0
分享至


新智元報(bào)道

編輯:KingHZ 好困

【新智元導(dǎo)讀】黃仁勛的預(yù)言成真!從Sora的夢(mèng)幻視頻到英偉達(dá)的3D通才模型,AI不再只是「看和說」,而是真正「動(dòng)手」構(gòu)建3D世界,開啟機(jī)器人時(shí)代的無限可能。

黃仁勛沒有吹牛!

AI不能只會(huì)看、會(huì)說、會(huì)生成,它還必須理解并遵守物理世界的規(guī)則。

現(xiàn)在,英偉達(dá)補(bǔ)上了關(guān)鍵拼圖——

讓AI從「生成畫面」升級(jí)為「生成可行動(dòng)的3D世界」,不僅能描述世界,還能一步步搭建世界、修改世界、糾錯(cuò)迭代。

時(shí)間撥回到兩年前, 2024年2月。

OpenAI發(fā)布了一段「東京街頭漫步」的Sora視頻,震驚世界,硅谷集體狂歡。


人們高呼「現(xiàn)實(shí)不存在了」,仿佛人終于可以「言出法隨」、重造萬物。

但在一片喧囂中,那個(gè)穿皮衣的男人始終保持冷靜,甚至帶有一絲不屑。

在2024年和2025年的多次演講中,黃仁勛像復(fù)讀機(jī)一樣不斷重復(fù)——「PhysicalAI」(物理AI)。





反駁視頻生成模型的理由是這樣的:

AI生成的視頻很美,但如果你走進(jìn)那個(gè)視頻,試圖拿起桌上的杯子,你的手會(huì)穿過去。

杯子沒有重量,沒有摩擦力,沒有物理法則。

那不是世界,那是動(dòng)畫片。下一波浪潮,必須是懂物理的AI。

當(dāng)時(shí),很多人以為這只是老黃的營銷話術(shù),最終目的是為了推銷昂貴的Omniverse平臺(tái)和RTX顯卡。

直到CES 2026,大家才明白老黃說的對(duì)。


剛剛,我們發(fā)現(xiàn)英偉達(dá)甩出了一篇新年第一篇論文:3D通才模型。


鏈接:https://research.nvidia.com/publication/2026-03_3d-generalist-vision-language-action-models-crafting-3d-worlds

如果說ChatGPT是AI學(xué)會(huì)了「說話」,Sora是AI學(xué)會(huì)了「做夢(mèng)」,那么英偉達(dá)的這個(gè)新模型,就是讓AI真正「睜眼看世界,動(dòng)手造世界」。

這是圖形學(xué)的勝利,這是「硅基生命」長出四肢的前夜。

老黃沒有畫餅——

物理AI的「ChatGPT時(shí)刻」,在這一刻,正式降臨。


英偉達(dá)開年首篇論文

手搓賽博房之家

這篇論文由英偉達(dá)和斯坦福大學(xué)合作,正式發(fā)表在今年第十三屆國際三維視覺會(huì)議上,標(biāo)題相當(dāng)拗口——

《3D Generalist:Vision-Language-Action Models for Crafting 3D Worlds》(3D通才:用于構(gòu)建三維世界的視覺-語言-動(dòng)作模型)。


2026年3月20日至23日,第十三屆國際三維視覺會(huì)議2在加拿大不列顛哥倫比亞省溫哥華的溫哥華會(huì)議中心以線下形式舉行

我們要讀懂這次技術(shù)革命,首先要從這篇論文標(biāo)題里,把那個(gè)最核心的單詞揪出來。

請(qǐng)盯住這個(gè)詞:Action(動(dòng)作/行動(dòng))。

這是整個(gè)邏輯的起點(diǎn)。

在過去的三年里,無論是Midjourney畫圖,還是Runway生成視頻,AI扮演的角色都是「觀察者」和「夢(mèng)想家」。

它看了一億張貓的照片,然后根據(jù)概率,在屏幕上預(yù)測下一排像素應(yīng)該是什么顏色,從而湊出一只貓的樣子。

它不知道貓有骨骼,不知道貓毛有觸感,它只是在「模仿視覺信號(hào)」。

但英偉達(dá)的VLA(Vision-Language-Action)模型,徹底顛覆了這個(gè)邏輯。

它不再是畫家,而是「全能手」。

你只要輸入一句話,3D-GENERALIST就能輸出包含完整3D布局的房屋。

這些3D布局包括材料、固定裝置(比如門和窗戶)、3D資產(chǎn)以及照明配置。


背后的理念是,構(gòu)建一個(gè)既詳細(xì)又與文本描述相符的3D環(huán)境,應(yīng)該被視為一個(gè)過程,需要依次做出決策。

因此,通過場景級(jí)和素材級(jí)的策略,他們不斷改進(jìn)和優(yōu)化這些3D環(huán)境。

在提出的框架中,第一個(gè)重要的模塊是全景環(huán)境生成。

如圖2所示,這個(gè)模塊能夠根據(jù)文本描述初始化一個(gè)基礎(chǔ)的3D房間模型,包括墻壁、地板以及固定裝置,如門和窗戶。

為了避免傳統(tǒng)方法過于簡化或不切實(shí)際的問題,他們首先利用全景擴(kuò)散模型生成一個(gè)360°的圖像作為指導(dǎo),然后通過逆圖形技術(shù)構(gòu)建3D環(huán)境。


圖2:3D-GENERALIST全景環(huán)境生成概述。全景擴(kuò)散模型生成引導(dǎo)性360°場景圖像,然后房間布局估計(jì)模型、Grounded-SAM和視覺語言模型提取角落、窗戶和門的信息。這些預(yù)測隨后被用于通過程序化方式構(gòu)建帶有構(gòu)件的3D房間

這個(gè)過程包括以下幾個(gè)步驟:

  1. 房間布局估算:利用全景圖像和HorizonNet模型,推斷出房間的基本結(jié)構(gòu),如墻壁、地板和天花板。

  2. 固定裝置分割:使用Grounded SAM技術(shù)對(duì)窗戶和門進(jìn)行分割。

  3. 視覺-語言模型注釋:通過GPT-4o這樣的視覺-語言模型,分析每個(gè)分割區(qū)域,確定其類型(例如單扇門、雙扇門、滑動(dòng)門或折疊門)和材料(如門框、門體和門把手的材料)。

  4. 過程化生成:最后,根據(jù)3D位置的相應(yīng)信息,房間、門和窗戶被逐步構(gòu)建出來。

3D-Generalist 使用擴(kuò)散模型生成全景圖像,并通過逆向圖形(inverse graphics)流水線來創(chuàng)建3D環(huán)境的結(jié)構(gòu)。

3D-Generalist采用視覺-語言-動(dòng)作(VLA)模型來生成代碼,用于構(gòu)建與修改最終3D環(huán)境的各個(gè)方面(材質(zhì)、光照、素材與布局)。

該VLA通過一個(gè)自我改進(jìn)訓(xùn)練循環(huán)進(jìn)行微調(diào),以優(yōu)化與提示詞(prompt)的對(duì)齊效果。

3D-Generalist還使用了另一個(gè)VLA來處理多樣化的小物體擺放任務(wù),即使 3D素材是無標(biāo)注(unlabeled)的也能完成。

微調(diào)后(After Finetuning),3D-Generalist涌現(xiàn)出自我糾錯(cuò)行為。


研究團(tuán)隊(duì)還使用Florence-2框架,在由3D-Generalist生成的3D環(huán)境渲染得到的合成數(shù)據(jù)上訓(xùn)練一個(gè)視覺基礎(chǔ)模型。


結(jié)果表明:其效果接近使用規(guī)模大幾個(gè)數(shù)量級(jí)的真實(shí)數(shù)據(jù)所能達(dá)到的效果。


物理AI的ChatGPT時(shí)刻,已開啟?

如果你認(rèn)為黃仁勛費(fèi)盡心機(jī)搞這個(gè),只是為了讓你玩游戲更爽,或者讓視覺特效更便宜,那你嚴(yán)重低估了英偉達(dá)的野心。

英偉達(dá)不只是買買游戲顯卡,更致力于解決「智能」算力問題。

這篇論文的真正戰(zhàn)略意圖,其實(shí)藏在英偉達(dá)宏大的「具身智能」(Embodied AI)版圖中。

老黃早已押注機(jī)器人,他認(rèn)為那是一個(gè)數(shù)萬億美元的機(jī)遇:


這次無疑是英偉達(dá)「秀肌肉」。

請(qǐng)看這個(gè)邏輯鏈條:

  1. 我們想要全能的機(jī)器人(比如特斯拉Optimus,或英偉達(dá)Project GR00T)。

  2. 機(jī)器人需要學(xué)會(huì)像人一樣處理復(fù)雜的物理世界(怎么拿雞蛋不碎?怎么在濕滑地板上走路?)。

  3. 在真實(shí)世界里訓(xùn)練機(jī)器人太慢、太貴、且不可逆(你不能讓機(jī)器人摔壞一萬個(gè)雞蛋,或者摔斷一千次腿)。

  4. 解決方案:把機(jī)器人扔進(jìn)「虛擬世界」里訓(xùn)練。

但是,以前的虛擬世界(模擬器)不僅搭建很慢,而且不夠真實(shí)。

如果模擬器里的物理規(guī)則和現(xiàn)實(shí)不一樣,機(jī)器人學(xué)出來的本事就是花拳繡腿,一上真機(jī)就撲街。

現(xiàn)在,新模型「3D通才」補(bǔ)上了這一環(huán)。

有了這個(gè)技術(shù),英偉達(dá)可以瞬間生成數(shù)百萬個(gè)包含不同物理變量的「虛擬平行宇宙」。

  • 場景A:地板剛拖過,很滑,光線昏暗。

  • 場景B:地板鋪了地毯,摩擦力大,強(qiáng)光照射。

  • 場景C:地板上散落著樂高積木,障礙物復(fù)雜。

在這個(gè)無限生成的「3D物理世界」里,機(jī)器人大腦可以在一天之內(nèi)經(jīng)歷人類幾百年的訓(xùn)練時(shí)長。它在虛擬世界里摔倒一億次,就是為了在現(xiàn)實(shí)世界里穩(wěn)穩(wěn)地邁出第一步。

在英偉達(dá)的Omniverse生態(tài)中,研究團(tuán)隊(duì)使用Omniverse Replicator實(shí)現(xiàn)大規(guī)模合成數(shù)據(jù)生成,并支持域隨機(jī)化(domain randomization);Isaac Lab提供可直接使用的具身載體(例如人形機(jī)器人),可在這些生成環(huán)境中進(jìn)行機(jī)器人仿真。



這才是「物理AI」的終極目標(biāo):打通Sim-to-Real(從模擬到現(xiàn)實(shí))的最后一公里。

黃仁勛構(gòu)建的不僅僅是一個(gè)生成的引擎,它是硅基生命誕生的子宮。

所有移動(dòng)之物,終將自主

當(dāng)AI不僅掌握了人類的語言(GPT),掌握了人類的視覺(Sora),現(xiàn)在又掌握了構(gòu)建物理世界的法則(Physcial AI)時(shí),虛擬與現(xiàn)實(shí)的界限,將不再是涇渭分明的。

我們?cè)谄聊焕飫?chuàng)造的世界,將擁有和現(xiàn)實(shí)世界一樣的重力、光影和因果律。

而我們?cè)诂F(xiàn)實(shí)世界里的機(jī)器人,將擁有在數(shù)億個(gè)虛擬世界里磨練出來的智慧。

在2024年的SIGGRAPH大會(huì)上,黃仁勛曾說:「Everything that moves will be autonomous.」(所有移動(dòng)之物,終將自主。)


當(dāng)時(shí)我們以為他在說機(jī)器人。

現(xiàn)在看來,他說的是整個(gè)物理世界。

作者介紹

Fan-Yun Sun


Fan-Yun Sun是斯坦福大學(xué)AI實(shí)驗(yàn)室(SAIL)的計(jì)算機(jī)科學(xué)博士生,隸屬于Autonomous Agents Lab和斯坦福視覺與學(xué)習(xí)實(shí)驗(yàn)室(SVL)。

在讀博期間,他也深度參與了英偉達(dá)研究院的工作,曾效力于學(xué)習(xí)與感知研究組、Metropolis深度學(xué)習(xí)(Omniverse)以及自動(dòng)駕駛汽車研究組。

他的研究興趣主要在于生成具身(3D)環(huán)境與數(shù)據(jù),用于訓(xùn)練機(jī)器人和強(qiáng)化學(xué)習(xí)策略;致力于推動(dòng)具身、多模態(tài)基礎(chǔ)模型及其推理能力的發(fā)展。

Shengguang Wu


Shengguang Wu目前是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的博士生,師從Serena Yeung-Levy教授。

他在北京大學(xué)獲得碩士學(xué)位,導(dǎo)師為Qi Su教授;此前,他也曾在Qwen團(tuán)隊(duì)擔(dān)任研究實(shí)習(xí)生。

他的研究致力于賦予機(jī)器跨多模態(tài)的類人學(xué)習(xí)與推理能力,并推動(dòng)現(xiàn)實(shí)應(yīng)用的落地。

  • 多模態(tài)Grounding與推理:利用視覺洞察來優(yōu)化基于語言的推理,同時(shí)引入文本反饋來指導(dǎo)細(xì)粒度的視覺感知。

  • 自我提升:讓AI智能體能夠從交互中學(xué)習(xí)并持續(xù)自我進(jìn)化——主動(dòng)適應(yīng)新信息,并隨著新任務(wù)的出現(xiàn)不斷成長。

Jiajun Wu


吳佳俊是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系助理教授,同時(shí)兼任心理學(xué)系助理教授。

在加入斯坦福之前,他曾在Google Research擔(dān)任訪問研究員,與Noah Snavely合作。

他本科畢業(yè)于清華大學(xué)交叉信息研究院「姚班」,師從屠卓文(Zhuowen Tu)教授。在清華期間,他曾連續(xù)三年保持年級(jí)第一,并榮獲清華大學(xué)最高榮譽(yù)——特等獎(jiǎng)學(xué)金以及「中國大學(xué)生年度人物」稱號(hào)。

隨后,他在麻省理工學(xué)院獲得電氣工程與計(jì)算機(jī)科學(xué)博士學(xué)位,導(dǎo)師是Bill Freeman和Josh Tenenbaum。

吳佳俊的團(tuán)隊(duì)致力于物理場景理解的研究——即構(gòu)建能夠「看」見世界、進(jìn)行推理并與物理世界互動(dòng)的機(jī)器,其代表性項(xiàng)目包括Galileo、MarrNet、4D Roses、Neuro-Symbolic Concept Learner以及Scene Language。

除了開發(fā)表征本身,團(tuán)隊(duì)還同步探索這些表征在各個(gè)領(lǐng)域的應(yīng)用:

  • 多模態(tài)感知,代表項(xiàng)目如ObjectFolder和RealImpact;

  • 4D物理世界的視覺生成,代表項(xiàng)目如3D-GAN、pi-GAN、Point-Voxel Diffusion、SDEdit和WonderWorld;

  • 基于物理概念接地的視覺推理,代表項(xiàng)目如NS-VQA、Shape Programs、CLEVRER和LEFT;

  • 機(jī)器人學(xué)與具身智能,代表項(xiàng)目如RoboCook和BEHAVIOR。

Shangru Li

Shangru Li是英偉達(dá)高級(jí)系統(tǒng)軟件工程師,長期從事智能視頻分析(IVA)和Metropolis平臺(tái)的相關(guān)工作。

他擁有賓夕法尼亞大學(xué)計(jì)算機(jī)圖形學(xué)與游戲技術(shù)工程碩士學(xué)位,以及廣東外語外貿(mào)大學(xué)計(jì)算機(jī)軟件工程學(xué)士學(xué)位。

其他華人作者還有:

  • Haoming Zou (Stanford University)

  • Yu-Hsin Chou (Stanford University)

  • Xunlei Wu (NVIDIA)

參考資料:

https://research.nvidia.com/publication/2026-03_3d-generalist-vision-language-action-models-crafting-3d-worlds


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
斯諾克排名賽官宣!3位中國名將退賽,趙心童沖第5冠,附首輪賽程

斯諾克排名賽官宣!3位中國名將退賽,趙心童沖第5冠,附首輪賽程

球場沒跑道
2026-01-24 10:38:10
連續(xù)6戰(zhàn)得分上雙!快船撿漏64萬奇兵:小卡哈登喜獲攻防一體絕配

連續(xù)6戰(zhàn)得分上雙!快船撿漏64萬奇兵:小卡哈登喜獲攻防一體絕配

李喜林籃球絕殺
2026-01-24 16:48:04
多部門出手,嫣然醫(yī)院新地址已定!但面臨一個(gè)大難題 原房東曝更多

多部門出手,嫣然醫(yī)院新地址已定!但面臨一個(gè)大難題 原房東曝更多

瓜哥的動(dòng)物日記
2026-01-24 14:12:55
曝李亞鵬直播帶貨殺瘋了!一晚賣超7500萬,躍居平臺(tái)帶貨總榜第一

曝李亞鵬直播帶貨殺瘋了!一晚賣超7500萬,躍居平臺(tái)帶貨總榜第一

小徐講八卦
2026-01-24 13:18:59
特朗普暴跳如雷,短短兩天他領(lǐng)教了:歐俄的精明、中國的頂級(jí)陽謀

特朗普暴跳如雷,短短兩天他領(lǐng)教了:歐俄的精明、中國的頂級(jí)陽謀

青煙小先生
2026-01-24 11:56:26
藥師提醒:銀杏葉片、血塞通、復(fù)方丹參片,心腦血管用藥別再選錯(cuò)

藥師提醒:銀杏葉片、血塞通、復(fù)方丹參片,心腦血管用藥別再選錯(cuò)

蜉蝣說
2026-01-17 18:36:03
50歲以上的阿姨好看打扮一下,一樣很有魅力

50歲以上的阿姨好看打扮一下,一樣很有魅力

牛彈琴123456
2026-01-24 17:21:29
葉一茜帶女兒游福州三坊七巷,17歲森碟簪花溫婉,化淡妝還戴美甲

葉一茜帶女兒游福州三坊七巷,17歲森碟簪花溫婉,化淡妝還戴美甲

阿纂看事
2026-01-24 14:09:54
美軍連夜撤離,把臺(tái)灣扔給解放軍!055帶刀侍衛(wèi)殺到,北京收網(wǎng)?

美軍連夜撤離,把臺(tái)灣扔給解放軍!055帶刀侍衛(wèi)殺到,北京收網(wǎng)?

阿傖說事
2026-01-23 15:12:38
僅英軍就在阿富汗陣亡457人,要求特朗普道歉!ICE堪比納粹黨衛(wèi)軍

僅英軍就在阿富汗陣亡457人,要求特朗普道歉!ICE堪比納粹黨衛(wèi)軍

鷹眼Defence
2026-01-24 17:44:22
中國“超豪華”車型年度排位:100萬元以上冠軍車,年銷16854臺(tái)

中國“超豪華”車型年度排位:100萬元以上冠軍車,年銷16854臺(tái)

柳先說
2026-01-24 20:30:09
玻璃中鋒!打破隊(duì)史紀(jì)錄!湖人取消交易后悔嗎?

玻璃中鋒!打破隊(duì)史紀(jì)錄!湖人取消交易后悔嗎?

籃球教學(xué)論壇
2026-01-24 17:27:39
大齡剩女崩潰的瞬間是什么時(shí)候?網(wǎng)友:多年的舔狗突然結(jié)婚

大齡剩女崩潰的瞬間是什么時(shí)候?網(wǎng)友:多年的舔狗突然結(jié)婚

夜深愛雜談
2026-01-20 18:56:34
20元香煙四強(qiáng)同臺(tái)競技!哪款才是煙民心中的 “口糧之王”?

20元香煙四強(qiáng)同臺(tái)競技!哪款才是煙民心中的 “口糧之王”?

復(fù)轉(zhuǎn)這些年
2026-01-22 23:45:26
特朗普承認(rèn)美國在委內(nèi)瑞拉使用秘密武器,俄羅斯稱將調(diào)查搜集相關(guān)信息

特朗普承認(rèn)美國在委內(nèi)瑞拉使用秘密武器,俄羅斯稱將調(diào)查搜集相關(guān)信息

紅星新聞
2026-01-24 11:33:24
3連勝!中國莎娃殺瘋:首進(jìn)澳網(wǎng)16強(qiáng)+獎(jiǎng)金230萬 世界排名沖到第33

3連勝!中國莎娃殺瘋:首進(jìn)澳網(wǎng)16強(qiáng)+獎(jiǎng)金230萬 世界排名沖到第33

風(fēng)過鄉(xiāng)
2026-01-24 18:14:53
女子因肺栓塞不幸走了!醫(yī)生:天冷寧愿躺一天,也別干這5事!

女子因肺栓塞不幸走了!醫(yī)生:天冷寧愿躺一天,也別干這5事!

健康之光
2026-01-13 10:54:55
最新研究:烹飪3天,可引發(fā)肺炎,持續(xù)7天重創(chuàng)腸道;助推癌癥和心血管疾病,但這些方法可緩解

最新研究:烹飪3天,可引發(fā)肺炎,持續(xù)7天重創(chuàng)腸道;助推癌癥和心血管疾病,但這些方法可緩解

腫瘤醫(yī)學(xué)論壇
2026-01-22 18:54:02
35歲俄羅斯姑娘卡佳遠(yuǎn)嫁成都,和老公離婚后搬走,離婚一分錢沒要

35歲俄羅斯姑娘卡佳遠(yuǎn)嫁成都,和老公離婚后搬走,離婚一分錢沒要

南權(quán)先生
2026-01-24 05:15:03
猶太財(cái)團(tuán)又要開始賣國了,大規(guī)模資產(chǎn)轉(zhuǎn)移后,貝萊德:美國沒救了

猶太財(cái)團(tuán)又要開始賣國了,大規(guī)模資產(chǎn)轉(zhuǎn)移后,貝萊德:美國沒救了

老范談史
2026-01-13 20:15:38
2026-01-24 21:04:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14401文章數(shù) 66527關(guān)注度
往期回顧 全部

科技要聞

特斯拉Cybercrab即將落地 每公里不到1塊錢

頭條要聞

安徽女教師校內(nèi)宿舍病亡2天后才被發(fā)現(xiàn) 學(xué)校:建議起訴

頭條要聞

安徽女教師校內(nèi)宿舍病亡2天后才被發(fā)現(xiàn) 學(xué)校:建議起訴

體育要聞

當(dāng)家球星打替補(bǔ),他們?cè)诠室鈹[爛?

娛樂要聞

回歸還是頂流 鳳凰傳奇將現(xiàn)身馬年春晚

財(cái)經(jīng)要聞

“百年老字號(hào)”張小泉遭60億債務(wù)壓頂

汽車要聞

有增程和純電版可選 日產(chǎn)NX8或于3-4月間上市

態(tài)度原創(chuàng)

家居
藝術(shù)
教育
親子
軍事航空

家居要聞

在家度假 160平南洋混搭宅

藝術(shù)要聞

梁益君 2025風(fēng)景油畫寫生

教育要聞

高三生注意!2026年四川高校體育單招簡章發(fā)布

親子要聞

孩子的改變真是一瞬間,以前哭嚎著不去幼兒園,上了三年哭了三年,一提幼兒園就惱,自從開始上小學(xué)了,突然...

軍事要聞

俄美烏首次三方會(huì)談在阿聯(lián)酋舉行

無障礙瀏覽 進(jìn)入關(guān)懷版