国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

95后博士休學(xué)創(chuàng)業(yè)押注AI空間游戲,未上線先出圈吸粉百萬

0
分享至

過去,我們經(jīng)歷和見證了不同模態(tài) APP 在不同階段的發(fā)展:從 QQ 和天涯的文本模態(tài),到博客、QQ 空間、微博的圖文模態(tài),往后到土豆、優(yōu)酷等視頻模態(tài),再到現(xiàn)在以抖音、快手為代表的短視頻。

就在創(chuàng)業(yè)者們用 AI 在文本、圖像、視頻生成的領(lǐng)域中“卷生卷死”之際,生境科技(Sengine Technology)的 CEO 劉紫東帶領(lǐng)團(tuán)隊(duì)選擇了另一條路徑——空間。他認(rèn)為,每個(gè)時(shí)代真正的機(jī)會(huì)來自新的模態(tài),而不是在舊模態(tài)里做得更精致??臻g,正是像視頻一樣可以被大眾創(chuàng)作、交互和變現(xiàn)的下一代模態(tài)。

世界模型有多條技術(shù)路線:有以時(shí)間理解、動(dòng)作幀預(yù)測為核心的視頻大模型(如 DeepMind 的 Gennie 3),有專注隱式空間表達(dá)(楊立昆),還有一個(gè)主要的類別,就是 3D 場景生成。其中,又細(xì)分成基于 3D 高斯?jié)姖u的純視覺表皮還原(李飛飛的 World Labs)和離散實(shí)體的組合與布局(如Autodesk、普林斯頓 infinigen)等。

劉紫東認(rèn)為后者更貼近實(shí)際應(yīng)用,他將空間生成還原為兩個(gè)最基本的問題:擺什么,以及擺在哪。這種構(gòu)建空間的敘事邏輯更多基于人類的實(shí)際需求,而非生成一層表皮的純視覺方案?!坝ミ_(dá)、Autodesk 等大廠和 MIT、普林斯頓等高校實(shí)驗(yàn)室都在持續(xù)研究這條技術(shù)路線,但是我們的算法是最先能達(dá)到商業(yè)落地的?!彼f。

在這條獨(dú)特技術(shù)路徑背后,是一條同樣不尋常的學(xué)術(shù)軌跡。劉紫東本科畢業(yè)于東南大學(xué)建筑學(xué)院,后在英國倫敦大學(xué)學(xué)院獲得計(jì)算設(shè)計(jì)碩士學(xué)位,之后赴美國德州大學(xué)奧斯汀分校攻讀博士學(xué)位,主要研究方向是空間 AI 生成。2023 年,他敏銳地意識(shí)到這條賽道正在出現(xiàn)窗口期——在他看來,除了空間,其他模態(tài)的“舊戰(zhàn)場”已經(jīng)結(jié)束。

在近期 DeepTech 與劉紫東的深度對話中,我們談到了對空間智能行業(yè)的理解、賽道的選擇、技術(shù)差異性路徑、商業(yè)落地和未來發(fā)展趨勢等。他將空間智能創(chuàng)業(yè)所處的階段,類比為抖音在 PC 互聯(lián)網(wǎng)時(shí)代競爭中,率先識(shí)別并切入移動(dòng)互聯(lián)網(wǎng)的那個(gè)關(guān)鍵節(jié)點(diǎn)。

基于 AI 生成空間的核心技術(shù),生境科技已在多個(gè)方向展開探索。其中最引人關(guān)注的是其自研的全球首款空間 AI 游戲——森盒 SenBOX3,它就像是一個(gè)空間編輯器,用戶只需要用一句話、一張照片就能自動(dòng)生成專屬的“夢想家園”。

這款產(chǎn)品被不少玩家理解為 AI 版《我的世界》,在尚未正式上線的情況下,基于獨(dú)特的共創(chuàng)和個(gè)性化創(chuàng)作,全網(wǎng)相關(guān)內(nèi)容累計(jì)吸引百萬級粉絲關(guān)注,其中 15 至 25 歲的女性用戶占據(jù)相當(dāng)比例。


(來源:劉紫東)

與此同時(shí),該公司也發(fā)展了面向 B 端的 API 業(yè)務(wù),服務(wù)客戶包括松下、Ashley、萬華等。盡管這部分業(yè)務(wù)已帶來千萬元級的營收,但劉紫東更愿意將其視為“順手做”的延展,而非公司的核心重心。

在做出創(chuàng)業(yè)決定時(shí),他并不諱言自己的代際焦慮。作為一名 95 后,劉紫東曾悲觀地判斷,與 60 后、70 后和 80 后相比,90 后、95 后這一代人的學(xué)歷紅利已經(jīng)不在。因此當(dāng)機(jī)會(huì)來臨時(shí),他幾乎沒有猶豫,選擇放棄博士學(xué)位回國創(chuàng)業(yè)。

劉紫東將效率視為真正的技術(shù)壁壘,因此并不懼怕后來者。除了技術(shù)的原創(chuàng)性,他的底氣一部分還來自于身后的“智囊團(tuán)”:不僅由其博士生導(dǎo)師丹尼爾·庫勒(Daniel Koehler)教授擔(dān)任公司首席科學(xué)家顧問,還獲得了中國工程院孟建民院士和“大疆教父”李澤湘教授的支持。截至目前,生境科技已完成 Pre-A 與 Pre-A+ 輪近億元融資。

在他的設(shè)想中,空間 AI 的終點(diǎn)并不僅是一款游戲或一個(gè)內(nèi)容社區(qū),而是逐步演化為一個(gè)室內(nèi)版的“谷歌地球(Google Earth)”——一個(gè)與實(shí)體經(jīng)濟(jì)深度耦合、可以承載交易與社交的空間智能平臺(tái)。

以下是對話內(nèi)容,在不改變原意前提下經(jīng)編輯和整理。

逃離舊戰(zhàn)場:空間是 AI 領(lǐng)域少有的“新大陸”

DeepTech:你是基于怎樣的判斷,認(rèn)為空間 AI 賽道有潛在的發(fā)展機(jī)會(huì)?

劉紫東:要回答這個(gè)問題,我想先談?wù)劄槭裁窗l(fā)展其他的模態(tài)不行。從商業(yè)角度來看,各大廠在文本、圖像、視頻等模態(tài)具有顯著優(yōu)勢,如果發(fā)展這些傳統(tǒng)模態(tài),用戶獲取成本很高。這不是技術(shù)問題而是分發(fā)和規(guī)模的問題,實(shí)際上創(chuàng)業(yè)公司在結(jié)構(gòu)上已經(jīng)輸了。

我們是從模態(tài)的角度來判斷的。顯然,文字、圖像、視頻格局基本已定,目前都屬于“舊戰(zhàn)場”。其實(shí),每個(gè)模態(tài)都有自己的代表性 APP,每個(gè)時(shí)代也有屬于自己的模態(tài),而機(jī)會(huì)往往來自于新模態(tài)的產(chǎn)生。

以創(chuàng)立于 2016 年的抖音為例,它最厲害的是推薦算法,如果它只是做今日頭條的業(yè)務(wù),可能只比新浪、搜狐新聞好用一點(diǎn),但不可能有如此強(qiáng)的用戶感知差異,也就沒有今天的體量。

抖音正是在大家聚集在瀏覽器、殺毒軟件、彈窗、門戶網(wǎng)站等 PC 端“戰(zhàn)場”時(shí),選擇了一條不同的發(fā)展路徑——視頻模態(tài)。直到今天,它 90% 的體量仍然來自這里。我記得張一鳴當(dāng)時(shí)曾說過:“不要留戀 PC 互聯(lián)網(wǎng)舊戰(zhàn)場,抓住移動(dòng)互聯(lián)網(wǎng)機(jī)遇?!?/p>

我覺得現(xiàn)在同樣是到了這樣一個(gè)時(shí)機(jī),當(dāng)領(lǐng)域都還在“卷”圖像、文本、視頻這些舊模態(tài)時(shí),我們已經(jīng)有了一個(gè)清晰的判斷:新的空間模態(tài)里才是唯一的“新大陸”。

DeepTech:也就是說,你認(rèn)為空間是繼 AI 生成文本、圖像、視頻之后的下一個(gè)前沿。

劉紫東:是的。一種新模態(tài)的崛起離不開技術(shù)成熟的發(fā)展,這從根本上降低了內(nèi)容生產(chǎn)和消費(fèi)的門檻。就像過去拍攝視頻需要扛著攝像機(jī),拍攝和剪輯都非常麻煩。直到手機(jī)攝影錄像功能普及,內(nèi)容生產(chǎn)才變得簡單、門檻大幅降低。在消費(fèi)側(cè),手機(jī)屏幕提供了更好的觀看體驗(yàn),網(wǎng)速也提升到了 4G、5G 時(shí)代。生產(chǎn)和消費(fèi)兩端的共同作用,讓視頻變得又好看又容易實(shí)現(xiàn),它的火爆也就成了必然。

從文字到圖片、視頻再到空間,每個(gè)模態(tài)帶來的信息密度不一樣。文字已經(jīng)存在幾千年了,后面才有圖像。到了視頻,它不僅有聲音還有時(shí)間維度,能更好地描述故事。人類是傾向于更多維度的感知以及更豐富的信息層級,所以,能比視頻還更高維、更加貼近現(xiàn)實(shí)的就是空間。與視頻相比,空間天然有交互、漫游和自主性。

另一方面,剛好在最近幾年,空間在內(nèi)容的生產(chǎn)和消費(fèi)生態(tài)方面也在迅速成熟和便捷。內(nèi)容生產(chǎn)體現(xiàn)在 AI 制造 3D 資產(chǎn)和圖轉(zhuǎn) 3D 等成本大幅下降。從消費(fèi)層面來看,虛幻引擎已服務(wù)于 3D 場景渲染。隨著其畫質(zhì)越來越好,已經(jīng)逐漸支持手機(jī)芯片,例如寫實(shí)化游戲逐漸搬上移動(dòng)端。從長遠(yuǎn)來看,在 Vision Pro、AR、VR 方面的布局也在迅速加快。

所以綜合來看,我們得出一句“暴論”:從創(chuàng)業(yè)公司的視角看,空間模態(tài)可能是目前少數(shù)仍具備結(jié)構(gòu)性機(jī)會(huì)的方向之一。

DeepTech:空間與傳統(tǒng)的 3D 單體技術(shù)有怎樣的不同?

劉紫東:空間與 3D 單體的技術(shù)路徑不太一樣。3D 單體通過一張圖片就能推理還原出物體,而空間需要一系列圖片才能重建。簡單來說,3D 單體解決的是“單個(gè)物體長什么樣”,而空間解決的是“物體如何有序擺放構(gòu)成滿足人類需求的場景”。從城市規(guī)劃到室內(nèi)設(shè)計(jì),都無非是把東西擺來擺去的過程。

DeepTech:這個(gè)方向應(yīng)該有很多潛在的商業(yè)機(jī)會(huì),那各家大廠為何不自己做空間智能這個(gè)方向呢?

劉紫東:因?yàn)榇髲S在這方面喪失了兩個(gè)既有的優(yōu)勢:一是場景和用戶優(yōu)勢,它沒有一款以 3D 空間為主題的 APP;另一方面,在技術(shù)、數(shù)據(jù)和模型算法方面也不占優(yōu)勢。現(xiàn)在,大家對于“什么是空間”還在爭議中,它的技術(shù)路徑不像圖像、文本、算法工程那么好找,還在劇烈的波動(dòng)中。所以,對大廠來說可能“一會(huì)想干,一會(huì)又放棄”,因此很難組建團(tuán)隊(duì)。

建筑學(xué)底層的創(chuàng)新和革命:另類世界模型,核心是“擺什么、怎么擺”

DeepTech:生境科技在做的事情是否可以理解為通過“空間理解+AI 生成”,來做下一代基礎(chǔ)設(shè)施?它和現(xiàn)在大家高度關(guān)注的世界模型是一回事嗎?

劉紫東:現(xiàn)在,谷歌、李飛飛、楊立昆(Yann LeCun)都在借助世界模型,來探索對物理世界的理解。谷歌做的是文生視頻大模型;李飛飛的空間智能模型 Marble 致力于 3D 高斯?jié)姖u(Gaussian Splatting);楊立昆則聚焦于更抽象的世界表征。


(來源:劉紫東)

我們正在做的事情與李飛飛的技術(shù)方向比較貼近,但屬于完全不同的范式。她是從純視覺的維度來理解空間,方向是文生圖、圖轉(zhuǎn)空間。盡管可通過文字方式做修改,但由于鏈路太長,本質(zhì)上屬于“拿大炮打蚊子”。另外就是,視覺表皮生成的技術(shù)路線擅長換風(fēng)格,但在其它任務(wù)是結(jié)構(gòu)性地能力缺失。

這一點(diǎn)在室內(nèi)空間生成方面更加明顯,Marble 不僅精度較低會(huì)導(dǎo)致所生成的空間有些比較模糊的地方,而且無法輸入足夠多的限制條件。雖然其技術(shù)可以實(shí)現(xiàn)生成用戶提出的“童話世界”等切換風(fēng)格需求,但無法基于這樣的需求生成空間,例如“基于三室兩廳特定的布局生成空間,我的家庭是三口之家,我喜歡打麻將,爸爸喜歡打游戲”。此外,其很難做二次編輯和交互。


(來源:劉紫東)

DeepTech:除了技術(shù)的路徑,生境科技在做的事情和世界模型還有哪些本質(zhì)的不同呢?

劉紫東:從構(gòu)建空間的敘事邏輯來看,我們也有本質(zhì)的區(qū)別??臻g可以分成兩類:一類是由自然規(guī)律主導(dǎo)的空間,另一類是由人類活動(dòng)主導(dǎo)的空間。實(shí)際上,這兩類空間的形成邏輯并不完全相同。

具體而言,自然空間生成完全依賴自然規(guī)律和物理規(guī)律,但在人類的人造空間,從城市到人類的棲息地,再從城市到建筑再到室內(nèi),其生成邏輯物理定律可能只占 30%,剩下的 70% 與人類的需求密切相關(guān)。

所以,要生成從城市到室內(nèi)的空間不是一個(gè)純視覺邏輯,而是包括更多的社會(huì)心理學(xué)邏輯維度,例如功能、美學(xué)、日照采光、隱私和心理學(xué)等因素。我們只有把這些維度背后的參數(shù)特征提取出來,生成的空間才是能滿足人類需求的。

可以說我們相當(dāng)于創(chuàng)造了一個(gè)新學(xué)科,在這一理解空間的路徑和技術(shù)范式上,我們目前是非常少見、甚至可以說是獨(dú)特的。實(shí)際上,我們用了很多建筑學(xué)的關(guān)于人造空間的思維,然后又把它 AI 化做空間編碼,這是前所未有的??梢哉f,我們在做的 AI 生成空間是建筑學(xué)非常底層的一次創(chuàng)新和革命。

我們解決的是擺放、規(guī)劃和布局的問題,這個(gè)問題過去從未有人單獨(dú)來研究。無論是城市還是室內(nèi)的空間,所有的空間生成問題都可以拆解成兩個(gè)子問題:一個(gè)是擺什么,另一個(gè)是把建筑/物品擺在哪里。

總結(jié)來說,李飛飛的空間智能生成的是一層“皮”,更關(guān)注的是整體的視覺風(fēng)格;而我們認(rèn)為對于人類所建造的空間,需要更專業(yè)的其他信息來補(bǔ)充。

DeepTech:它背后的核心邏輯是什么?

劉紫東:這個(gè)邏輯其實(shí)和推薦算法有相似之處。推薦算法面對海量內(nèi)容,并根據(jù)用戶此時(shí)此刻的個(gè)性化的特征——無論是人物標(biāo)簽、當(dāng)前行為還是潛在訴求,推薦出用戶最喜歡的視頻或商品。

但推薦算法主要解決的是選擇問題,我們在做的空間生成,不僅需要從海量 3D 資產(chǎn)中選擇合適的物品,還要解決擺放的問題——把這些選中的物品合理地布置在空間里。

推薦算法并非抖音首創(chuàng),但后者將其產(chǎn)品化并做到極致,從這個(gè)意義上來說,抖音推動(dòng)了一個(gè)新學(xué)科的發(fā)展。我們在做的事情同樣是將一種新技術(shù)的邏輯轉(zhuǎn)化為成熟的產(chǎn)品與應(yīng)用,相當(dāng)于空間生成領(lǐng)域的“推薦算法”。

游戲是巨頭爭霸縫隙中的綠洲,年?duì)I收千萬的 B 端生意只是“順手做”

DeepTech:我們看到 AI 家園類游戲——森盒 SenBOX3 在全網(wǎng)非常火爆,生境科技目前在主推這款游戲,有哪些因素的考慮?

劉紫東:我們的核心技術(shù)是 AI 空間生成,現(xiàn)在 90% 以上的精力都在做這款游戲,這也是全球第一個(gè) AI 版《我的世界》。


(來源:劉紫東)

這個(gè)決定源于我們對創(chuàng)業(yè)公司類型的清醒認(rèn)知:軟件公司的類型涵蓋社交、電商、內(nèi)容,包括知乎、抖音、小紅書、豆瓣等等?,F(xiàn)在的趨勢是,涉及到這三大類的業(yè)務(wù)都是巨頭壟斷。過去 10 年沒有公司在這方面賺到錢。

軟件公司的成長曲線太陡峭了:要么是無限大,要么是 0,沒有中間地帶,所以這些生意沒得做。我們經(jīng)常說,豆包都是免費(fèi)的,AI ToC 軟件怎么賺錢呢?但是我們發(fā)現(xiàn),在軟件公司內(nèi)有一個(gè)例外的領(lǐng)域——游戲。游戲的商業(yè)市場交易很好,用戶的付費(fèi)意識(shí)很強(qiáng)。

另一方面,游戲內(nèi)容與整個(gè)產(chǎn)業(yè)生態(tài)很好,個(gè)人游戲工作室也能賺到一點(diǎn)錢,非常適合創(chuàng)業(yè)。它不是一家獨(dú)大,它的上限也夠高,比如既有像大家都熟悉的王者榮耀、吃雞這些游戲,也有大量的小游戲。它就像個(gè)熱帶雨林一樣,有大象、長頸鹿、老虎,還有螞蟻。所以我們盤算下來,要做軟件只能做游戲,做其他的都是死路。


圖丨由生境科技空間智能技術(shù)生成的“夢想臥室”(來源:劉紫東)

DeepTech:那剩下 10% 的精力,公司還在發(fā)展哪些業(yè)務(wù)呢?

劉紫東:我們還在做兩個(gè)方向。一是通過具身智能機(jī)器人數(shù)據(jù)合成平臺(tái) SimHub 提供海量的家庭數(shù)據(jù),訓(xùn)練機(jī)器人對空間智能的感知能力。目前,我們已經(jīng)與一些機(jī)器人廠商,包括掃地機(jī)器人廠商合作。但這個(gè)市場規(guī)模相對有限,而且我們只是批量造數(shù)據(jù),不涉及定制化服務(wù)。我覺得造數(shù)據(jù)就像挖石油一樣,造好了有人愿意買我就賣一點(diǎn)。

二是 Sengine API,我們與一些大型電商平臺(tái)合作,通過 API 對接,包括國內(nèi)外的頭部企業(yè)松下、Ashley、萬華等等。

我們提出了一個(gè)概念叫“空間購物車”。過去用戶將目標(biāo)商品放入購物車,并不知道這商品買回家是否合適,下單后可能還要退貨。我們的理念是:將你家的毛坯房模型用 AI 空間生成技術(shù)做出來,然后用戶把相關(guān)商品添加到空間購物車后,就可以把它們擺到你家。這樣就能一目了然地看到這些東西擺在你家是什么樣子、搭得好不好看。

這兩個(gè)方向用的也都是我們 AI 生成空間的能力,但其實(shí)這兩件事都是順手做的,我們最核心的、最好玩的仍然是自己開發(fā)的這款游戲。

DeepTech:其實(shí)相當(dāng)于公司在 B 端和 C 端雙線作戰(zhàn),這種路徑是階段性的策略,還是長期的并行路線呢?

劉紫東:我們還是以 C 端為主。實(shí)際上,新一代的 AI 公司做 B 端和過去傳統(tǒng)意義上的 B 端已經(jīng)有所不同。上一代做 SaaS 的更多是定制開發(fā)的軟件,大部分能力沒法復(fù)用。比如以設(shè)計(jì)平臺(tái)酷家樂為代表的公司,如果它做 B 端生意,就會(huì)陷入無止境的定制開發(fā)。

而現(xiàn)在的模型公司,尤其是像我們這種有自己獨(dú)特模型能力、具有商業(yè)變現(xiàn)能力的公司來說,做 B 端和做 C 端可以共享一套模型能力,我們按次數(shù)收費(fèi),定制化的程度非常低,更多體現(xiàn)在模型能力的復(fù)用上。對于我們目前的產(chǎn)品和模型能力來說,B 端業(yè)務(wù)只是順手做的,盡管服務(wù)的是一些頭部的大客戶但我自己不太 care,我主要還是關(guān)心這款游戲。

DeepTech:發(fā)展數(shù)據(jù)合成平臺(tái),是因?yàn)樯吃跀?shù)據(jù)方面具有優(yōu)勢,還是說在某些方面具有稀缺性呢?

劉紫東:我覺得與其說數(shù)據(jù)優(yōu)勢,不如說我們理解數(shù)據(jù)的維度和別人不一樣。比如,如果在清朝時(shí)挖到了油田并不會(huì)有太廣泛的影響力,因?yàn)槟菚r(shí)候還沒有汽車。我們擅長的是,更懂得如何充分利用數(shù)據(jù)背后的信息以及提取特征的維度。

另外,有些創(chuàng)業(yè)公司會(huì)覺得擁有 1 萬套自己的獨(dú)家數(shù)據(jù)非常厲害。但我并不這樣認(rèn)為,獨(dú)家數(shù)據(jù)的量太少了。如果要訓(xùn)練一個(gè)大的空間通用智能,一定是從全球互聯(lián)網(wǎng)上的億級、百億級數(shù)據(jù)里來學(xué)習(xí)。

所以問題的關(guān)鍵在于,如何利用互聯(lián)網(wǎng)上海量的公共資源。任何私有數(shù)據(jù)庫都無法與互聯(lián)網(wǎng)的公共數(shù)據(jù)庫相媲美,關(guān)鍵在于如何理解它以及如何對其學(xué)習(xí)。

我們的創(chuàng)新點(diǎn)一方面是我們理解數(shù)據(jù)的維度更多,另一方面是我們訓(xùn)練了一種多模態(tài)對齊的方法,通過看圖片學(xué)習(xí)空間設(shè)計(jì),有點(diǎn)類似建筑師:不用走遍全世界,而是通過看圖片在腦海里補(bǔ)出建筑整體的形象。

DeepTech:剛才你提到在提取特征數(shù)據(jù)的維度上,可能和別人做的不太一樣。你能具體說說這些特征在哪些方面比較不一樣嗎?

劉紫東:我們關(guān)注的是一些更具體的內(nèi)容,比如空間是否走得通順、利用率高不高、使用起來方不方便、感受起來舒不舒服、采光好不好、隱私有沒有得到注意等等。

從范式上來說,我覺得大致可以分成兩類。一類是在研究世界本源的科學(xué)研究,比如研究鋰電池、自動(dòng)駕駛、火箭發(fā)射。還有一類以人為中心的研究,比如抖音研究推薦算法,它并沒有標(biāo)準(zhǔn)答案,只要數(shù)據(jù)好、能把握時(shí)尚趨勢和潮流即可。從這個(gè)角度看,我們更多做的是抖音這一類的研究。我們的目標(biāo)是滿足更多用戶,讓他們更開心、更舒服。

DeepTech:具身智能現(xiàn)在是比較火熱的領(lǐng)域,大家也都在討論這個(gè)話題。除了我們剛談到的空間智能為具身訓(xùn)練數(shù)據(jù),有沒有可能幫助它做更多的事情?

劉紫東:我覺得這方面可以參考自動(dòng)駕駛,它可以理解成是道路級的通用空間智能。但應(yīng)用場景到了室內(nèi),有些情況變得不一樣。首先,數(shù)據(jù)采集變得更難、更復(fù)雜。因?yàn)榈缆分辽倏梢蚤_一輛車,裝個(gè)攝像頭就能像行車記錄儀一樣把數(shù)據(jù)錄入下來。

但是,室內(nèi)場景下沒有這樣的機(jī)器人?,F(xiàn)在大部分掃地機(jī)器人的精度很低,而且它的高度太低,不能對整個(gè)空間做全面掃描,而且還涉及到隱私問題。此外,室內(nèi)的情況比道路更復(fù)雜。道路的物體種類較少,例如大車、小車、行人、摩托車、斑馬線等。而室內(nèi)的復(fù)雜性體現(xiàn)在,不僅物品是 3D 的,還可能各角度都有。

另一方面,機(jī)器人的任務(wù)更復(fù)雜。自動(dòng)駕駛主要是躲避問題,但是對于室內(nèi)機(jī)器人來說,它需要主動(dòng)操作和理解空間。舉個(gè)例子,在家里找 U 盤,這個(gè)事情不僅僅是空間掃描的問題。

更多時(shí)候它可能是藏在某個(gè)抽屜里,需要先推理出來,U 盤大概率會(huì)放在哪個(gè)房間,然后去臥室或客廳搜索的時(shí)候,要知道抽屜可以拉開,如果翻一下沒找到下一步應(yīng)該去哪里找。所以,這件事情需要對空間本身有很深層次的理解。

從這方面來看,它可能比自動(dòng)駕駛還難。因此,當(dāng)把這些事情想通后,我們覺得未來機(jī)器人真的要走進(jìn)家庭是個(gè)長期的目標(biāo),至少還需要十年時(shí)間。對我們來說,它一定是必經(jīng)之路。剛才提到的三個(gè)難點(diǎn)卡在大家面前,所以領(lǐng)域內(nèi)數(shù)據(jù)稀缺。而我們剛好是造數(shù)據(jù)的,所以我們技術(shù)的作用就顯得非常重要。

DeepTech:也就是說,相當(dāng)于可以幫助具身智能領(lǐng)域解決其未完全解決的問題。

劉紫東:是的?,F(xiàn)在具身智能領(lǐng)域看起來很熱鬧,其實(shí)解決的問題還相對有限。我們把機(jī)器人歸納為三大階段:

第一階段是解決小腦的運(yùn)動(dòng)問題,比如在后空翻、打拳擊、跑步時(shí),保持機(jī)器人自己不摔倒,這個(gè)問題其實(shí)已經(jīng)基本解決了。大概十年前美國通過強(qiáng)化學(xué)習(xí)和物理仿真做了一套系統(tǒng),之后有了現(xiàn)在的相關(guān)技術(shù)。

第二個(gè)階段解決的是操作問題,比如機(jī)器人站在臺(tái)面上疊衣服、倒水,或拿蘋果、拿杯子等任務(wù)。這也是最近兩年最火的話題,V2A(Voice to Action,語音到行動(dòng))對機(jī)器人說一段話,通過環(huán)境感知后執(zhí)行任務(wù)。但是,這樣的環(huán)境感知和執(zhí)行其實(shí)空間智能很弱,它基本上是在固定的、單一的場景執(zhí)行比較固定的任務(wù)。

這與找 U 盤、端茶遞水,或在商場里找?guī)@類的任務(wù)根本不是一回事。實(shí)際上,這些復(fù)雜的空間任務(wù)就是第三階段要解決的問題——主動(dòng)理解空間智能,它并不是純視覺理解的問題。


(來源:劉紫東)

DeepTech:所以,相當(dāng)于現(xiàn)在還沒有正式地進(jìn)入到訓(xùn)練空間智能階段?

劉紫東:可以這么說。現(xiàn)在的機(jī)器人訓(xùn)練一般是在工廠或樣板間、實(shí)驗(yàn)室,可能 100 平米、200 平米。讓一個(gè)機(jī)器人在里面走來走去,不停地做小的模型訓(xùn)練。所以它沒有泛化能力,但解決特定場景已經(jīng)足夠用。所以,現(xiàn)在還是初步的空間智能,整個(gè)行業(yè)還沒有正式地開展這方面的工作。

研發(fā)效率即技術(shù)壁壘,不懼“后來者”

DeepTech:剛才我們也談到了,盡管大型公司有資源優(yōu)勢,但生境形成了和他們差異化的發(fā)展方向。那么,公司在這個(gè)領(lǐng)域有哪些技術(shù)壁壘,或者說在保持技術(shù)原創(chuàng)性方面做了哪些努力或嘗試呢?

劉紫東:我并不認(rèn)為世界上有什么堅(jiān)不可摧的技術(shù)壁壘。我們過去的敘事邏輯是,什么東西是別人永遠(yuǎn)都實(shí)現(xiàn)不了,只有我能實(shí)現(xiàn)的。但現(xiàn)在,我們對技術(shù)的理解和認(rèn)知也在不斷加深。我認(rèn)為所謂的技術(shù)壁壘,本質(zhì)上就是你的研發(fā)效率。

如果你的研發(fā)效率比別人高 10 倍,那客觀上就形成了技術(shù)壁壘,這是一個(gè)永無止境的賽跑。這種效率體現(xiàn)在成本和時(shí)間兩個(gè)方面:如果用更少的資源、更短的時(shí)間走得更前,那就會(huì)保持領(lǐng)先。

所以,技術(shù)壁壘的本質(zhì)還是企業(yè)的研發(fā)效率。這取決于整個(gè)研發(fā)架構(gòu)的設(shè)計(jì)、系統(tǒng)的優(yōu)化以及團(tuán)隊(duì)的文化、人才的選拔機(jī)制、招聘機(jī)制和晉升機(jī)制,它是由綜合的因素決定的。我們的技術(shù)端是絕對原創(chuàng)的,所以也不懼怕后來者借鑒,當(dāng)別人借鑒的速度還沒有我們原創(chuàng)的速度快的時(shí)候,壁壘就形成了。

從結(jié)果上來看,我們并不是世界上第一家做空間生成的公司。實(shí)際上在我們之前早幾年,像酷家樂、三維家、居然設(shè)計(jì)家(Homestyler)、Autodesk、英偉達(dá)都曾想過做空間擺放。另一方面,學(xué)界對這個(gè)方向的研究已有幾十年了,最近幾年也非常火。我們是用最短的時(shí)間,用最低的成本走在了最前面,證明了自己的執(zhí)行力。

DeepTech:生境在做的事情其實(shí)是一個(gè)全新的角度,包括我們剛才提到的創(chuàng)造了一個(gè)新 的學(xué)科。這和你在本科期間從事建筑方面的研究學(xué)習(xí)是不是也有非常密切的關(guān)系?

劉紫東:對,其中最重要的是把人類的空間理解成功能,這并不是常識(shí)。其實(shí)在過去幾千年,建筑學(xué)也不是這么來看待空間的,甚至我在剛開始學(xué)習(xí)建筑學(xué)的時(shí)候也沒有空間的概念。但是在 100 年前,建筑學(xué)有一次革命,現(xiàn)代主義建筑號(hào)召要“以人為本”。也就是說,從城市規(guī)劃到室內(nèi)設(shè)計(jì),再到家庭設(shè)計(jì)都是按照人的需求進(jìn)行設(shè)計(jì)。

現(xiàn)在主流的處理空間的方法,還是傳統(tǒng)的自然語言處理(NLP)和計(jì)算機(jī)視覺(CV)方式的延伸。基于 CV 的 3D 建模更擅長的是單體生成,這方面并沒有太多的技術(shù)稀缺性。我們公司也有很好的圖轉(zhuǎn) 3D 單體的模型,現(xiàn)在倉庫里面已經(jīng)有 100 萬個(gè)單體了。

但是問題的關(guān)鍵在于,如何針對用戶特定的需求,從這個(gè)倉庫中選擇出來合適的商品,綜合各種因素,擺放到合適的位置。本科期間,我們做了大量關(guān)于這方面能力的建筑學(xué)訓(xùn)練和認(rèn)知升維。這也是為什么我們現(xiàn)在這么稀缺和獨(dú)特,能把這個(gè)事情落地的原因。

DeepTech:決定成立公司做創(chuàng)業(yè)這件事,是你在德州大學(xué)奧斯汀分校讀博期間發(fā)生的。是怎樣的契機(jī)讓你覺得時(shí)機(jī)非常成熟了,已經(jīng)不能再等而是必須立刻休學(xué)去做這件事?

劉紫東:我覺得是兩方面。一方面是從宏觀層面來說,與 60 后、70 后、80 后相比,我們 90 后、95 后這一代人是被時(shí)代拋棄掉的一代。學(xué)歷紅利已不再,時(shí)代沒有給我們太多機(jī)會(huì),所以我是很絕望地活著的。對我來說走創(chuàng)業(yè)這條路是“沒得選”,我非常珍惜技術(shù)創(chuàng)新的機(jī)會(huì),當(dāng)機(jī)會(huì)來了一定要抓住。

從微觀上來說,當(dāng)時(shí)我在國外通過一些創(chuàng)新項(xiàng)目和比賽已經(jīng)小有名氣。2022 年底,隨著 ChatGPT 的火爆,有些國內(nèi)外的投資人認(rèn)為我們做 AI 生成空間挺好玩,就聯(lián)系到我。所以,我?guī)缀鯖]有什么遲疑就休學(xué)了,然后于 2023 年 4 月在深圳成立了這家公司。

DeepTech:你本身是 95 后,團(tuán)隊(duì)也是一支年輕的團(tuán)隊(duì),你是如何管理團(tuán)隊(duì)的呢?

劉紫東:作為公司的 CEO,我和整個(gè)團(tuán)隊(duì)的相處模式會(huì)隨著公司的情況的發(fā)展而有所變化。公司剛開始成立時(shí)只有幾個(gè)人、十幾個(gè)人,去年發(fā)展到 30 多人,現(xiàn)在已經(jīng)有 70 多人了。我更傾向于直接管理,我覺得減少中間層級,可以降低溝通成本和提升效率。但是這需要對管理者和執(zhí)行者都有更高的綜合素質(zhì)。這確實(shí)是一段挺奇妙的人生經(jīng)歷。我很難描述現(xiàn)在的狀態(tài),它有點(diǎn)來得太快了,有點(diǎn)像拔苗助長的感覺。我其實(shí)也經(jīng)常陷入一種反思,感覺一切都挺不可思議的。

DeepTech:空間生成是一個(gè)新的領(lǐng)域,它又涉及到很多學(xué)科交叉,你是如何管理和建設(shè)這支團(tuán)隊(duì)的呢?

劉紫東:主要以培養(yǎng)為主,因?yàn)?AI 領(lǐng)域變化很快。我們的團(tuán)隊(duì)成員不一定非得是對口的,可能只是大方向相近,然后我們再精準(zhǔn)培養(yǎng)、逐步上手。尤其是比較前沿的方向或沒有標(biāo)準(zhǔn)答案的領(lǐng)域,我們更加傾向于招學(xué)生,然后通過校企合作來進(jìn)行培養(yǎng)。整體上來說,公司在 3D 空間內(nèi)容生成的核心技術(shù)壁壘都是我們自己創(chuàng)造出來的。在這方面,我們覺得智商和意愿比直接經(jīng)驗(yàn)高很多倍。

DeepTech:那目前公司的發(fā)展?fàn)顟B(tài)和你最初預(yù)設(shè)的相比,是按照原來預(yù)設(shè)的來發(fā)展的嗎?

劉紫東:一部分比預(yù)想的更慢,一部分則更快。我們的產(chǎn)品研發(fā)和賺錢進(jìn)度比我們想象中要慢,因?yàn)槲覀冊阶鲈桨l(fā)現(xiàn)事情的復(fù)雜性。但另一方面,我們也更有信心,因?yàn)槲覀儾冗^的坑,后面進(jìn)入到這個(gè)領(lǐng)域的人還得再踩一遍。所以,研發(fā)和賺錢的進(jìn)度比我們預(yù)期的更慢,但融資的進(jìn)度、團(tuán)隊(duì)規(guī)模的擴(kuò)張速度比我們預(yù)期中更快。

DeepTech:那在進(jìn)展慢的方面會(huì)有壓力嗎?

劉紫東:那倒沒有,和想象中的進(jìn)度不太一樣是一件很正常的事情。雖然我們有些地方慢一點(diǎn),但整體上還是一個(gè)非常能打的、欣欣向榮的團(tuán)隊(duì)。我們剛開始覺得一年能做出來的事情,現(xiàn)在做了兩年多,但別人做了 10 年也沒做出來。并不是有一家競品公司做出來了產(chǎn)品,我們沒做出來,現(xiàn)在的情況是,我們進(jìn)行了世界上目前非常少見的、產(chǎn)品化程度最高的嘗試,所以我還是比較驕傲的。

空間 AI 的終極外延:不僅是工具,更是元宇宙的商業(yè)生態(tài)

DeepTech:最后請幫我們暢想一下,隨著技術(shù)的發(fā)展和團(tuán)隊(duì)逐漸走上軌道,在與用戶的交互方式方面可能會(huì)出現(xiàn)哪些顛覆性的改變?

劉紫東:我覺得這個(gè)會(huì)千差萬別。首先,游戲領(lǐng)域會(huì)在全球范圍內(nèi)出現(xiàn)的第一個(gè)類似現(xiàn)在抖音地位的、基于空間模態(tài)的娛樂內(nèi)容社交平臺(tái)。它既有娛樂屬性,也有社交屬性。最終可能是一個(gè)平臺(tái),也可能是兩個(gè)平臺(tái)。

人們會(huì)在這個(gè)平臺(tái)上做幾件事情:

第一,成為一個(gè)風(fēng)靡全球的、時(shí)尚和有活力的游戲內(nèi)容社區(qū),以青少年群體為主,然后向二三十歲的中青年群體蔓延。

第二,演化為包含實(shí)體經(jīng)濟(jì)的元宇宙電商平臺(tái),類似于室內(nèi)版的“谷歌地球(Google Earth)”,人們可以在該平臺(tái)社交、購物,甚至直播等各種活動(dòng)。用戶可以通過這個(gè)平臺(tái),足不出戶地去全球各地的家庭做客。既有個(gè)體戶在這個(gè)元宇宙平臺(tái)上開店售賣商品,也有大連鎖店在上面開 Shopping Mall。

當(dāng)然,我們還有一個(gè)更近期的目標(biāo),所有與設(shè)計(jì)和空間改造相關(guān)的都可以通過我們的平臺(tái)作為流量入口。比如買畫、地毯、床單、窗簾、擺件、花草……甚至布置兒童房等。

它們很可能是同步進(jìn)行的。首先它是款游戲,然后會(huì)進(jìn)行現(xiàn)實(shí)的鏡像。之后會(huì)有實(shí)際的需求在平臺(tái)產(chǎn)生,接下來就會(huì)有買賣、有交易,再往后就會(huì)有商家在上面開店。


(來源:劉紫東)

DeepTech:所以,也可以說它是虛擬現(xiàn)實(shí)之間真正的元宇宙平臺(tái)?

劉紫東:元宇宙這個(gè)詞在五年前已經(jīng)被用濫了,它之所以沒發(fā)展起來原因還是卡在了技術(shù)問題。過去的元宇宙其實(shí)都是用雇傭大量場景地編手工建模搭建出來的場景,那不是真正的元宇宙。隨著空間模態(tài)技術(shù)的成熟,每個(gè)人可以便捷地把自己家復(fù)制到網(wǎng)上、創(chuàng)造 3D 資產(chǎn)以及做渲染,所以現(xiàn)在我們覺得真正的元宇宙時(shí)機(jī)到來了。

DeepTech:總結(jié)來說,AI 生成空間相當(dāng)于改變了生產(chǎn)關(guān)系,也就是把之前特別高的門檻或者難以做到的事情,現(xiàn)在做成普通用戶人人都能參與、能實(shí)現(xiàn)的一種工具。

劉紫東:對,這是其中的一個(gè)方面。我們通過 AI 讓更多用戶能夠體驗(yàn)到個(gè)性化設(shè)計(jì)的樂趣,相當(dāng)于幫他們跨越了一個(gè)維度,顯著降低了技術(shù)的實(shí)現(xiàn)門檻。

但其實(shí)我們做的事情并不只是提供了一個(gè)工具那么簡單,而是提供了一種可以激發(fā)大規(guī)模創(chuàng)意以及互動(dòng)的基礎(chǔ)能力。一種已經(jīng)被驗(yàn)證的生態(tài)型公司的經(jīng)典路徑是:商業(yè)來自于流量,流量來自于內(nèi)容,內(nèi)容來自于工具。所以,當(dāng)我們有了一個(gè)好工具之后,它會(huì)產(chǎn)生好的內(nèi)容,好的內(nèi)容又會(huì)吸引更多用戶,而當(dāng)平臺(tái)聚集了海量用戶后,各種商業(yè)機(jī)會(huì)就都來了。

如果說過去十年,工具型平臺(tái)的終點(diǎn)是內(nèi)容社區(qū),那么空間 AI 的終點(diǎn),很可能是一個(gè)涵蓋內(nèi)容社區(qū)、電商和社交的、真實(shí)世界的數(shù)字鏡像與商業(yè)生態(tài)。

運(yùn)營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
在國安局食堂吃飯時(shí),無意發(fā)現(xiàn)打菜的師傅,竟是我追蹤的千面間諜

在國安局食堂吃飯時(shí),無意發(fā)現(xiàn)打菜的師傅,竟是我追蹤的千面間諜

千秋文化
2026-02-19 10:43:29
我從油車換到電車后,終于明白:還有那么多人不換車,不是傻,而是聰明

我從油車換到電車后,終于明白:還有那么多人不換車,不是傻,而是聰明

劉哥談體育
2026-02-16 20:29:51
VIVO從印度成功轉(zhuǎn)走7000億?大批外資企業(yè)撤離,莫迪已嘗到苦果?

VIVO從印度成功轉(zhuǎn)走7000億?大批外資企業(yè)撤離,莫迪已嘗到苦果?

顧史
2026-02-23 23:29:51
別被古裝劇騙了!這些老照片才是真實(shí)的晚清,最恐怖的人間煉獄

別被古裝劇騙了!這些老照片才是真實(shí)的晚清,最恐怖的人間煉獄

歷史小破站
2026-02-24 06:00:05
羊肉被關(guān)注!研究發(fā)現(xiàn):腦?;颊叱匝蛉猓貌涣硕嗑茫蛴?益處

羊肉被關(guān)注!研究發(fā)現(xiàn):腦?;颊叱匝蛉猓貌涣硕嗑?,或有3益處

阿兵科普
2026-02-07 21:11:54
何穗陳偉霆留在北京過年,曬出別墅內(nèi)景,滿屋蝴蝶蘭太有年味了

何穗陳偉霆留在北京過年,曬出別墅內(nèi)景,滿屋蝴蝶蘭太有年味了

章眽八卦
2026-02-24 13:13:14
靜安曹家渡動(dòng)遷實(shí)錘!50㎡公房補(bǔ)償近940萬?上海內(nèi)環(huán)這波真的頂

靜安曹家渡動(dòng)遷實(shí)錘!50㎡公房補(bǔ)償近940萬?上海內(nèi)環(huán)這波真的頂

說故事的阿襲
2026-02-24 20:27:32
日本將要求外國游客在入境前必須接受審查,并上調(diào)在留資格費(fèi)用

日本將要求外國游客在入境前必須接受審查,并上調(diào)在留資格費(fèi)用

東京在線
2026-02-21 22:32:28
新華社權(quán)威快報(bào)|環(huán)境空氣質(zhì)量新國標(biāo)來了!“好天氣”標(biāo)準(zhǔn)更嚴(yán)

新華社權(quán)威快報(bào)|環(huán)境空氣質(zhì)量新國標(biāo)來了!“好天氣”標(biāo)準(zhǔn)更嚴(yán)

新華社
2026-02-24 20:10:04
全網(wǎng)最愛發(fā)錢老板開工刷屏!2小時(shí)破億、5000萬首單、排隊(duì)交錢!這才是河南制造硬核開門紅

全網(wǎng)最愛發(fā)錢老板開工刷屏!2小時(shí)破億、5000萬首單、排隊(duì)交錢!這才是河南制造硬核開門紅

極目新聞
2026-02-23 22:49:15
余嘉豪太不容易!大早抵北京后,還需要轉(zhuǎn)兩航班歸隊(duì),真的要累死

余嘉豪太不容易!大早抵北京后,還需要轉(zhuǎn)兩航班歸隊(duì),真的要累死

籃球資訊達(dá)人
2026-02-24 12:06:15
她曾是一位游泳健將,這大身板一看就是運(yùn)動(dòng)員

她曾是一位游泳健將,這大身板一看就是運(yùn)動(dòng)員

陳意小可愛
2026-02-24 19:58:31
直沖9.7分,這部年度大作終于更新完了

直沖9.7分,這部年度大作終于更新完了

來看美劇
2026-02-24 20:07:41
寧愿在國外種地,也不愿意回國,培養(yǎng)出92個(gè)世界冠軍的李永波圖啥

寧愿在國外種地,也不愿意回國,培養(yǎng)出92個(gè)世界冠軍的李永波圖啥

閱微札記
2026-02-22 19:15:15
五星級酒店帶人不登記可以嗎?網(wǎng)友:又是上網(wǎng)漲見識(shí)的一天!

五星級酒店帶人不登記可以嗎?網(wǎng)友:又是上網(wǎng)漲見識(shí)的一天!

深度報(bào)
2026-02-22 22:52:56
就在今天,中國隊(duì)冬奧會(huì)獎(jiǎng)勵(lì)曝光,12人上榜:谷愛凌+寧忠?guī)r最多

就在今天,中國隊(duì)冬奧會(huì)獎(jiǎng)勵(lì)曝光,12人上榜:谷愛凌+寧忠?guī)r最多

侃球熊弟
2026-02-24 08:01:58
被教練性侵27次,你以為她是什么純潔的白蓮花?攻和受都是邪惡

被教練性侵27次,你以為她是什么純潔的白蓮花?攻和受都是邪惡

我心縱橫天地間
2026-02-24 08:52:19
CCTV5直播中國男籃世預(yù)賽決戰(zhàn)日本!嚴(yán)防3分太關(guān)鍵,郭導(dǎo)背水一戰(zhàn)

CCTV5直播中國男籃世預(yù)賽決戰(zhàn)日本!嚴(yán)防3分太關(guān)鍵,郭導(dǎo)背水一戰(zhàn)

老葉評球
2026-02-24 19:02:50
永爭第一!中國最強(qiáng)省,出手了

永爭第一!中國最強(qiáng)省,出手了

國民經(jīng)略
2026-02-24 12:35:39
央行宣布,6000億元!

央行宣布,6000億元!

中國基金報(bào)
2026-02-24 20:19:04
2026-02-25 00:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
16315文章數(shù) 514647關(guān)注度
往期回顧 全部

科技要聞

宇樹科技發(fā)布四足機(jī)器人Unitree As2

頭條要聞

男子摟住繼女強(qiáng)吻動(dòng)作親密 當(dāng)?shù)貗D聯(lián)介入

頭條要聞

男子摟住繼女強(qiáng)吻動(dòng)作親密 當(dāng)?shù)貗D聯(lián)介入

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個(gè)熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會(huì)照顧好3個(gè)孩子

財(cái)經(jīng)要聞

縣城消費(fèi)「限時(shí)繁榮」了十天

汽車要聞

入門即滿配 威蘭達(dá)AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

游戲
家居
數(shù)碼
藝術(shù)
手機(jī)

LOL傳奇選手公布戀情!發(fā)博曬照被夸夫妻相,女方身份曝光

家居要聞

本真棲居 愛暖伴流年

數(shù)碼要聞

299元雙模電競鼠標(biāo),專為中小手設(shè)計(jì)?

藝術(shù)要聞

2025年第八屆全國青年美展 | 油畫作品選刊

手機(jī)要聞

蘋果發(fā)布iOS 26.4 Beta 2系統(tǒng)更新,液態(tài)玻璃設(shè)計(jì)有新變化!

無障礙瀏覽 進(jìn)入關(guān)懷版