国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

95后博士休學(xué)創(chuàng)業(yè)押注AI空間游戲,未上線先出圈吸粉百萬

0
分享至

過去,我們經(jīng)歷和見證了不同模態(tài) APP 在不同階段的發(fā)展:從 QQ 和天涯的文本模態(tài),到博客、QQ 空間、微博的圖文模態(tài),往后到土豆、優(yōu)酷等視頻模態(tài),再到現(xiàn)在以抖音、快手為代表的短視頻。

就在創(chuàng)業(yè)者們用 AI 在文本、圖像、視頻生成的領(lǐng)域中“卷生卷死”之際,生境科技(Sengine Technology)的 CEO 劉紫東帶領(lǐng)團隊選擇了另一條路徑——空間。他認(rèn)為,每個時代真正的機會來自新的模態(tài),而不是在舊模態(tài)里做得更精致。空間,正是像視頻一樣可以被大眾創(chuàng)作、交互和變現(xiàn)的下一代模態(tài)。

世界模型有多條技術(shù)路線:有以時間理解、動作幀預(yù)測為核心的視頻大模型(如 DeepMind 的 Gennie 3),有專注隱式空間表達(dá)(楊立昆),還有一個主要的類別,就是 3D 場景生成。其中,又細(xì)分成基于 3D 高斯?jié)姖u的純視覺表皮還原(李飛飛的 World Labs)和離散實體的組合與布局(如Autodesk、普林斯頓 infinigen)等。

劉紫東認(rèn)為后者更貼近實際應(yīng)用,他將空間生成還原為兩個最基本的問題:擺什么,以及擺在哪。這種構(gòu)建空間的敘事邏輯更多基于人類的實際需求,而非生成一層表皮的純視覺方案?!坝ミ_(dá)、Autodesk 等大廠和 MIT、普林斯頓等高校實驗室都在持續(xù)研究這條技術(shù)路線,但是我們的算法是最先能達(dá)到商業(yè)落地的?!彼f。

在這條獨特技術(shù)路徑背后,是一條同樣不尋常的學(xué)術(shù)軌跡。劉紫東本科畢業(yè)于東南大學(xué)建筑學(xué)院,后在英國倫敦大學(xué)學(xué)院獲得計算設(shè)計碩士學(xué)位,之后赴美國德州大學(xué)奧斯汀分校攻讀博士學(xué)位,主要研究方向是空間 AI 生成。2023 年,他敏銳地意識到這條賽道正在出現(xiàn)窗口期——在他看來,除了空間,其他模態(tài)的“舊戰(zhàn)場”已經(jīng)結(jié)束。

在近期 DeepTech 與劉紫東的深度對話中,我們談到了對空間智能行業(yè)的理解、賽道的選擇、技術(shù)差異性路徑、商業(yè)落地和未來發(fā)展趨勢等。他將空間智能創(chuàng)業(yè)所處的階段,類比為抖音在 PC 互聯(lián)網(wǎng)時代競爭中,率先識別并切入移動互聯(lián)網(wǎng)的那個關(guān)鍵節(jié)點。

基于 AI 生成空間的核心技術(shù),生境科技已在多個方向展開探索。其中最引人關(guān)注的是其自研的全球首款空間 AI 游戲——森盒 SenBOX3,它就像是一個空間編輯器,用戶只需要用一句話、一張照片就能自動生成專屬的“夢想家園”。

這款產(chǎn)品被不少玩家理解為 AI 版《我的世界》,在尚未正式上線的情況下,基于獨特的共創(chuàng)和個性化創(chuàng)作,全網(wǎng)相關(guān)內(nèi)容累計吸引百萬級粉絲關(guān)注,其中 15 至 25 歲的女性用戶占據(jù)相當(dāng)比例。


(來源:劉紫東)

與此同時,該公司也發(fā)展了面向 B 端的 API 業(yè)務(wù),服務(wù)客戶包括松下、Ashley、萬華等。盡管這部分業(yè)務(wù)已帶來千萬元級的營收,但劉紫東更愿意將其視為“順手做”的延展,而非公司的核心重心。

在做出創(chuàng)業(yè)決定時,他并不諱言自己的代際焦慮。作為一名 95 后,劉紫東曾悲觀地判斷,與 60 后、70 后和 80 后相比,90 后、95 后這一代人的學(xué)歷紅利已經(jīng)不在。因此當(dāng)機會來臨時,他幾乎沒有猶豫,選擇放棄博士學(xué)位回國創(chuàng)業(yè)。

劉紫東將效率視為真正的技術(shù)壁壘,因此并不懼怕后來者。除了技術(shù)的原創(chuàng)性,他的底氣一部分還來自于身后的“智囊團”:不僅由其博士生導(dǎo)師丹尼爾·庫勒(Daniel Koehler)教授擔(dān)任公司首席科學(xué)家顧問,還獲得了中國工程院孟建民院士和“大疆教父”李澤湘教授的支持。截至目前,生境科技已完成 Pre-A 與 Pre-A+ 輪近億元融資。

在他的設(shè)想中,空間 AI 的終點并不僅是一款游戲或一個內(nèi)容社區(qū),而是逐步演化為一個室內(nèi)版的“谷歌地球(Google Earth)”——一個與實體經(jīng)濟深度耦合、可以承載交易與社交的空間智能平臺。

以下是對話內(nèi)容,在不改變原意前提下經(jīng)編輯和整理。

逃離舊戰(zhàn)場:空間是 AI 領(lǐng)域少有的“新大陸”

DeepTech:你是基于怎樣的判斷,認(rèn)為空間 AI 賽道有潛在的發(fā)展機會?

劉紫東:要回答這個問題,我想先談?wù)劄槭裁窗l(fā)展其他的模態(tài)不行。從商業(yè)角度來看,各大廠在文本、圖像、視頻等模態(tài)具有顯著優(yōu)勢,如果發(fā)展這些傳統(tǒng)模態(tài),用戶獲取成本很高。這不是技術(shù)問題而是分發(fā)和規(guī)模的問題,實際上創(chuàng)業(yè)公司在結(jié)構(gòu)上已經(jīng)輸了。

我們是從模態(tài)的角度來判斷的。顯然,文字、圖像、視頻格局基本已定,目前都屬于“舊戰(zhàn)場”。其實,每個模態(tài)都有自己的代表性 APP,每個時代也有屬于自己的模態(tài),而機會往往來自于新模態(tài)的產(chǎn)生。

以創(chuàng)立于 2016 年的抖音為例,它最厲害的是推薦算法,如果它只是做今日頭條的業(yè)務(wù),可能只比新浪、搜狐新聞好用一點,但不可能有如此強的用戶感知差異,也就沒有今天的體量。

抖音正是在大家聚集在瀏覽器、殺毒軟件、彈窗、門戶網(wǎng)站等 PC 端“戰(zhàn)場”時,選擇了一條不同的發(fā)展路徑——視頻模態(tài)。直到今天,它 90% 的體量仍然來自這里。我記得張一鳴當(dāng)時曾說過:“不要留戀 PC 互聯(lián)網(wǎng)舊戰(zhàn)場,抓住移動互聯(lián)網(wǎng)機遇?!?/p>

我覺得現(xiàn)在同樣是到了這樣一個時機,當(dāng)領(lǐng)域都還在“卷”圖像、文本、視頻這些舊模態(tài)時,我們已經(jīng)有了一個清晰的判斷:新的空間模態(tài)里才是唯一的“新大陸”。

DeepTech:也就是說,你認(rèn)為空間是繼 AI 生成文本、圖像、視頻之后的下一個前沿。

劉紫東:是的。一種新模態(tài)的崛起離不開技術(shù)成熟的發(fā)展,這從根本上降低了內(nèi)容生產(chǎn)和消費的門檻。就像過去拍攝視頻需要扛著攝像機,拍攝和剪輯都非常麻煩。直到手機攝影錄像功能普及,內(nèi)容生產(chǎn)才變得簡單、門檻大幅降低。在消費側(cè),手機屏幕提供了更好的觀看體驗,網(wǎng)速也提升到了 4G、5G 時代。生產(chǎn)和消費兩端的共同作用,讓視頻變得又好看又容易實現(xiàn),它的火爆也就成了必然。

從文字到圖片、視頻再到空間,每個模態(tài)帶來的信息密度不一樣。文字已經(jīng)存在幾千年了,后面才有圖像。到了視頻,它不僅有聲音還有時間維度,能更好地描述故事。人類是傾向于更多維度的感知以及更豐富的信息層級,所以,能比視頻還更高維、更加貼近現(xiàn)實的就是空間。與視頻相比,空間天然有交互、漫游和自主性。

另一方面,剛好在最近幾年,空間在內(nèi)容的生產(chǎn)和消費生態(tài)方面也在迅速成熟和便捷。內(nèi)容生產(chǎn)體現(xiàn)在 AI 制造 3D 資產(chǎn)和圖轉(zhuǎn) 3D 等成本大幅下降。從消費層面來看,虛幻引擎已服務(wù)于 3D 場景渲染。隨著其畫質(zhì)越來越好,已經(jīng)逐漸支持手機芯片,例如寫實化游戲逐漸搬上移動端。從長遠(yuǎn)來看,在 Vision Pro、AR、VR 方面的布局也在迅速加快。

所以綜合來看,我們得出一句“暴論”:從創(chuàng)業(yè)公司的視角看,空間模態(tài)可能是目前少數(shù)仍具備結(jié)構(gòu)性機會的方向之一。

DeepTech:空間與傳統(tǒng)的 3D 單體技術(shù)有怎樣的不同?

劉紫東:空間與 3D 單體的技術(shù)路徑不太一樣。3D 單體通過一張圖片就能推理還原出物體,而空間需要一系列圖片才能重建。簡單來說,3D 單體解決的是“單個物體長什么樣”,而空間解決的是“物體如何有序擺放構(gòu)成滿足人類需求的場景”。從城市規(guī)劃到室內(nèi)設(shè)計,都無非是把東西擺來擺去的過程。

DeepTech:這個方向應(yīng)該有很多潛在的商業(yè)機會,那各家大廠為何不自己做空間智能這個方向呢?

劉紫東:因為大廠在這方面喪失了兩個既有的優(yōu)勢:一是場景和用戶優(yōu)勢,它沒有一款以 3D 空間為主題的 APP;另一方面,在技術(shù)、數(shù)據(jù)和模型算法方面也不占優(yōu)勢?,F(xiàn)在,大家對于“什么是空間”還在爭議中,它的技術(shù)路徑不像圖像、文本、算法工程那么好找,還在劇烈的波動中。所以,對大廠來說可能“一會想干,一會又放棄”,因此很難組建團隊。

建筑學(xué)底層的創(chuàng)新和革命:另類世界模型,核心是“擺什么、怎么擺”

DeepTech:生境科技在做的事情是否可以理解為通過“空間理解+AI 生成”,來做下一代基礎(chǔ)設(shè)施?它和現(xiàn)在大家高度關(guān)注的世界模型是一回事嗎?

劉紫東:現(xiàn)在,谷歌、李飛飛、楊立昆(Yann LeCun)都在借助世界模型,來探索對物理世界的理解。谷歌做的是文生視頻大模型;李飛飛的空間智能模型 Marble 致力于 3D 高斯?jié)姖u(Gaussian Splatting);楊立昆則聚焦于更抽象的世界表征。


(來源:劉紫東)

我們正在做的事情與李飛飛的技術(shù)方向比較貼近,但屬于完全不同的范式。她是從純視覺的維度來理解空間,方向是文生圖、圖轉(zhuǎn)空間。盡管可通過文字方式做修改,但由于鏈路太長,本質(zhì)上屬于“拿大炮打蚊子”。另外就是,視覺表皮生成的技術(shù)路線擅長換風(fēng)格,但在其它任務(wù)是結(jié)構(gòu)性地能力缺失。

這一點在室內(nèi)空間生成方面更加明顯,Marble 不僅精度較低會導(dǎo)致所生成的空間有些比較模糊的地方,而且無法輸入足夠多的限制條件。雖然其技術(shù)可以實現(xiàn)生成用戶提出的“童話世界”等切換風(fēng)格需求,但無法基于這樣的需求生成空間,例如“基于三室兩廳特定的布局生成空間,我的家庭是三口之家,我喜歡打麻將,爸爸喜歡打游戲”。此外,其很難做二次編輯和交互。


(來源:劉紫東)

DeepTech:除了技術(shù)的路徑,生境科技在做的事情和世界模型還有哪些本質(zhì)的不同呢?

劉紫東:從構(gòu)建空間的敘事邏輯來看,我們也有本質(zhì)的區(qū)別??臻g可以分成兩類:一類是由自然規(guī)律主導(dǎo)的空間,另一類是由人類活動主導(dǎo)的空間。實際上,這兩類空間的形成邏輯并不完全相同。

具體而言,自然空間生成完全依賴自然規(guī)律和物理規(guī)律,但在人類的人造空間,從城市到人類的棲息地,再從城市到建筑再到室內(nèi),其生成邏輯物理定律可能只占 30%,剩下的 70% 與人類的需求密切相關(guān)。

所以,要生成從城市到室內(nèi)的空間不是一個純視覺邏輯,而是包括更多的社會心理學(xué)邏輯維度,例如功能、美學(xué)、日照采光、隱私和心理學(xué)等因素。我們只有把這些維度背后的參數(shù)特征提取出來,生成的空間才是能滿足人類需求的。

可以說我們相當(dāng)于創(chuàng)造了一個新學(xué)科,在這一理解空間的路徑和技術(shù)范式上,我們目前是非常少見、甚至可以說是獨特的。實際上,我們用了很多建筑學(xué)的關(guān)于人造空間的思維,然后又把它 AI 化做空間編碼,這是前所未有的??梢哉f,我們在做的 AI 生成空間是建筑學(xué)非常底層的一次創(chuàng)新和革命。

我們解決的是擺放、規(guī)劃和布局的問題,這個問題過去從未有人單獨來研究。無論是城市還是室內(nèi)的空間,所有的空間生成問題都可以拆解成兩個子問題:一個是擺什么,另一個是把建筑/物品擺在哪里。

總結(jié)來說,李飛飛的空間智能生成的是一層“皮”,更關(guān)注的是整體的視覺風(fēng)格;而我們認(rèn)為對于人類所建造的空間,需要更專業(yè)的其他信息來補充。

DeepTech:它背后的核心邏輯是什么?

劉紫東:這個邏輯其實和推薦算法有相似之處。推薦算法面對海量內(nèi)容,并根據(jù)用戶此時此刻的個性化的特征——無論是人物標(biāo)簽、當(dāng)前行為還是潛在訴求,推薦出用戶最喜歡的視頻或商品。

但推薦算法主要解決的是選擇問題,我們在做的空間生成,不僅需要從海量 3D 資產(chǎn)中選擇合適的物品,還要解決擺放的問題——把這些選中的物品合理地布置在空間里。

推薦算法并非抖音首創(chuàng),但后者將其產(chǎn)品化并做到極致,從這個意義上來說,抖音推動了一個新學(xué)科的發(fā)展。我們在做的事情同樣是將一種新技術(shù)的邏輯轉(zhuǎn)化為成熟的產(chǎn)品與應(yīng)用,相當(dāng)于空間生成領(lǐng)域的“推薦算法”。

游戲是巨頭爭霸縫隙中的綠洲,年營收千萬的 B 端生意只是“順手做”

DeepTech:我們看到 AI 家園類游戲——森盒 SenBOX3 在全網(wǎng)非?;鸨?,生境科技目前在主推這款游戲,有哪些因素的考慮?

劉紫東:我們的核心技術(shù)是 AI 空間生成,現(xiàn)在 90% 以上的精力都在做這款游戲,這也是全球第一個 AI 版《我的世界》。


(來源:劉紫東)

這個決定源于我們對創(chuàng)業(yè)公司類型的清醒認(rèn)知:軟件公司的類型涵蓋社交、電商、內(nèi)容,包括知乎、抖音、小紅書、豆瓣等等?,F(xiàn)在的趨勢是,涉及到這三大類的業(yè)務(wù)都是巨頭壟斷。過去 10 年沒有公司在這方面賺到錢。

軟件公司的成長曲線太陡峭了:要么是無限大,要么是 0,沒有中間地帶,所以這些生意沒得做。我們經(jīng)常說,豆包都是免費的,AI ToC 軟件怎么賺錢呢?但是我們發(fā)現(xiàn),在軟件公司內(nèi)有一個例外的領(lǐng)域——游戲。游戲的商業(yè)市場交易很好,用戶的付費意識很強。

另一方面,游戲內(nèi)容與整個產(chǎn)業(yè)生態(tài)很好,個人游戲工作室也能賺到一點錢,非常適合創(chuàng)業(yè)。它不是一家獨大,它的上限也夠高,比如既有像大家都熟悉的王者榮耀、吃雞這些游戲,也有大量的小游戲。它就像個熱帶雨林一樣,有大象、長頸鹿、老虎,還有螞蟻。所以我們盤算下來,要做軟件只能做游戲,做其他的都是死路。


圖丨由生境科技空間智能技術(shù)生成的“夢想臥室”(來源:劉紫東)

DeepTech:那剩下 10% 的精力,公司還在發(fā)展哪些業(yè)務(wù)呢?

劉紫東:我們還在做兩個方向。一是通過具身智能機器人數(shù)據(jù)合成平臺 SimHub 提供海量的家庭數(shù)據(jù),訓(xùn)練機器人對空間智能的感知能力。目前,我們已經(jīng)與一些機器人廠商,包括掃地機器人廠商合作。但這個市場規(guī)模相對有限,而且我們只是批量造數(shù)據(jù),不涉及定制化服務(wù)。我覺得造數(shù)據(jù)就像挖石油一樣,造好了有人愿意買我就賣一點。

二是 Sengine API,我們與一些大型電商平臺合作,通過 API 對接,包括國內(nèi)外的頭部企業(yè)松下、Ashley、萬華等等。

我們提出了一個概念叫“空間購物車”。過去用戶將目標(biāo)商品放入購物車,并不知道這商品買回家是否合適,下單后可能還要退貨。我們的理念是:將你家的毛坯房模型用 AI 空間生成技術(shù)做出來,然后用戶把相關(guān)商品添加到空間購物車后,就可以把它們擺到你家。這樣就能一目了然地看到這些東西擺在你家是什么樣子、搭得好不好看。

這兩個方向用的也都是我們 AI 生成空間的能力,但其實這兩件事都是順手做的,我們最核心的、最好玩的仍然是自己開發(fā)的這款游戲。

DeepTech:其實相當(dāng)于公司在 B 端和 C 端雙線作戰(zhàn),這種路徑是階段性的策略,還是長期的并行路線呢?

劉紫東:我們還是以 C 端為主。實際上,新一代的 AI 公司做 B 端和過去傳統(tǒng)意義上的 B 端已經(jīng)有所不同。上一代做 SaaS 的更多是定制開發(fā)的軟件,大部分能力沒法復(fù)用。比如以設(shè)計平臺酷家樂為代表的公司,如果它做 B 端生意,就會陷入無止境的定制開發(fā)。

而現(xiàn)在的模型公司,尤其是像我們這種有自己獨特模型能力、具有商業(yè)變現(xiàn)能力的公司來說,做 B 端和做 C 端可以共享一套模型能力,我們按次數(shù)收費,定制化的程度非常低,更多體現(xiàn)在模型能力的復(fù)用上。對于我們目前的產(chǎn)品和模型能力來說,B 端業(yè)務(wù)只是順手做的,盡管服務(wù)的是一些頭部的大客戶但我自己不太 care,我主要還是關(guān)心這款游戲。

DeepTech:發(fā)展數(shù)據(jù)合成平臺,是因為生境在數(shù)據(jù)方面具有優(yōu)勢,還是說在某些方面具有稀缺性呢?

劉紫東:我覺得與其說數(shù)據(jù)優(yōu)勢,不如說我們理解數(shù)據(jù)的維度和別人不一樣。比如,如果在清朝時挖到了油田并不會有太廣泛的影響力,因為那時候還沒有汽車。我們擅長的是,更懂得如何充分利用數(shù)據(jù)背后的信息以及提取特征的維度。

另外,有些創(chuàng)業(yè)公司會覺得擁有 1 萬套自己的獨家數(shù)據(jù)非常厲害。但我并不這樣認(rèn)為,獨家數(shù)據(jù)的量太少了。如果要訓(xùn)練一個大的空間通用智能,一定是從全球互聯(lián)網(wǎng)上的億級、百億級數(shù)據(jù)里來學(xué)習(xí)。

所以問題的關(guān)鍵在于,如何利用互聯(lián)網(wǎng)上海量的公共資源。任何私有數(shù)據(jù)庫都無法與互聯(lián)網(wǎng)的公共數(shù)據(jù)庫相媲美,關(guān)鍵在于如何理解它以及如何對其學(xué)習(xí)。

我們的創(chuàng)新點一方面是我們理解數(shù)據(jù)的維度更多,另一方面是我們訓(xùn)練了一種多模態(tài)對齊的方法,通過看圖片學(xué)習(xí)空間設(shè)計,有點類似建筑師:不用走遍全世界,而是通過看圖片在腦海里補出建筑整體的形象。

DeepTech:剛才你提到在提取特征數(shù)據(jù)的維度上,可能和別人做的不太一樣。你能具體說說這些特征在哪些方面比較不一樣嗎?

劉紫東:我們關(guān)注的是一些更具體的內(nèi)容,比如空間是否走得通順、利用率高不高、使用起來方不方便、感受起來舒不舒服、采光好不好、隱私有沒有得到注意等等。

從范式上來說,我覺得大致可以分成兩類。一類是在研究世界本源的科學(xué)研究,比如研究鋰電池、自動駕駛、火箭發(fā)射。還有一類以人為中心的研究,比如抖音研究推薦算法,它并沒有標(biāo)準(zhǔn)答案,只要數(shù)據(jù)好、能把握時尚趨勢和潮流即可。從這個角度看,我們更多做的是抖音這一類的研究。我們的目標(biāo)是滿足更多用戶,讓他們更開心、更舒服。

DeepTech:具身智能現(xiàn)在是比較火熱的領(lǐng)域,大家也都在討論這個話題。除了我們剛談到的空間智能為具身訓(xùn)練數(shù)據(jù),有沒有可能幫助它做更多的事情?

劉紫東:我覺得這方面可以參考自動駕駛,它可以理解成是道路級的通用空間智能。但應(yīng)用場景到了室內(nèi),有些情況變得不一樣。首先,數(shù)據(jù)采集變得更難、更復(fù)雜。因為道路至少可以開一輛車,裝個攝像頭就能像行車記錄儀一樣把數(shù)據(jù)錄入下來。

但是,室內(nèi)場景下沒有這樣的機器人。現(xiàn)在大部分掃地機器人的精度很低,而且它的高度太低,不能對整個空間做全面掃描,而且還涉及到隱私問題。此外,室內(nèi)的情況比道路更復(fù)雜。道路的物體種類較少,例如大車、小車、行人、摩托車、斑馬線等。而室內(nèi)的復(fù)雜性體現(xiàn)在,不僅物品是 3D 的,還可能各角度都有。

另一方面,機器人的任務(wù)更復(fù)雜。自動駕駛主要是躲避問題,但是對于室內(nèi)機器人來說,它需要主動操作和理解空間。舉個例子,在家里找 U 盤,這個事情不僅僅是空間掃描的問題。

更多時候它可能是藏在某個抽屜里,需要先推理出來,U 盤大概率會放在哪個房間,然后去臥室或客廳搜索的時候,要知道抽屜可以拉開,如果翻一下沒找到下一步應(yīng)該去哪里找。所以,這件事情需要對空間本身有很深層次的理解。

從這方面來看,它可能比自動駕駛還難。因此,當(dāng)把這些事情想通后,我們覺得未來機器人真的要走進家庭是個長期的目標(biāo),至少還需要十年時間。對我們來說,它一定是必經(jīng)之路。剛才提到的三個難點卡在大家面前,所以領(lǐng)域內(nèi)數(shù)據(jù)稀缺。而我們剛好是造數(shù)據(jù)的,所以我們技術(shù)的作用就顯得非常重要。

DeepTech:也就是說,相當(dāng)于可以幫助具身智能領(lǐng)域解決其未完全解決的問題。

劉紫東:是的?,F(xiàn)在具身智能領(lǐng)域看起來很熱鬧,其實解決的問題還相對有限。我們把機器人歸納為三大階段:

第一階段是解決小腦的運動問題,比如在后空翻、打拳擊、跑步時,保持機器人自己不摔倒,這個問題其實已經(jīng)基本解決了。大概十年前美國通過強化學(xué)習(xí)和物理仿真做了一套系統(tǒng),之后有了現(xiàn)在的相關(guān)技術(shù)。

第二個階段解決的是操作問題,比如機器人站在臺面上疊衣服、倒水,或拿蘋果、拿杯子等任務(wù)。這也是最近兩年最火的話題,V2A(Voice to Action,語音到行動)對機器人說一段話,通過環(huán)境感知后執(zhí)行任務(wù)。但是,這樣的環(huán)境感知和執(zhí)行其實空間智能很弱,它基本上是在固定的、單一的場景執(zhí)行比較固定的任務(wù)。

這與找 U 盤、端茶遞水,或在商場里找?guī)@類的任務(wù)根本不是一回事。實際上,這些復(fù)雜的空間任務(wù)就是第三階段要解決的問題——主動理解空間智能,它并不是純視覺理解的問題。


(來源:劉紫東)

DeepTech:所以,相當(dāng)于現(xiàn)在還沒有正式地進入到訓(xùn)練空間智能階段?

劉紫東:可以這么說。現(xiàn)在的機器人訓(xùn)練一般是在工廠或樣板間、實驗室,可能 100 平米、200 平米。讓一個機器人在里面走來走去,不停地做小的模型訓(xùn)練。所以它沒有泛化能力,但解決特定場景已經(jīng)足夠用。所以,現(xiàn)在還是初步的空間智能,整個行業(yè)還沒有正式地開展這方面的工作。

研發(fā)效率即技術(shù)壁壘,不懼“后來者”

DeepTech:剛才我們也談到了,盡管大型公司有資源優(yōu)勢,但生境形成了和他們差異化的發(fā)展方向。那么,公司在這個領(lǐng)域有哪些技術(shù)壁壘,或者說在保持技術(shù)原創(chuàng)性方面做了哪些努力或嘗試呢?

劉紫東:我并不認(rèn)為世界上有什么堅不可摧的技術(shù)壁壘。我們過去的敘事邏輯是,什么東西是別人永遠(yuǎn)都實現(xiàn)不了,只有我能實現(xiàn)的。但現(xiàn)在,我們對技術(shù)的理解和認(rèn)知也在不斷加深。我認(rèn)為所謂的技術(shù)壁壘,本質(zhì)上就是你的研發(fā)效率。

如果你的研發(fā)效率比別人高 10 倍,那客觀上就形成了技術(shù)壁壘,這是一個永無止境的賽跑。這種效率體現(xiàn)在成本和時間兩個方面:如果用更少的資源、更短的時間走得更前,那就會保持領(lǐng)先。

所以,技術(shù)壁壘的本質(zhì)還是企業(yè)的研發(fā)效率。這取決于整個研發(fā)架構(gòu)的設(shè)計、系統(tǒng)的優(yōu)化以及團隊的文化、人才的選拔機制、招聘機制和晉升機制,它是由綜合的因素決定的。我們的技術(shù)端是絕對原創(chuàng)的,所以也不懼怕后來者借鑒,當(dāng)別人借鑒的速度還沒有我們原創(chuàng)的速度快的時候,壁壘就形成了。

從結(jié)果上來看,我們并不是世界上第一家做空間生成的公司。實際上在我們之前早幾年,像酷家樂、三維家、居然設(shè)計家(Homestyler)、Autodesk、英偉達(dá)都曾想過做空間擺放。另一方面,學(xué)界對這個方向的研究已有幾十年了,最近幾年也非?;?。我們是用最短的時間,用最低的成本走在了最前面,證明了自己的執(zhí)行力。

DeepTech:生境在做的事情其實是一個全新的角度,包括我們剛才提到的創(chuàng)造了一個新 的學(xué)科。這和你在本科期間從事建筑方面的研究學(xué)習(xí)是不是也有非常密切的關(guān)系?

劉紫東:對,其中最重要的是把人類的空間理解成功能,這并不是常識。其實在過去幾千年,建筑學(xué)也不是這么來看待空間的,甚至我在剛開始學(xué)習(xí)建筑學(xué)的時候也沒有空間的概念。但是在 100 年前,建筑學(xué)有一次革命,現(xiàn)代主義建筑號召要“以人為本”。也就是說,從城市規(guī)劃到室內(nèi)設(shè)計,再到家庭設(shè)計都是按照人的需求進行設(shè)計。

現(xiàn)在主流的處理空間的方法,還是傳統(tǒng)的自然語言處理(NLP)和計算機視覺(CV)方式的延伸。基于 CV 的 3D 建模更擅長的是單體生成,這方面并沒有太多的技術(shù)稀缺性。我們公司也有很好的圖轉(zhuǎn) 3D 單體的模型,現(xiàn)在倉庫里面已經(jīng)有 100 萬個單體了。

但是問題的關(guān)鍵在于,如何針對用戶特定的需求,從這個倉庫中選擇出來合適的商品,綜合各種因素,擺放到合適的位置。本科期間,我們做了大量關(guān)于這方面能力的建筑學(xué)訓(xùn)練和認(rèn)知升維。這也是為什么我們現(xiàn)在這么稀缺和獨特,能把這個事情落地的原因。

DeepTech:決定成立公司做創(chuàng)業(yè)這件事,是你在德州大學(xué)奧斯汀分校讀博期間發(fā)生的。是怎樣的契機讓你覺得時機非常成熟了,已經(jīng)不能再等而是必須立刻休學(xué)去做這件事?

劉紫東:我覺得是兩方面。一方面是從宏觀層面來說,與 60 后、70 后、80 后相比,我們 90 后、95 后這一代人是被時代拋棄掉的一代。學(xué)歷紅利已不再,時代沒有給我們太多機會,所以我是很絕望地活著的。對我來說走創(chuàng)業(yè)這條路是“沒得選”,我非常珍惜技術(shù)創(chuàng)新的機會,當(dāng)機會來了一定要抓住。

從微觀上來說,當(dāng)時我在國外通過一些創(chuàng)新項目和比賽已經(jīng)小有名氣。2022 年底,隨著 ChatGPT 的火爆,有些國內(nèi)外的投資人認(rèn)為我們做 AI 生成空間挺好玩,就聯(lián)系到我。所以,我?guī)缀鯖]有什么遲疑就休學(xué)了,然后于 2023 年 4 月在深圳成立了這家公司。

DeepTech:你本身是 95 后,團隊也是一支年輕的團隊,你是如何管理團隊的呢?

劉紫東:作為公司的 CEO,我和整個團隊的相處模式會隨著公司的情況的發(fā)展而有所變化。公司剛開始成立時只有幾個人、十幾個人,去年發(fā)展到 30 多人,現(xiàn)在已經(jīng)有 70 多人了。我更傾向于直接管理,我覺得減少中間層級,可以降低溝通成本和提升效率。但是這需要對管理者和執(zhí)行者都有更高的綜合素質(zhì)。這確實是一段挺奇妙的人生經(jīng)歷。我很難描述現(xiàn)在的狀態(tài),它有點來得太快了,有點像拔苗助長的感覺。我其實也經(jīng)常陷入一種反思,感覺一切都挺不可思議的。

DeepTech:空間生成是一個新的領(lǐng)域,它又涉及到很多學(xué)科交叉,你是如何管理和建設(shè)這支團隊的呢?

劉紫東:主要以培養(yǎng)為主,因為 AI 領(lǐng)域變化很快。我們的團隊成員不一定非得是對口的,可能只是大方向相近,然后我們再精準(zhǔn)培養(yǎng)、逐步上手。尤其是比較前沿的方向或沒有標(biāo)準(zhǔn)答案的領(lǐng)域,我們更加傾向于招學(xué)生,然后通過校企合作來進行培養(yǎng)。整體上來說,公司在 3D 空間內(nèi)容生成的核心技術(shù)壁壘都是我們自己創(chuàng)造出來的。在這方面,我們覺得智商和意愿比直接經(jīng)驗高很多倍。

DeepTech:那目前公司的發(fā)展?fàn)顟B(tài)和你最初預(yù)設(shè)的相比,是按照原來預(yù)設(shè)的來發(fā)展的嗎?

劉紫東:一部分比預(yù)想的更慢,一部分則更快。我們的產(chǎn)品研發(fā)和賺錢進度比我們想象中要慢,因為我們越做越發(fā)現(xiàn)事情的復(fù)雜性。但另一方面,我們也更有信心,因為我們踩過的坑,后面進入到這個領(lǐng)域的人還得再踩一遍。所以,研發(fā)和賺錢的進度比我們預(yù)期的更慢,但融資的進度、團隊規(guī)模的擴張速度比我們預(yù)期中更快。

DeepTech:那在進展慢的方面會有壓力嗎?

劉紫東:那倒沒有,和想象中的進度不太一樣是一件很正常的事情。雖然我們有些地方慢一點,但整體上還是一個非常能打的、欣欣向榮的團隊。我們剛開始覺得一年能做出來的事情,現(xiàn)在做了兩年多,但別人做了 10 年也沒做出來。并不是有一家競品公司做出來了產(chǎn)品,我們沒做出來,現(xiàn)在的情況是,我們進行了世界上目前非常少見的、產(chǎn)品化程度最高的嘗試,所以我還是比較驕傲的。

空間 AI 的終極外延:不僅是工具,更是元宇宙的商業(yè)生態(tài)

DeepTech:最后請幫我們暢想一下,隨著技術(shù)的發(fā)展和團隊逐漸走上軌道,在與用戶的交互方式方面可能會出現(xiàn)哪些顛覆性的改變?

劉紫東:我覺得這個會千差萬別。首先,游戲領(lǐng)域會在全球范圍內(nèi)出現(xiàn)的第一個類似現(xiàn)在抖音地位的、基于空間模態(tài)的娛樂內(nèi)容社交平臺。它既有娛樂屬性,也有社交屬性。最終可能是一個平臺,也可能是兩個平臺。

人們會在這個平臺上做幾件事情:

第一,成為一個風(fēng)靡全球的、時尚和有活力的游戲內(nèi)容社區(qū),以青少年群體為主,然后向二三十歲的中青年群體蔓延。

第二,演化為包含實體經(jīng)濟的元宇宙電商平臺,類似于室內(nèi)版的“谷歌地球(Google Earth)”,人們可以在該平臺社交、購物,甚至直播等各種活動。用戶可以通過這個平臺,足不出戶地去全球各地的家庭做客。既有個體戶在這個元宇宙平臺上開店售賣商品,也有大連鎖店在上面開 Shopping Mall。

當(dāng)然,我們還有一個更近期的目標(biāo),所有與設(shè)計和空間改造相關(guān)的都可以通過我們的平臺作為流量入口。比如買畫、地毯、床單、窗簾、擺件、花草……甚至布置兒童房等。

它們很可能是同步進行的。首先它是款游戲,然后會進行現(xiàn)實的鏡像。之后會有實際的需求在平臺產(chǎn)生,接下來就會有買賣、有交易,再往后就會有商家在上面開店。


(來源:劉紫東)

DeepTech:所以,也可以說它是虛擬現(xiàn)實之間真正的元宇宙平臺?

劉紫東:元宇宙這個詞在五年前已經(jīng)被用濫了,它之所以沒發(fā)展起來原因還是卡在了技術(shù)問題。過去的元宇宙其實都是用雇傭大量場景地編手工建模搭建出來的場景,那不是真正的元宇宙。隨著空間模態(tài)技術(shù)的成熟,每個人可以便捷地把自己家復(fù)制到網(wǎng)上、創(chuàng)造 3D 資產(chǎn)以及做渲染,所以現(xiàn)在我們覺得真正的元宇宙時機到來了。

DeepTech:總結(jié)來說,AI 生成空間相當(dāng)于改變了生產(chǎn)關(guān)系,也就是把之前特別高的門檻或者難以做到的事情,現(xiàn)在做成普通用戶人人都能參與、能實現(xiàn)的一種工具。

劉紫東:對,這是其中的一個方面。我們通過 AI 讓更多用戶能夠體驗到個性化設(shè)計的樂趣,相當(dāng)于幫他們跨越了一個維度,顯著降低了技術(shù)的實現(xiàn)門檻。

但其實我們做的事情并不只是提供了一個工具那么簡單,而是提供了一種可以激發(fā)大規(guī)模創(chuàng)意以及互動的基礎(chǔ)能力。一種已經(jīng)被驗證的生態(tài)型公司的經(jīng)典路徑是:商業(yè)來自于流量,流量來自于內(nèi)容,內(nèi)容來自于工具。所以,當(dāng)我們有了一個好工具之后,它會產(chǎn)生好的內(nèi)容,好的內(nèi)容又會吸引更多用戶,而當(dāng)平臺聚集了海量用戶后,各種商業(yè)機會就都來了。

如果說過去十年,工具型平臺的終點是內(nèi)容社區(qū),那么空間 AI 的終點,很可能是一個涵蓋內(nèi)容社區(qū)、電商和社交的、真實世界的數(shù)字鏡像與商業(yè)生態(tài)。

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
金融圈炸鍋!中信建投連續(xù)兩人栽了,“投行第一美女”也沒逃過

金融圈炸鍋!中信建投連續(xù)兩人栽了,“投行第一美女”也沒逃過

金融八卦女
2025-12-26 14:59:39
97歲田華現(xiàn)狀曝光,和小孫子相依為命,住破舊老房子,日子清貧

97歲田華現(xiàn)狀曝光,和小孫子相依為命,住破舊老房子,日子清貧

以茶帶書
2025-12-02 18:11:43
1958年,2億只麻雀一夜之間沒了,大家都以為保住了糧食,結(jié)果第二年那報應(yīng)來得太猛,還得厚著臉皮找蘇聯(lián)救急

1958年,2億只麻雀一夜之間沒了,大家都以為保住了糧食,結(jié)果第二年那報應(yīng)來得太猛,還得厚著臉皮找蘇聯(lián)救急

歷史回憶室
2025-12-26 11:11:27
97年毛新宇在京結(jié)婚,300位老將軍齊刷刷到場,輪椅上那位老人一露面,全場眼眶都紅了

97年毛新宇在京結(jié)婚,300位老將軍齊刷刷到場,輪椅上那位老人一露面,全場眼眶都紅了

清風(fēng)鑒史
2025-12-18 20:10:17
北京一大型醫(yī)院停業(yè)!

北京一大型醫(yī)院停業(yè)!

美麗大北京
2025-12-26 11:02:43
對越反擊戰(zhàn)期間,先前有 15 個國家明確站隊支持越南,然而戰(zhàn)爭正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

對越反擊戰(zhàn)期間,先前有 15 個國家明確站隊支持越南,然而戰(zhàn)爭正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

史海孤雁
2025-12-19 17:46:17
王勵勤人事調(diào)整展現(xiàn)高超手腕!秦志戩由乒協(xié)回國乒,有望任總教練

王勵勤人事調(diào)整展現(xiàn)高超手腕!秦志戩由乒協(xié)回國乒,有望任總教練

不寫散文詩
2025-12-25 20:22:00
錢再多有啥用?身價5億英鎊的貝克漢姆現(xiàn)狀,給所有運動員提了醒

錢再多有啥用?身價5億英鎊的貝克漢姆現(xiàn)狀,給所有運動員提了醒

洲洲影視娛評
2025-12-25 20:19:03
山東青島公益人王順利不幸去世,享年61歲,一年前駕車時突發(fā)癲癇查出腦癌,遺體告別儀式今日舉行

山東青島公益人王順利不幸去世,享年61歲,一年前駕車時突發(fā)癲癇查出腦癌,遺體告別儀式今日舉行

極目新聞
2025-12-26 12:27:50
跨年檔15部影片定檔!懸疑戰(zhàn)爭成主流,成龍?zhí)栒倭Σ患芽靿|底

跨年檔15部影片定檔!懸疑戰(zhàn)爭成主流,成龍?zhí)栒倭Σ患芽靿|底

萌神木木
2025-12-26 14:47:52
美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

楓冷慕詩
2025-12-25 14:39:02
聞泰科技:10月中旬以來安世中國累計出貨超110億片芯片 公司將于近期參加安世第二次聽證會

聞泰科技:10月中旬以來安世中國累計出貨超110億片芯片 公司將于近期參加安世第二次聽證會

財聯(lián)社
2025-12-26 19:50:08
美司令曾警告:若大陸武力收臺,美軍將摧毀中方火箭軍和核武庫!

美司令曾警告:若大陸武力收臺,美軍將摧毀中方火箭軍和核武庫!

壹知眠羊
2025-12-21 07:15:19
NBA12月球員場均罰球榜:東契奇11.3次居首,亞歷山大僅第18

NBA12月球員場均罰球榜:東契奇11.3次居首,亞歷山大僅第18

懂球帝
2025-12-26 15:28:10
塔利斯卡:在中國生活簡直是一種享受,那段時光非常美好

塔利斯卡:在中國生活簡直是一種享受,那段時光非常美好

懂球帝
2025-12-26 13:44:47
我偷拿父母800給同桌父親看病,12年后我去相親時,被她母親攔住

我偷拿父母800給同桌父親看病,12年后我去相親時,被她母親攔住

清茶淺談
2025-03-26 16:51:12
火箭鋒線太恐怖!阿門伊森再現(xiàn)雙鬼拍門,KD強解,電風(fēng)扇也復(fù)出了

火箭鋒線太恐怖!阿門伊森再現(xiàn)雙鬼拍門,KD強解,電風(fēng)扇也復(fù)出了

細(xì)話籃球
2025-12-26 12:51:20
俄盧布匯率今年迄今已飆升逾四成 勢創(chuàng)30年來最強年度表現(xiàn)

俄盧布匯率今年迄今已飆升逾四成 勢創(chuàng)30年來最強年度表現(xiàn)

財聯(lián)社
2025-12-26 00:20:37
湖北男子到杭州旅游,在公交車上差點“社死”,被3個小學(xué)生“感動到涌泉相報”

湖北男子到杭州旅游,在公交車上差點“社死”,被3個小學(xué)生“感動到涌泉相報”

瀟湘晨報
2025-12-26 17:35:18
“向14億國人道歉!”亂港暴徒在法庭上大喊:是美國間諜指使的!

“向14億國人道歉!”亂港暴徒在法庭上大喊:是美國間諜指使的!

來科點譜
2025-12-24 09:01:30
2025-12-26 21:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16041文章數(shù) 514436關(guān)注度
往期回顧 全部

科技要聞

收割3000億!拼多多"土辦法"熬死所有巨頭

頭條要聞

多名中國女明星已立遺囑 關(guān)之琳無子將遺產(chǎn)都留給弟弟

頭條要聞

多名中國女明星已立遺囑 關(guān)之琳無子將遺產(chǎn)都留給弟弟

體育要聞

開翻航母之后,他決定親手造一艘航母

娛樂要聞

王傳君生病后近照變化大,面部浮腫

財經(jīng)要聞

投資巨鱷羅杰斯最新持倉:只留四種資產(chǎn)

汽車要聞

兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

態(tài)度原創(chuàng)

教育
時尚
手機
游戲
軍事航空

教育要聞

有變化!考研初試成績可能年前出?

今日熱點:電影《飛馳人生3》定檔春節(jié);大麥否認(rèn)與黃牛掛鉤……

手機要聞

華為Pura X2被曝明年暑期發(fā)布:麒麟9030+獨特設(shè)計,還有紅楓四攝

你也是龍宮禮奈?《寂靜嶺f》曾計劃"柴刀"當(dāng)武器!

軍事要聞

烏最新20點俄烏和平草案遞交莫斯科 俄方拒絕

無障礙瀏覽 進入關(guān)懷版