国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話影眸科技 CTO 張啟煊:大力不會永遠(yuǎn)出奇跡

0
分享至

3D 生成行業(yè)很大,但剛剛到GPT-2 的水平,國內(nèi)團隊要領(lǐng)先海外團隊,大廠與創(chuàng)業(yè)公司在同一起跑線。

撰文|藍(lán)洞商業(yè) 趙衛(wèi)衛(wèi)

消費級的生成式AI屢見不鮮,工業(yè)級的生成式AI亟待新突破,繼騰訊混元入局3D生成模型之后,字節(jié)跳動最近也發(fā)布了3D生成大模型Seed3D 1.0。

工業(yè)級的3D生成意味著更高的精度和質(zhì)量,而且適用的行業(yè)也主要集中在B端行業(yè)。騰訊混元3D生成模型已經(jīng)進(jìn)化到了3.0版本,主要用于游戲開發(fā),而字節(jié)跳動展示的3D生成大模型使用場景,主要瞄準(zhǔn)仿真環(huán)境中的具身智能大模型訓(xùn)練。

衡量一個3D生成模型的能力,目前沒有絕對標(biāo)準(zhǔn),只有相對質(zhì)量的對比。

在字節(jié)跳動Seed3D 1.0的測試圖中,還原度、透視與結(jié)構(gòu)、幾何質(zhì)量等多個維度都優(yōu)于同行對手,而它選取的國內(nèi)對手中,表現(xiàn)較好的分別是影眸科技的Rodin Gen-1.5、騰訊Hunyuan 3D-2.1和VAST的Tripo 2.5。

影眸科技團隊,后排左一為CEO吳迪,前排左一為CTO張啟煊

尤其是影眸科技,這家專注于3D大模型技術(shù)的創(chuàng)業(yè)公司由吳迪、張啟煊等人于2020年創(chuàng)立,去年A輪融資時,影眸科技的主要產(chǎn)品Rodin用45天就拿到了100萬美元ARR,字節(jié)跳動和美團龍珠領(lǐng)投,在今年的A+輪中,字節(jié)跳動繼續(xù)追加投資。

值得注意的是,過去一年間,字節(jié)在自身AI業(yè)務(wù)上飛速發(fā)展,但戰(zhàn)略投資很少出手AI項目,影眸科技是為數(shù)不多的一家。

如今,字節(jié)跳動親自下場布局3D生成模型,不難看出對這一賽道的重視,這也意味著3D生成市場會迎來更快發(fā)展。

9月,影眸科技上新了Rodin Gen-2.0版本的模型,相比上一代模型,生成的3D模型有了更加銳利和平直的邊緣,這一代模型在交互上增加了分件功能,讓用戶通過指定顆粒度來控制和重新拆分零件,增加了用戶可用性的同時領(lǐng)先于同類產(chǎn)品。

與此同時,網(wǎng)易游戲的《蛋仔派對》、3D打印行業(yè)的拓竹等公司和產(chǎn)品,都已經(jīng)用上了影眸科技的Rodin,他們通過Rodin的3D生成開發(fā)產(chǎn)品,這大大提升了3D內(nèi)容生產(chǎn)的規(guī)模和效率。

但3D生成的ChatGPT時刻尚未到來,影眸科技CTO張啟煊認(rèn)為,當(dāng)下行業(yè)差不多剛剛發(fā)展到GPT-2的水平,而未來進(jìn)化的方向,是要滿足不同行業(yè)的具體使用場景,更需要互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)公司們齊頭并進(jìn)。

在騰訊、字節(jié)紛紛下場布局3D生成模型的當(dāng)下,影眸科技作為創(chuàng)業(yè)公司如何思考未來的發(fā)展?「藍(lán)洞商業(yè)」對話了影眸科技CTO張啟煊,以下為內(nèi)容精編:

藍(lán)洞:你看到大廠相繼入局3D生成的產(chǎn)品之后,第一反應(yīng)是什么?

張啟煊:這更像是一個信號,表示愿意投入3D生成這件事。

騰訊混元3D大模型真正的飛躍,是今年三四月份,混元3D把模型參數(shù)量上到了百億級規(guī)模,這種嘗試需要一次性投入巨大的算力成本,對初創(chuàng)公司來說風(fēng)險很大,但幸運的是混元成功了,后面的公司再去Scaling(規(guī)?;┚捅容^有信心了。

藍(lán)洞:大廠在3D生成的場景上各有側(cè)重,比如騰訊主要是游戲,字節(jié)主要是具身智能和電商,你們呢?

張啟煊:具身智能的幾家頭部公司也都在用我們的產(chǎn)品,包括上海交大的穆堯老師有一個Robo Twin項目,通過結(jié)合現(xiàn)實世界的遙操作數(shù)據(jù)與數(shù)字孿生的合成數(shù)據(jù),為雙臂機器人的研究提供強有力的支持,他們就選擇我們Rodin去生成具身智能的3D資產(chǎn),因為生成的模型橫平豎直規(guī)整度很高。

具身智能領(lǐng)域的數(shù)據(jù)來源有兩個,一個是真實數(shù)據(jù),另一個是虛擬數(shù)據(jù)。

如果你要在仿真環(huán)境中做虛擬數(shù)據(jù)的話,肯定需要3D資產(chǎn)在仿真環(huán)境中使用,那這個3D資產(chǎn)不可能靠掃描,也不太能夠雇人去建,靠現(xiàn)有的數(shù)據(jù)集的話又太少了,這時候3D生成就是很好的方向。

消費級的文字、音頻、圖片或是視頻內(nèi)容生成,都是往社交媒體走的,但3D生成不是這種模態(tài),它不是直接跟大眾接觸,從網(wǎng)易游戲到3D打印行業(yè)的拓竹,都是我們的客戶,但不同行業(yè)對3D的要求是不一樣的,差異非常巨大。

比如3D打印行業(yè)更關(guān)注模型的水密性,而游戲行業(yè)是一個很長的工業(yè)管線,我們在逐步攻破布線、UV和綁定動畫等問題,因為表面的平整度和曲面規(guī)范性非常重要。

藍(lán)洞:對于一個普通用戶來說,現(xiàn)在接觸你們的3D生成最普遍的形式是什么?

張啟煊:一個是3D打印,另外一個就是網(wǎng)易的游戲《蛋仔派對》。《蛋仔派對》上的「AI模型生成」功能,讓玩家輸出文字或上傳圖片就可以生成高質(zhì)量模型,然后在樂園工坊中直接使用,這意味著3D?成技術(shù)已經(jīng)進(jìn)?了?規(guī)模商業(yè)應(yīng)?階段。

能夠跟大廠合作,是因為我們團隊在國內(nèi)的圖形學(xué)中是領(lǐng)先的,在國際圖形學(xué)頂級會議上斬獲過「最佳論文獎」和「TOP10技術(shù)論文速覽」雙料榮譽。

對于很多游戲公司來說,選擇第三方模型是現(xiàn)階段最穩(wěn)妥的方案,因為各家模型有各自的特點,語言模型上GPT-5更好還是Claude更好?視頻生成上Sora-2跟VEO-3.1哪個更好?大家都很難說絕對領(lǐng)先,我們只能說第一梯隊是誰。

藍(lán)洞:現(xiàn)階段國內(nèi)3D生成的第一梯隊是誰?

張啟煊:我認(rèn)為是我們Rodin-2跟騰訊混元3D。我們不擔(dān)心競爭,最擔(dān)心的是大廠沒有加入這個游戲。

目前海外市場,基本占了我們收入的百分之七八十。海外主要在布局這一塊的是Roblox,它是一個在線游戲創(chuàng)建平臺,讓用戶通過免費工具來創(chuàng)作內(nèi)容,Roblox最早做了3D Control Net,能夠產(chǎn)生高質(zhì)量的輸出。

一年前發(fā)布1.0版本的時候,我們的一個賣點就是可控性很高,用3D的Control Net把設(shè)計產(chǎn)品的長寬高比例等固定下來,而不是讓AI胡亂生成, 這對游戲和工業(yè)設(shè)計是非常重要的剛需。上個月,混元3D也發(fā)布了原生3D組件生成模型的可控功能。

藍(lán)洞:上個月發(fā)布的新版本,相比去年的1.5版本,行業(yè)有哪些新變化?外界有哪些新的反饋?

張啟煊:現(xiàn)在跟去年相比,總的來說3D生成整個行業(yè)最大的變化就是參數(shù)量上去了。

比如去年年底,我們發(fā)布Rodin Gen-1.5版本的時候,參數(shù)量是超過40億,而現(xiàn)在整個3D生成行業(yè)第一梯隊中的模型,標(biāo)配已經(jīng)是百億參數(shù)了,百億參數(shù)也就意味著你背后的數(shù)據(jù)量,已經(jīng)到百萬級別了。

所以行業(yè)飛速發(fā)展,一方面創(chuàng)業(yè)公司有了資本和資源去收集大量3D數(shù)據(jù),渠道已經(jīng)打通,也不再擔(dān)心3D數(shù)據(jù)從哪里來,而另外一方面,第一波做3D生成的公司已經(jīng)賺錢了,所以互聯(lián)網(wǎng)大廠也注意到了這個方向,開始跟游戲業(yè)務(wù)做協(xié)同,后面包括初創(chuàng)公司和大廠的競爭會更激烈。

我們影眸的特點是模型側(cè)各種功能性上的改進(jìn),比如將模型快速拆解為多個獨立部件,這些功能性和底層框架上比較領(lǐng)先。

上個月發(fā)布的新版本,我們已經(jīng)提前把基座模型給到一些用戶體驗,主打的功能就是分件,用戶體驗感覺很不錯。

但意想不到的反饋是,很多人覺得我們貼圖質(zhì)量變差了,其實我們做過AB test,換回原來的貼圖模型會更差,背后原因是模型質(zhì)量提升了之后,大家對貼圖的要求更高了,顯得貼圖質(zhì)量變差了。

我們每個版本的迭代都是朝著用戶需求展開,比如國內(nèi)一家知名智能硬件科技企業(yè),他們設(shè)計師都在用我們的產(chǎn)品,給我們的反饋是需要3D生成邊緣銳利,我們回去就在1.5版本中把這個特性做出來了。如今到2.0版本,我們分件功能也是來自設(shè)計行業(yè)的需求,讓設(shè)計變得更可控,使用面更廣了。

對于3D打印行業(yè)來說,現(xiàn)在小紅書上很多案例,都是用我們的產(chǎn)品生成3D設(shè)計之后拼裝的案例?,F(xiàn)在還需要下載之后在三維軟件中進(jìn)一步操作,但后面我們會把這一套流程集成在我們網(wǎng)站中,不再需要用戶二次操作。

藍(lán)洞:從你們的產(chǎn)品UI設(shè)計上,能感覺你們的審美超過很多大廠,這是怎么來的?

張啟煊:我們團隊很多藝術(shù)家,幾個創(chuàng)始成員都喜歡拍電影,都會自己用三維動畫軟件Blender做3D渲染,所以很多產(chǎn)品宣傳片讓外界以為是專業(yè)團隊做的,其實都是我們自己設(shè)計的。在交互上的設(shè)計也是,與其說滿足自己的審美偏好,不如說幫用戶做到足夠方便,否則效果不會好。

藍(lán)洞:就目前3D生成來說,大廠比創(chuàng)業(yè)公司的優(yōu)勢大很多嗎?

張啟煊:大模型最重要的還是數(shù)據(jù)。至少目前,大廠跟創(chuàng)業(yè)公司在3D生成上是站在同一起跑線的。比如說,我們現(xiàn)在的數(shù)據(jù)量級已經(jīng)超出騰訊這樣級別的大廠在做的游戲數(shù)據(jù)量。

舉個例子,一般中小型游戲有幾百到上千個模型,中大型游戲則是幾千到上萬個。假設(shè)頂級游戲公司有100個游戲,每個游戲有1萬個模型,那么它最多有100萬個模型,而我們現(xiàn)在有的數(shù)量級已經(jīng)遠(yuǎn)遠(yuǎn)超過這個數(shù)量了。

大廠可以大力出奇跡,一次兩次可以,但第三次可能就難了。大家能看出GPT-5和GPT-4o的巨大差別嗎?所以要的是在體驗和場景使用上的新突破。

3D是個很大的行業(yè),但3D生成現(xiàn)在其實差不多剛剛到GPT-2的水平,而且國內(nèi)的團隊要領(lǐng)先海外團隊,我們私下開玩笑說,最聰明的那批人全都沒在做3D生成,海外的聰明人都去做AI視頻生成,都去做AGI了。

藍(lán)洞:制約3D生成下一步發(fā)展的條件,除了巨大的算力消耗還有什么?如何找到新的突破方向?

張啟煊:之前是有了模型之后去定制產(chǎn)品,比如從GPT-3.5到GPT- 4,而其實一個新的方向是為了一個產(chǎn)品去定制一個模型,比如最新的Sora 2。

它是為了社交媒體玩法,設(shè)計了可以植入人物多人合拍的功能,這些功能都是需要在網(wǎng)絡(luò)側(cè)引入的。再比如Google的AI圖像生成和編輯工具Nano Banana,也是從產(chǎn)品角度出發(fā)設(shè)計了一個新的網(wǎng)絡(luò)結(jié)構(gòu)。

那對應(yīng)到3D生成領(lǐng)域,我們很早就意識到為了用戶需求要在功能上進(jìn)行設(shè)計,比如之前的3D Control Net和現(xiàn)在的分件,都是因為要滿足不同行業(yè)的具體使用場景,而不是加大數(shù)據(jù)和參數(shù)讓絕對質(zhì)量變高。

3D生成行業(yè)剛剛起步,因為3D行業(yè)不同行業(yè)對3D模型需求差異遠(yuǎn)要比圖像跟視頻高很多。比如工業(yè)設(shè)計都要CAD模型,需要的是曲面模型而不是網(wǎng)格化的,那就要求我們把模型變成曲面參數(shù)表達(dá),每完成一個新的里程碑,就會在新的領(lǐng)域里發(fā)現(xiàn)新的客戶去使用你的東西,這就是后面大家整個AI生成行業(yè)去迭代的方向。

藍(lán)洞:最近美國李飛飛團隊也發(fā)布了全新實時生成式世界模型RTFM,一張H100就可以運行,他們主導(dǎo)的3D生成方向本質(zhì)是學(xué)會了渲染的AI,而你之前也提到未來看好的方向是用生成式的方式去做渲染,這其中有什么不同?

張啟煊:我們其實不是一個賽道。李飛飛老師功成名就,她要考慮的是人類未來10年或20年后的東西,所以很前衛(wèi),他們的產(chǎn)品有點像視頻生成,是顛覆現(xiàn)在圖形渲染管線的事,其實不是為了這一代游戲和這一代的CG去做的,所以周期肯定更長。

而我們作為一家小初創(chuàng)公司,要先解決現(xiàn)階段的生存問題。3D生成是基于Mesh表達(dá), 所謂Mesh表達(dá)就是由大量三角形面拼接而成的3D模型表達(dá)形式,它跟現(xiàn)在的CG還有游戲的工業(yè)是接軌的。

我看好未來生成式的方式去做渲染,我們也確實在布局,但跟我們現(xiàn)在的Rodin產(chǎn)品不太相關(guān)。之前大家想要呈現(xiàn)一個精致的視頻畫面,背后有3D模型、光照和材質(zhì)等等要求,然后通過渲染引擎去得到最后的圖像。而生成式AI改變了這個規(guī)則,圖像可以直接降噪生成視頻,但做不到非常精準(zhǔn),我們就希望把視頻生成變成一個渲染器,去完成妥當(dāng)?shù)匿秩尽?/p>

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
特斯拉中國再推促銷方案:5月31日前,購買Model 3、Model Y、Model Y L車型5年0息

特斯拉中國再推促銷方案:5月31日前,購買Model 3、Model Y、Model Y L車型5年0息

魯中晨報
2026-04-29 10:48:05
要來了?鄭麗文啟程赴美前,大陸先聲奪人,全島2300萬人面臨抉擇

要來了?鄭麗文啟程赴美前,大陸先聲奪人,全島2300萬人面臨抉擇

軒逸阿II
2026-05-01 08:16:37
辣眼!侃爺澳洲妻子再穿暴露連體衣,大方展示...!外媒都看不下去了

辣眼!侃爺澳洲妻子再穿暴露連體衣,大方展示...!外媒都看不下去了

澳洲紅領(lǐng)巾
2026-04-29 14:44:16
不滿,湖人球迷對斯科特福斯特執(zhí)法對陣火箭的第六場比賽感到憤怒

不滿,湖人球迷對斯科特福斯特執(zhí)法對陣火箭的第六場比賽感到憤怒

好火子
2026-05-02 00:55:52
滾回你自己的破國家!南非爆發(fā)大規(guī)模排外浪潮,暴力驅(qū)逐非法移民

滾回你自己的破國家!南非爆發(fā)大規(guī)模排外浪潮,暴力驅(qū)逐非法移民

十夏九漓
2026-05-01 19:35:35
U15國足0-1羅馬尼亞!1勝3負(fù)收官 獲12國邀請賽第8名 遭單刀絕殺

U15國足0-1羅馬尼亞!1勝3負(fù)收官 獲12國邀請賽第8名 遭單刀絕殺

我愛英超
2026-05-01 18:40:29
電商亂象:AB貨已經(jīng)猖獗到恐怖如斯!

電商亂象:AB貨已經(jīng)猖獗到恐怖如斯!

黯泉
2026-05-01 10:34:48
火箭湖人真要搶七了?福斯特?fù)?dān)任G6主裁判:他執(zhí)哨火箭勝率最高

火箭湖人真要搶七了?福斯特?fù)?dān)任G6主裁判:他執(zhí)哨火箭勝率最高

羅說NBA
2026-05-01 22:47:04
一條傳了近30年的謠言,澄清為何那么難?

一條傳了近30年的謠言,澄清為何那么難?

網(wǎng)絡(luò)辟謠
2026-04-27 08:11:30
去城里的姑父家拜年,姑姑讓我滾,后來她從新聞上看到我任命縣長

去城里的姑父家拜年,姑姑讓我滾,后來她從新聞上看到我任命縣長

千秋文化
2026-04-30 18:46:59
判決來了!三星向中興支付 27 億專利費

判決來了!三星向中興支付 27 億專利費

云頭條
2026-05-01 22:31:43
5月1日俄烏:俄羅斯正在認(rèn)清現(xiàn)實,特朗普不想再裝了

5月1日俄烏:俄羅斯正在認(rèn)清現(xiàn)實,特朗普不想再裝了

山河路口
2026-05-01 18:36:01
湖火G6傷情更新,杜蘭特狀態(tài)升級!火箭連獲4大喜訊送雷霆神助攻

湖火G6傷情更新,杜蘭特狀態(tài)升級!火箭連獲4大喜訊送雷霆神助攻

鍋子籃球
2026-05-01 11:34:12
美軍封鎖逼退41艘伊朗油輪6900萬桶原油,德黑蘭內(nèi)外交困

美軍封鎖逼退41艘伊朗油輪6900萬桶原油,德黑蘭內(nèi)外交困

新浪財經(jīng)
2026-05-01 15:20:11
孫楊工作室:孫楊已就相關(guān)不實信息報案,公安機關(guān)已受理

孫楊工作室:孫楊已就相關(guān)不實信息報案,公安機關(guān)已受理

界面新聞
2026-05-01 11:29:00
舉報抽煙的沈女士為何翻車?因為她踩中,網(wǎng)友們最討厭的1個雷區(qū)

舉報抽煙的沈女士為何翻車?因為她踩中,網(wǎng)友們最討厭的1個雷區(qū)

觀察鑒娛
2026-05-01 08:51:07
車載馬桶,屎無前例的創(chuàng)新

車載馬桶,屎無前例的創(chuàng)新

難得君
2026-05-01 18:05:01
剛剛!新加坡總理黃循財一度淚灑群眾大會、哽咽近3分鐘,只因…

剛剛!新加坡總理黃循財一度淚灑群眾大會、哽咽近3分鐘,只因…

新加坡萬事通
2026-05-01 18:50:07
陳慧琳演唱會穿三角褲衩,五十多了合適嗎?不愧是女神

陳慧琳演唱會穿三角褲衩,五十多了合適嗎?不愧是女神

西樓知趣雜談
2026-05-01 22:23:05
1936年親手活捉蔣介石的孫銘九:建國后,上級部門破例為他謀工作

1936年親手活捉蔣介石的孫銘九:建國后,上級部門破例為他謀工作

磊子講史
2026-01-22 10:13:17
2026-05-02 05:56:49
藍(lán)洞商業(yè)
藍(lán)洞商業(yè)
原創(chuàng)、深度的新經(jīng)濟人物和事件
691文章數(shù) 773關(guān)注度
往期回顧 全部

科技要聞

DeepSeek發(fā)布多模態(tài)論文又連夜刪除

頭條要聞

美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

頭條要聞

美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

體育要聞

無奈!約基奇:這要在塞爾維亞 全隊早被炒了

娛樂要聞

馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

財經(jīng)要聞

GPU神話松動,AI真正的戰(zhàn)場變了

汽車要聞

限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

態(tài)度原創(chuàng)

健康
教育
本地
家居
公開課

干細(xì)胞治燒燙傷面臨這些“瓶頸”

教育要聞

高考地理概念:地下水

本地新聞

用青花瓷的方式,打開西溪濕地

家居要聞

靈動實用 生活藝術(shù)場

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版