国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

對話自變量CTO王昊:在具身智能的“無人區(qū)” 探索端到端大模型的終極形態(tài)|連線創(chuàng)始人

0
分享至

編者按:他們創(chuàng)辦的公司或已是獨角獸,或剛啟動種子輪,或已家喻戶曉,或長期身居幕后,或正起于微末,但他們都是中國新經濟的微觀脈搏,是這輪產業(yè)和技術升級的微觀主導者和實踐者,不同行業(yè)成千成萬的他們的身影匯聚,投射變革的洪流。

由財聯社和《科創(chuàng)板日報》聯合發(fā)起的 “連線創(chuàng)始人/CEO”欄目,主要關注創(chuàng)新創(chuàng)業(yè)型企業(yè),以企業(yè)創(chuàng)始人/CEO的訪談為一手信源,讓成長中的創(chuàng)業(yè)公司走入公眾和市場視野,并發(fā)掘最新技術和產業(yè)趨勢。

《科創(chuàng)板日報》4月10日訊(記者 李明明)2026年開年,國內具身智能賽道已是獨角獸林立——自變量機器人、眾擎機器人、星動紀元、千尋智能等企業(yè)估值相繼突破百億大關,加之宇樹科技、智元機器人等已有的百億陣營,行業(yè)百億估值公司至少已達10家,正式邁入頭部獨角獸集群發(fā)展的新階段。

在這波密集的資本浪潮中,自變量機器人的爆發(fā)力尤為典型。據《科創(chuàng)板日報》記者此前獨家獲悉,繼今年1月官宣獲得由字節(jié)跳動、紅杉中國等機構參與的十億元級別融資后,該公司在2月份短期內又迅速完成了數億元的新一輪融資。

近期,《科創(chuàng)板日報》記者采訪了自變量聯合創(chuàng)始人、CTO王昊,圍繞自變量的技術路線迭代、開源進展、場景落地戰(zhàn)略,以及對具身智能行業(yè)的核心判斷,展開了全面且深度的分享。

王昊對《科創(chuàng)板日報》記者勾勒出一幅清晰的技術藍圖:端到端大模型是底座,世界模型與VLA的融合是突破口,人機協作的數據閉環(huán)是燃料,家庭場景是終極試煉場。這是一條與"分段式""垂類小模型"截然不同的路徑,也是一條需要長期投入、承受不確定性的"無人區(qū)"探索。

當前具身智能行業(yè)深陷“虛假繁榮”的癥結:技術驗證長期困于仿真“溫室”——完美參數下表現優(yōu)異,卻難以跨越重力、摩擦、光線變化等真實物理世界的“鴻溝”,導致模型泛化能力弱、長期穩(wěn)定性差、成本居高不下,產業(yè)化落地舉步維艱。

自變量與深圳市人工智能行業(yè)協會等聯合舉辦的全球首屆具身智能開發(fā)者大會(EAIDC 2026),正是對這一行業(yè)痛點的正面回應。其意義在于徹底撕掉Demo濾鏡,將競賽全面推向"真實荒野":通過全球最大規(guī)模真機實戰(zhàn),讓上百條機械臂在真實場地同步作業(yè),直面物理世界的所有變量,拒絕"紙上談兵"。這不僅為技術成熟度提供了在真實物理環(huán)境中檢驗的平臺,更以標準落地、產業(yè)鏈閉環(huán)推動產業(yè)化拐點的真正到來。


開發(fā)者大會啟示:具身智能需要"動手"的文化

作為全球首屆具身智能開發(fā)者大會的核心環(huán)節(jié),"具亮計劃"決賽采用了極具挑戰(zhàn)性的賽制:參賽團隊在三天內,于現場完成數據采集、模型訓練和測試。王昊對《科創(chuàng)板日報》記者表示,這種賽制設計 deliberately 模擬了具身智能的真實開發(fā)環(huán)境。

"我們提供所有硬件,沒有力覺傳感器,"王昊舉例說,"但在限速柔性操作、需要處理力信息時,有的隊伍嘗試密集捕獲機械臂關節(jié)的電流信號。雖然沒有那么準確,但把關節(jié)電流信號加入模型,可以部分彌補力感受的缺失——這是很有意思的想法。"

更令他印象深刻的是團隊間的分化:"第一天下午開源,到晚上有的選手還在調試環(huán)境,有的已經有成績了。后來我們發(fā)現,頻繁評測、仔細觀察數據和硬件的團隊,比不動手的成長得快得多。"

王昊從中提煉出一個關鍵認知:具身智能是交互學習,讓機器在測試和人的觀察中找到問題,越有可能找到物理世界復雜性的解法。 "這和一般的編程比賽差別很大——一般編程比賽沒有硬件,沒有數據。在具身智能黑客松中,愛動手、愛評測的團隊更容易突出。"

談及舉辦比賽的初衷,王昊表示核心目標是降低開源項目的使用門檻,建立通用和標準的接口。"把所有人放在同一套硬件、相同賽制下,大家會嘗試怎么盡可能快把代碼用起來、用好。同時,我們也想尋找同路人,挖掘優(yōu)秀選手,支持和鼓勵大家一起加入具身智能大潮。"

從WALL-OSS到世界模型與VLA的融合框架

開發(fā)者大會見證了開源社區(qū)的蓬勃活力,而技術的最終落地還要看模型產品的真實迭代。距離 WALL-OSS 開源過去整整半年,王昊在接受《科創(chuàng)板日報》記者專訪時,揭曉了這段時間的關鍵突破——世界模型與VLA(Vision-Language-Action)的聯合建模。

"現在業(yè)界的世界模型大多是分段式做法:先訓練一個視頻生成模型,再用動作生成模型,兩段式拼接完成從視覺到動作的映射。"王昊解釋道,"但我們的聯合框架中,動作和視覺是聯合建模的。這樣做的好處是,動作預測可以更好地尊重未來的預測,而未來預測又可以更好地遵循物理規(guī)律。通過聯合建模,我們希望突破世界模型很難遵循物理規(guī)律的限制。"

這一技術路線的差異化在于對"物理規(guī)律"的強調。當前視頻生成模型雖然能夠預測像素級的變化,但在具身智能場景下,模型需要理解的是物理世界的因果關系——物體如何受力、操作如何改變環(huán)境狀態(tài)。王昊指出,短期來看,自變量將引入更多多模態(tài)輸出架構以減少誤差累積;中長期目標則是在基模上實現"絕對意義上通用場景的泛化"。

當被問及"多模態(tài)"的具體所指時,王昊明確回應:"以前是輸出有限模態(tài),現在在端到端模型上更多考慮動作、語言、視覺的融合。"這意味著自變量的新一代架構將不再局限于傳統(tǒng)的"視覺編碼器+大語言模型+動作輸出"的流水線,而是探索更原生的多模態(tài)對齊方式。

"我們越來越傾向于做原生的多模態(tài),在很早的時候就讓語言和動作對齊。"王昊表示,"以前的方式往往會犧牲視覺能力——語言描述的信息很宏觀,但具身操作需要厘米級甚至毫米級的空間精度,時間尺度在秒級別。如果能讓動作、語言、視覺在同一個水平下進行思維鏈推理,模型就能同時在宏觀和微觀上都有清晰表現。"

數據戰(zhàn)略:真機、Ego-Centric與穿戴式的金字塔配比

盡管WALL-OSS在數據驅動下取得了長足進步,但王昊也坦言,數據采集依然是橫亙在具身智能行業(yè)面前的壁壘之一。面對近期大熱的Ego-Centric(第一人稱視角)和Human-Centric(以人為中心)數采路線,王昊明確表態(tài):自變量的核心路線不會偏移,但數據策略將發(fā)生重大調整。

自變量一直堅持真實世界的數據采集,過往主要來自機器人真機,這個不會停。所有交互式學習和強化學習,最重要的數據都來自于真機。王昊強調,"但2026年會有很大變化——我們會越來越依賴人的穿戴式或Ego-Centric方式采集數據,這是大趨勢。"

王昊特別區(qū)分了Human-Centric與Ego-Centric的概念差異:"Human-Centric意味著機器人的通用數據形態(tài),它一定有末端執(zhí)行器,可以是靈巧手的某種設備,自由度和機器人的自由度之間取折中。而Ego-Centric的數據完全和人的自由度一致,手持式、穿戴設備則介于兩者之間。"

這一數據戰(zhàn)略的底層邏輯是人機協作的閉環(huán)進化。"盡早用人機協作的方式讓閉環(huán)跑起來,"王昊說,"先用高質量數據、大規(guī)模訓練構建基礎模型,然后放到真實環(huán)境中。它有做不好的地方,人就接管,幫它從錯誤中恢復。這樣的數據會成為非常寶貴的來源,幫助模型提升。評測、訓練和數據采集要在同一個過程中完成,而不是分開的。"

自變量從成立第一天起就選擇了"大小腦統(tǒng)一的端到端大模型"路線。王昊對《科創(chuàng)板日報》記者坦誠分析了這一路線的核心挑戰(zhàn)。

"端到端相比于分層或小模型,訓練更復雜,需要的規(guī)模更大。如果沒有這兩個條件,端到端的效果不一定比分層模型好。"他指出,"端到端意味著必須有規(guī)模效應——數據量、模型參數量要上去。這兩點達不到,訓練很難起效。"

第二個挑戰(zhàn)在于Infra。"對端到端大模型的Infra要求和以往小模型不同。如果在Infra上沒有突破,訓練效率會很低。"王昊補充道。

第三個挑戰(zhàn)更為根本:評測的復雜性。"語言大模型可以看loss曲線,但具身智能不是這樣。Loss不能反映真實世界的表現,因為真實世界是閉環(huán)系統(tǒng)——環(huán)境怎么變化,模型怎么應對,更考驗模型的處理能力。"

面對"數據壁壘"的經典難題——模型不夠好就做不了復雜任務,采集不到高質量數據,沒有數據又訓練不好模型——王昊的解決方案是盡早建立人機協作的閉環(huán),讓評測、訓練和數據采集在同一個過程中完成。

家庭場景:直面"具身智能的圣杯"

上個月,自變量機器人攜手58集團旗下58到家平臺,在深圳正式推出了一項全新的智能保潔家庭服務——機器人保潔員正式“上崗”,與保潔阿姨協同作業(yè)完成家庭清潔服務。自變量與58同城合作進軍家庭服務場景,這一選擇在外界看來頗為激進——家庭場景比工業(yè)場景標準化程度更低,難度更大。王昊卻認為這是必由之路。

"家庭確實是具身智能的圣杯,因為它代表最廣泛、最開放的環(huán)境,以及最廣泛的任務。解決了家庭任務,就代表模型可以實現完全的泛化,基本上實現保姆級別的通用機器人。"他強調,"這個最終目標不是先做簡單場景、最后達到,而是一開始就要直面最復雜、最開放的場景,才能讓模型智能水平提升到可以解決豐富場景的能力。越早開始越好。"

進入家庭場景需要攻克兩大難題。首先是零樣本泛化能力。"進入家庭一開始沒有多少機會訓練模型,需要激發(fā)模型的推理能力,讓它在家庭場景通過推理探索成功,之后才能結合人機協作讓訓練越來越好。"其次是長程任務的精細度問題。"現在基模進入家庭,在很多任務上有完成的趨勢或動作意圖——比如對任何物體都有伸過去抓的趨勢,但精細度不夠,導致完成復雜長程任務時錯誤累積、最終失敗。"

王昊提出兩點解決思路:一是激發(fā)模型的推理能力,通過語言、視覺、動作在同一水平下的思維鏈,讓模型自己規(guī)劃和反思;二是在大規(guī)模真機基礎上探索強化學習,"保持在基模標準下更高的空間精度"。

對于商業(yè)化時間表,王昊對《科創(chuàng)板日報》記者給出了相對務實的判斷:"普通清潔、收納這類任務,1-2年時間可以實現完全自主。但在所有家庭任務中實現閉環(huán),時間可能要更長。"他區(qū)分了"大規(guī)模進入家庭"和"機器人被大規(guī)模應用"兩個概念,強調前者是逐步迭代的過程。

專訪最后,面對"具身智能是否會重走大模型卷算力、高資本投入老路"的提問,王昊給出了冷靜的判斷。

"做基礎模型的投入一直很高。我們從公司成立第一天起,在數據、算力、基礎設施上的投入都很大。"他承認,"但一旦建立規(guī)?;斈阃度?0倍資源取得領先時,資源聚集效應會越來越明顯。你會以數量級的優(yōu)勢在速度上超越別人,后來者要追上需要花數倍資源的增加。越早開始越有優(yōu)勢,越晚開始越難做成。"

這是否意味著需要千億級投入?"大家可以看自動駕駛的投入,每年幾百億。如果完全靠純資本投入很難,這是一個逐步發(fā)展的過程。"王昊強調,"很難在一年內把模型做到完全通用。要協作發(fā)展、階段式發(fā)展——不停提升基模能力,不斷迭代,反饋回來做更強的基模。模型越來越強,和商業(yè)競爭形成互補,研發(fā)投入才會越來越大,最后形成完全閉環(huán)。"

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
白巖松批評全紅嬋近況曝光,下場大快人心

白巖松批評全紅嬋近況曝光,下場大快人心

孤芳自賞的小李
2026-04-10 14:01:18
越來越多的人查出腸癌!醫(yī)生含淚苦勸:冰箱久置的這4物是幫兇

越來越多的人查出腸癌!醫(yī)生含淚苦勸:冰箱久置的這4物是幫兇

岐黃傳人孫大夫
2026-03-17 23:25:03
特朗普、萬斯為歐爾班助選,可能起反作用了......

特朗普、萬斯為歐爾班助選,可能起反作用了......

山河路口
2026-04-10 19:06:33
伊朗最高領袖,最新表態(tài)!伊媒:由于伊朗的堅持和施壓,以色列被迫停止對黎首都的襲擊!伊軍:隨時準備開火

伊朗最高領袖,最新表態(tài)!伊媒:由于伊朗的堅持和施壓,以色列被迫停止對黎首都的襲擊!伊軍:隨時準備開火

每日經濟新聞
2026-04-10 23:37:05
少婦被丈夫朋友侵犯,甘愿和對方做情人,還把老公掙的錢給他花

少婦被丈夫朋友侵犯,甘愿和對方做情人,還把老公掙的錢給他花

丫頭舫
2026-04-10 11:51:42
上海女博士在家8年未出門,警察破門后,看到屋內景象頓時傻眼了

上海女博士在家8年未出門,警察破門后,看到屋內景象頓時傻眼了

詭譎怪談
2025-05-02 00:08:52
網紅“一栗小莎子”因癌癥剃光頭,再穿藍衣仍漂亮,老公也理光頭

網紅“一栗小莎子”因癌癥剃光頭,再穿藍衣仍漂亮,老公也理光頭

裕豐娛間說
2026-04-10 18:58:05
朱琳現狀:錯過唐僧,二婚老公寵愛一生,73歲仍年輕漂亮

朱琳現狀:錯過唐僧,二婚老公寵愛一生,73歲仍年輕漂亮

蕭狡科普解說
2026-04-10 01:21:23
男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現驚人現象

男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現驚人現象

詭譎怪談
2025-04-01 17:37:59
真相來了!濃眉親承:因為錫安我才去了湖人,如果選莫蘭特絕不走

真相來了!濃眉親承:因為錫安我才去了湖人,如果選莫蘭特絕不走

夜白侃球
2026-04-10 14:41:02
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
遁入空門?遲重瑞寺廟誦經,送妻后被曝皈依,百億遺產說扔就扔

遁入空門?遲重瑞寺廟誦經,送妻后被曝皈依,百億遺產說扔就扔

李橑在北漂
2026-04-10 17:17:42
突發(fā)!大V“臧其超”商業(yè)帝國覆滅,500賬號全線封殺,粉絲超1億

突發(fā)!大V“臧其超”商業(yè)帝國覆滅,500賬號全線封殺,粉絲超1億

影像溫度
2026-04-10 09:23:33
“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

千言娛樂記
2026-04-09 09:17:50
黎巴嫩真主黨領導人納伊姆·卡西姆發(fā)表全國講話:將抵抗到生命最后一刻!以軍昨天剛宣布將其打死

黎巴嫩真主黨領導人納伊姆·卡西姆發(fā)表全國講話:將抵抗到生命最后一刻!以軍昨天剛宣布將其打死

每日經濟新聞
2026-04-10 21:10:18
錄音門事件:歐爾班與普京通話曝光,匈牙利大選最后一刻生變

錄音門事件:歐爾班與普京通話曝光,匈牙利大選最后一刻生變

民間胡扯老哥
2026-04-10 01:03:46
你永遠想不到,日本對我國的土地渴望到了什么程度

你永遠想不到,日本對我國的土地渴望到了什么程度

賤議你讀史
2026-04-10 12:07:08
警惕文化入侵!兩朵中國千年名花,被日漫和西方帶偏,成了晦氣花

警惕文化入侵!兩朵中國千年名花,被日漫和西方帶偏,成了晦氣花

云景侃記
2026-04-09 17:14:24
奉陪到底,中方專機抵朝前,朝鮮亮出集束彈頭,日韓防長緊急通話

奉陪到底,中方專機抵朝前,朝鮮亮出集束彈頭,日韓防長緊急通話

Ck的蜜糖
2026-04-10 17:03:54
鄭麗文的婚姻:女主外男主內,不生育孩子,事業(yè)理想置于家庭之上

鄭麗文的婚姻:女主外男主內,不生育孩子,事業(yè)理想置于家庭之上

青梅侃史啊
2026-04-09 19:51:42
2026-04-11 00:04:51
財聯社 incentive-icons
財聯社
以“準確、快速、權威、專業(yè)”為新聞準則,為投資者提供專業(yè)的投資資訊。
706329文章數 1019875關注度
往期回顧 全部

科技要聞

馬斯克狂發(fā)大火箭也養(yǎng)不起AI 年虧50億美元

頭條要聞

73歲騎友抄近路摔倒身亡 女兒:賠償問題無法達成共識

頭條要聞

73歲騎友抄近路摔倒身亡 女兒:賠償問題無法達成共識

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認戀情!聚會細節(jié)被扒

財經要聞

李強主持召開經濟形勢專家和企業(yè)家座談會

汽車要聞

搭載第二代刀片電池及閃充技術 騰勢N8L閃充版預售35萬起

態(tài)度原創(chuàng)

旅游
數碼
教育
手機
本地

旅游要聞

一個山村年旅游收入超兩億 云南“七子餅路”如何將茶區(qū)變景區(qū)|一線探訪

數碼要聞

飛利浦推出“27M2G5800”27英寸顯示器,4999元

教育要聞

生命教育潤無聲,家校社協同育擔當——邱林家教好故事

手機要聞

OPPO Find X9s Pro配色公布,全面登陸“鎖屏島”

本地新聞

12噸巧克力有難,全網化身超級偵探添亂

無障礙瀏覽 進入關懷版