国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

繼Deepseek后, 中國(guó)又迎來“Spirit時(shí)刻”: 具身智能也登頂了 | 前沿在線

0
分享至



繼 Deepseek 在語言模型領(lǐng)域登頂后,中國(guó)模型又一次在全球統(tǒng)一標(biāo)準(zhǔn)下拿下第一。這次,是具身智能。Spirit v1.5 的登頂,意味著中國(guó)團(tuán)隊(duì)訓(xùn)練出的機(jī)器人“大腦”,開始具備真正的世界級(jí)通用能力。

編輯:前沿在線 編輯部

2025年3月,Deepseek沖上Hugging Face Trending榜首,引爆了那句圈內(nèi)刷屏的評(píng)論:“中國(guó)第一次用開源模型把chatGPT擠下去了?!?/p>


那一刻不只是一次排行榜事件,而是國(guó)產(chǎn)通用模型從 “追得上” 到 “開始?jí)壕€” 的節(jié)點(diǎn),標(biāo)志著中國(guó)團(tuán)隊(duì)能在全球共享的benchmark上贏得公平賽道。

現(xiàn)在,這一幕在另一個(gè)原本更難追上的領(lǐng)域 ——具身智能,也悄然發(fā)生了。

2026年1月12日,千尋智能開源自研基礎(chǔ)模型Spirit v1.5,并在由Hugging Face、Dexmal等機(jī)構(gòu)聯(lián)合發(fā)起的真機(jī)評(píng)測(cè)平臺(tái)RoboChallenge上,以綜合得分66.09任務(wù)成功率50.33%的成績(jī),擊敗了長(zhǎng)期領(lǐng)跑的 Physical Intelligence 的 pi0.5,登頂榜首。



這不是一個(gè) “演示視頻更流暢” 的勝利,也不是國(guó)產(chǎn)模型 “又一次在自己主場(chǎng)稱王”,而是:第一次有國(guó)產(chǎn)具身模型,在一個(gè)全球通用的硬標(biāo)準(zhǔn)下,拿到了第一。這是具身智能的 “Spirit 時(shí)刻”。



從 Deepseek 到 Spirit,中國(guó)模型兩次在 “全球標(biāo)尺” 下贏了

在講 Spirit v1.5 為什么值得關(guān)注前,我們先厘清一個(gè)問題:它到底贏在哪兒?又贏得算不算數(shù)?

因?yàn)槲覀兌贾溃?strong>AI 行業(yè)并不缺 “自封的第一”。過去一年,幾乎每個(gè)月都有 “XX 模型超過 GPT”“XX 跑贏 LLaMA” 的宣傳,但真正能引起行業(yè)結(jié)構(gòu)性認(rèn)知變化的,只有那幾次 “全球可驗(yàn)證、真實(shí)登榜、公開對(duì)比” 的勝利。

比如Deepseek 登頂 Hugging Face Trending,打破的是 GPT 開源生態(tài)長(zhǎng)時(shí)間的統(tǒng)治格局。


而這次,Spirit v1.5 拿下的,是具身智能領(lǐng)域目前唯一一個(gè) “統(tǒng)一硬件 + 標(biāo)準(zhǔn)任務(wù) + 遠(yuǎn)程真機(jī) + 全公開評(píng)分” 的國(guó)際評(píng)測(cè)平臺(tái) —— RoboChallenge。


這個(gè)平臺(tái)自 2025 年底上線以來,做了一件大家早該做但沒人真做成的事:用一套統(tǒng)一設(shè)備(如 Franka、ALOHA、UR5)、統(tǒng)一操作任務(wù)(Table30 任務(wù)集),讓來自全球的機(jī)器人模型站在 “同一個(gè)肉身” 上,接受公開考試。它像是同時(shí)具備統(tǒng)一基準(zhǔn)價(jià)值(類似ImageNet/GLUE)真實(shí)場(chǎng)景落地屬性(類似 RealRobot)的評(píng)測(cè)體系,第一次把 “具身智能的理解、規(guī)劃與執(zhí)行能力”,從演示視頻里拉到同臺(tái)競(jìng)技的公開榜單上。


Spirit v1.5 就是在這套規(guī)則里,拿下了榜首,成為 RoboChallenge 成立以來,第一個(gè)打破 Pi0.5 連續(xù)霸榜的選手,也是第一個(gè)開源的登頂者。


所以如果你認(rèn)同 Deepseek 帶來的 “全球標(biāo)尺下的中國(guó)時(shí)刻”,那么 Spirit v1.5,就是具身智能領(lǐng)域的對(duì)應(yīng)場(chǎng)景落地。而且,從多個(gè)角度看,這甚至是個(gè)更難的勝利:

  • 語言模型至少在文本語料和基準(zhǔn)評(píng)測(cè)體系上是比較成熟的

  • 具身智能則是一個(gè)連 “如何比” 都剛剛建立共識(shí)的領(lǐng)域

所以,這次 Spirit 的登頂,更像是兩件事一起完成:

  1. 中國(guó)模型第一次贏了

  2. 全球行業(yè)第一次確認(rèn):現(xiàn)在可以比了

這不是普通的 “又一張榜單第一”,而是真正意義上的對(duì)等競(jìng)技場(chǎng)初次逆轉(zhuǎn)。


RoboChallenge 不只是榜單,而是 “具身智能的度量衡”

Spirit v1.5 的勝利之所以值得書寫,并不只是因?yàn)樗?“比 Pi0.5 分?jǐn)?shù)更高”,而是它贏的這個(gè)地方,是目前全球唯一可以把具身智能模型放在一套硬件上、公平做任務(wù)、數(shù)據(jù)全公開的統(tǒng)一評(píng)測(cè)平臺(tái)。

這件事在具身智能領(lǐng)域的意義,相當(dāng)于當(dāng)年 ImageNet 之于計(jì)算機(jī)視覺,GLUE 之于自然語言處理。


它標(biāo)志著這個(gè)領(lǐng)域從 “各自為政的炫技賽” 進(jìn)入到 “統(tǒng)一問題定義 + 標(biāo)準(zhǔn)化評(píng)測(cè) + 可對(duì)比結(jié)果” 的新階段。而這種標(biāo)尺的建立,其實(shí)比 “拿第一” 更難。

為什么具身智能需要 “統(tǒng)一標(biāo)尺”?過去幾年,具身智能給大眾的印象,大多來自一條條驚艷的演示視頻。人形機(jī)器人會(huì)疊衣服、擦桌子、烹飪、插花、做體操、搬快遞箱……這些 Demo 往往流量爆棚,也為很多公司帶來了融資與話語權(quán)。

但在行業(yè)內(nèi)部,這些 “” 長(zhǎng)期存在幾個(gè)老大難問題:

  • 環(huán)境是人為設(shè)計(jì)的:光線、物體位置、執(zhí)行順序、甚至可能還有隱形輔助,全部在控制范圍內(nèi),模型演得漂亮但脫不了 “溫室感”。

  • 沒有統(tǒng)一題庫(kù):一個(gè)模型做插花,另一個(gè)做打掃,第三個(gè)做翻書頁(yè)…… 任務(wù)之間完全無法比較。

  • 評(píng)測(cè)主語是公司,不是模型:工程干預(yù)、手動(dòng)調(diào)參、遙控接管,很難看清 “AI 大腦” 到底能干多少。

于是整個(gè)行業(yè)開始陷入一個(gè)剪輯優(yōu)先、工程堆疊的尷尬狀態(tài)大家都在做具身智能,但到底誰家模型能力強(qiáng)?怎么個(gè)強(qiáng)法?能不能遷移?適不適合商品化?沒有答案,只有視頻。

這才是 RoboChallenge 的意義所在:它不只是 “讓大家比一次”,而是嘗試用統(tǒng)一的題庫(kù)、統(tǒng)一的身體、統(tǒng)一的運(yùn)行方式,來回答一句我們過去回答不了的問題:“如果你們的模型都裝在同一臺(tái)機(jī)器人上,讓它做同一件事,到底誰做得更好?

一套 “硬規(guī)則” 帶來的行業(yè)重塑


RoboChallenge 的三大特征,是它能夠成為行業(yè)轉(zhuǎn)折點(diǎn)的底氣:

1、統(tǒng)一硬件、統(tǒng)一任務(wù)、遠(yuǎn)程操控

  • 所有參賽模型運(yùn)行在本地,只能通過網(wǎng)絡(luò)接口向真實(shí)機(jī)器人發(fā)送動(dòng)作指令

  • 真機(jī)平臺(tái)(Franka、ALOHA、UR5、ARX5 等)在一個(gè)標(biāo)準(zhǔn)化的測(cè)試環(huán)境中執(zhí)行任務(wù)

  • 所有任務(wù)執(zhí)行錄像、成功失敗標(biāo)準(zhǔn)、操作時(shí)長(zhǎng)都完全公開這一點(diǎn),極大削減了工程干預(yù)空間:你無法偷偷遙控,也無法用某些場(chǎng)景優(yōu)化模型,只能靠模型本身的感知、推理、控制能力。

2、Table30 任務(wù)集:具身智能的 “考試卷”這個(gè)測(cè)試包含 30 個(gè)標(biāo)準(zhǔn)桌面操作任務(wù),覆蓋了從抓取、插入、傾倒,到遮擋物處理、長(zhǎng)時(shí)序指令、雙臂協(xié)作等多種真實(shí)挑戰(zhàn)。這些任務(wù)并不是 “秀肌肉” 的項(xiàng)目,而是典型的、難度剛好的真實(shí)生活 / 工作場(chǎng)景:


Spirit v1.5部分子項(xiàng)評(píng)測(cè)分?jǐn)?shù)一欄 (共30項(xiàng)具體評(píng)測(cè)項(xiàng)目)


Spirit v1.5堆疊彩色方塊任務(wù)分為10個(gè)評(píng)價(jià)維度,成功率80%,子項(xiàng)總分85分

spirit v1.5 clean_dining

pi0.5 clean_dining

所以,Spirit v1.5 選擇在這個(gè)平臺(tái)上登頂,本身就是一種宣言:不是自己做個(gè)榜單跑個(gè)分,而是走進(jìn)公認(rèn)規(guī)則體系,在世界的主場(chǎng)上,贏一次有說服力的分?jǐn)?shù)。更重要的是,這種場(chǎng)景,在國(guó)產(chǎn)模型身上并不多見。



Spirit v1.5 贏的不是 “更大”,而是 “更對(duì)”

這幾年大家看機(jī)器人比賽、論文、視頻看的多了,逐漸都默認(rèn)了一件事:要訓(xùn)練出一個(gè)能干活的機(jī)器人,就得靠 “干凈數(shù)據(jù)”—— 成功率高、動(dòng)作標(biāo)準(zhǔn)、物體擺放整齊、環(huán)境清晰、路徑可復(fù)現(xiàn)。像搭積木一樣,搭出一個(gè)看上去 “什么都會(huì)” 的模型。


但問題是,這種 “干凈”,很多時(shí)候反而變成了一種詛咒。

Spirit v1.5 這次能贏,并不是在現(xiàn)有框架里優(yōu)化得更極致,而是它主動(dòng)拋棄了這些 “干凈標(biāo)準(zhǔn)”,選擇從一開始就走一條更貼近現(xiàn)實(shí)、更泛化但也更混亂的路徑:非結(jié)構(gòu)化、多樣化、目標(biāo)驅(qū)動(dòng)的數(shù)據(jù)采集范式。


千尋團(tuán)隊(duì)沒有給采集員寫詳細(xì)劇本,而是只設(shè)定高層任務(wù)目標(biāo),比如 “清理廚房”“澆花”“放回物品”,剩下的流程由采集員在真實(shí)場(chǎng)景中自由執(zhí)行。

在執(zhí)行過程中,會(huì)自然出現(xiàn)諸如 “抓取 - 移動(dòng) - 整理 - 擦拭” 等多個(gè)原子技能的連續(xù)銜接,有遮擋、有偏差、有失敗、有臨場(chǎng)調(diào)整,甚至還有跨任務(wù)的中斷與恢復(fù)。

這種方式的最大價(jià)值在于:它讓模型不再像演員那樣只記住一套流程,而是開始像人類一樣,習(xí)得 “處理現(xiàn)實(shí)意外的能力”。

我們都知道,真實(shí)世界的環(huán)境是動(dòng)態(tài)、復(fù)雜、充滿意外的,而傳統(tǒng)的精選演示數(shù)據(jù),恰恰屏蔽掉了這一層復(fù)雜性。你給模型看了一千遍成功插花,它還是不知道插花失敗后怎么調(diào)整手臂角度重新插。


Spirit 的訓(xùn)練方式打破了這一限制。它的訓(xùn)練數(shù)據(jù)中自然包含失敗、遮擋、任務(wù)干擾和環(huán)境變化。模型在這種高多樣性的情境中訓(xùn)練,就學(xué)會(huì)了在 “出錯(cuò)” 時(shí)如何調(diào)整,在 “混亂” 中保持策略,在 “變化” 中找到路徑。

這不只是理論上好聽,官方通稿里還給出了實(shí)打?qū)嵉膶?duì)比實(shí)驗(yàn):

  • 在同樣數(shù)據(jù)量下,采用多樣化采集的模型,在新任務(wù)上的微調(diào)迭代次數(shù)減少了約 40%;


    多樣化采集預(yù)訓(xùn)練的模型比干凈數(shù)據(jù)采集訓(xùn)練的模型具有更快的收斂速度和更好的驗(yàn)證誤差。

  • 模型在驗(yàn)證任務(wù)上的誤差隨著數(shù)據(jù)規(guī)模擴(kuò)大持續(xù)下降,沒有出現(xiàn) “早期飽和”;

    并且,這種范式還帶來了顯著的工程效率提升 —— 人均有效采集時(shí)間提升 200%,算法專家干預(yù)需求減少 60%。


    不同數(shù)據(jù)規(guī)模下的模型效果。擴(kuò)大多樣化采集的數(shù)據(jù)規(guī)??梢猿掷m(xù)降低模型的驗(yàn)證誤差。

注意:這些指標(biāo)不是出現(xiàn)在某個(gè) “特定任務(wù)上調(diào)得好” 的模型上,而是出現(xiàn)在一個(gè)跑通了 30 項(xiàng)任務(wù)、覆蓋 Franka、UR5、ARX5、ALOHA 等多平臺(tái)、多形態(tài)、多任務(wù)的通用模型上。

這就意味著,它不是 “針對(duì)某一場(chǎng)景表現(xiàn)出色”,而是真正具備了泛化潛力。

你可以說,Spirit v1.5 贏的不是 “更猛的參數(shù)” 或 “更巧的架構(gòu)”,而是從最底層的采集邏輯開始,就在訓(xùn)練 “一個(gè)懂得現(xiàn)實(shí)的人”。這在具身智能還高度依賴工程兜底和腳本堆疊的今天,是一次非常少見的思路勝出。

而從結(jié)果看,它確實(shí)讓這條路跑通了 ——不僅打穿了榜單,也為全行業(yè)提供了一種新的 “基礎(chǔ)模型可行路徑”。


這不是一次模型優(yōu)化,而是一場(chǎng)數(shù)據(jù)范式的換代

如果說Deepseek的那一刻,第一次讓全球開發(fā)者在Hugging Face上認(rèn)真看向了中國(guó)模型,那 Spirit v1.5 的登頂,則讓人意識(shí)到:中國(guó)不止會(huì)在自然語言模型上玩開源,也能在最具落地門檻、工程復(fù)雜度最高的具身智能賽道上,開出一條自己的路,而且,已經(jīng)比很多人想象中快一步。

更關(guān)鍵的是,這兩次勝利之間,有著驚人一致的結(jié)構(gòu):都是在全球主流 benchmark 下完成了突破、都選擇了開放共享的方式發(fā)布、都不只是“模型性能高”,而是在數(shù)據(jù)策略與訓(xùn)練邏輯上,提出了新范式。

這才是值得被稱為“Deepseek 式勝利”的地方。


過去我們講國(guó)產(chǎn)模型的勝利,總習(xí)慣性帶著點(diǎn)自卑語氣:“也能行了”“終于追上了”“國(guó)內(nèi)也可以”。但 Deepseek 和 Spirit 的共同之處恰恰在于:它們的成功不是從模仿出發(fā),而是從認(rèn)知升級(jí)出發(fā);不是一步步壓線追平,而是直接在方法論層面提出新標(biāo)準(zhǔn)。

你回頭看,會(huì)發(fā)現(xiàn)它們都完成了幾個(gè)關(guān)鍵的敘事躍遷

第一,是從“追平”到“定義”的轉(zhuǎn)變。

  • Deepseek 把中文主導(dǎo)語料訓(xùn)練模型、結(jié)合指令微調(diào)、工程流公開部署做成了 Hugging Face 上的范式案例,成為后續(xù)眾多開源雙語模型的技術(shù)參考;

  • Spirit 也是一樣,從數(shù)據(jù)采集范式就開始自立門戶,拒絕腳本化、標(biāo)準(zhǔn)化演示樣本,轉(zhuǎn)而采用更貼近人類真實(shí)操作路徑的自由采集機(jī)制,構(gòu)建的是一個(gè)全流程貼近真實(shí)物理環(huán)境的訓(xùn)練體系。

這兩件事都不是“參數(shù)更優(yōu)”“指標(biāo)更高”就能做到的,而是:你提出的路線,比別人那套更合理、更有普適性、也更容易被社區(qū)繼承。

第二,是從“開源是追趕”到“開源是領(lǐng)先的一部分”的認(rèn)知變化。

很多團(tuán)隊(duì)說開源,只是因?yàn)榕懿贿^ GPT;但 Deepseek 和 Spirit 選擇開源,是一種正向選擇,是對(duì)自己訓(xùn)練邏輯、模型質(zhì)量、推理接口、社區(qū)文檔成熟度的自信表達(dá)。

更重要的是,他們都在用“開源”作為推廣模型范式、構(gòu)建合作共識(shí)、打通上下游生態(tài)的第一步。這不再是“研究導(dǎo)向”的展示品,而是“產(chǎn)業(yè)導(dǎo)向”的基礎(chǔ)設(shè)施。

說白了,開源不再是戰(zhàn)術(shù),而是一種戰(zhàn)略,是模型勝出的延續(xù)條件,而不只是前戲。

第三,是從“模型領(lǐng)先”到“路線成立”的落點(diǎn)變化。

你可以有很多高光模型,但如果沒人能在你之后走下去,那它很可能只是一次工程奇跡。而 Deepseek 和 Spirit 的路線,真正跑通了方法論的閉環(huán)。

  • Deepseek 讓國(guó)內(nèi)越來越多團(tuán)隊(duì)參考其指令數(shù)據(jù)構(gòu)建方式、壓縮推理部署路徑、中文向訓(xùn)練技巧;

  • 而 Spirit 則已經(jīng)成為國(guó)內(nèi)多家研究團(tuán)隊(duì)在具身預(yù)訓(xùn)練任務(wù)上采樣機(jī)制與泛化能力設(shè)計(jì)的標(biāo)桿案例。


這才是一個(gè)范式成立之后,最重要的特征:它不只是一個(gè)項(xiàng)目成功,而是一整套技術(shù)邏輯開始被行業(yè)復(fù)用,成為“標(biāo)準(zhǔn)答案”之一。

所以,如果你問,Spirit v1.5 是不是一次中國(guó)模型的戰(zhàn)術(shù)性突破?我會(huì)說,不,它不是“偶爾跑贏一次”的故事,它是我們路線成立之后,在一張全球標(biāo)準(zhǔn)考卷上交出的那一份有說服力的答卷。

而正是這張答卷,讓我們不僅贏了當(dāng)前的比賽,更為下一輪全球模型競(jìng)賽寫下了自己的題目。


開源不是 “順帶一下”,而是一種能力,一種態(tài)度,也是一種宣言

Spirit v1.5 登上 RoboChallenge 榜首的第二個(gè)震撼,是它在贏的同時(shí),選擇了立刻全量開源。不是只發(fā)個(gè)模型鏈接意思一下,而是連同基模權(quán)重、推理代碼、調(diào)用樣例都一并放了出來,結(jié)構(gòu)清晰、文檔完善。那種 “我不怕你復(fù)現(xiàn),也歡迎你來接著做” 的姿態(tài),不只是展示實(shí)力,更是一種罕見的主動(dòng)姿態(tài)。

要知道,在具身智能這個(gè)領(lǐng)域里,開源從來都不是默認(rèn)選項(xiàng),反而是例外。尤其是高性能模型,一旦跑出好成績(jī),很多團(tuán)隊(duì)的第一反應(yīng)都是 “先封起來”,畢竟這個(gè)領(lǐng)域的門檻高、工程重、資本熱,誰都想先拿著成果去融資、接項(xiàng)目、談生態(tài)。


但 Spirit 并沒有把這當(dāng)成一個(gè) “技術(shù)護(hù)城河”,而是反過來,把它變成一個(gè) “產(chǎn)業(yè)底座”:歡迎你在我這之上搭建應(yīng)用、構(gòu)建生態(tài)、開展合作。

這不僅僅是自信的問題,更是意識(shí)的問題。具身智能產(chǎn)業(yè)遲早要走到生態(tài)化階段,一個(gè)模型想走得遠(yuǎn),不能只靠自己能做什么,還得看別人能不能在你身上做點(diǎn)什么。

  • 能不能快速?gòu)?fù)現(xiàn)?

  • 能不能移植到不同機(jī)器人?

  • 能不能兼容不同任務(wù)?

  • 能不能在不懂算法的場(chǎng)景方手里跑起來?

這背后靠的不是性能指標(biāo),而是開源的質(zhì)量、工程的完備度、文檔的友好程度、范式的普適性。Spirit v1.5 交出來的這套東西,已經(jīng)能被國(guó)內(nèi)外的研究者直接調(diào)起來在真機(jī)上復(fù)現(xiàn)任務(wù),也意味著一套通用具身模型的 “復(fù)用路徑” 正在形成。

而這對(duì)下游廠商而言,信號(hào)非常明確:你不需要從零做模型,也不需要綁死在海外 API 上。在過去的幾年里,那些高性能的具身模型不是不開,而是不能用:Google RT 只發(fā)了 paper,不開權(quán)重;Figure 展示了效果,但系統(tǒng)封閉;一些開源模型雖然存在,但性能過低,難以商用。


而 Spirit 現(xiàn)在交出的是一個(gè) “性能可比 Pi0.5、架構(gòu)全量公開、兼容多機(jī)器人” 的真實(shí)底座 。這類模型,一旦經(jīng)得起復(fù)現(xiàn)和落地驗(yàn)證,很快就能變成行業(yè)共用的 “基礎(chǔ)設(shè)施”。而當(dāng)一個(gè)模型能變成基礎(chǔ)設(shè)施,它就有了真實(shí)意義上的產(chǎn)業(yè)號(hào)召力,不再只是實(shí)驗(yàn)室里的好看作品。

所以說,Spirit v1.5 開源的,不只是代碼,也不只是 “透明”。它開源的,是一種新的產(chǎn)業(yè)策略。是說:我們不玩壁壘,我們搭地基;我們不等獨(dú)角獸,我們先把路修出來。你愿意走進(jìn)來,我們不設(shè)門檻。

這,是中國(guó)具身智能在全球舞臺(tái)上,第一次有底氣說出這句話。


中國(guó)機(jī)器人產(chǎn)業(yè),終于開始比 “大腦” 了

這幾年,誰去過幾場(chǎng)機(jī)器人展,就會(huì)明白一個(gè)現(xiàn)實(shí):中國(guó)的機(jī)器人,從 “身體” 層面,從來不缺驚喜。一個(gè)比一個(gè)輕,一個(gè)比一個(gè)穩(wěn),腿越做越多,手越做越巧,身形逼近人類,甚至跳舞、打拳、翻跟頭、耍手絹…… 樣樣不在話下。

但很多行業(yè)人也知道:越是炫技的動(dòng)作,背后越是工程化編排。動(dòng)作是精調(diào)出來的,流程是腳本堆出來的,甚至某些 “具身智能模型” 的名字,更多是出現(xiàn)在 PPT 和發(fā)布會(huì)中——真正起作用的,是工程師連夜調(diào)的參數(shù)、默契配合的操控臺(tái),還有被剪輯過無數(shù)次的演示視頻。

我們擅長(zhǎng)制造一個(gè) “會(huì)動(dòng)的身體”。但要造出一個(gè) “能想的大腦”,一直是最短的那一塊板。

所以前幾年,中國(guó)團(tuán)隊(duì)的共識(shí)幾乎就是:先把軀體搞出來,智能先靠工程兜底。動(dòng)作能跑就行,模型慢慢補(bǔ)。


Spirit v1.5 是這條路徑的一個(gè)分水嶺。它是第一次,中國(guó)團(tuán)隊(duì)不是用工程表演拼 “智能”,而是用訓(xùn)練范式和泛化能力,在一張國(guó)際統(tǒng)一標(biāo)準(zhǔn)的考卷上,以模型為主角,贏得一場(chǎng)無可爭(zhēng)議的具身智能硬仗。

而且這場(chǎng)勝利足夠扎實(shí):是真機(jī)評(píng)測(cè)、統(tǒng)一任務(wù)、多構(gòu)型平臺(tái)、多步驟任務(wù),全套打下來,比的是遷移能力、策略泛化、失敗恢復(fù)、任務(wù)理解—— 這些能力,不可能靠腳本堆出來,必須是模型自己 “學(xué)” 出來的。

這說明一個(gè)事實(shí)正在發(fā)生變化:國(guó)產(chǎn)機(jī)器人不再只靠姿勢(shì)取勝,而是開始真正構(gòu)建自己的 “認(rèn)知中樞”。過去我們能造出能跑、能跳、能舉重的身體;現(xiàn)在我們開始造出能決策、能適應(yīng)、能變通的大腦。


這不是技術(shù)指標(biāo)的變化,而是技術(shù)認(rèn)知和產(chǎn)業(yè)定位的變化。從 “誰動(dòng)作更穩(wěn)” 到 “誰泛化能力更強(qiáng)”;從 “誰現(xiàn)場(chǎng) demo 更驚艷” 到 “誰能復(fù)現(xiàn)、能落地、能服務(wù)多個(gè)場(chǎng)景”。

這背后,其實(shí)是一整代機(jī)器人開發(fā)邏輯的轉(zhuǎn)變。從工程先行,走向智能主導(dǎo)。從 “用代碼堆功能”,走向“用模型學(xué)策略”。

Spirit v1.5 只是起點(diǎn),但它標(biāo)志著中國(guó)具身智能產(chǎn)業(yè),已經(jīng)走出了 “只有肌肉沒有大腦” 的階段,開始邁向智能主導(dǎo)的產(chǎn)業(yè)結(jié)構(gòu)升級(jí)。

真正的具身智能,從來不是哪個(gè)機(jī)器人能做什么動(dòng)作,而是:它能不能學(xué),能不能變,能不能在失敗之后繼續(xù)做正確的事。

而接下來,比的不是誰喊得響、視頻做得好,而是 —— 誰的模型,真能在真實(shí)世界里站得住。


繼 DeepSeek 之后,中國(guó)又贏了一次 “起點(diǎn)之戰(zhàn)”

還記得 2025 年 DeepSeek 刷屏 Hugging Face Trending 熱榜的那個(gè)瞬間嗎?那一晚,無數(shù)人第一次意識(shí)到,中國(guó)不只是能開源出一款 “差不多” 的大模型,而是能做出真正領(lǐng)先的通用語言模型,并靠社區(qū)力量跑到全球開發(fā)者的核心視野里。那被稱為 “中國(guó)開源大模型的高光時(shí)刻”。

而現(xiàn)在,Spirit v1.5在 RoboChallenge 登頂,同樣開放出完整的具身大模型底座,意味著我們?cè)诰呱碇悄苓@個(gè)更靠近物理世界、更接近工業(yè)難度的賽道上,也迎來了屬于中國(guó)的 “開源主角時(shí)刻”。


語言之后,是行動(dòng)。大腦之后,是身體。

從 DeepSeek 到 Spirit,這兩個(gè) “高光節(jié)點(diǎn)” 的共同點(diǎn)都不是它們技術(shù)上有多極致,而是 ——它們都把開源這件事,做到了基礎(chǔ)設(shè)施級(jí)的完成度。不是半封閉的 checkpoint,不是好看的展示頁(yè)面,而是真正可用、可跑、可拓展、能打通上下游系統(tǒng)的 “工程化開源”。

我們都知道,在 AI 的世界里,“第一” 這兩個(gè)字并不稀缺。每周都有新模型,每天都有新榜單,搶熱度、爭(zhēng)發(fā)布、刷存在感,行業(yè)早已習(xí)慣。真正稀缺的,是那種能被長(zhǎng)期綁定、能夠沉淀為生態(tài)起點(diǎn)、能撐起別人項(xiàng)目、成為別人方案的一部分的模型。

Spirit v1.5 是目前我們看到的,具身智能領(lǐng)域中第一個(gè)具備這個(gè)潛質(zhì)的國(guó)產(chǎn)模型。它背后連接著完整的技術(shù)路徑(多樣化采集范式)、產(chǎn)品思路(可復(fù)現(xiàn)、多任務(wù)遷移)、工程能力(多構(gòu)型適配)、以及最重要的:開源出來的勇氣和組織能力。


這是一種行業(yè)信號(hào),也是一種戰(zhàn)略姿態(tài)。過去中國(guó)的具身智能總被貼上 “硬件強(qiáng)、智能弱” 的標(biāo)簽。今天開始,有團(tuán)隊(duì)用一個(gè)完整、開源、性能領(lǐng)先的通用模型,給出了不一樣的答案。

當(dāng)然,這并不意味著我們已經(jīng)贏了。RoboChallenge 的榜單會(huì)變,開源模型的競(jìng)爭(zhēng)會(huì)加速,下一代具身模型可能轉(zhuǎn)向端側(cè)部署、極簡(jiǎn)架構(gòu)、甚至多模態(tài)協(xié)同。

但正如當(dāng)年 ImageNet、GLUE、OpenAI Gym 之于計(jì)算機(jī)視覺、自然語言與智能體訓(xùn)練的意義一樣:只要你能在 “統(tǒng)一基準(zhǔn)” 下拿到一次真正領(lǐng)先的結(jié)果,并開放給全球社區(qū)驗(yàn)證、使用和超越,你就為中國(guó)具身智能贏得了關(guān)鍵的起點(diǎn)話語權(quán)。

這一次,是 Spirit。

再下一次,會(huì)是誰?

開源地址:

Code: https://github.com/Spirit-AI-Team/spirit-v1.5Model:https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5Blog:https://www.spirit-ai.com/en/blog/spirit-v1-5


前沿動(dòng)態(tài)前沿大會(huì)

前沿人物

點(diǎn)「在看」,給前前加雞腿

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
到底有多無知,才能做出這樣的判決!

到底有多無知,才能做出這樣的判決!

槽三刀
2026-03-25 22:01:04
特朗普,開始甩鍋

特朗普,開始甩鍋

中國(guó)基金報(bào)
2026-03-26 07:57:39
上海一女子“閃婚”拿到價(jià)值近千萬房產(chǎn)99%份額,“閃離”后起訴分割房產(chǎn),法院判了!

上海一女子“閃婚”拿到價(jià)值近千萬房產(chǎn)99%份額,“閃離”后起訴分割房產(chǎn),法院判了!

環(huán)球網(wǎng)資訊
2026-03-26 08:13:14
引而不發(fā)才是王道,封鎖霍爾木茲海峽,伊朗打完了最后一張牌……

引而不發(fā)才是王道,封鎖霍爾木茲海峽,伊朗打完了最后一張牌……

家傳編輯部
2026-03-26 10:34:27
是什么,讓這個(gè)日本自衛(wèi)官竟敢對(duì)中國(guó)大使館舉刀?

是什么,讓這個(gè)日本自衛(wèi)官竟敢對(duì)中國(guó)大使館舉刀?

環(huán)球時(shí)報(bào)國(guó)際
2026-03-26 00:13:51
張雪峰員工:辦公室已拆掉紅色錦旗,員工徹夜難眠,家長(zhǎng)電話打爆

張雪峰員工:辦公室已拆掉紅色錦旗,員工徹夜難眠,家長(zhǎng)電話打爆

每日人物
2026-03-26 13:34:51
張雪峰猝然離世,辦公室內(nèi)景曝光,擺設(shè)奇怪,寫真照被指像遺照,生前的話字字催淚

張雪峰猝然離世,辦公室內(nèi)景曝光,擺設(shè)奇怪,寫真照被指像遺照,生前的話字字催淚

筆墨V
2026-03-26 14:53:51
越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場(chǎng)

越扒越猛!釋永信在少林寺有多爽,你根本想不到!終于落到這下場(chǎng)

林輕吟
2026-03-26 07:34:21
國(guó)際油價(jià)暴漲,國(guó)內(nèi)油價(jià)卻“壓著不漲”!國(guó)家出手了:每噸少漲1000多塊

國(guó)際油價(jià)暴漲,國(guó)內(nèi)油價(jià)卻“壓著不漲”!國(guó)家出手了:每噸少漲1000多塊

思如哲思
2026-03-26 06:36:02
張少康辭去廣東省人民政府副省長(zhǎng)職務(wù)

張少康辭去廣東省人民政府副省長(zhǎng)職務(wù)

新快報(bào)新聞
2026-03-26 11:50:03
張雪峰6年前已離婚,獨(dú)女張姩菡只能分16.5%遺產(chǎn),現(xiàn)任妻子占大頭

張雪峰6年前已離婚,獨(dú)女張姩菡只能分16.5%遺產(chǎn),現(xiàn)任妻子占大頭

楓紅染山徑
2026-03-25 16:56:22
我就不信張一山?jīng)]有后悔過嗎?這么美的前任拱手讓出去了

我就不信張一山?jīng)]有后悔過嗎?這么美的前任拱手讓出去了

喜歡歷史的阿繁
2026-03-26 09:20:58
聯(lián)大通過決議,宣布“最嚴(yán)重反人類罪”

聯(lián)大通過決議,宣布“最嚴(yán)重反人類罪”

澎湃新聞
2026-03-26 11:03:06
中國(guó)SUV最大騙局,被嵐圖泰山X8的“622”當(dāng)場(chǎng)拆穿

中國(guó)SUV最大騙局,被嵐圖泰山X8的“622”當(dāng)場(chǎng)拆穿

汽車預(yù)言家
2026-03-23 12:21:30
好消息!麒麟芯片已不受制裁了,華為手機(jī)真正全面歸來

好消息!麒麟芯片已不受制裁了,華為手機(jī)真正全面歸來

互聯(lián)網(wǎng).亂侃秀
2026-03-26 10:55:17
中國(guó)、俄羅斯、伊朗等123票贊成,美國(guó)、以色列等3票反對(duì),聯(lián)合國(guó)認(rèn)定:最嚴(yán)重反人類罪!英法德日等52國(guó)投棄權(quán)票

中國(guó)、俄羅斯、伊朗等123票贊成,美國(guó)、以色列等3票反對(duì),聯(lián)合國(guó)認(rèn)定:最嚴(yán)重反人類罪!英法德日等52國(guó)投棄權(quán)票

每日經(jīng)濟(jì)新聞
2026-03-26 13:25:09
張雪峰離世!北京蘇州房產(chǎn)不在名下,1400名員工等安撫,好友停工

張雪峰離世!北京蘇州房產(chǎn)不在名下,1400名員工等安撫,好友停工

阿纂看事
2026-03-25 21:31:59
周杰倫繼續(xù)割韭菜!網(wǎng)友一針見血:他唯一和華流關(guān)系最大的是割大陸韭菜

周杰倫繼續(xù)割韭菜!網(wǎng)友一針見血:他唯一和華流關(guān)系最大的是割大陸韭菜

爆角追蹤
2026-03-26 08:56:24
我國(guó)航空發(fā)動(dòng)機(jī)領(lǐng)域著名專家嚴(yán)紅病逝,年僅57歲

我國(guó)航空發(fā)動(dòng)機(jī)領(lǐng)域著名專家嚴(yán)紅病逝,年僅57歲

澎湃新聞
2026-03-26 11:40:26
萬科高管被要求退還薪酬

萬科高管被要求退還薪酬

地產(chǎn)微資訊
2026-03-26 12:22:04
2026-03-26 16:11:00
前沿在線 incentive-icons
前沿在線
前沿在線官方賬號(hào),關(guān)注AI、機(jī)器人、智能車等前沿領(lǐng)域;
125文章數(shù) 1235關(guān)注度
往期回顧 全部

科技要聞

Meta高管狂分百億期權(quán),700名員工卻下崗

頭條要聞

上海媽媽尋親27年懸賞市區(qū)一套房:不用盡孝 要個(gè)擁抱

頭條要聞

上海媽媽尋親27年懸賞市區(qū)一套房:不用盡孝 要個(gè)擁抱

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰家人首發(fā)聲 不設(shè)追思會(huì)喪事從簡(jiǎn)

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

本地
時(shí)尚
游戲
數(shù)碼
軍事航空

本地新聞

救命,這只醬板鴨已經(jīng)在我手機(jī)復(fù)仇了一萬遍

皮衣+裙,高級(jí)到炸

DOTA2 7.41版本大更新!再見了命石,選擇困難癥有福了

數(shù)碼要聞

三星更新870 EVO系列SATA SSD:最高8TB 定價(jià)超1萬元

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時(shí)盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版