繼Deepseek后, 中國又迎來“Spirit時刻”: 具身智能也登頂了 | 前沿在線

2026-01-12 22:55:08　來源: 前沿在線

北京舉報

分享至

繼 Deepseek 在語言模型領(lǐng)域登頂后，中國模型又一次在全球統(tǒng)一標(biāo)準(zhǔn)下拿下第一。這次，是具身智能。Spirit v1.5 的登頂，意味著中國團(tuán)隊訓(xùn)練出的機(jī)器人“大腦”，開始具備真正的世界級通用能力。

編輯：前沿在線編輯部

2025年3月，Deepseek沖上Hugging Face Trending榜首，引爆了那句圈內(nèi)刷屏的評論：“中國第一次用開源模型把chatGPT擠下去了?！?/p>

那一刻不只是一次排行榜事件，而是國產(chǎn)通用模型從 “追得上” 到 “開始壓線” 的節(jié)點，標(biāo)志著中國團(tuán)隊能在全球共享的benchmark上贏得公平賽道。

現(xiàn)在，這一幕在另一個原本更難追上的領(lǐng)域 ——具身智能，也悄然發(fā)生了。

2026年1月12日，千尋智能開源自研基礎(chǔ)模型Spirit v1.5，并在由Hugging Face、Dexmal等機(jī)構(gòu)聯(lián)合發(fā)起的真機(jī)評測平臺RoboChallenge上，以綜合得分66.09、任務(wù)成功率50.33%的成績，擊敗了長期領(lǐng)跑的 Physical Intelligence 的 pi0.5，登頂榜首。

這不是一個 “演示視頻更流暢” 的勝利，也不是國產(chǎn)模型 “又一次在自己主場稱王”，而是：第一次有國產(chǎn)具身模型，在一個全球通用的硬標(biāo)準(zhǔn)下，拿到了第一。這是具身智能的 “Spirit 時刻”。

從 Deepseek 到 Spirit，中國模型兩次在 “全球標(biāo)尺” 下贏了

在講 Spirit v1.5 為什么值得關(guān)注前，我們先厘清一個問題：它到底贏在哪兒？又贏得算不算數(shù)？

因為我們都知道，AI 行業(yè)并不缺 “自封的第一”。過去一年，幾乎每個月都有 “XX 模型超過 GPT”“XX 跑贏 LLaMA” 的宣傳，但真正能引起行業(yè)結(jié)構(gòu)性認(rèn)知變化的，只有那幾次 “全球可驗證、真實登榜、公開對比” 的勝利。

比如Deepseek 登頂 Hugging Face Trending，打破的是 GPT 開源生態(tài)長時間的統(tǒng)治格局。

而這次，Spirit v1.5 拿下的，是具身智能領(lǐng)域目前唯一一個 “統(tǒng)一硬件 + 標(biāo)準(zhǔn)任務(wù) + 遠(yuǎn)程真機(jī) + 全公開評分” 的國際評測平臺 —— RoboChallenge。

這個平臺自 2025 年底上線以來，做了一件大家早該做但沒人真做成的事：用一套統(tǒng)一設(shè)備（如 Franka、ALOHA、UR5）、統(tǒng)一操作任務(wù)（Table30 任務(wù)集），讓來自全球的機(jī)器人模型站在 “同一個肉身” 上，接受公開考試。它像是同時具備統(tǒng)一基準(zhǔn)價值（類似ImageNet/GLUE）與真實場景落地屬性（類似 RealRobot）的評測體系，第一次把 “具身智能的理解、規(guī)劃與執(zhí)行能力”，從演示視頻里拉到同臺競技的公開榜單上。

Spirit v1.5 就是在這套規(guī)則里，拿下了榜首，成為 RoboChallenge 成立以來，第一個打破 Pi0.5 連續(xù)霸榜的選手，也是第一個開源的登頂者。

所以如果你認(rèn)同 Deepseek 帶來的 “全球標(biāo)尺下的中國時刻”，那么 Spirit v1.5，就是具身智能領(lǐng)域的對應(yīng)場景落地。而且，從多個角度看，這甚至是個更難的勝利：

語言模型至少在文本語料和基準(zhǔn)評測體系上是比較成熟的
具身智能則是一個連 “如何比” 都剛剛建立共識的領(lǐng)域

所以，這次 Spirit 的登頂，更像是兩件事一起完成：

中國模型第一次贏了
全球行業(yè)第一次確認(rèn)：現(xiàn)在可以比了

這不是普通的 “又一張榜單第一”，而是真正意義上的對等競技場初次逆轉(zhuǎn)。

RoboChallenge 不只是榜單，而是 “具身智能的度量衡”

Spirit v1.5 的勝利之所以值得書寫，并不只是因為它 “比 Pi0.5 分?jǐn)?shù)更高”，而是它贏的這個地方，是目前全球唯一可以把具身智能模型放在一套硬件上、公平做任務(wù)、數(shù)據(jù)全公開的統(tǒng)一評測平臺。

這件事在具身智能領(lǐng)域的意義，相當(dāng)于當(dāng)年 ImageNet 之于計算機(jī)視覺，GLUE 之于自然語言處理。

它標(biāo)志著這個領(lǐng)域從 “各自為政的炫技賽” 進(jìn)入到 “統(tǒng)一問題定義 + 標(biāo)準(zhǔn)化評測 + 可對比結(jié)果” 的新階段。而這種標(biāo)尺的建立，其實比 “拿第一” 更難。

為什么具身智能需要 “統(tǒng)一標(biāo)尺”？過去幾年，具身智能給大眾的印象，大多來自一條條驚艷的演示視頻。人形機(jī)器人會疊衣服、擦桌子、烹飪、插花、做體操、搬快遞箱……這些 Demo 往往流量爆棚，也為很多公司帶來了融資與話語權(quán)。

但在行業(yè)內(nèi)部，這些 “秀” 長期存在幾個老大難問題：

環(huán)境是人為設(shè)計的：光線、物體位置、執(zhí)行順序、甚至可能還有隱形輔助，全部在控制范圍內(nèi)，模型演得漂亮但脫不了 “溫室感”。
沒有統(tǒng)一題庫：一個模型做插花，另一個做打掃，第三個做翻書頁…… 任務(wù)之間完全無法比較。
評測主語是公司，不是模型：工程干預(yù)、手動調(diào)參、遙控接管，很難看清 “AI 大腦” 到底能干多少。

于是整個行業(yè)開始陷入一個剪輯優(yōu)先、工程堆疊的尷尬狀態(tài)。大家都在做具身智能，但到底誰家模型能力強(qiáng)？怎么個強(qiáng)法？能不能遷移？適不適合商品化？沒有答案，只有視頻。

這才是 RoboChallenge 的意義所在：它不只是 “讓大家比一次”，而是嘗試用統(tǒng)一的題庫、統(tǒng)一的身體、統(tǒng)一的運(yùn)行方式，來回答一句我們過去回答不了的問題：“如果你們的模型都裝在同一臺機(jī)器人上，讓它做同一件事，到底誰做得更好？”

一套 “硬規(guī)則” 帶來的行業(yè)重塑

RoboChallenge 的三大特征，是它能夠成為行業(yè)轉(zhuǎn)折點的底氣：

1、統(tǒng)一硬件、統(tǒng)一任務(wù)、遠(yuǎn)程操控

所有參賽模型運(yùn)行在本地，只能通過網(wǎng)絡(luò)接口向真實機(jī)器人發(fā)送動作指令
真機(jī)平臺（Franka、ALOHA、UR5、ARX5 等）在一個標(biāo)準(zhǔn)化的測試環(huán)境中執(zhí)行任務(wù)
所有任務(wù)執(zhí)行錄像、成功失敗標(biāo)準(zhǔn)、操作時長都完全公開這一點，極大削減了工程干預(yù)空間：你無法偷偷遙控，也無法用某些場景優(yōu)化模型，只能靠模型本身的感知、推理、控制能力。

2、Table30 任務(wù)集：具身智能的 “考試卷”這個測試包含 30 個標(biāo)準(zhǔn)桌面操作任務(wù)，覆蓋了從抓取、插入、傾倒，到遮擋物處理、長時序指令、雙臂協(xié)作等多種真實挑戰(zhàn)。這些任務(wù)并不是 “秀肌肉” 的項目，而是典型的、難度剛好的真實生活 / 工作場景：

Spirit v1.5部分子項評測分?jǐn)?shù)一欄（共30項具體評測項目）

Spirit v1.5堆疊彩色方塊任務(wù)分為10個評價維度，成功率80%，子項總分85分

（spirit v1.5 clean_dining）

（pi0.5 clean_dining）

所以，Spirit v1.5 選擇在這個平臺上登頂，本身就是一種宣言：不是自己做個榜單跑個分，而是走進(jìn)公認(rèn)規(guī)則體系，在世界的主場上，贏一次有說服力的分?jǐn)?shù)。更重要的是，這種場景，在國產(chǎn)模型身上并不多見。

Spirit v1.5 贏的不是 “更大”，而是 “更對”

這幾年大家看機(jī)器人比賽、論文、視頻看的多了，逐漸都默認(rèn)了一件事：要訓(xùn)練出一個能干活的機(jī)器人，就得靠 “干凈數(shù)據(jù)”—— 成功率高、動作標(biāo)準(zhǔn)、物體擺放整齊、環(huán)境清晰、路徑可復(fù)現(xiàn)。像搭積木一樣，搭出一個看上去 “什么都會” 的模型。

但問題是，這種 “干凈”，很多時候反而變成了一種詛咒。

Spirit v1.5 這次能贏，并不是在現(xiàn)有框架里優(yōu)化得更極致，而是它主動拋棄了這些 “干凈標(biāo)準(zhǔn)”，選擇從一開始就走一條更貼近現(xiàn)實、更泛化但也更混亂的路徑：非結(jié)構(gòu)化、多樣化、目標(biāo)驅(qū)動的數(shù)據(jù)采集范式。

千尋團(tuán)隊沒有給采集員寫詳細(xì)劇本，而是只設(shè)定高層任務(wù)目標(biāo)，比如 “清理廚房”“澆花”“放回物品”，剩下的流程由采集員在真實場景中自由執(zhí)行。

在執(zhí)行過程中，會自然出現(xiàn)諸如 “抓取 - 移動 - 整理 - 擦拭” 等多個原子技能的連續(xù)銜接，有遮擋、有偏差、有失敗、有臨場調(diào)整，甚至還有跨任務(wù)的中斷與恢復(fù)。

這種方式的最大價值在于：它讓模型不再像演員那樣只記住一套流程，而是開始像人類一樣，習(xí)得 “處理現(xiàn)實意外的能力”。

我們都知道，真實世界的環(huán)境是動態(tài)、復(fù)雜、充滿意外的，而傳統(tǒng)的精選演示數(shù)據(jù)，恰恰屏蔽掉了這一層復(fù)雜性。你給模型看了一千遍成功插花，它還是不知道插花失敗后怎么調(diào)整手臂角度重新插。

Spirit 的訓(xùn)練方式打破了這一限制。它的訓(xùn)練數(shù)據(jù)中自然包含失敗、遮擋、任務(wù)干擾和環(huán)境變化。模型在這種高多樣性的情境中訓(xùn)練，就學(xué)會了在 “出錯” 時如何調(diào)整，在 “混亂” 中保持策略，在 “變化” 中找到路徑。

這不只是理論上好聽，官方通稿里還給出了實打?qū)嵉膶Ρ葘嶒灒?/p>

在同樣數(shù)據(jù)量下，采用多樣化采集的模型，在新任務(wù)上的微調(diào)迭代次數(shù)減少了約 40%；

多樣化采集預(yù)訓(xùn)練的模型比干凈數(shù)據(jù)采集訓(xùn)練的模型具有更快的收斂速度和更好的驗證誤差。
模型在驗證任務(wù)上的誤差隨著數(shù)據(jù)規(guī)模擴(kuò)大持續(xù)下降，沒有出現(xiàn) “早期飽和”；
并且，這種范式還帶來了顯著的工程效率提升 —— 人均有效采集時間提升 200%，算法專家干預(yù)需求減少 60%。

不同數(shù)據(jù)規(guī)模下的模型效果。擴(kuò)大多樣化采集的數(shù)據(jù)規(guī)?？梢猿掷m(xù)降低模型的驗證誤差。

注意：這些指標(biāo)不是出現(xiàn)在某個 “特定任務(wù)上調(diào)得好” 的模型上，而是出現(xiàn)在一個跑通了 30 項任務(wù)、覆蓋 Franka、UR5、ARX5、ALOHA 等多平臺、多形態(tài)、多任務(wù)的通用模型上。

這就意味著，它不是 “針對某一場景表現(xiàn)出色”，而是真正具備了泛化潛力。

你可以說，Spirit v1.5 贏的不是 “更猛的參數(shù)” 或 “更巧的架構(gòu)”，而是從最底層的采集邏輯開始，就在訓(xùn)練 “一個懂得現(xiàn)實的人”。這在具身智能還高度依賴工程兜底和腳本堆疊的今天，是一次非常少見的思路勝出。

而從結(jié)果看，它確實讓這條路跑通了 ——不僅打穿了榜單，也為全行業(yè)提供了一種新的 “基礎(chǔ)模型可行路徑”。

這不是一次模型優(yōu)化，而是一場數(shù)據(jù)范式的換代

如果說Deepseek的那一刻，第一次讓全球開發(fā)者在Hugging Face上認(rèn)真看向了中國模型，那 Spirit v1.5 的登頂，則讓人意識到：中國不止會在自然語言模型上玩開源，也能在最具落地門檻、工程復(fù)雜度最高的具身智能賽道上，開出一條自己的路，而且，已經(jīng)比很多人想象中快一步。

更關(guān)鍵的是，這兩次勝利之間，有著驚人一致的結(jié)構(gòu)：都是在全球主流 benchmark 下完成了突破、都選擇了開放共享的方式發(fā)布、都不只是“模型性能高”，而是在數(shù)據(jù)策略與訓(xùn)練邏輯上，提出了新范式。

這才是值得被稱為“Deepseek 式勝利”的地方。

過去我們講國產(chǎn)模型的勝利，總習(xí)慣性帶著點自卑語氣：“也能行了”“終于追上了”“國內(nèi)也可以”。但 Deepseek 和 Spirit 的共同之處恰恰在于：它們的成功不是從模仿出發(fā)，而是從認(rèn)知升級出發(fā)；不是一步步壓線追平，而是直接在方法論層面提出新標(biāo)準(zhǔn)。

你回頭看，會發(fā)現(xiàn)它們都完成了幾個關(guān)鍵的敘事躍遷：

第一，是從“追平”到“定義”的轉(zhuǎn)變。

Deepseek 把中文主導(dǎo)語料訓(xùn)練模型、結(jié)合指令微調(diào)、工程流公開部署做成了 Hugging Face 上的范式案例，成為后續(xù)眾多開源雙語模型的技術(shù)參考；
Spirit 也是一樣，從數(shù)據(jù)采集范式就開始自立門戶，拒絕腳本化、標(biāo)準(zhǔn)化演示樣本，轉(zhuǎn)而采用更貼近人類真實操作路徑的自由采集機(jī)制，構(gòu)建的是一個全流程貼近真實物理環(huán)境的訓(xùn)練體系。

這兩件事都不是“參數(shù)更優(yōu)”“指標(biāo)更高”就能做到的，而是：你提出的路線，比別人那套更合理、更有普適性、也更容易被社區(qū)繼承。

第二，是從“開源是追趕”到“開源是領(lǐng)先的一部分”的認(rèn)知變化。

很多團(tuán)隊說開源，只是因為跑不過 GPT；但 Deepseek 和 Spirit 選擇開源，是一種正向選擇，是對自己訓(xùn)練邏輯、模型質(zhì)量、推理接口、社區(qū)文檔成熟度的自信表達(dá)。

更重要的是，他們都在用“開源”作為推廣模型范式、構(gòu)建合作共識、打通上下游生態(tài)的第一步。這不再是“研究導(dǎo)向”的展示品，而是“產(chǎn)業(yè)導(dǎo)向”的基礎(chǔ)設(shè)施。

說白了，開源不再是戰(zhàn)術(shù)，而是一種戰(zhàn)略，是模型勝出的延續(xù)條件，而不只是前戲。

第三，是從“模型領(lǐng)先”到“路線成立”的落點變化。

你可以有很多高光模型，但如果沒人能在你之后走下去，那它很可能只是一次工程奇跡。而 Deepseek 和 Spirit 的路線，真正跑通了方法論的閉環(huán)。

Deepseek 讓國內(nèi)越來越多團(tuán)隊參考其指令數(shù)據(jù)構(gòu)建方式、壓縮推理部署路徑、中文向訓(xùn)練技巧；
而 Spirit 則已經(jīng)成為國內(nèi)多家研究團(tuán)隊在具身預(yù)訓(xùn)練任務(wù)上采樣機(jī)制與泛化能力設(shè)計的標(biāo)桿案例。

這才是一個范式成立之后，最重要的特征：它不只是一個項目成功，而是一整套技術(shù)邏輯開始被行業(yè)復(fù)用，成為“標(biāo)準(zhǔn)答案”之一。

所以，如果你問，Spirit v1.5 是不是一次中國模型的戰(zhàn)術(shù)性突破？我會說，不，它不是“偶爾跑贏一次”的故事，它是我們路線成立之后，在一張全球標(biāo)準(zhǔn)考卷上交出的那一份有說服力的答卷。

而正是這張答卷，讓我們不僅贏了當(dāng)前的比賽，更為下一輪全球模型競賽寫下了自己的題目。

開源不是 “順帶一下”，而是一種能力，一種態(tài)度，也是一種宣言

Spirit v1.5 登上 RoboChallenge 榜首的第二個震撼，是它在贏的同時，選擇了立刻全量開源。不是只發(fā)個模型鏈接意思一下，而是連同基模權(quán)重、推理代碼、調(diào)用樣例都一并放了出來，結(jié)構(gòu)清晰、文檔完善。那種 “我不怕你復(fù)現(xiàn)，也歡迎你來接著做” 的姿態(tài)，不只是展示實力，更是一種罕見的主動姿態(tài)。

要知道，在具身智能這個領(lǐng)域里，開源從來都不是默認(rèn)選項，反而是例外。尤其是高性能模型，一旦跑出好成績，很多團(tuán)隊的第一反應(yīng)都是 “先封起來”，畢竟這個領(lǐng)域的門檻高、工程重、資本熱，誰都想先拿著成果去融資、接項目、談生態(tài)。

但 Spirit 并沒有把這當(dāng)成一個 “技術(shù)護(hù)城河”，而是反過來，把它變成一個 “產(chǎn)業(yè)底座”：歡迎你在我這之上搭建應(yīng)用、構(gòu)建生態(tài)、開展合作。

這不僅僅是自信的問題，更是意識的問題。具身智能產(chǎn)業(yè)遲早要走到生態(tài)化階段，一個模型想走得遠(yuǎn)，不能只靠自己能做什么，還得看別人能不能在你身上做點什么。

能不能快速復(fù)現(xiàn)？
能不能移植到不同機(jī)器人？
能不能兼容不同任務(wù)？
能不能在不懂算法的場景方手里跑起來？

這背后靠的不是性能指標(biāo)，而是開源的質(zhì)量、工程的完備度、文檔的友好程度、范式的普適性。Spirit v1.5 交出來的這套東西，已經(jīng)能被國內(nèi)外的研究者直接調(diào)起來在真機(jī)上復(fù)現(xiàn)任務(wù)，也意味著一套通用具身模型的 “復(fù)用路徑” 正在形成。

而這對下游廠商而言，信號非常明確：你不需要從零做模型，也不需要綁死在海外 API 上。在過去的幾年里，那些高性能的具身模型不是不開，而是不能用：Google RT 只發(fā)了 paper，不開權(quán)重；Figure 展示了效果，但系統(tǒng)封閉；一些開源模型雖然存在，但性能過低，難以商用。

而 Spirit 現(xiàn)在交出的是一個 “性能可比 Pi0.5、架構(gòu)全量公開、兼容多機(jī)器人” 的真實底座。這類模型，一旦經(jīng)得起復(fù)現(xiàn)和落地驗證，很快就能變成行業(yè)共用的 “基礎(chǔ)設(shè)施”。而當(dāng)一個模型能變成基礎(chǔ)設(shè)施，它就有了真實意義上的產(chǎn)業(yè)號召力，不再只是實驗室里的好看作品。

所以說，Spirit v1.5 開源的，不只是代碼，也不只是 “透明”。它開源的，是一種新的產(chǎn)業(yè)策略。是說：我們不玩壁壘，我們搭地基；我們不等獨角獸，我們先把路修出來。你愿意走進(jìn)來，我們不設(shè)門檻。

這，是中國具身智能在全球舞臺上，第一次有底氣說出這句話。

中國機(jī)器人產(chǎn)業(yè)，終于開始比 “大腦” 了

這幾年，誰去過幾場機(jī)器人展，就會明白一個現(xiàn)實：中國的機(jī)器人，從 “身體” 層面，從來不缺驚喜。一個比一個輕，一個比一個穩(wěn)，腿越做越多，手越做越巧，身形逼近人類，甚至跳舞、打拳、翻跟頭、耍手絹…… 樣樣不在話下。

但很多行業(yè)人也知道：越是炫技的動作，背后越是工程化編排。動作是精調(diào)出來的，流程是腳本堆出來的，甚至某些 “具身智能模型” 的名字，更多是出現(xiàn)在 PPT 和發(fā)布會中——真正起作用的，是工程師連夜調(diào)的參數(shù)、默契配合的操控臺，還有被剪輯過無數(shù)次的演示視頻。

我們擅長制造一個 “會動的身體”。但要造出一個 “能想的大腦”，一直是最短的那一塊板。

所以前幾年，中國團(tuán)隊的共識幾乎就是：先把軀體搞出來，智能先靠工程兜底。動作能跑就行，模型慢慢補(bǔ)。

Spirit v1.5 是這條路徑的一個分水嶺。它是第一次，中國團(tuán)隊不是用工程表演拼 “智能”，而是用訓(xùn)練范式和泛化能力，在一張國際統(tǒng)一標(biāo)準(zhǔn)的考卷上，以模型為主角，贏得一場無可爭議的具身智能硬仗。

而且這場勝利足夠扎實：是真機(jī)評測、統(tǒng)一任務(wù)、多構(gòu)型平臺、多步驟任務(wù)，全套打下來，比的是遷移能力、策略泛化、失敗恢復(fù)、任務(wù)理解—— 這些能力，不可能靠腳本堆出來，必須是模型自己 “學(xué)” 出來的。

這說明一個事實正在發(fā)生變化：國產(chǎn)機(jī)器人不再只靠姿勢取勝，而是開始真正構(gòu)建自己的 “認(rèn)知中樞”。過去我們能造出能跑、能跳、能舉重的身體；現(xiàn)在我們開始造出能決策、能適應(yīng)、能變通的大腦。

這不是技術(shù)指標(biāo)的變化，而是技術(shù)認(rèn)知和產(chǎn)業(yè)定位的變化。從 “誰動作更穩(wěn)” 到 “誰泛化能力更強(qiáng)”；從 “誰現(xiàn)場 demo 更驚艷” 到 “誰能復(fù)現(xiàn)、能落地、能服務(wù)多個場景”。

這背后，其實是一整代機(jī)器人開發(fā)邏輯的轉(zhuǎn)變。從工程先行，走向智能主導(dǎo)。從 “用代碼堆功能”，走向“用模型學(xué)策略”。

Spirit v1.5 只是起點，但它標(biāo)志著中國具身智能產(chǎn)業(yè)，已經(jīng)走出了 “只有肌肉沒有大腦” 的階段，開始邁向智能主導(dǎo)的產(chǎn)業(yè)結(jié)構(gòu)升級。

真正的具身智能，從來不是哪個機(jī)器人能做什么動作，而是：它能不能學(xué)，能不能變，能不能在失敗之后繼續(xù)做正確的事。

而接下來，比的不是誰喊得響、視頻做得好，而是 —— 誰的模型，真能在真實世界里站得住。

繼 DeepSeek 之后，中國又贏了一次 “起點之戰(zhàn)”

還記得 2025 年 DeepSeek 刷屏 Hugging Face Trending 熱榜的那個瞬間嗎？那一晚，無數(shù)人第一次意識到，中國不只是能開源出一款 “差不多” 的大模型，而是能做出真正領(lǐng)先的通用語言模型，并靠社區(qū)力量跑到全球開發(fā)者的核心視野里。那被稱為 “中國開源大模型的高光時刻”。

而現(xiàn)在，Spirit v1.5在 RoboChallenge 登頂，同樣開放出完整的具身大模型底座，意味著我們在具身智能這個更靠近物理世界、更接近工業(yè)難度的賽道上，也迎來了屬于中國的 “開源主角時刻”。

語言之后，是行動。大腦之后，是身體。

從 DeepSeek 到 Spirit，這兩個 “高光節(jié)點” 的共同點都不是它們技術(shù)上有多極致，而是 ——它們都把開源這件事，做到了基礎(chǔ)設(shè)施級的完成度。不是半封閉的 checkpoint，不是好看的展示頁面，而是真正可用、可跑、可拓展、能打通上下游系統(tǒng)的 “工程化開源”。

我們都知道，在 AI 的世界里，“第一” 這兩個字并不稀缺。每周都有新模型，每天都有新榜單，搶熱度、爭發(fā)布、刷存在感，行業(yè)早已習(xí)慣。真正稀缺的，是那種能被長期綁定、能夠沉淀為生態(tài)起點、能撐起別人項目、成為別人方案的一部分的模型。

Spirit v1.5 是目前我們看到的，具身智能領(lǐng)域中第一個具備這個潛質(zhì)的國產(chǎn)模型。它背后連接著完整的技術(shù)路徑（多樣化采集范式）、產(chǎn)品思路（可復(fù)現(xiàn)、多任務(wù)遷移）、工程能力（多構(gòu)型適配）、以及最重要的：開源出來的勇氣和組織能力。

這是一種行業(yè)信號，也是一種戰(zhàn)略姿態(tài)。過去中國的具身智能總被貼上 “硬件強(qiáng)、智能弱” 的標(biāo)簽。今天開始，有團(tuán)隊用一個完整、開源、性能領(lǐng)先的通用模型，給出了不一樣的答案。

當(dāng)然，這并不意味著我們已經(jīng)贏了。RoboChallenge 的榜單會變，開源模型的競爭會加速，下一代具身模型可能轉(zhuǎn)向端側(cè)部署、極簡架構(gòu)、甚至多模態(tài)協(xié)同。

但正如當(dāng)年 ImageNet、GLUE、OpenAI Gym 之于計算機(jī)視覺、自然語言與智能體訓(xùn)練的意義一樣：只要你能在 “統(tǒng)一基準(zhǔn)” 下拿到一次真正領(lǐng)先的結(jié)果，并開放給全球社區(qū)驗證、使用和超越，你就為中國具身智能贏得了關(guān)鍵的“起點話語權(quán)”。

這一次，是 Spirit。

再下一次，會是誰？

開源地址：

Code: https://github.com/Spirit-AI-Team/spirit-v1.5Model:https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5Blog：https://www.spirit-ai.com/en/blog/spirit-v1-5

前沿動態(tài)前沿大會

前沿人物

點「在看」，給前前加雞腿

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.