国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

拿下9榜第一!優(yōu)必選開(kāi)源新基座模型,要破解具身智能落地最大難題

0
分享至


機(jī)器人前瞻(公眾號(hào):robot_pro)
作者 程茜
編輯 漠影

機(jī)器人前瞻2月5日?qǐng)?bào)道,人形機(jī)器人第一股優(yōu)必選近期開(kāi)源了最新的自研具身智能大模型Thinker,一舉拿下9個(gè)權(quán)威基準(zhǔn)測(cè)試榜第一。Thinker參數(shù)規(guī)模僅4B,就在多項(xiàng)基準(zhǔn)測(cè)試超過(guò)10B以上參數(shù)規(guī)模模型,成為大模型領(lǐng)域“以小搏大”的又一典型代表。


此前具身智能落地真實(shí)工業(yè)產(chǎn)線(xiàn),始終存在難以突破的技術(shù)門(mén)檻,核心癥結(jié)便是機(jī)器人空間度量失準(zhǔn)、時(shí)間響應(yīng)遲滯,這也成為其從實(shí)驗(yàn)室技術(shù)走向產(chǎn)業(yè)化應(yīng)用的關(guān)鍵瓶頸。

開(kāi)源的Thinker模型,正是優(yōu)必選在具身智能規(guī)?;瘧?yīng)用的前夜,交出的一份全新高分答卷,而該模型的性能突破,正源于優(yōu)必選的兩大核心優(yōu)勢(shì):

作為人形機(jī)器人第一股,優(yōu)必選是國(guó)內(nèi)深耕人形機(jī)器人領(lǐng)域的先行者,不僅率先實(shí)現(xiàn)人形機(jī)器人的工廠(chǎng)落地應(yīng)用,更在具身智能的場(chǎng)景理解、數(shù)據(jù)積累與模型能力打磨上形成了深厚積淀;

其研發(fā)目標(biāo)瞄準(zhǔn)的是支撐人形機(jī)器人從感知、認(rèn)知、決策到執(zhí)行的全閉環(huán)能力,可以應(yīng)對(duì)工業(yè)、服務(wù)等不同場(chǎng)景的多樣化需求,構(gòu)建通用的具身智能基座模型。

如今最為直接的例證就是,優(yōu)必選已在自研的Thinker基座模型上進(jìn)行模型的二次開(kāi)發(fā),真實(shí)應(yīng)用于Walker S2,并在工廠(chǎng)中進(jìn)行小批量應(yīng)用,為其具身智能生態(tài)發(fā)展邁出關(guān)鍵一步。

一、刷榜9大權(quán)威榜單,讓機(jī)器人突破落地限制

Thinker要解決的核心問(wèn)題是,讓機(jī)器人不僅能在各項(xiàng)測(cè)試中“考高分”,還能在真實(shí)業(yè)務(wù)場(chǎng)景里快速落地、真干活。

先來(lái)看下這一模型的性能表現(xiàn)。

與多個(gè)10B參數(shù)規(guī)模以下模型相比,Thinker在全球的具身智能大腦模型權(quán)威榜中拿下了9項(xiàng)第一。

規(guī)劃與視覺(jué)定位能力中,Thinker在全部5個(gè)測(cè)評(píng)中均排名第一。這主要考察的是模型理解空間關(guān)系、定位物體和執(zhí)行規(guī)劃的能力,其結(jié)果說(shuō)明Thinker在面對(duì)看哪里、將物品放到哪里等空間規(guī)劃與視覺(jué)理解相關(guān)任務(wù)上有優(yōu)勢(shì)。

此外是考察模型對(duì)三維空間、立體結(jié)構(gòu)的感知與推理能力的3D空間理解能力維度,Thinker拿下其中三項(xiàng)第一。

還有在多模態(tài)綜合理解方面,Thinker在RealWorldQA基準(zhǔn)測(cè)試集上排名第一,證明其在真實(shí)世界的場(chǎng)景問(wèn)答中的能力,在通用學(xué)術(shù)評(píng)測(cè)MMMU中,其表現(xiàn)略遜于更大參數(shù)量模型。這進(jìn)一步說(shuō)明,優(yōu)必選此次開(kāi)源的新模型在真實(shí)世界應(yīng)用場(chǎng)景的理解上會(huì)優(yōu)于通用大模型。


面對(duì)參數(shù)規(guī)模更大的10B以上模型,Thinker的表現(xiàn)并不遜色。

其拿下了7項(xiàng)第一,在規(guī)劃與視覺(jué)定位、3D空間理解上,Thinker面對(duì)機(jī)器人核心感知能力相關(guān)的物體空間關(guān)系理解、目標(biāo)定位、任務(wù)規(guī)劃等測(cè)試,表現(xiàn)仍?xún)?yōu)于通用大模型。

不過(guò)在多模態(tài)綜合理解上,該模型排名靠后,這或許是因?yàn)槠湓谥R(shí)儲(chǔ)備上無(wú)法與32B、72B級(jí)別的大模型抗衡。


綜合來(lái)看,Thinker的表現(xiàn)證明了其能讓機(jī)器人在自主看懂所處環(huán)境、規(guī)劃好做事步驟,以及精準(zhǔn)感知周邊情況、搞懂空間關(guān)系、完成物理互動(dòng)方面的真本事。

二、手握真實(shí)場(chǎng)景資源,構(gòu)建數(shù)據(jù)飛輪與技術(shù)應(yīng)用正向閉環(huán)

優(yōu)必選選擇打造Thinker通用基座模型,背后有著貼合自身發(fā)展優(yōu)勢(shì)與行業(yè)生態(tài)布局的獨(dú)特考量,體現(xiàn)在兩大核心維度:

首先,優(yōu)必選手握大量高質(zhì)量真實(shí)場(chǎng)景數(shù)據(jù),能夠在模型訓(xùn)練中充分釋放數(shù)據(jù)價(jià)值。

其次,Thinker以通用基座能力為基礎(chǔ),可高效適配具身智能與真實(shí)世界場(chǎng)景,實(shí)現(xiàn)更廣泛的產(chǎn)品與生態(tài)落地。

這背后的關(guān)鍵前提就是高質(zhì)量的訓(xùn)練數(shù)據(jù)。一般而言,模型訓(xùn)練的原始數(shù)據(jù)需要經(jīng)過(guò)嚴(yán)格的清洗、標(biāo)注與篩選,才能有效驅(qū)動(dòng)模型性能提升。

面對(duì)20B、含噪聲、難對(duì)齊、模態(tài)缺失的原始數(shù)據(jù),優(yōu)必選構(gòu)建全流程自動(dòng)化“精煉提純”流水線(xiàn)。通過(guò)“數(shù)據(jù)篩選”與“質(zhì)量評(píng)分”兩步,將其提純?yōu)?0M級(jí)別的高質(zhì)量數(shù)據(jù)。

為了找到高質(zhì)量數(shù)據(jù),其制定了規(guī)則快速?gòu)?0B數(shù)據(jù)中過(guò)濾出約1%的候選數(shù)據(jù)池,然后引入大模型構(gòu)建多維度評(píng)分模塊,再次篩選出約1%的最高質(zhì)量數(shù)據(jù)。

基于此,優(yōu)必選為T(mén)hinker構(gòu)建了四種數(shù)據(jù)集,涵蓋空間和時(shí)間理解、自我視角推理、機(jī)器人操作規(guī)劃以及其內(nèi)部開(kāi)發(fā)的工業(yè)數(shù)據(jù)集Industroplan。其中,Industroplan專(zhuān)注于工業(yè)環(huán)境中的多物體操作和運(yùn)輸任務(wù)。


▲模型訓(xùn)練數(shù)據(jù)分布

接著是數(shù)據(jù)標(biāo)注環(huán)節(jié),其痛點(diǎn)在于人工標(biāo)注成本居高不下,且因具身智能的場(chǎng)景特性和數(shù)據(jù)本身的多維復(fù)雜性使得標(biāo)注難度不小,因此優(yōu)必選搭建了“弱監(jiān)督+自監(jiān)督+少量人工校驗(yàn)”的自動(dòng)化標(biāo)注體系。

其通過(guò)大模型輔助標(biāo)注疊加多模型交叉驗(yàn)證,實(shí)現(xiàn)視覺(jué)場(chǎng)景分割、動(dòng)作序列分類(lèi)、指令意圖解析等任務(wù)的端到端自動(dòng)化標(biāo)注。同時(shí),其會(huì)將人工參與率控制在1%以下, 僅對(duì)標(biāo)注置信度低于閾值的樣本進(jìn)行人工復(fù)核。最后,該機(jī)制還包括建立動(dòng)態(tài)迭代優(yōu)化體系,把模型訓(xùn)練后的誤差反饋至標(biāo)注流水線(xiàn),持續(xù)優(yōu)化標(biāo)注算法參數(shù)。

這樣一來(lái),其就可以形成自動(dòng)化標(biāo)注閉環(huán),且相較全人工標(biāo)注方案成本降低99%,標(biāo)注效率提升超百倍。

這一方案的核心價(jià)值在于,既依托高質(zhì)量數(shù)據(jù)筑牢大模型訓(xùn)練的核心根基,更讓Thinker模型的能力打磨深度貼合具身智能的實(shí)際落地場(chǎng)景,使其具備更強(qiáng)的實(shí)用價(jià)值與商業(yè)化落地潛力。


Thinker模型的意義遠(yuǎn)不止于此,基于其技術(shù)積淀,優(yōu)必選還打通了數(shù)據(jù)回流機(jī)制,構(gòu)建起具身智能領(lǐng)域的數(shù)據(jù)飛輪:通過(guò)將技術(shù)方案深度部署于工廠(chǎng)搬運(yùn)、工件分揀等真實(shí)工業(yè)場(chǎng)景,把核心技術(shù)優(yōu)勢(shì)切實(shí)轉(zhuǎn)化為場(chǎng)景落地能力,同時(shí)讓場(chǎng)景端產(chǎn)生的真實(shí)數(shù)據(jù)持續(xù)反哺模型迭代進(jìn)化。

以工廠(chǎng)搬運(yùn)為例,系統(tǒng)持續(xù)收集實(shí)際作業(yè)中的長(zhǎng)尾案例數(shù)據(jù),如料箱識(shí)別失敗、抓取軌跡動(dòng)態(tài)調(diào)整等。這些真實(shí)場(chǎng)景數(shù)據(jù)直接反哺Thinker模型的訓(xùn)練,推動(dòng)其自主進(jìn)化,不斷增強(qiáng)基礎(chǔ)性能與場(chǎng)景適應(yīng)能力。最終基于Thinker大模型,Walker S2可在箱體搬運(yùn)、工件分揀等下游應(yīng)用場(chǎng)景中實(shí)現(xiàn)99.99%的作業(yè)準(zhǔn)確率。

三、全鏈路優(yōu)化,訓(xùn)練策略適配具身智能通用需求

盡管獲取高質(zhì)量數(shù)據(jù)是訓(xùn)練具身智能大模型的關(guān)鍵,但優(yōu)必選之所以能憑借優(yōu)質(zhì)數(shù)據(jù)訓(xùn)出超越一眾主流模型的Thinker,核心還在于一套科學(xué)系統(tǒng)的模型訓(xùn)練策略。

更重要的是,其模型始終圍繞通用基座模型的定位展開(kāi),從源頭適配先進(jìn)且廣闊的具身智能生態(tài)建設(shè)需求。

Thinker的技術(shù)報(bào)告提到,該模型架構(gòu)包括四個(gè)模塊,文本分詞器、視覺(jué)編碼器、用于對(duì)齊視覺(jué)空間和語(yǔ)言空間的多層感知器以及大語(yǔ)言模型主干。

在具體的訓(xùn)練過(guò)程中,研究人員分成了兩個(gè)訓(xùn)練階段,以讓模型在復(fù)雜場(chǎng)景下也能有穩(wěn)定的規(guī)劃能力。

第一階段是專(zhuān)注于構(gòu)建模型的基礎(chǔ)感知和推理能力。研究人員結(jié)合通用數(shù)據(jù)集、空間理解數(shù)據(jù)集和大規(guī)模規(guī)劃數(shù)據(jù)集對(duì)Thinker進(jìn)行微調(diào),使其具備空間感知和推理能力為后續(xù)復(fù)雜場(chǎng)景下的任務(wù)對(duì)齊和長(zhǎng)遠(yuǎn)規(guī)劃奠定基礎(chǔ)。

值得一提的是,研究人員還會(huì)視頻理解訓(xùn)練過(guò)程中將每個(gè)視頻片段的最后一幀作為輔助輸入,以進(jìn)一步提升模型性能。


第二階段的重點(diǎn)是,對(duì)下游規(guī)劃任務(wù)進(jìn)行監(jiān)督式微調(diào),使模型推理能力與特定任務(wù)目標(biāo)保持一致。

研究人員對(duì)Industroplan-200K數(shù)據(jù)集進(jìn)行監(jiān)督式微調(diào),這一過(guò)程使模型能夠?qū)⑵鋸牡谝浑A段繼承的推理能力應(yīng)用于順序依賴(lài)關(guān)系、多樣化的對(duì)象布局以及糾錯(cuò)反饋。

這使得Thinker能夠在真實(shí)的工業(yè)場(chǎng)景中生成可執(zhí)行的規(guī)劃方案,有效將空間理解與實(shí)際任務(wù)執(zhí)行聯(lián)系起來(lái)。

不論從訓(xùn)練數(shù)據(jù)的選擇、標(biāo)注還是到訓(xùn)練策略的設(shè)計(jì),Thinker均服務(wù)于其具身智能基座模型的核心定位。不同于單一功能型模型,優(yōu)必選憑借模塊化架構(gòu)、高效訓(xùn)練策略打造的模型具備通用化、高適配、強(qiáng)性能的核心能力

并且基于這一通用底座,開(kāi)發(fā)者可靈活進(jìn)行二次開(kāi)發(fā)、按需拓展,為搭建更先進(jìn)、更廣闊的具身智能生態(tài),筑牢可復(fù)用、可拓展、可協(xié)同的智能底座。

根據(jù)當(dāng)前行業(yè)發(fā)展的趨勢(shì),Thinker這樣以開(kāi)源為核心支撐的具身智能生態(tài)建設(shè)正穩(wěn)步推進(jìn),為人形機(jī)器人自主化水平的提升打開(kāi)新的發(fā)展空間。

結(jié)語(yǔ):瞄準(zhǔn)具身智能通用底座,優(yōu)必選加速打破技術(shù)壁壘

優(yōu)必選打造并開(kāi)源的Thinker基座模型,相當(dāng)于為行業(yè)提供了一個(gè)通用、開(kāi)放的技術(shù)底座,不同的科研團(tuán)隊(duì)可以基于這個(gè)底座,針對(duì)不同場(chǎng)景做個(gè)性化的模型開(kāi)發(fā);不同的企業(yè)可以將自身的硬件、場(chǎng)景數(shù)據(jù)與基座模型對(duì)接,快速實(shí)現(xiàn)具身智能技術(shù)的落地應(yīng)用。

這種模式打破了技術(shù)之間的壁壘,讓行業(yè)資源得以高效整合。

具身智能的終極愿景是讓機(jī)器人走進(jìn)千行百業(yè)、融入人類(lèi)生活,實(shí)現(xiàn)與人類(lèi)的高效協(xié)作,這一目標(biāo)絕非單一功能模型、單一企業(yè)能實(shí)現(xiàn),也需要技術(shù)的持續(xù)迭代和形態(tài)的不斷進(jìn)化。而基座模型的生態(tài)化布局,恰好為這一長(zhǎng)遠(yuǎn)愿景預(yù)留了充足的技術(shù)空間。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“反詐老陳”賬號(hào)被封,本人回應(yīng):?jiǎn)栃臒o(wú)愧!MCN機(jī)構(gòu):即刻解除所有合約,雙方合作立即終止

“反詐老陳”賬號(hào)被封,本人回應(yīng):?jiǎn)栃臒o(wú)愧!MCN機(jī)構(gòu):即刻解除所有合約,雙方合作立即終止

都市快報(bào)橙柿互動(dòng)
2026-03-01 07:15:47
為什么科學(xué)家說(shuō):如果宇宙中只有人類(lèi),比找到外星人更可怕?

為什么科學(xué)家說(shuō):如果宇宙中只有人類(lèi),比找到外星人更可怕?

觀察宇宙
2026-03-01 20:46:19
春天,少吃紅薯南瓜多吃它,一次買(mǎi)10斤囤起來(lái),隨吃隨取,特省事

春天,少吃紅薯南瓜多吃它,一次買(mǎi)10斤囤起來(lái),隨吃隨取,特省事

阿龍美食記
2026-02-28 10:47:08
年輕人超愛(ài)的“椰子水”塌房了,豈能披著“純天然”的皮干勾兌的買(mǎi)賣(mài)?

年輕人超愛(ài)的“椰子水”塌房了,豈能披著“純天然”的皮干勾兌的買(mǎi)賣(mài)?

極目新聞
2026-03-02 13:10:38
伊朗前總統(tǒng)內(nèi)賈德遇襲身亡

伊朗前總統(tǒng)內(nèi)賈德遇襲身亡

瀟湘晨報(bào)
2026-03-02 10:37:19
A股:行情十分異常,大幅放量下跌!做好準(zhǔn)備,新一輪大漲開(kāi)啟?

A股:行情十分異常,大幅放量下跌!做好準(zhǔn)備,新一輪大漲開(kāi)啟?

虎哥閑聊
2026-03-02 11:36:36
破釜沉舟!伊朗用集束彈對(duì)美猛轟,擊落37架戰(zhàn)機(jī),中東被炸成火海

破釜沉舟!伊朗用集束彈對(duì)美猛轟,擊落37架戰(zhàn)機(jī),中東被炸成火海

健身狂人
2026-03-02 16:45:48
父親之謎!谷愛(ài)凌出生證明生父一欄空白 最新傳聞曝光:長(zhǎng)得真像

父親之謎!谷愛(ài)凌出生證明生父一欄空白 最新傳聞曝光:長(zhǎng)得真像

念洲
2026-03-01 21:29:29
哈梅內(nèi)伊開(kāi)會(huì)時(shí)遭襲身亡,細(xì)節(jié)披露!美媒:伊朗防長(zhǎng)等約40名官員在襲擊中死亡!伊方:總統(tǒng)等將領(lǐng)導(dǎo)國(guó)家

哈梅內(nèi)伊開(kāi)會(huì)時(shí)遭襲身亡,細(xì)節(jié)披露!美媒:伊朗防長(zhǎng)等約40名官員在襲擊中死亡!伊方:總統(tǒng)等將領(lǐng)導(dǎo)國(guó)家

每日經(jīng)濟(jì)新聞
2026-03-01 12:09:04
中國(guó)50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

中國(guó)50后還有多少人?多少人能活到80歲?權(quán)威數(shù)據(jù)告訴你

深度報(bào)
2026-02-27 21:36:50
最新戰(zhàn)況:伊朗與多支武裝協(xié)同反擊,美以遭重創(chuàng)

最新戰(zhàn)況:伊朗與多支武裝協(xié)同反擊,美以遭重創(chuàng)

兵國(guó)大事
2026-03-01 21:11:10
女兵98年被開(kāi)除軍籍,問(wèn)連長(zhǎng)知道她奶奶是誰(shuí)嗎,連長(zhǎng):誰(shuí)都沒(méi)用

女兵98年被開(kāi)除軍籍,問(wèn)連長(zhǎng)知道她奶奶是誰(shuí)嗎,連長(zhǎng):誰(shuí)都沒(méi)用

奶茶麥子
2026-03-02 14:23:09
韓國(guó)網(wǎng)紅博主上海旅游被宰客?一頓火鍋花了177萬(wàn)韓幣!

韓國(guó)網(wǎng)紅博主上海旅游被宰客?一頓火鍋花了177萬(wàn)韓幣!

奮斗在韓國(guó)
2026-03-02 11:00:03
現(xiàn)貨黃金失守5320美元/盎司

現(xiàn)貨黃金失守5320美元/盎司

每日經(jīng)濟(jì)新聞
2026-03-02 09:06:28
“沒(méi)完沒(méi)了了!”杭州女子崩潰:一天五六通電話(huà),精準(zhǔn)報(bào)我名字,為啥別人欠錢(qián)一直在催我?

“沒(méi)完沒(méi)了了!”杭州女子崩潰:一天五六通電話(huà),精準(zhǔn)報(bào)我名字,為啥別人欠錢(qián)一直在催我?

環(huán)球網(wǎng)資訊
2026-03-02 16:31:06
哈梅內(nèi)伊遇害,讓我們更佩服毛主席70多年前對(duì)美國(guó)本質(zhì)的深刻認(rèn)知

哈梅內(nèi)伊遇害,讓我們更佩服毛主席70多年前對(duì)美國(guó)本質(zhì)的深刻認(rèn)知

小楊歷史
2026-03-01 21:33:52
美國(guó)終于明白,當(dāng)年他們“誤炸”中國(guó)大使館,中國(guó)為什么不反擊

美國(guó)終于明白,當(dāng)年他們“誤炸”中國(guó)大使館,中國(guó)為什么不反擊

蜉蝣說(shuō)
2025-10-07 16:08:53
新勢(shì)力2月銷(xiāo)量:零跑理想前兩名,小米問(wèn)界跌慘了

新勢(shì)力2月銷(xiāo)量:零跑理想前兩名,小米問(wèn)界跌慘了

定焦One
2026-03-02 09:59:17
2換1!即將交易首秀!倫納德等回全明星后衛(wèi)

2換1!即將交易首秀!倫納德等回全明星后衛(wèi)

籃球?qū)崙?zhàn)寶典
2026-03-02 18:13:14
伊朗吃肉的時(shí)候,對(duì)中國(guó)防得嚴(yán)嚴(yán)實(shí)實(shí),生怕中國(guó)占一點(diǎn)便宜

伊朗吃肉的時(shí)候,對(duì)中國(guó)防得嚴(yán)嚴(yán)實(shí)實(shí),生怕中國(guó)占一點(diǎn)便宜

百態(tài)人間
2026-02-24 15:37:37
2026-03-02 21:23:00
機(jī)器人前瞻
機(jī)器人前瞻
專(zhuān)注于機(jī)器人報(bào)道的媒體
378文章數(shù) 8關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

頭條要聞

特朗普稱(chēng)對(duì)伊行動(dòng)還要打四周 學(xué)者:達(dá)成目標(biāo)需"補(bǔ)槍"

頭條要聞

特朗普稱(chēng)對(duì)伊行動(dòng)還要打四周 學(xué)者:達(dá)成目標(biāo)需"補(bǔ)槍"

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

美伊以沖突爆發(fā),多位明星被困中東

財(cái)經(jīng)要聞

金銀大漲 市場(chǎng)仍在評(píng)估沖突會(huì)否長(zhǎng)期化

汽車(chē)要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
游戲
手機(jī)
公開(kāi)課

推廣|| 春天第一雙鞋!暴走不累、搭遍好看小裙子

藝術(shù)要聞

簡(jiǎn)約的風(fēng)景畫(huà),美國(guó)畫(huà)家Ben Bauer作品

手握357靈第一無(wú)級(jí)別神鏈!夢(mèng)幻西游東海淵能否劍指神威第一?

手機(jī)要聞

盧偉冰回應(yīng)小米新機(jī)海外售價(jià)1.6萬(wàn)元:有信心沖擊iPhone!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版