国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Thinking Machines產(chǎn)品更新:K2 Thinking、Qwen3-VL都可以微調(diào)

0
分享至



機(jī)器之心報(bào)道

機(jī)器之心編輯部

當(dāng)前,AI 領(lǐng)域的研究者與開(kāi)發(fā)者在關(guān)注 OpenAI、Google 等領(lǐng)先機(jī)構(gòu)最新進(jìn)展的同時(shí),也將目光投向了由前 OpenAI CTO Mira Murati 創(chuàng)辦的 Thinking Machines Lab。

今年早些時(shí)候,他們推出了首款產(chǎn)品 Tinker:這是一個(gè) API,用于幫開(kāi)發(fā)者 / 研究人員微調(diào)語(yǔ)言模型。你只需要專注于訓(xùn)練數(shù)據(jù)和算法,而你不擅長(zhǎng)的關(guān)于 Infra 的部分 —— 調(diào)度、調(diào)優(yōu)、資源管理和 Infra 可靠性 —— 統(tǒng)統(tǒng)由 Tinker 來(lái)搞定,從而大大簡(jiǎn)化了 LLM 的后訓(xùn)練過(guò)程。

此前,Tinker 僅向研究人員和開(kāi)發(fā)者開(kāi)放內(nèi)部測(cè)試;而如今,Thinking Machines 宣布正式取消候選名單,所有用戶都可以直接使用 Tinker

除此以外,Tinker 還帶來(lái)了其他三項(xiàng)更新:

首先,更強(qiáng)推理能力:用戶現(xiàn)在可以在 Tinker 上對(duì) Kimi K2 Thinking 進(jìn)行微調(diào)。 Kimi K2 擁有萬(wàn)億參數(shù)規(guī)模,是 Thinking Machines 目前規(guī)模最大的模型,專為長(zhǎng)鏈推理和工具調(diào)用場(chǎng)景而設(shè)計(jì)。

其次,兼容 OpenAI API 的全新推理接口:Tinker 提供了標(biāo)準(zhǔn)的推理接口,例如:



借助本次發(fā)布,Tinker 還新增了兼容 OpenAI API 的接口封裝,用戶只需通過(guò)指定模型路徑,即可對(duì)模型進(jìn)行快速采樣,即使模型仍處于訓(xùn)練過(guò)程中也可以使用。

這也意味著,Tinker 現(xiàn)在可以即插即用地接入任何兼容 OpenAI API 的平臺(tái)。



最后,Qwen3-VL 支持視覺(jué)輸入。Tinker 新增了兩款視覺(jué)模型:Qwen3-VL-30B-A3B-Instruct 和 Qwen3-VL-235B-A22B-Instruct。借助這些模型,用戶可以在多種應(yīng)用場(chǎng)景中處理圖片、截圖以及示意圖等視覺(jué)內(nèi)容。



這些視覺(jué)輸入開(kāi)箱即用,可直接應(yīng)用于多種任務(wù)場(chǎng)景,包括監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí)微調(diào)。



Tinker支持的模型

過(guò)去,開(kāi)發(fā)者若想訓(xùn)練或微調(diào)前沿大模型,必須自行采購(gòu) GPU、搭建集群、處理 CUDA/NCCL 環(huán)境、維護(hù)分布式訓(xùn)練穩(wěn)定性,門檻極高且成本巨大。

而 Tinker 通過(guò)將所有訓(xùn)練基礎(chǔ)設(shè)施抽象為一個(gè) API,使開(kāi)發(fā)者無(wú)需管理任何算力資源,只需準(zhǔn)備數(shù)據(jù)和算法即可訓(xùn)練模型。更重要的是,此次更新首次讓普通開(kāi)發(fā)者能夠微調(diào)萬(wàn)億參數(shù)的 Kimi K2 Thinking,這本來(lái)是只有頂級(jí)實(shí)驗(yàn)室才能掌握的能力,視覺(jué)輸入的加入進(jìn)一步降低了 VLM 應(yīng)用門檻。

對(duì)此,研究者紛紛表示:「能夠在無(wú)需自行管理 GPU 基礎(chǔ)設(shè)施的情況下訓(xùn)練自定義圖文數(shù)據(jù),對(duì)開(kāi)發(fā)者來(lái)說(shuō)是一項(xiàng)巨大的進(jìn)步。」



使用 Tinker 訓(xùn)練圖像分類模型

為了展示 Tinker 新增的視覺(jué)能力,Thinking Machines Lab 對(duì) Qwen3-VL-235B-A22B-Instruct 進(jìn)行了微調(diào),并將其應(yīng)用于多項(xiàng)經(jīng)典圖像分類基準(zhǔn)測(cè)試中。

具體而言,研究團(tuán)隊(duì)選擇了四個(gè)常用的數(shù)據(jù)集進(jìn)行評(píng)估,包括:

  • Caltech-101:包含 101 類常見(jiàn)物體的數(shù)據(jù)集
  • Stanford Cars:涵蓋汽車品牌、型號(hào)和年份的數(shù)據(jù)集
  • Oxford Flowers:花卉品種數(shù)據(jù)集
  • Oxford Pets:寵物品種數(shù)據(jù)集

由于 Qwen3-VL 本質(zhì)上是語(yǔ)言模型,研究中將圖像分類任務(wù)建模為文本生成問(wèn)題:給定一張圖片,模型直接輸出對(duì)應(yīng)的類別名稱。研究人員將這一方法與傳統(tǒng)的視覺(jué)基線方案 DINOv2 進(jìn)行了對(duì)比。

DINOv2 是一種通過(guò)自監(jiān)督方式訓(xùn)練的視覺(jué) Transformer,常被用作純計(jì)算機(jī)視覺(jué)任務(wù)的 backbone。對(duì)于 DINOv2,研究中在其模型之上添加了一個(gè)分類頭,用于預(yù)測(cè)所有 N 個(gè)類別的概率分布。兩種模型均采用 LoRA 方式進(jìn)行微調(diào)。



圖中展示了經(jīng)過(guò)微調(diào)的 Qwen3-VL-235B-A22B 與 DINOv2 在簡(jiǎn)單圖像分類任務(wù)上的性能對(duì)比。

在小樣本數(shù)據(jù)場(chǎng)景下,Qwen3-VL-235B-A22B 的表現(xiàn)優(yōu)于 DINOv2。這不僅是因?yàn)槠淠P鸵?guī)模更大,更重要的是,作為視覺(jué)語(yǔ)言模型(VLM),它天然具備語(yǔ)言知識(shí)(例如知道「向日葵」指代什么)。正是這種通用的語(yǔ)言與視覺(jué)聯(lián)合能力,使得 Qwen3-VL 在圖像分類之外,也能夠更方便地遷移到其他視覺(jué)任務(wù)中。

還沒(méi)體驗(yàn)的小伙伴,Tinker 絕對(duì)值得一試。

https://thinkingmachines.ai/tinker/

https://thinkingmachines.ai/blog/tinker-general-availability/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
馬文峰任廣東省外事辦公室主任

馬文峰任廣東省外事辦公室主任

中國(guó)經(jīng)濟(jì)網(wǎng)
2025-12-19 14:20:06
張震岳不慣著!一句話撕下朱孝天最后體面,李冰冰的臉被他丟盡了

張震岳不慣著!一句話撕下朱孝天最后體面,李冰冰的臉被他丟盡了

曉帝愛(ài)八卦
2025-12-20 06:34:39
國(guó)資委大消息!這些板塊迎重大利好,下周“這類股”有望騰飛大漲

國(guó)資委大消息!這些板塊迎重大利好,下周“這類股”有望騰飛大漲

虎哥閑聊
2025-12-20 08:13:29
上海著名百貨商場(chǎng)官宣改名、啟動(dòng)不停業(yè)改造!屋頂觀景平臺(tái)目測(cè)要火

上海著名百貨商場(chǎng)官宣改名、啟動(dòng)不停業(yè)改造!屋頂觀景平臺(tái)目測(cè)要火

新民晚報(bào)
2025-12-19 19:28:59
羅永浩又開(kāi)炮!開(kāi)通1000兆寬帶下載只有90多兆,上海電信壓力來(lái)了

羅永浩又開(kāi)炮!開(kāi)通1000兆寬帶下載只有90多兆,上海電信壓力來(lái)了

火山詩(shī)話
2025-12-19 06:40:20
新來(lái)的縣委書(shū)記是我大學(xué)時(shí)的男友,會(huì)議結(jié)束,他把我叫到了辦公室

新來(lái)的縣委書(shū)記是我大學(xué)時(shí)的男友,會(huì)議結(jié)束,他把我叫到了辦公室

五元講堂
2025-12-14 08:50:03
馬云預(yù)言或?qū)?yīng)驗(yàn)了?未來(lái)5年,比開(kāi)藥店還要暴利的4個(gè)方向

馬云預(yù)言或?qū)?yīng)驗(yàn)了?未來(lái)5年,比開(kāi)藥店還要暴利的4個(gè)方向

百態(tài)人間
2025-12-20 05:25:03
蔣萬(wàn)安又開(kāi)批了! 鈕則勛盤點(diǎn)其抗綠系列發(fā)言大贊:在野第一勇

蔣萬(wàn)安又開(kāi)批了! 鈕則勛盤點(diǎn)其抗綠系列發(fā)言大贊:在野第一勇

海峽導(dǎo)報(bào)社
2025-12-19 10:52:19
馬斯克贏得560億美元薪酬方案:如今價(jià)值1390億美元

馬斯克贏得560億美元薪酬方案:如今價(jià)值1390億美元

鞭牛士
2025-12-20 08:07:09
揭秘楊瀚森下放召回:兩座球館只有10分鐘車程 每天餐補(bǔ)150美元

揭秘楊瀚森下放召回:兩座球館只有10分鐘車程 每天餐補(bǔ)150美元

羅說(shuō)NBA
2025-12-20 11:21:17
下周可能會(huì)漲的板塊:

下周可能會(huì)漲的板塊:

風(fēng)風(fēng)順
2025-12-20 09:37:24
汕汕高鐵汕頭至汕頭南段12月22日將建成通車

汕汕高鐵汕頭至汕頭南段12月22日將建成通車

環(huán)球網(wǎng)資訊
2025-12-20 12:30:42
大量汽車材料進(jìn)入禁限用清單 車企出口歐盟將迎全面合規(guī)挑戰(zhàn)

大量汽車材料進(jìn)入禁限用清單 車企出口歐盟將迎全面合規(guī)挑戰(zhàn)

經(jīng)濟(jì)觀察報(bào)
2025-12-19 10:14:39
凌晨4點(diǎn)皇馬年度收官戰(zhàn)!姆巴佩進(jìn)2球=超C羅紀(jì)錄 4巨頭強(qiáng)攻

凌晨4點(diǎn)皇馬年度收官戰(zhàn)!姆巴佩進(jìn)2球=超C羅紀(jì)錄 4巨頭強(qiáng)攻

葉青足球世界
2025-12-20 09:05:22
渤海完全屬于中國(guó)!因當(dāng)年毛主席的一句話,如今沒(méi)有一艘外船敢進(jìn)

渤海完全屬于中國(guó)!因當(dāng)年毛主席的一句話,如今沒(méi)有一艘外船敢進(jìn)

抽象派大師
2025-12-11 17:05:41
賀江川落馬,在北京國(guó)企圈子里,妥妥是金字塔尖的大佬。

賀江川落馬,在北京國(guó)企圈子里,妥妥是金字塔尖的大佬。

百態(tài)人間
2025-12-19 16:54:12
膜拜歐皇!綠軍一球迷參加中場(chǎng)抽獎(jiǎng)活動(dòng),喜獲100萬(wàn)美元獎(jiǎng)金

膜拜歐皇!綠軍一球迷參加中場(chǎng)抽獎(jiǎng)活動(dòng),喜獲100萬(wàn)美元獎(jiǎng)金

懂球帝
2025-12-20 12:37:04
破案!狀態(tài)明顯很差,杜鋒卻不敢下胡明軒原因找到,關(guān)辛說(shuō)出實(shí)情

破案!狀態(tài)明顯很差,杜鋒卻不敢下胡明軒原因找到,關(guān)辛說(shuō)出實(shí)情

后仰大風(fēng)車
2025-12-20 07:47:07
51歲賈靜雯與高圓圓同框,一個(gè)臉緊致一個(gè)褶多,骨相皮相區(qū)別明顯

51歲賈靜雯與高圓圓同框,一個(gè)臉緊致一個(gè)褶多,骨相皮相區(qū)別明顯

小娛樂(lè)悠悠
2025-12-20 11:44:20
她相貌平平,卻拿捏兩位千億富豪,為老頭連生兩子,現(xiàn)是豪門董事

她相貌平平,卻拿捏兩位千億富豪,為老頭連生兩子,現(xiàn)是豪門董事

說(shuō)歷史的老牢
2025-12-19 10:57:14
2025-12-20 12:55:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
11957文章數(shù) 142514關(guān)注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時(shí)刻"還未到來(lái)

頭條要聞

克林頓與愛(ài)潑斯坦案受害者共浴照片披露:坐在浴缸里

頭條要聞

克林頓與愛(ài)潑斯坦案受害者共浴照片披露:坐在浴缸里

體育要聞

我開(kāi)了20年大巴,現(xiàn)在是一名西甲主帥

娛樂(lè)要聞

戚薇女兒大變樣,10歲就進(jìn)入“尷尬期”

財(cái)經(jīng)要聞

日本加息落地:暴跌沒(méi)有,麻煩在后頭

汽車要聞

嵐圖推進(jìn)L3量產(chǎn)測(cè)試 已完成11萬(wàn)公里實(shí)際道路驗(yàn)證

態(tài)度原創(chuàng)

家居
親子
本地
藝術(shù)
公開(kāi)課

家居要聞

高端私宅 理想隱居圣地

親子要聞

泰蘭尼斯千元兒童“穩(wěn)跑鞋” ,加入碳板是割韭菜還是剛需?

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

藝術(shù)要聞

Grigorieva Klimova:紛繁輕盈的色彩

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版