国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

50 美元復(fù)刻 DeepSeek R1?李飛飛團(tuán)隊(duì) AI 研究新突破!

0
分享至

最近,AI 圈又炸了!斯坦福大學(xué)李飛飛團(tuán)隊(duì)聯(lián)合華盛頓大學(xué)的研究人員,用不到 50 美元的云計(jì)算費(fèi)用,訓(xùn)練出了一個(gè)名為 s1 的 AI 推理模型。據(jù)稱,這個(gè)模型在數(shù)學(xué)和編碼能力測(cè)試中,表現(xiàn)與 OpenAI 的o1 和 DeepSeek 的 R1等頂尖推理模型不相上下。

消息一出,瞬間引發(fā)了廣泛討論:50 美元就能復(fù)刻 DeepSeek R1?這到底是 AI 領(lǐng)域的重大突破,還是媒體過(guò)度炒作的噱頭?今天,我們就來(lái)深度解析一下這項(xiàng)研究,看看它到底意味著什么。

一、50 美元背后的真相:低成本訓(xùn)練的“秘密武器”

1. 低成本的核心:基座模型與蒸餾技術(shù)

首先,我們需要明確一點(diǎn):s1 模型并不是從零開始訓(xùn)練的。它的低成本訓(xùn)練建立在阿里云通義千問(wèn)(Qwen2.5-32B-Instruct)這一開源基座模型之上。

研究團(tuán)隊(duì)通過(guò)蒸餾技術(shù),從谷歌的 Gemini 2.0 Flash Thinking Experimental 模型中提煉知識(shí),并結(jié)合精心篩選的 1000 個(gè)高質(zhì)量推理問(wèn)題(s1K 數(shù)據(jù)集),對(duì) Qwen 模型進(jìn)行了監(jiān)督微調(diào)(SFT)。這種“小數(shù)據(jù)+強(qiáng)蒸餾”的策略,讓 s1 在極低的成本下實(shí)現(xiàn)了性能躍升。

2. 訓(xùn)練成本的計(jì)算

根據(jù)論文,s1 的訓(xùn)練僅使用了 16 塊 NVIDIA H100 GPU,耗時(shí) 26 分鐘。如果按云服務(wù)租賃價(jià)格計(jì)算,確實(shí)只需要幾十美元。

但需要注意的是,這里的成本僅包括 GPU 算力費(fèi)用,并不包括基座模型 Qwen 的訓(xùn)練成本(通常需要數(shù)百萬(wàn)美元),以及人力、數(shù)據(jù)篩選等其他隱性成本。因此,50 美元更多是一個(gè)“噱頭”,實(shí)際意義在于展示了如何通過(guò)優(yōu)化訓(xùn)練方法大幅降低成本。

但是相比于之前閉源大模型動(dòng)輒上千萬(wàn)美元的GPU算力費(fèi)用,S1的進(jìn)步是顯而易見的。

二、s1 模型的性能表現(xiàn):真的能媲美 DeepSeek R1 嗎?

1. 特定任務(wù)上的優(yōu)異表現(xiàn)

在競(jìng)賽數(shù)學(xué)問(wèn)題(如 AIME24 和 MATH500)上,s1-32B 的表現(xiàn)確實(shí)令人驚艷:它比 OpenAI 的o1-preview 高出 27%,接近 Gemini 2.0的水平。

這種優(yōu)異表現(xiàn)主要?dú)w功于兩個(gè)關(guān)鍵因素:

- s1K 數(shù)據(jù)集:1000 個(gè)高質(zhì)量問(wèn)題,涵蓋數(shù)學(xué)競(jìng)賽、博士級(jí)科學(xué)問(wèn)題等,經(jīng)過(guò)嚴(yán)格的難度、多樣性和質(zhì)量篩選。

- 預(yù)算強(qiáng)制法(Budget Forcing):通過(guò)控制模型在測(cè)試時(shí)的計(jì)算量(如插入“Wait” token 延長(zhǎng)思考時(shí)間),s1 在特定任務(wù)上表現(xiàn)出了更強(qiáng)的推理能力。

2. 與 DeepSeek R1 的差距

盡管 s1 在特定任務(wù)上表現(xiàn)優(yōu)異,但與 DeepSeek R1 相比,仍有明顯差距:

- 通用性不足:s1 的表現(xiàn)主要集中在數(shù)學(xué)推理任務(wù)上,而 DeepSeek R1 則覆蓋了更廣泛的場(chǎng)景,如金融建模、工程計(jì)算等。

- 依賴外部模型:s1 的推理能力依賴于 Qwen 和 Gemini 的知識(shí)遷移,而 DeepSeek R1 采用全自研技術(shù)鏈,具備獨(dú)立迭代能力。

因此,s1 并不能完全復(fù)刻 DeepSeek R1,更多是在特定任務(wù)上實(shí)現(xiàn)了低成本的高性能推理。

三、低成本訓(xùn)練的局限性:AI 普惠的曙光還是曇花一現(xiàn)?

1. 依賴強(qiáng)大基座模型

s1 的成功離不開 Qwen 這一強(qiáng)大的基座模型。如果沒有這樣的基座,僅靠 1000 個(gè)樣本數(shù)據(jù),很難訓(xùn)練出具備推理能力的模型。

這也引發(fā)了一個(gè)問(wèn)題:基座模型的開發(fā)者是否應(yīng)該獲得更多回報(bào)? 如果越來(lái)越多的研究依賴于開源基座模型,如何確保 AI 技術(shù)的公平使用和共享,將成為業(yè)界需要探討的重要議題。

2. 數(shù)據(jù)量的局限性

s1 的訓(xùn)練僅使用了 1000 個(gè)樣本數(shù)據(jù),這在大多數(shù)復(fù)雜任務(wù)場(chǎng)景中是不夠的。雖然研究團(tuán)隊(duì)通過(guò)精心篩選數(shù)據(jù)實(shí)現(xiàn)了高性能,但這種方法的可擴(kuò)展性仍有待驗(yàn)證。

3. 對(duì) AI 產(chǎn)業(yè)的影響

s1 的低成本訓(xùn)練模式,為中小團(tuán)隊(duì)參與 AI 研發(fā)提供了新的可能性。它打破了算力壁壘,讓更多開發(fā)者能夠參與到 AI 軍備競(jìng)賽中。

但同時(shí),這種模式也可能對(duì)大型 AI 公司的研發(fā)投入構(gòu)成挑戰(zhàn)。如果頂級(jí)模型可以輕易被復(fù)刻,那么這些公司的技術(shù)積累和商業(yè)價(jià)值將如何保障?

四、未來(lái)展望:低成本 AI 訓(xùn)練的新方向

1. 小數(shù)據(jù)+強(qiáng)蒸餾:AI 普惠的關(guān)鍵

s1 的研究展示了“小數(shù)據(jù)+強(qiáng)蒸餾”策略的潛力。未來(lái),隨著基座模型的不斷優(yōu)化和蒸餾技術(shù)的進(jìn)步,我們或許會(huì)看到更多低成本、高性能的 AI 模型問(wèn)世。

2. 測(cè)試時(shí)計(jì)算擴(kuò)展:提升模型性能的新范式

s1 采用的預(yù)算強(qiáng)制法,為測(cè)試時(shí)計(jì)算擴(kuò)展提供了新思路。通過(guò)控制模型的思考時(shí)間和計(jì)算量,可以在不增加訓(xùn)練成本的情況下,提升模型的推理能力。

3. 開源生態(tài)的繁榮

阿里云通義千問(wèn)等開源模型的成功,為 AI 普惠奠定了基礎(chǔ)。未來(lái),開源社區(qū)或?qū)⒂楷F(xiàn)更多低成本垂直模型,推動(dòng) AI 技術(shù)的普及和應(yīng)用。

五、總結(jié):50 美元的啟示

李飛飛團(tuán)隊(duì)的這項(xiàng)研究,雖然不能完全復(fù)刻 DeepSeek R1,但它為 AI 領(lǐng)域提供了新的思考方向:如何在保證性能的前提下,大幅降低訓(xùn)練成本。

對(duì)于開發(fā)者而言,這是一次技術(shù)普惠的嘗試;對(duì)于行業(yè)而言,這是一場(chǎng)關(guān)于 AI 研發(fā)模式的深刻變革。未來(lái),隨著技術(shù)的進(jìn)步,我們或許真的能夠看到更多“低成本、高性能”的 AI 模型,飛入尋常百姓家。

你怎么看待這項(xiàng)研究?歡迎在評(píng)論區(qū)分享你的觀點(diǎn)!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鈞正平發(fā)文:中國(guó)人民永遠(yuǎn)都要保持居安思危的清醒

鈞正平發(fā)文:中國(guó)人民永遠(yuǎn)都要保持居安思危的清醒

閃電新聞
2026-03-02 12:29:06
伊朗最高國(guó)家安全委員會(huì)秘書:已為長(zhǎng)期戰(zhàn)爭(zhēng)做好準(zhǔn)備

伊朗最高國(guó)家安全委員會(huì)秘書:已為長(zhǎng)期戰(zhàn)爭(zhēng)做好準(zhǔn)備

財(cái)聯(lián)社
2026-03-02 20:44:25
“大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

“大力神”軍機(jī)墜毀 已致15人死亡 天空下鈔票雨 民眾瘋搶!

每日經(jīng)濟(jì)新聞
2026-02-28 14:37:58
中方的資本,已經(jīng)開始不受管控了,政府必須要提高警惕!

中方的資本,已經(jīng)開始不受管控了,政府必須要提高警惕!

大靜吖
2026-02-07 23:30:36
巴拿馬運(yùn)河兩端港口運(yùn)營(yíng)恢復(fù),MSC完成首船裝卸

巴拿馬運(yùn)河兩端港口運(yùn)營(yíng)恢復(fù),MSC完成首船裝卸

海事服務(wù)網(wǎng)CNSS
2026-03-02 19:58:04
伊朗稱霍爾木茲海峽已關(guān)閉 將打擊所有試圖通過(guò)的船只

伊朗稱霍爾木茲海峽已關(guān)閉 將打擊所有試圖通過(guò)的船只

財(cái)聯(lián)社
2026-03-03 04:20:36
36歲副鎮(zhèn)長(zhǎng)開會(huì)時(shí)腦出血暈倒,除夕當(dāng)天不幸離世:上任僅10余天,最后一條動(dòng)態(tài)為督促社火排練,留下3個(gè)孩子

36歲副鎮(zhèn)長(zhǎng)開會(huì)時(shí)腦出血暈倒,除夕當(dāng)天不幸離世:上任僅10余天,最后一條動(dòng)態(tài)為督促社火排練,留下3個(gè)孩子

極目新聞
2026-03-02 15:45:15
560名美軍死傷,彈藥庫(kù)劇烈大爆炸,伊朗導(dǎo)彈雨把以色列炸成火海

560名美軍死傷,彈藥庫(kù)劇烈大爆炸,伊朗導(dǎo)彈雨把以色列炸成火海

策略述
2026-03-02 14:41:25
海瀾之家被“全軍拉黑”!中標(biāo)后拒簽合同,200億撐不起一單軍需

海瀾之家被“全軍拉黑”!中標(biāo)后拒簽合同,200億撐不起一單軍需

新浪財(cái)經(jīng)
2026-03-02 16:03:13
上海著名主持人淚目!中東戰(zhàn)火下,有人平安返航、有人新婚分離、有人只想回家

上海著名主持人淚目!中東戰(zhàn)火下,有人平安返航、有人新婚分離、有人只想回家

上觀新聞
2026-03-02 15:27:27
伊朗反擊太快,只給以2小時(shí),導(dǎo)彈從天而降,以色列民眾抱頭鼠竄

伊朗反擊太快,只給以2小時(shí),導(dǎo)彈從天而降,以色列民眾抱頭鼠竄

書紀(jì)文譚
2026-03-02 17:24:46
王毅外長(zhǎng):今后世上再無(wú)“中國(guó)臺(tái)灣省”之外的任何模糊稱謂。

王毅外長(zhǎng):今后世上再無(wú)“中國(guó)臺(tái)灣省”之外的任何模糊稱謂。

南權(quán)先生
2026-02-02 15:59:44
《大西洋月刊》丨所有人的目光都投向了古巴

《大西洋月刊》丨所有人的目光都投向了古巴

邸報(bào)
2026-03-02 10:33:45
8小時(shí)撤離德黑蘭,沈陽(yáng)男子講述離開伊朗細(xì)節(jié):當(dāng)?shù)貙?duì)中國(guó)人友好,3次盤問(wèn)都順利放行

8小時(shí)撤離德黑蘭,沈陽(yáng)男子講述離開伊朗細(xì)節(jié):當(dāng)?shù)貙?duì)中國(guó)人友好,3次盤問(wèn)都順利放行

瀟湘晨報(bào)
2026-03-02 19:49:19
伊朗生死關(guān)頭,一個(gè)關(guān)鍵人物走向前臺(tái)……

伊朗生死關(guān)頭,一個(gè)關(guān)鍵人物走向前臺(tái)……

補(bǔ)壹刀
2026-03-02 16:08:19
78:72爆冷!世預(yù)賽B組大亂,中國(guó)男籃自挖苦坑,日本隊(duì)坐收漁利

78:72爆冷!世預(yù)賽B組大亂,中國(guó)男籃自挖苦坑,日本隊(duì)坐收漁利

行舟問(wèn)茶
2026-03-02 12:06:53
全國(guó)政協(xié)委員劉永好:建議全民發(fā)放500元通用消費(fèi)券 可拉動(dòng)消費(fèi)近2萬(wàn)億元

全國(guó)政協(xié)委員劉永好:建議全民發(fā)放500元通用消費(fèi)券 可拉動(dòng)消費(fèi)近2萬(wàn)億元

財(cái)聯(lián)社
2026-03-02 10:57:04
伊朗再對(duì)美以基地發(fā)動(dòng)大規(guī)模襲擊

伊朗再對(duì)美以基地發(fā)動(dòng)大規(guī)模襲擊

財(cái)聯(lián)社
2026-03-01 12:32:05
“天下第一村”崩了!從人人千萬(wàn)富翁,到人均欠債1300萬(wàn)?

“天下第一村”崩了!從人人千萬(wàn)富翁,到人均欠債1300萬(wàn)?

趣味萌寵的日常
2026-03-03 01:15:43
真想來(lái)了!婚禮當(dāng)天撕戶口本,新郎發(fā)聲報(bào)警,稱新娘才是受害者!

真想來(lái)了!婚禮當(dāng)天撕戶口本,新郎發(fā)聲報(bào)警,稱新娘才是受害者!

川渝視覺
2026-03-02 23:37:41
2026-03-03 05:55:00
萌壹菌 incentive-icons
萌壹菌
只輸出原創(chuàng)高質(zhì)量科技數(shù)碼內(nèi)容
443文章數(shù) 749關(guān)注度
往期回顧 全部

科技要聞

蘋果中國(guó)官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

媒體:拉里賈尼走向前臺(tái) 四大關(guān)鍵變量將決定伊朗命運(yùn)

頭條要聞

媒體:拉里賈尼走向前臺(tái) 四大關(guān)鍵變量將決定伊朗命運(yùn)

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

藝術(shù)
旅游
親子
數(shù)碼
游戲

藝術(shù)要聞

這四位老人的花鳥畫,竟讓人欲罷不能!

旅游要聞

不用遠(yuǎn)行!重慶家門口的花海,治愈所有疲憊

親子要聞

開學(xué)了!珠海香洲:筑牢安全防線,保障托育機(jī)構(gòu)順利開園復(fù)托

數(shù)碼要聞

蘋果新款iPad Air發(fā)布:4799元起 搭載M4芯片

外媒給《寶可夢(mèng)》新作60分:不夠有趣的縫合怪

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版