国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

7800美元!微博Vibethinker-1.5B數(shù)學(xué)能力超越R1-671B

0
分享至


始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū)。正在,歡迎加入共同成長。wisemodel推出邀請注冊獎勵活動,最高可得算力券+token包380元獎勵,歡迎參與和支持!

當(dāng)整個AI行業(yè)陷入“參數(shù)競賽”的狂熱時,微博AI交出了一份出乎意料的答卷,為沸騰的大模型戰(zhàn)場開辟了一條充滿想象力的新路徑。

近日,微博正式發(fā)布首個自研開源大模型VibeThinker,這個僅擁有15億參數(shù)的“輕量級選手”,在國際頂級數(shù)學(xué)競賽基準(zhǔn)測試上擊敗了參數(shù)量是其數(shù)百倍的、高達(dá)6710億的DeepSeek R1模型。

更令人矚目的是,其單次“后訓(xùn)練”的成本僅7800美元,對比DeepSeek-R1和MiniMax-M1等成本直接降低了幾十倍。

這一突破不僅重新定義了大模型的技術(shù)評價標(biāo)準(zhǔn),更有望推動AI產(chǎn)業(yè)從“規(guī)模競賽”轉(zhuǎn)向“效率革命”。VibeThinker-1.5B已上線始智AI-wisemodel開源社區(qū),歡迎大家前去體驗(yàn)。

此模型是一個實(shí)驗(yàn)性版本,旨在探索小型模型的推理能力,主要解決競賽風(fēng)格的數(shù)學(xué)和算法編碼問題,用英語提問效果更好,不建議將其用于其他任務(wù)。


模型地址

https://wisemodel.cn/models/WeiboAI/VibeThinker-1.5B

01.

小模型打破參數(shù)崇拜

在AI發(fā)展史上,參數(shù)量曾被視為衡量模型能力的核心指標(biāo)。

行業(yè)普遍認(rèn)為,復(fù)雜推理能力需要1000億以上參數(shù)才能涌現(xiàn),而小模型則因無法處理高難度問題被視為“天生不足”。

但如果從小模型入手,通過巧妙的訓(xùn)練策略,能否挖掘出隱藏的推理能力?

微博自研開源大模型VibeThinker,給出了行業(yè)一個肯定的答案。

當(dāng)大多數(shù)AI廠商仍遵循著“規(guī)模擴(kuò)大即智能提升”的Scaling Law法則時,微博AI研發(fā)人員轉(zhuǎn)而優(yōu)化模型結(jié)構(gòu)和訓(xùn)練范式,并創(chuàng)新提出了“頻譜到信號原理”(SSP)方法訓(xùn)練,創(chuàng)造出了一個僅擁有15億參數(shù)的“輕量級選手”,但在AI競技場上戰(zhàn)勝了超越其數(shù)百倍體量的“巨人”。

VibeThinker一經(jīng)發(fā)布,立即引起了全球AI研究界的廣泛關(guān)注,因其在一系列涵蓋數(shù)學(xué)、編碼的權(quán)威基準(zhǔn)測試中,交出了一份出乎意料的答卷:


HuggingFace官方主動下場發(fā)文宣傳VibeThinker論文

在AIME24、AIME25以及HMMT25三個高難度數(shù)學(xué)測試集上的表現(xiàn),VibeThinker超越了參數(shù)量超其400倍的模型DeepSeek-R1-0120版本(模型大小671B),與規(guī)模為456B的MiniMax-M1效果接近或相當(dāng),甚至媲美Gemini 2.5 flash和Claude Opus 4。

此外,在LiveCodeBench v6(編程算法題測試集)中的成績,VibeThinker成功追平參數(shù)量數(shù)超其數(shù)十倍的模型,比如歐洲領(lǐng)先AI企業(yè)Minstral.AI的深度思考模型Magistral-Medium-2506版本。

VibeThinker雄辯地證明,通過精巧的算法設(shè)計(jì)和訓(xùn)練策略,一個小規(guī)模模型完全有潛力在復(fù)雜的邏輯推理任務(wù)上,達(dá)到甚至超越那些體量龐大數(shù)百倍的巨型模型,更為AI產(chǎn)業(yè)的成本結(jié)構(gòu)、技術(shù)路線和資本布局帶來了全新的思考路徑。

需要說明的是,VibeThinker目前發(fā)布的版本尚處于實(shí)驗(yàn)性版本,其研發(fā)重點(diǎn)主要集中于極大強(qiáng)化小模型復(fù)雜數(shù)學(xué)與競賽編程等方面的能力,其在日常聊天等能力還沒有做過針對性訓(xùn)練優(yōu)化,所以暫不適合作為日常聊天工具進(jìn)行互動,更適用于數(shù)學(xué)和代碼等高智能應(yīng)用場景。

02.

7800美元門檻重塑產(chǎn)業(yè)生態(tài)

訓(xùn)練成本一直是制約AI技術(shù)普及的關(guān)鍵瓶頸,VibeThinker的成就不僅在于驚艷的性能,更在于其極致的成本效益。

根據(jù)公開數(shù)據(jù),2025年主流大模型單次后訓(xùn)練(Post-Training)成本普遍在數(shù)十萬美元級別。

上海AI企業(yè)MiniMax于今年6月發(fā)布的M1模型,使用512塊H800 GPU訓(xùn)練三周,租賃成本約53.5萬美元,創(chuàng)始人發(fā)文表示:“第一次感覺到大山不是不能翻越?!?/p>

今年9月,AI初創(chuàng)公司DeepSeek(深度求索)的論文登上《自然》雜志。論文首次揭示了訓(xùn)練R1的成本:僅為29.4萬美元。這不包括DeepSeek公司在開發(fā)R1所基于的基礎(chǔ)LLM(即DeepSeek-V3)上花費(fèi)的約600萬美元,但總成本仍然遠(yuǎn)低于競爭對手模型被認(rèn)為花費(fèi)的數(shù)千萬美元。

在這樣的行業(yè)背景下,VibeThinker整個后訓(xùn)練過程(包括SFT和RL階段)總共只花費(fèi)了約3900個GPU小時。按照當(dāng)時的市場租賃價格,總計(jì)算成本僅7800美元。


這也意味著,其用不到8000美元的成本,達(dá)到了需要花費(fèi)30萬、甚至50萬美元才能企及的性能水平,成本效益比達(dá)到了驚人的30到60倍。

這種成本上的顯著優(yōu)勢,也意味著強(qiáng)大的AI推理能力不再是少數(shù)科技巨頭的專利,原本被巨頭壟斷的技術(shù)資源得以普惠,更多中小型公司、研究機(jī)構(gòu)和大學(xué),都有機(jī)會參與到前沿AI創(chuàng)新開發(fā)中來,極大地促進(jìn)了AI研究的普惠化,推動整個行業(yè)朝著更開放、更多元、更具活力的方向發(fā)展。

03.

微博AI生態(tài)多點(diǎn)開花

技術(shù)突破的最終價值在于應(yīng)用落地

微博積極擁抱人工智能發(fā)展趨勢,全面促進(jìn)AI技術(shù)在多項(xiàng)業(yè)務(wù)場景的落地。

2024年,微博自主研發(fā)“知微”大語言模型,并成功通過備案,更陸續(xù)推出微博智搜、內(nèi)容總結(jié)、AI互動號等前沿功能,優(yōu)化用戶體驗(yàn),提升內(nèi)容生產(chǎn)和互動效率。

基于自研的“知微”大模型,微博構(gòu)建了適配微博場景的AI應(yīng)用生態(tài),并創(chuàng)造了兩大頂流AI產(chǎn)品:

  • 一是微博智搜,它通過深度分析平臺內(nèi)海量優(yōu)質(zhì)內(nèi)容,構(gòu)建可信知識圖譜,實(shí)現(xiàn)“精準(zhǔn)捕捉用戶需求、理解情感與場景”的突破性體驗(yàn),6月智搜月活躍用戶突破5000萬;

  • 二是評論羅伯特,作為AI互動賬號,它從毒舌風(fēng)格起步,逐漸進(jìn)化出溫情與聰明版本,成為廣大用戶“又愛又恨”的交流對象,全網(wǎng)粉絲近200萬,展現(xiàn)了AI評論助手的另一種可能性。

隨著自研大模型VibeThinker取得突破,更標(biāo)志著微博AI戰(zhàn)略邁入新階段。

立足于自研大模型VibeThinker,微博的未來規(guī)劃凸顯了鮮明的“數(shù)據(jù)賦能”路徑。公司計(jì)劃深度融合其在心理等垂直領(lǐng)域積累的獨(dú)特?cái)?shù)據(jù)資產(chǎn),目標(biāo)是打造一個更洞悉公眾情緒、更能服務(wù)社會化需求的專屬模型。

微博不僅是在優(yōu)化一個大模型,更是在解鎖其數(shù)據(jù)生態(tài)的深層價值,以提供更精準(zhǔn)、更懂用戶心理狀態(tài)的下一代社交服務(wù)。

VibeThinker的強(qiáng)大技術(shù)能力,或?qū)⒊蔀轵?qū)動微博AI應(yīng)用“多點(diǎn)開花”的核心引擎,深度融入平臺全業(yè)務(wù)生態(tài)。

未來,VibeThinker有望在微博智搜等核心AI產(chǎn)品中落地,不僅能持續(xù)提升用戶使用體驗(yàn),更有望打破場景邊界,裂變出兼具社交屬性與智能服務(wù)的下一個“社交超級生態(tài)”。

此外,VibeThinker的技術(shù)突破有望大幅降低微博AI應(yīng)用成本。

無論是智能搜索的算力損耗,還是實(shí)時互動場景的AI響應(yīng)成本,都將得到高效優(yōu)化,讓平臺在規(guī)?;度階I能力時無需承擔(dān)過高的資源壓力,進(jìn)一步釋放微博的生態(tài)創(chuàng)新能力,為用戶帶來更豐富、更便捷的智能體驗(yàn)。

04.

在線體驗(yàn)/API

wisemodel社區(qū)-鏡像上線了“微博AI/VibeThinker-1.5B”的鏡像,支持一鍵創(chuàng)建在線體驗(yàn)或者API服務(wù),選中該鏡像,點(diǎn)擊部署在線體驗(yàn)或者部署API服務(wù)。


進(jìn)入后,根據(jù)需要填寫相應(yīng)的信息,點(diǎn)擊“提交訂單”按鈕,體驗(yàn)進(jìn)入后臺的啟動階段。大概等待1分鐘左右,體驗(yàn)進(jìn)入運(yùn)行中的狀態(tài)。


公開狀態(tài)的在線體驗(yàn)可以在wisemodel社區(qū)-體驗(yàn)與API”的頁面上點(diǎn)擊相應(yīng)的體驗(yàn),進(jìn)入體驗(yàn)的頁面;私有狀態(tài)的在線體驗(yàn)需要前往“用戶中心-我的資源-體驗(yàn)”進(jìn)入體驗(yàn)的頁面。



----- END -----


wisemodel相關(guān):

系列模型:

關(guān)于wisemodel更多

1

歡迎持續(xù)關(guān)注和支持

開源社區(qū)建設(shè)需要長期堅(jiān)持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計(jì)劃和開源共創(chuàng)計(jì)劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動態(tài)。

2

歡迎加盟wisemodel開源社區(qū)

始智AI wisemodel社區(qū)自2023年9月上線以來,逐漸成為影響力日益擴(kuò)大的中立開放的AI開源社區(qū),為了加快公司發(fā)展,我們長期需要技術(shù)、運(yùn)營等人才加盟,技術(shù)側(cè)重在AI infra、后端開發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開發(fā)者生態(tài)運(yùn)營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優(yōu)質(zhì)內(nèi)容

歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵高校實(shí)驗(yàn)室、大企業(yè)研究團(tuán)隊(duì)、個人等,在wisemodel平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實(shí)踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關(guān)于wisemodel開源社區(qū)

始智AI wisemodel.cn開源社區(qū)由清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高??蒲性核⒋笮突ヂ?lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個人開發(fā)者,以及政府部門、學(xué)會協(xié)會、聯(lián)盟、基金會等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。

向上滑動查看

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
殲-10首飛28周年,該型戰(zhàn)機(jī)從獨(dú)立作戰(zhàn)平臺轉(zhuǎn)型為網(wǎng)絡(luò)化作戰(zhàn)節(jié)點(diǎn)

殲-10首飛28周年,該型戰(zhàn)機(jī)從獨(dú)立作戰(zhàn)平臺轉(zhuǎn)型為網(wǎng)絡(luò)化作戰(zhàn)節(jié)點(diǎn)

止戈軍是我
2026-03-26 22:45:27
正式確定!CBA名將加盟浙江廣廈,重返老東家,全力衛(wèi)冕總冠軍

正式確定!CBA名將加盟浙江廣廈,重返老東家,全力衛(wèi)冕總冠軍

體壇瞎白話
2026-03-25 16:52:09
黃天鵝曬出的檢測報(bào)告上顯示檢測開始日期是2027年

黃天鵝曬出的檢測報(bào)告上顯示檢測開始日期是2027年

映射生活的身影
2026-03-26 18:40:07
全國最大比亞迪中心落地常州,預(yù)計(jì)今年5月中旬正式運(yùn)營

全國最大比亞迪中心落地常州,預(yù)計(jì)今年5月中旬正式運(yùn)營

財(cái)聞
2026-03-26 12:53:13
上海交大解剖405名心梗死者,驚訝發(fā)現(xiàn)患心梗的人,有3個共性

上海交大解剖405名心梗死者,驚訝發(fā)現(xiàn)患心梗的人,有3個共性

健康之光
2026-03-26 13:55:06
蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

蔣介石孫子召開發(fā)布會,提出“兩蔣”移靈大陸,2句話讓世人唏噓

老謝談史
2026-03-18 18:33:35
伊朗被美以單方面轟炸23天,為何革命衛(wèi)隊(duì)依舊不認(rèn)輸?

伊朗被美以單方面轟炸23天,為何革命衛(wèi)隊(duì)依舊不認(rèn)輸?

高博新視野
2026-03-24 08:00:16
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
特朗普再次就停戰(zhàn)談判威脅伊朗

特朗普再次就停戰(zhàn)談判威脅伊朗

澎湃新聞
2026-03-26 20:24:03
臨時閉園!常州一景區(qū)重要通知

臨時閉園!常州一景區(qū)重要通知

常州大喇叭
2026-03-26 15:26:59
ESPN:薩拉赫是英超歷史最佳,甚至可以沒有之一

ESPN:薩拉赫是英超歷史最佳,甚至可以沒有之一

懂球帝
2026-03-25 23:20:06
伊朗拒絕美國停戰(zhàn)方案并提出伊方5項(xiàng)條件

伊朗拒絕美國停戰(zhàn)方案并提出伊方5項(xiàng)條件

新京報(bào)
2026-03-25 23:58:14
燒了18.6萬美元讓AI連軸肝了17天,它產(chǎn)出了166篇論文

燒了18.6萬美元讓AI連軸肝了17天,它產(chǎn)出了166篇論文

酷玩實(shí)驗(yàn)室
2026-03-25 18:25:49
800億!泉州首富家族,太可怕了

800億!泉州首富家族,太可怕了

深藍(lán)財(cái)經(jīng)
2026-03-26 18:58:45
國防部:菲方侵權(quán)挑釁只會遭到更加堅(jiān)決應(yīng)對

國防部:菲方侵權(quán)挑釁只會遭到更加堅(jiān)決應(yīng)對

界面新聞
2026-03-26 16:00:27
朝鮮戰(zhàn)場繳獲美軍火箭筒,拆解驚覺技術(shù)差距改寫陸軍征程

朝鮮戰(zhàn)場繳獲美軍火箭筒,拆解驚覺技術(shù)差距改寫陸軍征程

嘮叨說歷史
2026-03-18 13:40:57
315曝光10個最毒食黑名單!第8個你幾乎天天在吃,看完脊背發(fā)涼

315曝光10個最毒食黑名單!第8個你幾乎天天在吃,看完脊背發(fā)涼

現(xiàn)代小青青慕慕
2026-03-24 08:13:54
詹姆斯:布朗尼絕對配得上立足NBA 我們家的人做事從來不敷衍

詹姆斯:布朗尼絕對配得上立足NBA 我們家的人做事從來不敷衍

羅說NBA
2026-03-26 22:15:56
英國以國家安全為由否決了中企在蘇格蘭建廠計(jì)劃,外交部:中英經(jīng)貿(mào)綠色合作的本質(zhì)是互利共贏,不應(yīng)受到泛政治化、泛安全化的沖擊

英國以國家安全為由否決了中企在蘇格蘭建廠計(jì)劃,外交部:中英經(jīng)貿(mào)綠色合作的本質(zhì)是互利共贏,不應(yīng)受到泛政治化、泛安全化的沖擊

瀟湘晨報(bào)
2026-03-26 16:25:20
1986年韓先楚拒絕葬在八寶山,他對陳云說:那里有我不愿見到的人

1986年韓先楚拒絕葬在八寶山,他對陳云說:那里有我不愿見到的人

百年歷史老號
2026-03-25 18:27:41
2026-03-26 23:19:00
wisemodel開源社區(qū) incentive-icons
wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū),打造中國版“huggingface”
466文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

美團(tuán)發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

頭條要聞

張雪峰留巨額遺產(chǎn):二婚妻子或拿50% 剩下的女兒占1/3

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財(cái)經(jīng)要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

時尚
教育
健康
游戲
軍事航空

這些才是適合春季的穿搭!不沉悶、不單調(diào),大方靚麗又減齡

教育要聞

罵人沒有殺傷力?那不是白忙活嗎?

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

50萬銷量達(dá)成!這款I(lǐng)GN 9分獨(dú)游走紅 官方發(fā)推慶賀

軍事要聞

擔(dān)心特朗普突然停戰(zhàn) 以總理下令48小時盡力摧毀伊設(shè)施

無障礙瀏覽 進(jìn)入關(guān)懷版