国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

陳天橋入局小模型,用 30B 跑贏萬億

0
分享至


2026 年小模型或成為關(guān)鍵。


作者|徐珊

編輯|鄭玄

如果說 2025 年 DeepSeek 的爆發(fā)讓全球意識到算力并非通往 AGI 的唯一方式,那么 2026 年開年,MiroThinker 1.5 的發(fā)布,讓人更關(guān)注小模型的潛力所在。

MiroThinker 1.5 是盛大集團(tuán)創(chuàng)始人陳天橋與 AI 科學(xué)家代季峰創(chuàng)辦的 MiroMind 所推出的新一代模型,MiroThinker 1.5 通過 其 30B 小模型規(guī)格,通過極小的算力調(diào)度,在復(fù)雜推理任務(wù)中取得了不輸大模型的表現(xiàn),同時響應(yīng)速度更快、成本更低、智能表現(xiàn)效果更好。目前,MiroThinker 1.5 正處于公開發(fā)布階段,人人皆可上手免費(fèi)使用。

除了 MiroThinker 1.5 性能表現(xiàn)優(yōu)越以外,MiroThinker 備受關(guān)注的另一大原因是,這是一個強(qiáng)強(qiáng)聯(lián)手打造出來的創(chuàng)業(yè)項目。

MiroMind 是陳天橋在 AI 領(lǐng)域,少有的,自己下場主導(dǎo)并參與的創(chuàng)業(yè)項目,他曾憑借《傳奇》締造網(wǎng)游神話、登頂中國首富。在淡出中心視野這些年里,他扎進(jìn)腦科學(xué)領(lǐng)域,砸下十億美金建立 TCCI,試圖挖掘人類大腦的秘密。

公司的另一個創(chuàng)始人則是代季峰,從微軟亞洲研究院到商湯科技,一直扎根在計算機(jī)視覺領(lǐng)域。他主導(dǎo)過 InternVL 等開源項目,是物體檢測與具身智能領(lǐng)域的風(fēng)云人物。兩者組合,讓 MiroThinker 1.5 哪怕只是剛上線不久,也得到業(yè)內(nèi)不少關(guān)注。


圖片來源: MiroMind 官網(wǎng)

不過,如果小模型的性能真的能夠與大模型相媲美,Agent 或許將會迎來一輪落地爆發(fā),隨著 Agent 真正完成端側(cè)落地,AI 硬件的能力與玩法,或許也會迎來新一輪的變革。

01

梁文鋒牽線搭橋,

MiroMind 想要成為下一個 DeepSeek


就在前不久,MiroMind 首席科學(xué)家代季峰在知乎上親自下場,還原了這段頗有江湖色彩的創(chuàng)業(yè)故事。

出人意料的是,為 MiroMind 兩位核心人物牽線搭橋的正是 DeepSeek 的掌門人梁文鋒。

2025 年初,當(dāng)陳天橋目睹了 DeepSeek 能力后,就意識到通往 AGI 的道路已開始明晰。當(dāng)發(fā)現(xiàn)自己完全有能力打造下一個 DeepSeek 時,他詢問梁文鋒,誰最適合帶隊沖刺 AGI?梁文鋒當(dāng)時就推薦了代季峰,陳天橋沒有任何遲疑,直接鎖定了他,兩人聯(lián)合創(chuàng)辦了 MiroMind。

據(jù)代季峰回憶道,在創(chuàng)業(yè)前最關(guān)鍵的那場談話中,沒有冗長的商務(wù)談判,只有相見恨晚的共鳴。

當(dāng)時,陳天橋問代季峰 DeepSeek 成功的核心原因是什么,代季峰提到因為梁文鋒一人集齊了「有錢、有理想、懂技術(shù)」三個要素,溝通與管理的成本降到極限。代老師隨后坦誠相待說:「我有理想和技術(shù),但唯獨(dú)少了點(diǎn)『資金』?!龟愄鞓?qū)Υ讼嘁曇恍μ岬?,「我有資本,有對 AGI 的執(zhí)著理想,但確實缺一位懂技術(shù)的領(lǐng)路人。」

這種各有所長的組合,補(bǔ)齊了他們通往 AGI 創(chuàng)業(yè)道路的最后一塊拼圖。代季峰在組建團(tuán)隊時,帶有一種近乎純粹的「少年感」,他提到自己不需要那種在大廠下午發(fā)消息、深夜十點(diǎn)才帶著滿身疲憊回家的員工,而是更希望團(tuán)隊伙伴們都能做到「眼里有光」的狀態(tài)。


圖片來源:清華大學(xué)官網(wǎng)

在選擇究竟以什么方向切入賽道時,代季峰很清醒地意識到,現(xiàn)在 LLM 預(yù)訓(xùn)練的曲線已經(jīng)走到了極其平緩的平臺期,作為一個后來者,選擇再去大模型賽道拼參數(shù)并沒有意義。

于是,MiroMind 毅然選擇殺入了剛興起的 Agent Modeling 賽道,他們想看看,如果不再推崇算力至上,而是追求最懂、最實用的模型,能不能在 Agent 時代跑出一條不一樣的生路。

02

模型參數(shù)量降至 1/30,

成本下降 1/20


過去七個月,MiroMind 一直在思考一個更為根本的問題:智能的「奇點(diǎn)」究竟在哪里?

最后他們給出的的答案并非是「用參數(shù)推出世界記憶模型」,而是追求「發(fā)現(xiàn)智能」。

他們在官網(wǎng)中寫道:真正的智能并非依賴于全知全能,而是依賴于研究、驗證和糾正的能力。因為真正的智能不是過目不忘的死記硬背,而是像科學(xué)家一樣,在不確定性中通過糾錯抵達(dá)真相。

MiroThinker 1.5 測試的最終的效果,也非常令人欣喜。面對萬億級參數(shù)的 Kimi-K2-Thinking,僅有 30B 參數(shù)規(guī)模的 MiroThinker-v1.5 表現(xiàn)出了相當(dāng)?shù)耐评硭?。而最直觀的表現(xiàn)是模型性能與模型成本成倒掛的態(tài)勢,在衡量搜索代理能力的基準(zhǔn)測試 BrowseComp-ZH 中,30B 版本的表現(xiàn)位列全球前列。


BrowseComp 基準(zhǔn)測試的性能比較 |圖片來源:MiroMind 官網(wǎng)

由于參數(shù)量縮減到對方的 1/30,MiroThinker 1.5 30B 調(diào)用成本大幅下降至每次 0.07 美元,僅為萬億模型成本的 1/20,且推理速度更快。


智能搜索基準(zhǔn)測試的性能比較|圖片來源:MiroMind 官網(wǎng)

MiroMind 在官網(wǎng)解釋了自己的設(shè)計思路與原理。他們認(rèn)為傳統(tǒng)的 Scaling Law 路徑傾向于將盡可能多的人類知識記憶在模型參數(shù)中。這種做法的弊端在于,當(dāng)模型面對未知領(lǐng)域或?qū)崟r變動的信息時,往往會基于統(tǒng)計概率「捏造」答案,從而產(chǎn)生幻覺。而 MiroMind 團(tuán)隊則將技術(shù)重點(diǎn)放在了交互式縮放(Interactive Scaling)上。

具體而言,在技術(shù)實現(xiàn)上,MiroThinker 1.5 引入了幾個核心的新機(jī)制:

  • 交互式推理閉環(huán):模型不再進(jìn)行簡單的線性思維鏈(CoT)外推。它構(gòu)建了一個「提出假設(shè)—查詢外部數(shù)據(jù)—發(fā)現(xiàn)沖突—修正假設(shè)」的研究循環(huán)。在得出結(jié)論前,模型會主動發(fā)起多輪外部檢索,利用確定性的外部證據(jù)流來抵御不確定的內(nèi)部推理偏差。

  • 證據(jù)驅(qū)動的訓(xùn)練機(jī)制:在訓(xùn)練階段,團(tuán)隊改變了獎勵函數(shù)。系統(tǒng)不再單純獎勵答案的正確性,而是強(qiáng)化模型搜尋證據(jù)的行為。缺乏來源支持的高置信度輸出會被懲罰,這迫使模型形成一種「先驗證、后判斷」的本能。

  • 時間敏感型訓(xùn)練沙箱:為了解決 AI 的「后見之明」問題,標(biāo)準(zhǔn)訓(xùn)練中,模型通常能看到數(shù)據(jù)的最終結(jié)果,這使其在預(yù)測未來時傾向于先「回憶過去」。簡單來說,MiroMind 構(gòu)建了一個沙箱,嚴(yán)格限制模型只能訪問特定時間戳之前的信息,迫使它在信息不完整、存在延遲的真實環(huán)境下學(xué)習(xí)推理和糾錯。

如此一來,MiroThinker 1.5 不再是一個試圖記住所有百科知識的容器,而是一個擅長使用工具的專業(yè)研究員。在處理金融分析、時效性預(yù)測等任務(wù)時,它能夠展示完整的邏輯驗證鏈條。


演示提問:下周有哪些重大事件可能會影響美國納斯達(dá)克指數(shù)?|圖片來源:MiroMind 官網(wǎng)

03

通往 AGI 的另一種道路

MiroThinker 1.5 的出現(xiàn),在行業(yè)內(nèi)引發(fā)了一定反響。不少業(yè)內(nèi)人士認(rèn)為,AI 競爭即將從拼參數(shù)拼規(guī)模的時代,轉(zhuǎn)向「拼智力」的時代。

隨著模型參數(shù)規(guī)模的持續(xù)下降和推理成本的邊際遞減,2026 年小模型或成為關(guān)鍵。當(dāng) AI 模型的參數(shù)規(guī)模最夠小、價格最夠低,且表現(xiàn)性能足夠好時,能夠更高效地集成進(jìn)各類移動終端和邊緣設(shè)備中,那么 AI 落地硬件的算力門檻問題將會迎刃而解。那些已經(jīng)在大廠實驗室、初創(chuàng)公司里打磨了一兩年的 AI 硬件,才算真正具備了底層技術(shù)支撐,迎來了真正的「開智」時刻,且能夠進(jìn)一步迎接更豐富的功能,更有趣的交互設(shè)計。

就如同電力時代剛開啟時,人類必須依賴龐大的變壓器和錯綜復(fù)雜的電網(wǎng)供電,那時的電力是昂貴且固定的。但當(dāng)電池技術(shù)成熟、電力變得可隨身攜帶后,電器才真正爆發(fā)并改變了每一個人的生活。如今的大模型就像初期的電網(wǎng)中心,而 MiroThinker 1.5 這樣的小模型,則更像隨處可見的「電池」。

可以預(yù)見的是,2026 年,AI 變革將不再僅僅局限于行業(yè)內(nèi)部的技術(shù)狂歡,而是會通過手機(jī)、眼鏡、穿戴設(shè)備等每一個真實的硬件入口,觸達(dá)每一個普通人。當(dāng) AI 能夠以極低的成本在端側(cè)實時運(yùn)行、自主研究并解決問題時,所有人都會比以往任何時候,都更直觀地感受到 AI 時代對生活的影響。

*頭圖來源:MiroMind

本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO

極客一問

你看好 MiroThinker 1.5 嗎?

未來 AI 在微觀型操作上,占比將被大大壓縮,轉(zhuǎn)而提升構(gòu)建角色交流感。

點(diǎn)贊關(guān)注極客公園視頻號,

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中方:沉痛哀悼丹羽宇一郎

中方:沉痛哀悼丹羽宇一郎

新京報政事兒
2026-01-09 15:31:25
樸槿惠出獄生活:住別墅,與小10歲律師為伴,如今生活安逸

樸槿惠出獄生活:住別墅,與小10歲律師為伴,如今生活安逸

策略述
2026-01-09 13:02:41
稀土不走中國口岸,哈薩克斯坦把里海通道第一次寫進(jìn)合同

稀土不走中國口岸,哈薩克斯坦把里海通道第一次寫進(jìn)合同

扶蘇聊歷史
2026-01-08 16:42:43
52票贊成,47票反對,美參議院推進(jìn)決議限制特朗普對委動武,多名共和黨議員“反水”!特朗普怒斥:削弱總統(tǒng)權(quán)力!委內(nèi)瑞拉:不屈服

52票贊成,47票反對,美參議院推進(jìn)決議限制特朗普對委動武,多名共和黨議員“反水”!特朗普怒斥:削弱總統(tǒng)權(quán)力!委內(nèi)瑞拉:不屈服

每日經(jīng)濟(jì)新聞
2026-01-09 13:25:05
1萬分里程碑創(chuàng)六紀(jì)錄!華子賽后致敬科比 近9戰(zhàn)場均31分升西部第4

1萬分里程碑創(chuàng)六紀(jì)錄!華子賽后致敬科比 近9戰(zhàn)場均31分升西部第4

顏小白的籃球夢
2026-01-09 15:16:34
白宮“購島”方案流出:向格陵蘭人一次性付款,以說服他們脫離丹麥并可能加入美國,每人或得1萬-10萬美元

白宮“購島”方案流出:向格陵蘭人一次性付款,以說服他們脫離丹麥并可能加入美國,每人或得1萬-10萬美元

都市快報橙柿互動
2026-01-09 08:14:32
官方通報深夜播發(fā)5分鐘廣播節(jié)目:對3名相關(guān)責(zé)任人停職檢查

官方通報深夜播發(fā)5分鐘廣播節(jié)目:對3名相關(guān)責(zé)任人停職檢查

界面新聞
2026-01-09 15:39:39
終結(jié)隊史最長13連??!卡萊爾1000勝步行者險勝黃蜂 三球33+8

終結(jié)隊史最長13連??!卡萊爾1000勝步行者險勝黃蜂 三球33+8

醉臥浮生
2026-01-09 10:35:57
蘋果正式官宣:1月9日,全面官降!

蘋果正式官宣:1月9日,全面官降!

科技堡壘
2026-01-09 11:45:41
中國猛捶日本,第一波反制剛到,第二波進(jìn)入倒計時:191國靠邊站

中國猛捶日本,第一波反制剛到,第二波進(jìn)入倒計時:191國靠邊站

近史博覽
2026-01-09 14:53:29
太行山采藥人發(fā)現(xiàn)1943年跳崖八路軍遺骸,腰帶里縫著黨員證

太行山采藥人發(fā)現(xiàn)1943年跳崖八路軍遺骸,腰帶里縫著黨員證

鶴羽說個事
2026-01-08 11:02:25
86歲李雙江近況傳出!真的不敢相信,他如今活成了這樣!

86歲李雙江近況傳出!真的不敢相信,他如今活成了這樣!

誰將笑到最后
2026-01-08 09:29:51
37分鐘創(chuàng)新高!林葳10分第二次上雙 5助攻全場最多+三分10中1

37分鐘創(chuàng)新高!林葳10分第二次上雙 5助攻全場最多+三分10中1

醉臥浮生
2026-01-09 13:44:41
購洗碗機(jī)遭丈夫砸家后續(xù):女子回應(yīng)披露更多細(xì)節(jié),家當(dāng)下仍有外債

購洗碗機(jī)遭丈夫砸家后續(xù):女子回應(yīng)披露更多細(xì)節(jié),家當(dāng)下仍有外債

天天熱點(diǎn)見聞
2026-01-09 08:34:00
大潰??!中國網(wǎng)貸公司,在印度全軍覆沒

大潰??!中國網(wǎng)貸公司,在印度全軍覆沒

首席品牌評論
2026-01-07 18:20:00
天安門原升旗手張自軒結(jié)婚,岳父豪送奧迪A6,新娘身份不一般

天安門原升旗手張自軒結(jié)婚,岳父豪送奧迪A6,新娘身份不一般

八斗小先生
2026-01-08 18:19:01
江西景德鎮(zhèn)一家三口被撞身亡案宣判,法院答疑

江西景德鎮(zhèn)一家三口被撞身亡案宣判,法院答疑

界面新聞
2026-01-09 09:20:58
回顧許家印被抓捕現(xiàn)場,奮力反抗,怒吼不已,被抓捕人員抬出去

回顧許家印被抓捕現(xiàn)場,奮力反抗,怒吼不已,被抓捕人員抬出去

干史人
2026-01-08 22:47:00
看到委內(nèi)瑞拉的情況,李顯龍在怕什么?

看到委內(nèi)瑞拉的情況,李顯龍在怕什么?

新民周刊
2026-01-09 09:09:48
Costco落戶廣州,對決山姆!

Costco落戶廣州,對決山姆!

中國零售信息
2026-01-08 23:27:03
2026-01-09 16:19:00
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
11711文章數(shù) 78747關(guān)注度
往期回顧 全部

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

"老板"拉群開口就要150萬 女財務(wù)付100萬后感覺天塌了

頭條要聞

"老板"拉群開口就要150萬 女財務(wù)付100萬后感覺天塌了

體育要聞

金元時代最后的外援,來中國8年了

娛樂要聞

檀健次戀愛風(fēng)波越演越烈 上學(xué)經(jīng)歷被扒

財經(jīng)要聞

郁亮的萬科35年:從"寶萬之爭"到"活下去"

汽車要聞

英偉達(dá)的野心:做一套自動駕駛的“安卓系統(tǒng)”

態(tài)度原創(chuàng)

本地
房產(chǎn)
數(shù)碼
藝術(shù)
公開課

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

房產(chǎn)要聞

豪宅搶瘋、剛需撿漏……2025年,一張房票改寫了廣州市場格局

數(shù)碼要聞

避免老設(shè)備“變磚”,Bose開源SoundTouch智能音箱API

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版