国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

陳天橋攜MiroThinker 1.5開年登場(chǎng):跑贏萬(wàn)億模型,實(shí)現(xiàn)小模型大智能

0
分享至


圖片由AI生成

憑借成功預(yù)測(cè)Polymarket篩選題目,連續(xù)登頂FutureX全球榜首的MiroMind團(tuán)隊(duì),正式發(fā)布了其自研旗艦搜索智能體模型MiroThinker 1.5。

MiroMind由全球知名創(chuàng)新企業(yè)家、慈善家陳天橋,與清華大學(xué)知名AI青年學(xué)者代季峰教授聯(lián)合發(fā)起。

去年,陳天橋提出,發(fā)現(xiàn)式智能才是真正意義上的通用人工智能這一重磅創(chuàng)新理念,引發(fā)全球業(yè)內(nèi)人士關(guān)注。他同時(shí)提出,建設(shè)發(fā)現(xiàn)式智能的5種關(guān)鍵能力,其中一項(xiàng)能力,是在未知條件下重建對(duì)世界的理解,這正是MiroMind的使命。

在過(guò)去7個(gè)月里,MiroMind在思考一個(gè)更本質(zhì)的問(wèn)題:智能的奇點(diǎn)究竟在哪里?

他們給出的答案不是把世界背進(jìn)參數(shù)里,而是押注“發(fā)現(xiàn)式智能”:真正的智能不靠全知,而靠會(huì)研究、會(huì)查證、會(huì)修正——像頂級(jí)情報(bào)官一樣對(duì)外極速取證、對(duì)內(nèi)嚴(yán)苛去偽存真;像嚴(yán)謹(jǐn)研究員一樣在不確定性里逼近真相,最終把預(yù)測(cè)未來(lái)從特權(quán)變成能力。

MiroThinker 1.5 :30B參數(shù),闖入全球搜索智能第一梯隊(duì)

MiroMind團(tuán)隊(duì)在AGI競(jìng)技場(chǎng)上,不信奉“大力出奇跡”,而是追求以高智效比為核心的巧勁。

MiroThinker-v1.5-30B僅用1/30的參數(shù)規(guī)模跑出了比肩眾多1T模型的性能表現(xiàn),其235B的版本在多個(gè)搜索智能體基準(zhǔn)測(cè)試中躋身全球第一梯隊(duì)。

BrowseComp性能對(duì)比

面對(duì)參數(shù)量高達(dá)30倍的萬(wàn)億參數(shù)巨獸Kimi-K2-Thinking,MiroThinker-v1.5-30B用極低的成本展示了旗鼓相當(dāng)?shù)谋憩F(xiàn):

  • 推理成本:MiroThinker-v1.5-30B單條調(diào)用成本低至$0.07,僅為Kimi-K2-Thinking的1/20,且推理更快。
  • 性能表現(xiàn):在關(guān)鍵評(píng)測(cè)集BrowseComp-ZH中實(shí)現(xiàn)性能超越,證明“大”不等于“強(qiáng)”。

MiroThinker團(tuán)隊(duì)指出,以擴(kuò)大模型內(nèi)部參數(shù)量(Internal Parameters)為核心的傳統(tǒng)Scaling Law已明顯觸及邊際瓶頸;要繼續(xù)提升模型性能,必須從內(nèi)部參數(shù)擴(kuò)張轉(zhuǎn)向以外部信息交互(External Interaction)為核心的Interactive Scaling,將智能的增長(zhǎng)空間從內(nèi)部參數(shù)擴(kuò)展到外部世界。

Agent搜索評(píng)測(cè)基準(zhǔn)性能對(duì)比

為什么該模型能在大幅降低成本的同時(shí),性能依然能打?

因?yàn)檫@不是大參數(shù)碾壓,而是一次“科學(xué)家模式”對(duì)“做題家模式”的勝利。以Scaling Law為代表的路線,更像“做題家”:試圖把全人類知識(shí)(也包括噪聲與錯(cuò)誤)盡可能背進(jìn)模型里;一旦遇到生物學(xué)等領(lǐng)域的未知問(wèn)題,就容易基于概率分布“編”出一個(gè)看似合理的答案——幻覺往往由此產(chǎn)生。

在MiroThinker v1.0中,團(tuán)隊(duì)首次系統(tǒng)性提出Interactive Scaling:隨著工具交互頻率與深度提升,研究式推理能力也穩(wěn)定增強(qiáng)——這構(gòu)成了與模型大小、上下文長(zhǎng)度并列的第三個(gè)可擴(kuò)展維度。

v1.5更進(jìn)一步,把這套機(jī)制內(nèi)化為貫穿訓(xùn)練與推理全流程的核心能力:將模型訓(xùn)練成“科學(xué)家”,核心不是死記硬背,而是勤查證。遇到難題時(shí),它不會(huì)給出概率最高的瞎猜,而是執(zhí)行慢思考的研究閉環(huán):提出假設(shè)→向外部世界查數(shù)據(jù)/取證→發(fā)現(xiàn)對(duì)不上→修正假設(shè)→再查證,直到證據(jù)收斂。

主流大模型往往追求萬(wàn)億參數(shù),試圖把整個(gè)互聯(lián)網(wǎng)“背”在腦子里。而MiroThinker系列選擇了一條反共識(shí)的路線:刻意將模型控制在30B–200B的輕量級(jí)規(guī)模。研發(fā)團(tuán)隊(duì)強(qiáng)調(diào),省下的不是算力,而是把算力花在了更刀刃的地方——對(duì)外的信息獲取與交互。

團(tuán)隊(duì)不追求讓模型擁有一顆“最重的腦子”,而是培養(yǎng)它擁有一雙“最勤的手”。當(dāng)模型同時(shí)具備研究式確認(rèn)機(jī)制與時(shí)序因果約束,這種圍繞外部信息獲取的交互過(guò)程才讓發(fā)現(xiàn)式智能真正落地——也正是對(duì)Interactive Scaling的深耕,使他們用小得多的模型,做到了大模型才能做到的事。

MiroThinker 1.5 核心技術(shù)揭秘

傳統(tǒng)的模型思維鏈本質(zhì)上是在模型內(nèi)部知識(shí)空間的線性外推,推理偏差會(huì)隨路徑增長(zhǎng)而不斷累積,最終導(dǎo)致邏輯坍塌。

MiroThinker 1.5的核心發(fā)力點(diǎn),在于通過(guò)Interactive Scaling打破孤立推理的僵局,將推理與外部環(huán)境深度耦合。通過(guò)構(gòu)建“推理-驗(yàn)證-修正”循環(huán),引入外部信息作為校驗(yàn)錨點(diǎn),用確定性的證據(jù)流來(lái)對(duì)沖不確定性的推演,解決邏輯坍塌問(wèn)題。

當(dāng)智能的Scaling范式,不再局限于模型內(nèi)部龐大的世界知識(shí)儲(chǔ)備與縝密的長(zhǎng)程邏輯推理,而是依托模型高頻與外部世界中探索與交互并獲得閉環(huán)反饋時(shí),小而高效的探索者模型能展現(xiàn)比肩于,甚至超出大而嚴(yán)謹(jǐn)?shù)乃伎颊吣P偷闹橇λ健?/p>

MiroThinker 1.5正是基于這一判斷,將Interactive Scaling從推理階段的外掛能力,前移并內(nèi)化為訓(xùn)練階段的核心機(jī)制。模型并非被要求盡量在腦中想清楚一切,而是被系統(tǒng)性地訓(xùn)練成一個(gè)善于向外求證、敢于否定自己、能夠快速修正路徑的Agent。

在訓(xùn)練過(guò)程中,研發(fā)團(tuán)隊(duì)刻意削弱對(duì)“單次完美推理”的獎(jiǎng)勵(lì),轉(zhuǎn)而強(qiáng)化以下行為模式:

  • Evidence-Seeking(主動(dòng)求證):模型被鼓勵(lì)將每一個(gè)關(guān)鍵判斷拆解為可驗(yàn)證的子假設(shè),并主動(dòng)發(fā)起對(duì)外查詢、檢索與比對(duì)。結(jié)論本身不再是訓(xùn)練目標(biāo),找到可靠證據(jù)的過(guò)程才是。缺乏信源支撐的高置信輸出,會(huì)在訓(xùn)練中被系統(tǒng)性地懲罰。
  • Iterative Verification(多輪校驗(yàn)與自我修正):推理不被視為一次性路徑,而是一個(gè)可反復(fù)回溯、修正的過(guò)程。模型在交互中被要求不斷對(duì)已有判斷進(jìn)行反證測(cè)試,一旦發(fā)現(xiàn)證據(jù)沖突,必須顯式調(diào)整假設(shè),而非“帶著錯(cuò)誤繼續(xù)推下去”。
  • Anti-Hallucination(對(duì)捷徑的系統(tǒng)性過(guò)濾):對(duì)那些看起來(lái)合理、但缺乏真實(shí)依據(jù)的推理捷徑保持零容忍。訓(xùn)練中不僅評(píng)估答案是否正確,更關(guān)注答案是如何得到的:任何依賴統(tǒng)計(jì)相關(guān)性、模式記憶或隱含先驗(yàn)而繞過(guò)證據(jù)驗(yàn)證的路徑,都會(huì)被標(biāo)記為低質(zhì)量推理。

通過(guò)這種訓(xùn)練方式,MiroThinker 1.5逐步形成了一種本能反應(yīng):在不確定性面前,先交互、再判斷;在高風(fēng)險(xiǎn)結(jié)論前,先查證、再收斂。這使得模型不再需要將龐大的世界知識(shí)全部?jī)?nèi)化為參數(shù),而是學(xué)會(huì)在需要時(shí),快速、精準(zhǔn)地向外部世界借力。

最終,團(tuán)隊(duì)用更小的參數(shù)規(guī)模,換來(lái)了更高的智能密度:不是讓模型記住更多,而是讓它學(xué)會(huì)如何找到、驗(yàn)證并使用信息。這正是MiroThinker 1.5能在顯著降低推理成本的同時(shí),依然保持一線性能的根本原因。

時(shí)序敏感訓(xùn)練沙盒,是破解因果律的鑰匙:普通大模型訓(xùn)練常處在上帝視角——它在數(shù)據(jù)里早已見過(guò)結(jié)果,學(xué)到的往往是復(fù)述與劇透,而不是預(yù)測(cè)。MiroThinker的訓(xùn)練則約束模型只能看過(guò)去,不能看未來(lái),在嚴(yán)格的時(shí)間可見性約束下做判斷,再用同樣受時(shí)序約束的證據(jù)去驗(yàn)證與更新。

  • 可控?cái)?shù)據(jù)合成引擎:構(gòu)建覆蓋多任務(wù)類型的、難度與時(shí)間戳可控的數(shù)據(jù)合成體系。每一道題目的“正確答案”并非靜態(tài)標(biāo)簽,而是隨時(shí)間戳動(dòng)態(tài)演化;模型必須在嚴(yán)格的信息可見性約束下,基于當(dāng)時(shí)可獲取的信息做出判斷,而校驗(yàn)過(guò)程同樣顯式引入時(shí)間戳約束,以確保推演與評(píng)分均符合真實(shí)世界的時(shí)序邏輯。
  • 時(shí)序敏感訓(xùn)練機(jī)制:采用嚴(yán)格的時(shí)間戳與信息可見性約束,徹底杜絕Future Leakage;模型在訓(xùn)練過(guò)程中的每一步只能與發(fā)表于當(dāng)前時(shí)間戳之前的信息進(jìn)行交互。

在這種訓(xùn)練范式下,模型被迫學(xué)會(huì)在信息不完備、噪聲存在、信號(hào)延遲的真實(shí)條件下進(jìn)行推演與修正,而不是依賴靜態(tài)數(shù)據(jù)集中的標(biāo)準(zhǔn)答案。時(shí)間由此從一個(gè)背景變量,轉(zhuǎn)變?yōu)樗茉炷P托袨榕c推理方式的核心約束,使模型更接近真實(shí)世界中的認(rèn)知與決策過(guò)程。(作者|李程程,編輯|李玉鵬)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!特朗普宣布,暴漲!

突發(fā)!特朗普宣布,暴漲!

中國(guó)基金報(bào)
2026-01-09 00:13:04
建國(guó)后,博古妻子哭求楊尚昆幫襯生活困難,楊尚昆是如何回復(fù)的?

建國(guó)后,博古妻子哭求楊尚昆幫襯生活困難,楊尚昆是如何回復(fù)的?

嘮叨說(shuō)歷史
2025-12-30 10:35:28
盤點(diǎn)|2025年上半年熱度新人

盤點(diǎn)|2025年上半年熱度新人

素然追光
2026-01-09 01:05:02
辭去央視工作,嫁大18歲李鐵為妻,如今52歲張泉靈已走上另一條路

辭去央視工作,嫁大18歲李鐵為妻,如今52歲張泉靈已走上另一條路

說(shuō)歷史的老牢
2026-01-08 10:42:57
女大學(xué)生餐館訛錢后續(xù):正臉曝光很漂亮 家人輪番找店主 目的曝光

女大學(xué)生餐館訛錢后續(xù):正臉曝光很漂亮 家人輪番找店主 目的曝光

鋭娛之樂(lè)
2026-01-08 08:34:40
為什么會(huì)挪用老百姓的錢?

為什么會(huì)挪用老百姓的錢?

生命可以承受之輕
2026-01-06 13:12:26
果然不出所料,委內(nèi)瑞拉的石油“有問(wèn)題”,只有中國(guó)能安穩(wěn)開采!

果然不出所料,委內(nèi)瑞拉的石油“有問(wèn)題”,只有中國(guó)能安穩(wěn)開采!

墜入二次元的海洋
2026-01-08 19:51:48
35歲鄭爽近照曝光!形象管理失敗,徹底成了素人,在美日子舒坦了

35歲鄭爽近照曝光!形象管理失敗,徹底成了素人,在美日子舒坦了

小咪侃娛圈
2026-01-08 14:06:23
票房大反轉(zhuǎn):《阿凡達(dá)3》跌至第三,尋秦記第二,第一成功逆襲

票房大反轉(zhuǎn):《阿凡達(dá)3》跌至第三,尋秦記第二,第一成功逆襲

糊咖娛樂(lè)
2026-01-07 17:08:47
科學(xué)家讓一對(duì)情侶在核磁共振里實(shí)戰(zhàn),才發(fā)現(xiàn)人體驚人真相!

科學(xué)家讓一對(duì)情侶在核磁共振里實(shí)戰(zhàn),才發(fā)現(xiàn)人體驚人真相!

徐德文科學(xué)頻道
2026-01-06 19:51:55
《我是刑警》原型:公安部九大懸案之一!追兇6年,萬(wàn)人行動(dòng)!

《我是刑警》原型:公安部九大懸案之一!追兇6年,萬(wàn)人行動(dòng)!

史記趣聞
2024-12-31 20:10:03
資深編審、法史學(xué)者,北京工業(yè)大學(xué)副教授解錕逝世,年僅48歲

資深編審、法史學(xué)者,北京工業(yè)大學(xué)副教授解錕逝世,年僅48歲

澎湃新聞
2026-01-08 17:04:26
閆學(xué)晶哭窮遭質(zhì)疑?導(dǎo)演力挺:北京一年花100萬(wàn)真不多,她沒說(shuō)謊

閆學(xué)晶哭窮遭質(zhì)疑?導(dǎo)演力挺:北京一年花100萬(wàn)真不多,她沒說(shuō)謊

代軍哥哥談娛樂(lè)
2026-01-08 10:44:33
伊朗抗議人群占領(lǐng)市政府大樓,舉牌感謝川普

伊朗抗議人群占領(lǐng)市政府大樓,舉牌感謝川普

知兵
2026-01-08 08:04:01
終于知道為啥要抓馬杜羅的夫人了!知道她厲害,沒想到這么厲害!

終于知道為啥要抓馬杜羅的夫人了!知道她厲害,沒想到這么厲害!

今日養(yǎng)生之道
2026-01-06 20:07:20
74歲王石坐公務(wù)艙出行!沒戴假發(fā)狀態(tài)疲憊,拿手機(jī)坐窗口認(rèn)真拍照

74歲王石坐公務(wù)艙出行!沒戴假發(fā)狀態(tài)疲憊,拿手機(jī)坐窗口認(rèn)真拍照

李健政觀察
2026-01-07 23:45:35
又轟下38+10+10!抱歉威少:你從歷史第二變成了歷史第三

又轟下38+10+10!抱歉威少:你從歷史第二變成了歷史第三

籃球大視野
2026-01-08 17:43:43
日月潭所在地有望“綠地變藍(lán)天”?國(guó)民黨魚池鄉(xiāng)鄉(xiāng)長(zhǎng)參選人出爐

日月潭所在地有望“綠地變藍(lán)天”?國(guó)民黨魚池鄉(xiāng)鄉(xiāng)長(zhǎng)參選人出爐

海峽導(dǎo)報(bào)社
2026-01-08 10:44:13
機(jī)構(gòu)大瘦身!廣東一縣8部門精簡(jiǎn)為4個(gè),人浮于事的舊現(xiàn)象將告別

機(jī)構(gòu)大瘦身!廣東一縣8部門精簡(jiǎn)為4個(gè),人浮于事的舊現(xiàn)象將告別

筆桿論道
2026-01-09 06:11:55
亞運(yùn)冠軍舉報(bào)訓(xùn)練基地負(fù)責(zé)人“索要獎(jiǎng)金”續(xù):云南體育局稱“很快會(huì)有結(jié)論”

亞運(yùn)冠軍舉報(bào)訓(xùn)練基地負(fù)責(zé)人“索要獎(jiǎng)金”續(xù):云南體育局稱“很快會(huì)有結(jié)論”

澎湃新聞
2026-01-08 16:04:29
2026-01-09 11:55:00
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
128660文章數(shù) 861599關(guān)注度
往期回顧 全部

科技要聞

17.68萬(wàn)起售!何小鵬一口氣發(fā)了4款車

頭條要聞

12歲男孩在溫泉池溺水身亡 父親:身高1.4米水深1.1米

頭條要聞

12歲男孩在溫泉池溺水身亡 父親:身高1.4米水深1.1米

體育要聞

世乒賽銀牌得主,說(shuō)自己夢(mèng)里都是孫穎莎

娛樂(lè)要聞

檀健次戀愛風(fēng)波越演越烈 上學(xué)經(jīng)歷被扒

財(cái)經(jīng)要聞

郁亮的萬(wàn)科35年:從"寶萬(wàn)之爭(zhēng)"到"活下去"

汽車要聞

上汽大眾首款“9系旗艦” ID. ERA 9X實(shí)車曝光

態(tài)度原創(chuàng)

親子
藝術(shù)
手機(jī)
旅游
公開課

親子要聞

真服了,一個(gè)女子懷孕了八個(gè)月了,去飯店,又喝啤酒,又抽煙

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

手機(jī)要聞

魅族2026魅友新春會(huì)明天舉行:將推出魅族22系列神秘產(chǎn)品

旅游要聞

重慶鴻恩寺公園紅梅初開,詩(shī)意畫卷引客來(lái)

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版