国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,蟬聯(lián)Future X全球榜首MiroMind發(fā)布全球最強搜索智能體模型

0
分享至



機器之心發(fā)布

憑借成功預測 Polymarket 題目,連續(xù)登頂 Future X 全球榜首的 MiroMind 團隊,于今日(1 月 5 日)正式發(fā)布其自研旗艦搜索智能體模型 MiroThinker 1.5。

MiroMind 由全球知名創(chuàng)新企業(yè)家、慈善家陳天橋,與清華大學知名 AI 青年學者代季峰教授聯(lián)合發(fā)起。去年陳天橋提出發(fā)現(xiàn)式智能才是真正意義上的通用人工智能這一重磅創(chuàng)新理念,引發(fā)全球業(yè)內人士關注。他同時提出建設發(fā)現(xiàn)式智能的 5 種關鍵能力,其中一項能力是在未知條件下重建對世界的理解,這正是 MiroMind 的使命。

在過去 7 個月里,當全行業(yè)都在「卷」參數(shù)規(guī)模、「卷」百萬長文本的紅海時,MiroMind 卻在思考一個更本質的問題:智能的「奇點」究竟在哪里?他們給出的答案不是「把世界背進參數(shù)里」,而是押注「發(fā)現(xiàn)式智能」:真正的智能不靠全知,而靠會研究、會查證、會修正—— 像頂級情報官一樣對外極速取證、對內嚴苛去偽存真;像嚴謹研究員一樣在不確定性里逼近真相,最終把「預測未來」從特權變成能力。

MiroThinker 1.5 性能評測

MiroMind 團隊在 AGI 競技場上,不信奉 “大力出奇跡”,而是追求以高智效比為核心的 「巧勁」。

MiroThinker-v1.5-30B 僅用 1/30 的參數(shù)規(guī)模跑出了比肩眾多 1T 模型的性能表現(xiàn),其 235B 的版本在多個搜索智能體基準測試中躋身全球第一梯隊。

實力霸榜:指標是門檻,預測是天花板



BrowseComp 性能對比



Agent 搜索評測基準性能對比

越級挑戰(zhàn):MiroThinker-v1.5-30B vs Kimi-K2-Thinking

面對參數(shù)量高達 30 倍的萬億參數(shù)巨獸 Kimi-K2-Thinking,MiroThinker-v1.5-30B 用極低的成本展示了旗鼓相當?shù)谋憩F(xiàn):

  • 推理成本: MiroThinker-v1.5-30B 單條調用成本低至 $0.07,僅為 Kimi-K2-Thinking 的 1/20,且推理更快。
  • 性能表現(xiàn): 在關鍵評測集 BrowseComp-ZH 中實現(xiàn)性能超越,證明「大」 不等于 「強」。

核心洞察:從 「做題家模式」 轉向 「科學家模式」

MiroMind 團隊指出,以擴大模型內部參數(shù)量(Internal Parameters)為核心的傳統(tǒng) Scaling Law 已明顯觸及邊際瓶頸;要繼續(xù)提升模型性能,必須從「內部參數(shù)擴張」轉向以「外部信息交互」(External Interaction)為核心的Interactive Scaling,將智能的增長空間從內部參數(shù)擴展到外部世界。

為什么該模型能在大幅降低成本的同時,性能依然能打?

因為這不是「大參數(shù)碾壓」,而是一次「科學家模式」對「做題家模式」的勝利。以 Scaling Law 為代表的路線,更像「做題家」:試圖把全人類知識(也包括噪聲與錯誤)盡可能背進模型里;一旦遇到生物學等領域的未知問題,就容易基于概率分布「編」出一個看似合理的答案 —— 幻覺往往由此產生。

MiroThinker 1.0中,MiroMind 團隊首次系統(tǒng)性提出Interactive Scaling:隨著工具交互頻率與深度提升,研究式推理能力也穩(wěn)定增強 —— 這構成了與模型大小、上下文長度并列的第三個可擴展維度。v1.5 更進一步,把這套機制內化為貫穿訓練與推理全流程的核心能力:將模型訓練成「科學家」,核心不是死記硬背,而是勤查證。遇到難題時,它不會給出概率最高的瞎猜,而是執(zhí)行慢思考的研究閉環(huán):提出假設 → 向外部世界查數(shù)據(jù) / 取證 → 發(fā)現(xiàn)對不上 → 修正假設 → 再查證,直到證據(jù)收斂。

主流大模型往往盲目追求萬億參數(shù),試圖把整個互聯(lián)網(wǎng)「背」在腦子里。而 MiroThinker 系列選擇了一條反共識的路線:刻意將模型控制在 30B–200B 的輕量級規(guī)模。MiroMind 團隊強調,省下的不是算力,而是把算力花在了更刀刃的地方 —— 對外的信息獲取與交互。

MiroMind 團隊不追求讓模型擁有一顆「最重的腦子」,而是培養(yǎng)它擁有一雙「最勤的手」。當模型同時具備研究式確認機制時序因果約束,這種圍繞外部信息獲取的交互過程才讓「發(fā)現(xiàn)式智能」真正落地 —— 也正是對 Interactive Scaling 的深耕,使他們用小得多的模型,做到了大模型才能做到的事。

MiroThinker 1.5 核心技術揭秘

傳統(tǒng)的模型思維鏈本質上是在模型內部知識空間的線性外推,推理偏差會隨路徑增長而不斷累積,最終導致邏輯坍塌。

MiroThinker 1.5 的核心發(fā)力點,在于通過 Interactive Scaling 打破孤立推理的僵局,將「推理」與「外部環(huán)境」深度耦合。通過構建「推理 - 驗證 - 修正」循環(huán),引入外部信息作為校驗錨點,用確定性的證據(jù)流來對沖不確定性的推演,解決邏輯坍塌問題。

Training-time Interactive Scaling 技術

當智能的 Scaling 范式不再局限于模型內部龐大的世界知識儲備與縝密的長程邏輯推理,而是依托模型高頻與外部世界中探索與交互并獲得閉環(huán)反饋時,小而高效的探索者模型能展現(xiàn)比肩于甚至超出大而嚴謹?shù)乃伎颊吣P偷闹橇λ健?/p>

MiroThinker 1.5 正是基于這一判斷,將 Interactive Scaling 從推理階段的外掛能力,前移并內化為訓練階段的核心機制。模型并非被要求「盡量在腦中想清楚一切」,而是被系統(tǒng)性地訓練成一個善于向外求證、敢于否定自己、能夠快速修正路徑的 Agent。

在訓練過程中,MiroMind 團隊刻意削弱對「單次完美推理」的獎勵,轉而強化以下行為模式:

  • Evidence-Seeking(主動求證): 模型被鼓勵將每一個關鍵判斷拆解為可驗證的子假設,并主動發(fā)起對外查詢、檢索與比對。結論本身不再是訓練目標,找到可靠證據(jù)的過程才是。缺乏信源支撐的高置信輸出,會在訓練中被系統(tǒng)性地懲罰。
  • Iterative Verification(多輪校驗與自我修正): 推理不被視為一次性路徑,而是一個可反復回溯、修正的過程。模型在交互中被要求不斷對已有判斷進行反證測試,一旦發(fā)現(xiàn)證據(jù)沖突,必須顯式調整假設,而非「帶著錯誤繼續(xù)推下去」。
  • Anti-Hallucination(對捷徑的系統(tǒng)性過濾): 對那些「看起來合理、但缺乏真實依據(jù)」的推理捷徑保持零容忍。訓練中不僅評估答案是否正確,更關注答案是如何得到的:任何依賴統(tǒng)計相關性、模式記憶或隱含先驗而繞過證據(jù)驗證的路徑,都會被標記為低質量推理。

通過這種訓練方式,MiroThinker 1.5 逐步形成了一種「本能反應」:在不確定性面前,先交互、再判斷;在高風險結論前,先查證、再收斂。這使得模型不再需要將龐大的世界知識全部內化為參數(shù),而是學會在需要時,快速、精準地向外部世界「借力」。

最終,團隊用更小的參數(shù)規(guī)模,換來了更高的智能密度:不是讓模型記住更多,而是讓它學會如何找到、驗證并使用信息。這正是 MiroThinker 1.5 能在顯著降低推理成本的同時,依然保持一線性能的根本原因。

時序敏感訓練沙盒

時序敏感訓練沙盒,是破解「因果律」的鑰匙:普通大模型訓練常處在「上帝視角」—— 它在數(shù)據(jù)里早已「見過結果」,學到的往往是復述與「劇透」,而不是預測。MiroThinker 的訓練則約束模型「只能看過去,不能看未來」,在嚴格的時間可見性約束下做判斷、再用同樣受時序約束的證據(jù)去驗證與更新。

  • 可控數(shù)據(jù)合成引擎: 構建覆蓋多任務類型的、難度與時間戳可控的數(shù)據(jù)合成體系。每一道題目的「正確答案」并非靜態(tài)標簽,而是隨時間戳動態(tài)演化;模型必須在嚴格的信息可見性約束下,基于當時可獲取的信息做出判斷,而校驗過程同樣顯式引入時間戳約束,以確保推演與評分均符合真實世界的時序邏輯。
  • 時序敏感訓練機制:采用嚴格的時間戳與信息可見性約束,徹底杜絕 Future Leakage;模型在訓練過程中的每一步只能與發(fā)表于當前時間戳之前的信息進行交互。

在這種訓練范式下,模型被迫學會在信息不完備、噪聲存在、信號延遲的真實條件下進行推演與修正,而不是依賴靜態(tài)數(shù)據(jù)集中的「標準答案」。時間由此從一個背景變量,轉變?yōu)樗茉炷P托袨榕c推理方式的核心約束,使模型更接近真實世界中的認知與決策過程。

樣例展示

Case 1: A 股漲停板預測

據(jù)介紹,這不是 「玄學」,更不是事后諸葛亮 —— 而是在信息極度噪聲化、情緒快速切換的盤面里,用開放世界證據(jù) + 因果推斷去賭 「次日正確答案」。(注:以下僅為技術展示,不構成投資建議)

  • 12 月 10 日(周三)



對話鏈接:https://dr.miromind.ai/share/07430808-d84d-4e40-9615-bf07d6e71365

  • 躍嶺股份| 16 只連板股,當天晉級僅 4 只,晉級率 25%,市場情緒顯著退潮。MiroMind 在 8 支二板股里,精準押中唯一晉級成功的那一支。
  • 12 月 11 日(周四)



對話鏈接:https://dr.miromind.ai/share/eccc29b9-889b-43f9-b6bf-f4b2b7c8dc1e

  • 再升科技| 9 只連板股,當天晉級僅 2 只,晉級率 22%,市場環(huán)境持續(xù)降溫。MiroMind 命中 9 支連板股中高位晉級者 —— 退潮里選中 「活口」。
  • 12 月 12 日(周五)



對話鏈接:https://dr.miromind.ai/share/e9db058d-3e8c-4922-b483-cf5efae2f414

  • 再升科技|13 只連板股,當天晉級 7 只,晉級率 54%,情緒強力回暖。MiroMind 不僅命中市場最高連板,還準確預判其繼續(xù)晉級(后續(xù)累計漲幅高達 58%)。
  • 12 月 15 日(周一)



對話鏈接:https://dr.miromind.ai/share/3dc7dae0-78cb-4a97-8f61-359ab2d3e1a0

  • 華菱線纜|13 只連板股,當天晉級 5 只,晉級率 38%,市場再度明顯降溫。MiroMind 繼續(xù)命中:在情緒回落時仍能穿透噪聲,給出可復盤的確定性答案。

Case 2: 下周有哪些大事件會對美股七巨頭產生影響?預期的市場反應和潛在波動方向是什么 ?



對話鏈接:https://dr.miromind.ai/share/f4afae1a-21e1-4f6d-8eef-16909c2d7b79

Case 3: GTA 6 明年能按時發(fā)布嗎?



對話鏈接:https://dr.miromind.ai/share/10e5d1fd-c6b6-4b96-a2ed-4b776a3e1dcd

人才招募

MiroMind 面向全球持續(xù)招募人才,簡歷投遞:talent@miromind.ai

產品體驗

立即體驗 MiroMind,免費解鎖預測未來的能力: https://dr.miromind.ai/

  • Discord 頻道(#everything-prediction):https://discord.gg/F7EQFnYscV
  • 微信社群(MiroMind 預測未來):微信添加小助手 miromind001

  • Hugging Face 模型下載:https://huggingface.co/miromind-ai/MiroThinker-v1.5-235B
  • Github 代碼地址:https://github.com/MiroMindAI/MiroThinker
  • MiroFlow 開源框架:https://github.com/MiroMindAI/MiroFlow

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
王毅外長發(fā)出統(tǒng)一最強音,向全世界通報兩件事,中國再也不避諱了

王毅外長發(fā)出統(tǒng)一最強音,向全世界通報兩件事,中國再也不避諱了

尋墨閣
2026-01-04 16:47:22
童錦程孩子媽曬照,有顏值有身材,難怪孩子好看,輿論風向變了

童錦程孩子媽曬照,有顏值有身材,難怪孩子好看,輿論風向變了

非常先生看娛樂
2026-01-06 18:00:27
馬杜羅為何不慌?進了DEA“牢籠”,反而拿到了博弈主動權

馬杜羅為何不慌?進了DEA“牢籠”,反而拿到了博弈主動權

回旋鏢
2026-01-05 23:14:21
055大驅垂發(fā)“長短兩型發(fā)射筒”同框,冷熱共架發(fā)射具象化

055大驅垂發(fā)“長短兩型發(fā)射筒”同框,冷熱共架發(fā)射具象化

瞳哥視界
2026-01-06 21:23:17
影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

影后辛芷蕾,這張照片攝影師得加雞腿,抓拍的太到位了

徐幫陽
2025-12-23 18:33:38
馬杜羅有救了?48小時內,中方兩次要求放人,特朗普對華作出承諾

馬杜羅有救了?48小時內,中方兩次要求放人,特朗普對華作出承諾

煙潯渺渺
2026-01-06 13:05:20
遼寧13分大勝同曦!賽后三好消息:威爾斯復蘇,本土球員穩(wěn)定!

遼寧13分大勝同曦!賽后三好消息:威爾斯復蘇,本土球員穩(wěn)定!

吳朑愛游泳
2026-01-06 21:32:02
“掏肛大師”,來了

“掏肛大師”,來了

中國新聞周刊
2026-01-06 19:29:04
花生再次被關注!調查發(fā)現(xiàn):糖尿病常吃花生,不過半年或有6好處

花生再次被關注!調查發(fā)現(xiàn):糖尿病常吃花生,不過半年或有6好處

展望云霄
2025-11-29 13:56:58
聯(lián)合國還有什么意義?安理會無視中方發(fā)言后,中國記者靈魂提問

聯(lián)合國還有什么意義?安理會無視中方發(fā)言后,中國記者靈魂提問

博覽歷史
2026-01-06 18:00:01
陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

陪玩陪睡不夠!集體開嫖、舔手指、目無王法,陰暗面徹底藏不住了

好賢觀史記
2025-11-09 21:58:39
光刻機之后,中國就剩最后一個工業(yè)明珠了,高精度數(shù)控機床

光刻機之后,中國就剩最后一個工業(yè)明珠了,高精度數(shù)控機床

三石記
2026-01-05 16:28:52
中紀委通報 “天網(wǎng)2025”行動成果

中紀委通報 “天網(wǎng)2025”行動成果

看看新聞Knews
2026-01-06 21:37:04
大爆冷,倒數(shù)第2掀翻北控!張慶鵬沮喪離場,執(zhí)教水平不如閔鹿蕾

大爆冷,倒數(shù)第2掀翻北控!張慶鵬沮喪離場,執(zhí)教水平不如閔鹿蕾

三秋體育
2026-01-06 23:22:31
游客人數(shù)和旅游收入增速均超30%,經濟第一大省領跑全國:清遠潮汕成熱門

游客人數(shù)和旅游收入增速均超30%,經濟第一大省領跑全國:清遠潮汕成熱門

時代周報
2026-01-04 21:13:09
3:1!天津女排升至第一,兩外援32分,劉美君低效,朱婷師妹亮眼

3:1!天津女排升至第一,兩外援32分,劉美君低效,朱婷師妹亮眼

跑者排球視角
2026-01-07 00:08:02
超650張公告!蘇州大拆遷!史上超全名單公布!

超650張公告!蘇州大拆遷!史上超全名單公布!

華瑤說房
2026-01-06 17:09:33
漢人最偉大的巔峰之戰(zhàn)!若此戰(zhàn)失敗,中國或將分裂成幾十個小國

漢人最偉大的巔峰之戰(zhàn)!若此戰(zhàn)失敗,中國或將分裂成幾十個小國

千秋文化
2026-01-06 20:49:21
這一仗徹底把中國打醒!美軍的狠毒的作戰(zhàn)方式,中國摸的很清楚了

這一仗徹底把中國打醒!美軍的狠毒的作戰(zhàn)方式,中國摸的很清楚了

史之銘
2025-12-12 19:23:56
建筑工人搖晃圍欄喊“要出去吃飯”;知情人:限制外出吃飯要求在食堂吃;中建一局:情況已上報

建筑工人搖晃圍欄喊“要出去吃飯”;知情人:限制外出吃飯要求在食堂吃;中建一局:情況已上報

大風新聞
2026-01-05 19:47:03
2026-01-07 04:44:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12066文章數(shù) 142530關注度
往期回顧 全部

科技要聞

速看!黃仁勛萬字實錄:甩出"物理AI"王牌

頭條要聞

俄羅斯發(fā)表關于委內瑞拉局勢的聲明

頭條要聞

俄羅斯發(fā)表關于委內瑞拉局勢的聲明

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強喬治

娛樂要聞

2026年央視春晚彩排照曝光!

財經要聞

50萬億存款"洪流"將至 四大去向引關注

汽車要聞

摩登出街潮品 實拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

藝術
教育
本地
公開課
軍事航空

藝術要聞

2026馬年趙孟頫高清集字春聯(lián)大放送,收藏備用!

教育要聞

剛剛,0.5+3集團直升拋出三個“王炸”!

本地新聞

云游內蒙|初見呼和浩特,古今交融的北疆都會

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美稱對“占領”委內瑞拉保留選擇權

無障礙瀏覽 進入關懷版