国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛,蟬聯(lián)Future X全球榜首MiroMind發(fā)布全球最強(qiáng)搜索智能體模型

0
分享至



機(jī)器之心發(fā)布

憑借成功預(yù)測 Polymarket 題目,連續(xù)登頂 Future X 全球榜首的 MiroMind 團(tuán)隊(duì),于今日(1 月 5 日)正式發(fā)布其自研旗艦搜索智能體模型 MiroThinker 1.5。

MiroMind 由全球知名創(chuàng)新企業(yè)家、慈善家陳天橋,與清華大學(xué)知名 AI 青年學(xué)者代季峰教授聯(lián)合發(fā)起。去年陳天橋提出發(fā)現(xiàn)式智能才是真正意義上的通用人工智能這一重磅創(chuàng)新理念,引發(fā)全球業(yè)內(nèi)人士關(guān)注。他同時(shí)提出建設(shè)發(fā)現(xiàn)式智能的 5 種關(guān)鍵能力,其中一項(xiàng)能力是在未知條件下重建對世界的理解,這正是 MiroMind 的使命。

在過去 7 個(gè)月里,當(dāng)全行業(yè)都在「卷」參數(shù)規(guī)模、「卷」百萬長文本的紅海時(shí),MiroMind 卻在思考一個(gè)更本質(zhì)的問題:智能的「奇點(diǎn)」究竟在哪里?他們給出的答案不是「把世界背進(jìn)參數(shù)里」,而是押注「發(fā)現(xiàn)式智能」:真正的智能不靠全知,而靠會(huì)研究、會(huì)查證、會(huì)修正—— 像頂級情報(bào)官一樣對外極速取證、對內(nèi)嚴(yán)苛去偽存真;像嚴(yán)謹(jǐn)研究員一樣在不確定性里逼近真相,最終把「預(yù)測未來」從特權(quán)變成能力。

MiroThinker 1.5 性能評測

MiroMind 團(tuán)隊(duì)在 AGI 競技場上,不信奉 “大力出奇跡”,而是追求以高智效比為核心的 「巧勁」。

MiroThinker-v1.5-30B 僅用 1/30 的參數(shù)規(guī)模跑出了比肩眾多 1T 模型的性能表現(xiàn),其 235B 的版本在多個(gè)搜索智能體基準(zhǔn)測試中躋身全球第一梯隊(duì)。

實(shí)力霸榜:指標(biāo)是門檻,預(yù)測是天花板



BrowseComp 性能對比



Agent 搜索評測基準(zhǔn)性能對比

越級挑戰(zhàn):MiroThinker-v1.5-30B vs Kimi-K2-Thinking

面對參數(shù)量高達(dá) 30 倍的萬億參數(shù)巨獸 Kimi-K2-Thinking,MiroThinker-v1.5-30B 用極低的成本展示了旗鼓相當(dāng)?shù)谋憩F(xiàn):

  • 推理成本: MiroThinker-v1.5-30B 單條調(diào)用成本低至 $0.07,僅為 Kimi-K2-Thinking 的 1/20,且推理更快。
  • 性能表現(xiàn): 在關(guān)鍵評測集 BrowseComp-ZH 中實(shí)現(xiàn)性能超越,證明「大」 不等于 「強(qiáng)」。

核心洞察:從 「做題家模式」 轉(zhuǎn)向 「科學(xué)家模式」

MiroMind 團(tuán)隊(duì)指出,以擴(kuò)大模型內(nèi)部參數(shù)量(Internal Parameters)為核心的傳統(tǒng) Scaling Law 已明顯觸及邊際瓶頸;要繼續(xù)提升模型性能,必須從「內(nèi)部參數(shù)擴(kuò)張」轉(zhuǎn)向以「外部信息交互」(External Interaction)為核心的Interactive Scaling,將智能的增長空間從內(nèi)部參數(shù)擴(kuò)展到外部世界。

為什么該模型能在大幅降低成本的同時(shí),性能依然能打?

因?yàn)檫@不是「大參數(shù)碾壓」,而是一次「科學(xué)家模式」對「做題家模式」的勝利。以 Scaling Law 為代表的路線,更像「做題家」:試圖把全人類知識(shí)(也包括噪聲與錯(cuò)誤)盡可能背進(jìn)模型里;一旦遇到生物學(xué)等領(lǐng)域的未知問題,就容易基于概率分布「編」出一個(gè)看似合理的答案 —— 幻覺往往由此產(chǎn)生。

MiroThinker 1.0中,MiroMind 團(tuán)隊(duì)首次系統(tǒng)性提出Interactive Scaling:隨著工具交互頻率與深度提升,研究式推理能力也穩(wěn)定增強(qiáng) —— 這構(gòu)成了與模型大小、上下文長度并列的第三個(gè)可擴(kuò)展維度。v1.5 更進(jìn)一步,把這套機(jī)制內(nèi)化為貫穿訓(xùn)練與推理全流程的核心能力:將模型訓(xùn)練成「科學(xué)家」,核心不是死記硬背,而是勤查證。遇到難題時(shí),它不會(huì)給出概率最高的瞎猜,而是執(zhí)行慢思考的研究閉環(huán):提出假設(shè) → 向外部世界查數(shù)據(jù) / 取證 → 發(fā)現(xiàn)對不上 → 修正假設(shè) → 再查證,直到證據(jù)收斂。

主流大模型往往盲目追求萬億參數(shù),試圖把整個(gè)互聯(lián)網(wǎng)「背」在腦子里。而 MiroThinker 系列選擇了一條反共識(shí)的路線:刻意將模型控制在 30B–200B 的輕量級規(guī)模。MiroMind 團(tuán)隊(duì)強(qiáng)調(diào),省下的不是算力,而是把算力花在了更刀刃的地方 —— 對外的信息獲取與交互。

MiroMind 團(tuán)隊(duì)不追求讓模型擁有一顆「最重的腦子」,而是培養(yǎng)它擁有一雙「最勤的手」。當(dāng)模型同時(shí)具備研究式確認(rèn)機(jī)制時(shí)序因果約束,這種圍繞外部信息獲取的交互過程才讓「發(fā)現(xiàn)式智能」真正落地 —— 也正是對 Interactive Scaling 的深耕,使他們用小得多的模型,做到了大模型才能做到的事。

MiroThinker 1.5 核心技術(shù)揭秘

傳統(tǒng)的模型思維鏈本質(zhì)上是在模型內(nèi)部知識(shí)空間的線性外推,推理偏差會(huì)隨路徑增長而不斷累積,最終導(dǎo)致邏輯坍塌。

MiroThinker 1.5 的核心發(fā)力點(diǎn),在于通過 Interactive Scaling 打破孤立推理的僵局,將「推理」與「外部環(huán)境」深度耦合。通過構(gòu)建「推理 - 驗(yàn)證 - 修正」循環(huán),引入外部信息作為校驗(yàn)錨點(diǎn),用確定性的證據(jù)流來對沖不確定性的推演,解決邏輯坍塌問題。

Training-time Interactive Scaling 技術(shù)

當(dāng)智能的 Scaling 范式不再局限于模型內(nèi)部龐大的世界知識(shí)儲(chǔ)備與縝密的長程邏輯推理,而是依托模型高頻與外部世界中探索與交互并獲得閉環(huán)反饋時(shí),小而高效的探索者模型能展現(xiàn)比肩于甚至超出大而嚴(yán)謹(jǐn)?shù)乃伎颊吣P偷闹橇λ健?/p>

MiroThinker 1.5 正是基于這一判斷,將 Interactive Scaling 從推理階段的外掛能力,前移并內(nèi)化為訓(xùn)練階段的核心機(jī)制。模型并非被要求「盡量在腦中想清楚一切」,而是被系統(tǒng)性地訓(xùn)練成一個(gè)善于向外求證、敢于否定自己、能夠快速修正路徑的 Agent。

在訓(xùn)練過程中,MiroMind 團(tuán)隊(duì)刻意削弱對「單次完美推理」的獎(jiǎng)勵(lì),轉(zhuǎn)而強(qiáng)化以下行為模式:

  • Evidence-Seeking(主動(dòng)求證): 模型被鼓勵(lì)將每一個(gè)關(guān)鍵判斷拆解為可驗(yàn)證的子假設(shè),并主動(dòng)發(fā)起對外查詢、檢索與比對。結(jié)論本身不再是訓(xùn)練目標(biāo),找到可靠證據(jù)的過程才是。缺乏信源支撐的高置信輸出,會(huì)在訓(xùn)練中被系統(tǒng)性地懲罰。
  • Iterative Verification(多輪校驗(yàn)與自我修正): 推理不被視為一次性路徑,而是一個(gè)可反復(fù)回溯、修正的過程。模型在交互中被要求不斷對已有判斷進(jìn)行反證測試,一旦發(fā)現(xiàn)證據(jù)沖突,必須顯式調(diào)整假設(shè),而非「帶著錯(cuò)誤繼續(xù)推下去」。
  • Anti-Hallucination(對捷徑的系統(tǒng)性過濾): 對那些「看起來合理、但缺乏真實(shí)依據(jù)」的推理捷徑保持零容忍。訓(xùn)練中不僅評估答案是否正確,更關(guān)注答案是如何得到的:任何依賴統(tǒng)計(jì)相關(guān)性、模式記憶或隱含先驗(yàn)而繞過證據(jù)驗(yàn)證的路徑,都會(huì)被標(biāo)記為低質(zhì)量推理。

通過這種訓(xùn)練方式,MiroThinker 1.5 逐步形成了一種「本能反應(yīng)」:在不確定性面前,先交互、再判斷;在高風(fēng)險(xiǎn)結(jié)論前,先查證、再收斂。這使得模型不再需要將龐大的世界知識(shí)全部內(nèi)化為參數(shù),而是學(xué)會(huì)在需要時(shí),快速、精準(zhǔn)地向外部世界「借力」。

最終,團(tuán)隊(duì)用更小的參數(shù)規(guī)模,換來了更高的智能密度:不是讓模型記住更多,而是讓它學(xué)會(huì)如何找到、驗(yàn)證并使用信息。這正是 MiroThinker 1.5 能在顯著降低推理成本的同時(shí),依然保持一線性能的根本原因。

時(shí)序敏感訓(xùn)練沙盒

時(shí)序敏感訓(xùn)練沙盒,是破解「因果律」的鑰匙:普通大模型訓(xùn)練常處在「上帝視角」—— 它在數(shù)據(jù)里早已「見過結(jié)果」,學(xué)到的往往是復(fù)述與「劇透」,而不是預(yù)測。MiroThinker 的訓(xùn)練則約束模型「只能看過去,不能看未來」,在嚴(yán)格的時(shí)間可見性約束下做判斷、再用同樣受時(shí)序約束的證據(jù)去驗(yàn)證與更新。

  • 可控?cái)?shù)據(jù)合成引擎: 構(gòu)建覆蓋多任務(wù)類型的、難度與時(shí)間戳可控的數(shù)據(jù)合成體系。每一道題目的「正確答案」并非靜態(tài)標(biāo)簽,而是隨時(shí)間戳動(dòng)態(tài)演化;模型必須在嚴(yán)格的信息可見性約束下,基于當(dāng)時(shí)可獲取的信息做出判斷,而校驗(yàn)過程同樣顯式引入時(shí)間戳約束,以確保推演與評分均符合真實(shí)世界的時(shí)序邏輯。
  • 時(shí)序敏感訓(xùn)練機(jī)制:采用嚴(yán)格的時(shí)間戳與信息可見性約束,徹底杜絕 Future Leakage;模型在訓(xùn)練過程中的每一步只能與發(fā)表于當(dāng)前時(shí)間戳之前的信息進(jìn)行交互。

在這種訓(xùn)練范式下,模型被迫學(xué)會(huì)在信息不完備、噪聲存在、信號延遲的真實(shí)條件下進(jìn)行推演與修正,而不是依賴靜態(tài)數(shù)據(jù)集中的「標(biāo)準(zhǔn)答案」。時(shí)間由此從一個(gè)背景變量,轉(zhuǎn)變?yōu)樗茉炷P托袨榕c推理方式的核心約束,使模型更接近真實(shí)世界中的認(rèn)知與決策過程。

樣例展示

Case 1: A 股漲停板預(yù)測

據(jù)介紹,這不是 「玄學(xué)」,更不是事后諸葛亮 —— 而是在信息極度噪聲化、情緒快速切換的盤面里,用開放世界證據(jù) + 因果推斷去賭 「次日正確答案」。(注:以下僅為技術(shù)展示,不構(gòu)成投資建議)

  • 12 月 10 日(周三)



對話鏈接:https://dr.miromind.ai/share/07430808-d84d-4e40-9615-bf07d6e71365

  • 躍嶺股份| 16 只連板股,當(dāng)天晉級僅 4 只,晉級率 25%,市場情緒顯著退潮。MiroMind 在 8 支二板股里,精準(zhǔn)押中唯一晉級成功的那一支。
  • 12 月 11 日(周四)



對話鏈接:https://dr.miromind.ai/share/eccc29b9-889b-43f9-b6bf-f4b2b7c8dc1e

  • 再升科技| 9 只連板股,當(dāng)天晉級僅 2 只,晉級率 22%,市場環(huán)境持續(xù)降溫。MiroMind 命中 9 支連板股中高位晉級者 —— 退潮里選中 「活口」。
  • 12 月 12 日(周五)



對話鏈接:https://dr.miromind.ai/share/e9db058d-3e8c-4922-b483-cf5efae2f414

  • 再升科技|13 只連板股,當(dāng)天晉級 7 只,晉級率 54%,情緒強(qiáng)力回暖。MiroMind 不僅命中市場最高連板,還準(zhǔn)確預(yù)判其繼續(xù)晉級(后續(xù)累計(jì)漲幅高達(dá) 58%)。
  • 12 月 15 日(周一)



對話鏈接:https://dr.miromind.ai/share/3dc7dae0-78cb-4a97-8f61-359ab2d3e1a0

  • 華菱線纜|13 只連板股,當(dāng)天晉級 5 只,晉級率 38%,市場再度明顯降溫。MiroMind 繼續(xù)命中:在情緒回落時(shí)仍能穿透噪聲,給出可復(fù)盤的確定性答案。

Case 2: 下周有哪些大事件會(huì)對美股七巨頭產(chǎn)生影響?預(yù)期的市場反應(yīng)和潛在波動(dòng)方向是什么 ?



對話鏈接:https://dr.miromind.ai/share/f4afae1a-21e1-4f6d-8eef-16909c2d7b79

Case 3: GTA 6 明年能按時(shí)發(fā)布嗎?



對話鏈接:https://dr.miromind.ai/share/10e5d1fd-c6b6-4b96-a2ed-4b776a3e1dcd

人才招募

MiroMind 面向全球持續(xù)招募人才,簡歷投遞:talent@miromind.ai

產(chǎn)品體驗(yàn)

立即體驗(yàn) MiroMind,免費(fèi)解鎖預(yù)測未來的能力: https://dr.miromind.ai/

  • Discord 頻道(#everything-prediction):https://discord.gg/F7EQFnYscV
  • 微信社群(MiroMind 預(yù)測未來):微信添加小助手 miromind001

  • Hugging Face 模型下載:https://huggingface.co/miromind-ai/MiroThinker-v1.5-235B
  • Github 代碼地址:https://github.com/MiroMindAI/MiroThinker
  • MiroFlow 開源框架:https://github.com/MiroMindAI/MiroFlow

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
日軍為何攻不進(jìn)延安?一位大將透露:在毛主席面前日本人還嫩著呢

日軍為何攻不進(jìn)延安?一位大將透露:在毛主席面前日本人還嫩著呢

老范談史
2025-11-28 23:40:12
全球難度最高的直升機(jī):美國獨(dú)霸技術(shù)60年,神話終于被中國打破

全球難度最高的直升機(jī):美國獨(dú)霸技術(shù)60年,神話終于被中國打破

歷史求知所
2025-11-11 07:55:03
李顯龍說臺(tái)海:新加坡反對武力收臺(tái),一旦爆發(fā)沖突,我們都很麻煩

李顯龍說臺(tái)海:新加坡反對武力收臺(tái),一旦爆發(fā)沖突,我們都很麻煩

青途歷史
2026-01-09 14:38:18
東體:申花的人員調(diào)整還沒有結(jié)束,外援需要做減法

東體:申花的人員調(diào)整還沒有結(jié)束,外援需要做減法

懂球帝
2026-01-09 10:26:41
女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),2015年被親人點(diǎn)到不赴約

漢史趣聞
2025-11-08 09:27:32
中共湖北省委直屬機(jī)關(guān)工委領(lǐng)導(dǎo)班子調(diào)整

中共湖北省委直屬機(jī)關(guān)工委領(lǐng)導(dǎo)班子調(diào)整

王姐懶人家常菜
2026-01-08 15:52:34
對重傷球員施暴!阿森納紅星遭狂噴:可恥逃紅 利物浦全隊(duì)該揍他

對重傷球員施暴!阿森納紅星遭狂噴:可恥逃紅 利物浦全隊(duì)該揍他

我愛英超
2026-01-09 07:51:15
重磅!住房公積金將迎來大改革!

重磅!住房公積金將迎來大改革!

南通樓市說說
2026-01-08 16:36:38
第一批免簽去俄羅斯的中產(chǎn)傻眼了

第一批免簽去俄羅斯的中產(chǎn)傻眼了

風(fēng)向觀察
2025-12-16 18:26:08
釋永信塌房后,被曝為女明星開光,除了李湘外,多名女星被拉下水

釋永信塌房后,被曝為女明星開光,除了李湘外,多名女星被拉下水

阿器談史
2026-01-08 13:16:09
爆雷百億的浙金受害人,開始回款了

爆雷百億的浙金受害人,開始回款了

鳴金網(wǎng)
2026-01-08 18:54:10
1976年毛主席追悼會(huì)后,葉帥密會(huì)許世友,只問了一句話,南京軍區(qū)的指揮權(quán)到底在誰手里?

1976年毛主席追悼會(huì)后,葉帥密會(huì)許世友,只問了一句話,南京軍區(qū)的指揮權(quán)到底在誰手里?

文史明鑒
2026-01-04 18:33:13
女人坐了28年牢,出獄去辦證,民警一查系統(tǒng),當(dāng)場愣了

女人坐了28年牢,出獄去辦證,民警一查系統(tǒng),當(dāng)場愣了

卡西莫多的故事
2025-10-30 11:33:46
馬德興:U23男足還在爬坡中,整個(gè)亞洲都很膠著,0-0可以接受

馬德興:U23男足還在爬坡中,整個(gè)亞洲都很膠著,0-0可以接受

懂球帝
2026-01-09 12:12:14
同樣是20屆選秀,華子解鎖1萬分!三球5419分,馬克西哈利伯頓呢

同樣是20屆選秀,華子解鎖1萬分!三球5419分,馬克西哈利伯頓呢

兵哥籃球故事
2026-01-09 13:49:14
俄交通部確認(rèn)美軍登船 稱與“馬里涅拉號”失去聯(lián)系

俄交通部確認(rèn)美軍登船 稱與“馬里涅拉號”失去聯(lián)系

環(huán)球網(wǎng)資訊
2026-01-07 23:17:39
無緣中超!28歲日本名將加盟延邊 29場造24球助鐵人沖超+曾任隊(duì)長

無緣中超!28歲日本名將加盟延邊 29場造24球助鐵人沖超+曾任隊(duì)長

我愛英超
2026-01-09 10:58:59
我那兄弟娶了個(gè)洋媳婦,天天哀嚎:摟著俄羅斯老婆睡,堪比抱刺猬

我那兄弟娶了個(gè)洋媳婦,天天哀嚎:摟著俄羅斯老婆睡,堪比抱刺猬

前沿天地
2025-12-29 11:22:33
10萬元或能清零癌細(xì)胞?國產(chǎn)新型抗癌技術(shù)獲突破,治什么癌?

10萬元或能清零癌細(xì)胞?國產(chǎn)新型抗癌技術(shù)獲突破,治什么癌?

元爸體育
2026-01-09 12:33:54
不到24小時(shí),中方又對日本命脈下手,高市承認(rèn),中國要來真的了

不到24小時(shí),中方又對日本命脈下手,高市承認(rèn),中國要來真的了

悄悄史話
2026-01-09 01:21:30
2026-01-09 15:52:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12088文章數(shù) 142532關(guān)注度
往期回顧 全部

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

"老板"拉群開口就要150萬 女財(cái)務(wù)付100萬后感覺天塌了

頭條要聞

"老板"拉群開口就要150萬 女財(cái)務(wù)付100萬后感覺天塌了

體育要聞

金元時(shí)代最后的外援,來中國8年了

娛樂要聞

檀健次戀愛風(fēng)波越演越烈 上學(xué)經(jīng)歷被扒

財(cái)經(jīng)要聞

郁亮的萬科35年:從"寶萬之爭"到"活下去"

汽車要聞

英偉達(dá)的野心:做一套自動(dòng)駕駛的“安卓系統(tǒng)”

態(tài)度原創(chuàng)

本地
旅游
親子
家居
公開課

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

旅游要聞

“冷資源”迸發(fā)“熱動(dòng)能” 冰雪季成為經(jīng)濟(jì)增長“黃金季”

親子要聞

爸爸出門回到家,3歲女兒的舉動(dòng)讓人感動(dòng),情緒價(jià)值直接拉滿!

家居要聞

木色留白 演繹現(xiàn)代自由

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版