国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Meta 143億挖角后首個作品來了:Alexandr Wang 推出閉源模型,楊立坤點贊

0
分享至


作者|冬梅

Alexandr Wang 帶隊,

Meta 新模型深夜來襲

沉寂了 9 個月后,這位讓扎克伯克花了 143 億美元挖來的天才少年 Alexandr Wang 終于交出了首個作品。


昨夜,Meta 正式發(fā)布新一代模型 Muse Spark,代號 Avocado,就是外界傳了很久的“牛油果”。這是其內(nèi)部 AI 組織Meta Superintelligence Labs在戰(zhàn)略重組后的首個落地產(chǎn)品,也被視為這家科技巨頭邁向“個人超級智能”路線圖的起點。



Alexandr Wang 甚至激動地在 X 上連發(fā)九條推文介紹該模型。

與此前側(cè)重語言能力的模型不同,Muse Spark 從一開始就被定義為“原生多模態(tài)推理模型”。它不僅能夠處理文本,還能理解圖像、環(huán)境信息,并在此基礎(chǔ)上進(jìn)行推理、調(diào)用工具,甚至與其他智能體協(xié)同完成復(fù)雜任務(wù)。

這種能力組合,意味著 Meta 正試圖將 AI 從“對話工具”升級為“行動系統(tǒng)”。

Muse Spark 的發(fā)布,并非一次單點技術(shù)升級,而更像是 Meta AI 戰(zhàn)略的一次整體轉(zhuǎn)向。

過去一年,Meta 在 AI 領(lǐng)域經(jīng)歷了明顯的路徑調(diào)整。從開源導(dǎo)向的 Llama 系列,到如今強調(diào)“超級智能”的閉環(huán)系統(tǒng)能力,核心變化在于:不再單純追求模型能力本身,而是強調(diào)“模型 + 工具 + 環(huán)境 + 多智能體”的系統(tǒng)級協(xié)同。

Muse Spark 正是這一思路的首個成型產(chǎn)品。

官方披露,為支撐這一方向,Meta 正在對整個技術(shù)棧進(jìn)行重構(gòu),包括模型訓(xùn)練、數(shù)據(jù)管理以及底層基礎(chǔ)設(shè)施。其中,名為Hyperion的新一代數(shù)據(jù)中心被明確點名,成為未來大規(guī)模模型擴展的關(guān)鍵支撐。

性能媲美 Gemini Pro 和 GPT 5.4

在能力層面,Muse Spark 的核心突破集中在“多模態(tài)推理”。

Meta 在官方博客中表示:“在過去的九個月里,我們徹底重建了人工智能堆棧,速度比以往任何開發(fā)周期都要快。這個初始模型的設(shè)計初衷就是體積小、速度快,但卻足以應(yīng)對科學(xué)、數(shù)學(xué)和健康領(lǐng)域的復(fù)雜問題。這是一個強大的基礎(chǔ),下一代模型已經(jīng)在開發(fā)中?!?/p>


據(jù)介紹,Meta 還發(fā)布了“思考模式”,該模式可協(xié)調(diào)多個智能體并行推理。這使得 Muse Spark 能夠與 Gemini Deep Think 和 GPT Pro 等前沿模型的極限推理模式相媲美。“思考模式”顯著提升了 Muse Spark 在挑戰(zhàn)性任務(wù)中的能力,在“人類最后的考試”任務(wù)中取得了 58% 的完成率,在“前沿科學(xué)研究”任務(wù)中取得了 38% 的完成率。


不同于傳統(tǒng)視覺模型僅能識別圖像內(nèi)容,Muse Spark 被設(shè)計為能夠?qū)⒁曈X信息與推理過程深度融合。例如,在 STEM 問題、物體識別與空間定位等場景中,它不僅能“看見”,還能“理解并推導(dǎo)”。

這種能力使其可以直接參與實際任務(wù)。例如:

  • 通過攝像頭分析家電狀態(tài),并用動態(tài)標(biāo)注輔助用戶排查故障

  • 根據(jù)視覺輸入生成互動內(nèi)容,如小游戲或教學(xué)演示

  • 在復(fù)雜環(huán)境中進(jìn)行實時決策輔助

更關(guān)鍵的是,Muse Spark 支持“可視化思維鏈”(visual chain-of-thought),即將推理過程以可視形式呈現(xiàn)。這一設(shè)計不僅提升了可解釋性,也為復(fù)雜任務(wù)的人機協(xié)作提供了新的交互范式。

Meta 此次特別強調(diào)了 Muse Spark 在健康領(lǐng)域的應(yīng)用潛力。

據(jù)介紹,Meta 與超過 1000 名醫(yī)生合作構(gòu)建訓(xùn)練數(shù)據(jù),使模型在健康推理上具備更高的專業(yè)性與可靠性?;谶@一能力,Muse Spark 可以生成帶交互界面的分析結(jié)果,例如:

  • 食物營養(yǎng)結(jié)構(gòu)的可視化拆解

  • 運動過程中肌肉激活情況的動態(tài)展示

  • 個性化飲食建議(結(jié)合用戶健康狀況)

這類能力的本質(zhì),是將 AI 從“信息提供者”升級為“決策輔助系統(tǒng)”。

在技術(shù)層面,Meta 把另一個重點放在“擴展效率”上。

官方披露,在過去九個月中,團(tuán)隊重構(gòu)了預(yù)訓(xùn)練體系,包括模型架構(gòu)、優(yōu)化方法和數(shù)據(jù)管理流程。結(jié)果是:在達(dá)到相同性能的前提下,Muse Spark 所需的訓(xùn)練計算量(FLOPs)相比上一代模型(如 Llama 4 Maverick)下降了一個數(shù)量級以上。

這一結(jié)果具有明確的行業(yè)意義。

過去兩年,大模型競爭很大程度上依賴“堆算力”。而 Meta 此次強調(diào)的,是通過工程優(yōu)化提升“單位算力產(chǎn)出”。換句話說,其試圖證明:性能增長不必完全依賴指數(shù)級資源投入。

提示:你能把它轉(zhuǎn)換成一個我可以在網(wǎng)上玩的數(shù)獨游戲嗎?

技術(shù)實現(xiàn)細(xì)節(jié)完整披露

在官方技術(shù)博客中,Meta 詳細(xì)介紹了他們?nèi)绾螐娜齻€維度研究和追蹤 Muse Spark 的擴展特性:預(yù)訓(xùn)練、強化學(xué)習(xí)和測試時推理。

預(yù)訓(xùn)練。在預(yù)訓(xùn)練階段,Muse Spark 獲得其核心的多模態(tài)理解、推理和編碼能力——這是強化學(xué)習(xí)和測試時計算的基礎(chǔ)。

Meta 重構(gòu)了預(yù)訓(xùn)練堆棧,改進(jìn)了模型架構(gòu)、優(yōu)化和數(shù)據(jù)管理。這些改進(jìn)共同提升了其利用每一單位計算資源所能達(dá)到的性能。為了嚴(yán)格評估新方案,Meta 研發(fā)團(tuán)隊對一系列小型模型擬合了一個擴展定律,并比較了達(dá)到特定性能水平所需的訓(xùn)練浮點運算次數(shù)(FLOPs)。結(jié)果顯而易見:與之前的模型 Llama 4 Maverick 相比,他們用少一個數(shù)量級以上的計算資源就能達(dá)到相同的性能。這一改進(jìn)也使得 Muse Spark 比目前可供比較的領(lǐng)先基礎(chǔ)模型效率更高。


強化學(xué)習(xí)。經(jīng)過預(yù)訓(xùn)練后,強化學(xué)習(xí) (RL) 利用計算能力可擴展地提升模型性能。盡管大規(guī)模強化學(xué)習(xí)歷來容易出現(xiàn)不穩(wěn)定,但 Meta 的新技術(shù)棧能夠帶來平穩(wěn)、可預(yù)測的性能提升。

下圖展示了擴展 Muse Spark 的強化學(xué)習(xí) (RL) 計算能力(以步數(shù)衡量)所帶來的益處。左圖顯示,在訓(xùn)練數(shù)據(jù)上,pass@1 和 pass@16(16 次嘗試中至少成功一次)的數(shù)值呈對數(shù)線性增長。這表明強化學(xué)習(xí)在不影響推理多樣性的前提下提高了模型的可靠性。右圖顯示,在預(yù)留的評估集上準(zhǔn)確率的增長表明,強化學(xué)習(xí)帶來的收益具有可預(yù)測的泛化能力:Muse Spark 在訓(xùn)練中未遇到的任務(wù)上也表現(xiàn)良好。


測試時推理。強化學(xué)習(xí)訓(xùn)練模型在回答問題前進(jìn)行“思考”——這一過程被稱為測試時推理。要讓數(shù)十億用戶擁有這種能力,就需要高效利用推理令牌。為此,研發(fā)團(tuán)隊依靠兩個關(guān)鍵手段:一是思考時間懲罰,用于優(yōu)化 token 使用;二是多智能體編排,用于在不降低響應(yīng)速度的前提下提升性能。

為了在每個 token 上實現(xiàn)最高的智能水平,強化學(xué)習(xí)訓(xùn)練在增加思考時間的前提下,最大化正確率。在諸如 AIME 等部分評估任務(wù)中,這會導(dǎo)致階段性轉(zhuǎn)變。在初始階段,模型通過延長思考時間來提升性能;之后,思考時間的懲罰會促使模型進(jìn)行思維壓縮——Muse Spark 會壓縮其推理過程,從而使用更少的 token 解決問題。壓縮之后,模型會再次擴展其解決方案,以獲得更強的性能。

為了在不顯著增加延遲的情況下,將更多時間用于測試時的推理,可以擴展協(xié)作解決難題的并行智能體的數(shù)量。下圖展示了這種方法的優(yōu)勢。標(biāo)準(zhǔn)的測試時擴展方法會使單個智能體思考更長時間,而采用多智能體思維的 Muse Spark 擴展方法則可以在保持相當(dāng)延遲的情況下實現(xiàn)更高的性能。


在安全層面,Meta 表示已在部署前對Muse Spark進(jìn)行系統(tǒng)性評估,依據(jù)其更新后的“高級人工智能擴展框架”(Advanced AI Scaling Framework),對威脅模型、評估流程及上線標(biāo)準(zhǔn)進(jìn)行了統(tǒng)一規(guī)范。

評估重點覆蓋前沿風(fēng)險(如生物與化學(xué)領(lǐng)域)、行為一致性以及對抗魯棒性,并在安全措施實施前后進(jìn)行對比測試。結(jié)果顯示,Muse Spark 在涉及高風(fēng)險內(nèi)容時表現(xiàn)出明顯的拒絕傾向,這主要得益于數(shù)據(jù)過濾、后訓(xùn)練安全對齊及系統(tǒng)級防護(hù)的多層機制。

Meta 同時指出,在網(wǎng)絡(luò)攻擊或“失控”場景中,當(dāng)前模型尚不具備執(zhí)行復(fù)雜威脅任務(wù)的自主能力。整體來看,Muse Spark 在已評估的風(fēng)險范圍內(nèi)處于可控水平,更多細(xì)節(jié)將于后續(xù)《安全與準(zhǔn)備報告》中披露。


網(wǎng)友:模型強不強不知道,

但閉源讓人失望

Muse Spark 的發(fā)布在技術(shù)社區(qū)引發(fā)了巨大反響,Stability AI 創(chuàng)始人 Emad Mostaque 及 Meta 前首席科學(xué)家 Yann LeCun、Coinbase 聯(lián)創(chuàng)兼 CEO Brian Armstrong 等大佬紛紛在 x 上向 Alexandr Wang 和 Meta 表示祝賀。


另一方面,普通網(wǎng)友和部分開發(fā)者則聚焦于實際應(yīng)用層面相關(guān)問題展開了爭論。

有網(wǎng)友表示,該模型在排行榜上的表現(xiàn)令人印象深刻,但好奇 Meta 是否也會在智能體編碼領(lǐng)域展開競爭?


還有網(wǎng)友表示,新模型的多代理編排部分很有意思,Muse Spark 能原生處理這個問題,是一個真正的突破。他寫道:“我一直在單體倉庫的不同模塊上運行并行的 Claude Code 代理,協(xié)調(diào)開銷非常大。如果 Muse Spark 能原生處理這個問題,對于大型代碼庫的復(fù)雜重構(gòu)來說,這將是一個真正的突破。”


有網(wǎng)友認(rèn)為,Meta 能在短時間內(nèi)構(gòu)建出性能如此強大的模型,為以后的基礎(chǔ)設(shè)施建設(shè)打下了堅實基礎(chǔ)。他評論:

“從零開始重建了整個堆棧,計算能力比 Maverick 低 10 倍,性能卻與之匹敵。這 9 個月的基礎(chǔ)設(shè)施建設(shè)工作構(gòu)成了制勝的護(hù)城河?!?/blockquote>


還有網(wǎng)友將 Meta 的新模型與 Opus 4.5 進(jìn)行了對比,認(rèn)為“牛油果”表現(xiàn)遜色于 Opus 4.5。


值得注意的是,Meta 此次發(fā)布的新模型走的是閉源路線,與此前一直主張的開源模型完全相反,這樣一些 x 用戶感到失望。


也有網(wǎng)友認(rèn)為,Meta 這次之所以將模型閉源,是因為此前的一系列開源沒有為股東創(chuàng)造足夠價值。


邁向“個人超級智能”,

仍有很長的路要走

盡管 Meta 將 Muse Spark 定義為“個人超級智能”的起點,但其也明確承認(rèn),目前仍存在明顯短板。尤其是在兩個關(guān)鍵領(lǐng)域:

  • 長時程智能體(long-horizon agents)

  • 編碼與復(fù)雜工作流

這意味著,雖然模型已經(jīng)具備多模態(tài)與推理能力,但在持續(xù)執(zhí)行復(fù)雜任務(wù)、長鏈條決策等方面,仍未達(dá)到真正“代理人級別”的能力。

此外,雖然 Meta 利用生成式 AI 的進(jìn)步以及自身在該技術(shù)領(lǐng)域的投資來增強其廣告業(yè)務(wù)并提高公司整體效率,但它尚未在大模型市場取得顯著突破,而其在該領(lǐng)域的主要競爭對手已經(jīng)遙遙領(lǐng)先。

OpenAI 和 Anthropic 的估值總和現(xiàn)已超過 1 萬億美元,谷歌的 Gemini 技術(shù)和服務(wù)也獲得了廣泛認(rèn)可,尤其是在消費市場。

據(jù) Grand View Research 稱,全球生成式人工智能市場預(yù)計將以每年 40% 以上的速度增長,從 2025 年的約 220 億美元增長到 2033 年的近 3250 億美元,因此,該市場前景十分廣闊。


與此同時,Meta 正在加大對人工智能基礎(chǔ)設(shè)施的投入,力圖趕上其他超大規(guī)模數(shù)據(jù)中心運營商。Meta 在其最新財報中表示,其 2026 年與人工智能相關(guān)的資本支出將在 1150 億美元至 1350 億美元之間,幾乎是去年的兩倍。

Meta 公司也在嘗試一種新的 AI 模型盈利模式,即通過 API 向第三方開發(fā)者提供 Muse Spark 底層技術(shù)的訪問權(quán)限。Meta 公司表示,目前只有部分“特邀合作伙伴”可以訪問該 AI 模型的“私有 API 預(yù)覽版”,但計劃在未來某個時候向更廣泛的用戶群體提供付費 API 訪問權(quán)限。

Meta 公司表示,其全新模型 Muse Spark 目前已應(yīng)用于公司獨立的 Meta AI 應(yīng)用程序和桌面網(wǎng)站中的數(shù)字助理功能。該公司還表示,Muse Spark 將在未來幾周內(nèi)率先登陸 Facebook、Instagram、WhatsApp 和 Messenger,以及公司與 Ray-Ban 合作推出的 Meta AI 眼鏡。

Meta 還計劃最終讓 Muse Spark 為 Meta AI 應(yīng)用程序中的 Vibes AI 視頻功能提供支持。Meta 指出,該服務(wù)目前使用的是來自 Black Forest Labs 等第三方公司的 AI 模型。

Meta 表示:“購物模式借鑒了我們應(yīng)用程序中已有的造型靈感和品牌故事,展現(xiàn)了創(chuàng)作者和人們已經(jīng)關(guān)注的社群的創(chuàng)意。”

https://ai.meta.com/blog/introducing-muse-spark-msl/

https://www.cnbc.com/2026/04/08/meta-debuts-first-major-ai-model-since-14-billion-deal-to-bring-in-alexandr-wang.html

聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

QCon 全球軟件開發(fā)大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動、小米、百度等一線科技企業(yè)與創(chuàng)新團(tuán)隊的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進(jìn)展開深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進(jìn)行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
把瑜伽褲穿成日常的松弛感美女

把瑜伽褲穿成日常的松弛感美女

只要高興就好
2026-04-13 14:30:30
44歲前國腳9年前突發(fā)腦溢血,透露近況,每天學(xué)走路努力康復(fù)

44歲前國腳9年前突發(fā)腦溢血,透露近況,每天學(xué)走路努力康復(fù)

米修體育
2026-05-06 23:59:56
誰把女游客推下了懸崖?

誰把女游客推下了懸崖?

賓語觀世
2026-05-06 20:10:49
美國國務(wù)卿魯比奧就臺灣問題表態(tài)。

美國國務(wù)卿魯比奧就臺灣問題表態(tài)。

荊楚寰宇文樞
2026-05-06 23:24:47
吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說錯話

吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進(jìn)店小心翼翼的怕說錯話

另子維愛讀史
2026-02-27 20:31:34
浙江義烏一女神,169cm身高清麗出塵,貌美如花,傾國傾城。

浙江義烏一女神,169cm身高清麗出塵,貌美如花,傾國傾城。

小椰的奶奶
2026-05-07 11:12:43
上海內(nèi)環(huán)舊改大局已定!真正有動遷機會的就這幾片

上海內(nèi)環(huán)舊改大局已定!真正有動遷機會的就這幾片

科學(xué)發(fā)掘
2026-05-07 10:58:12
馬克龍說已向伊朗提議法英牽頭霍爾木茲海峽護(hù)航行動

馬克龍說已向伊朗提議法英牽頭霍爾木茲海峽護(hù)航行動

新華社
2026-05-07 10:42:05
5月7日1/4決賽:國乒晉級八強,男隊力爭復(fù)仇韓國!王楚欽不容易

5月7日1/4決賽:國乒晉級八強,男隊力爭復(fù)仇韓國!王楚欽不容易

開成運動會
2026-05-06 23:44:31
隨著拜仁5-6出局,歐冠最新奪冠賠率出爐:英超領(lǐng)頭羊第一

隨著拜仁5-6出局,歐冠最新奪冠賠率出爐:英超領(lǐng)頭羊第一

側(cè)身凌空斬
2026-05-07 05:12:02
FIFA急瘋了!2000萬美元打發(fā)叫花子?許多國家和中國一樣不買單了

FIFA急瘋了!2000萬美元打發(fā)叫花子?許多國家和中國一樣不買單了

春序娛樂
2026-05-07 04:52:17
媽媽帶3歲兒子送外賣不幸遭遇車禍,孩子滿臉傷痕不哭不鬧一直守在身旁,網(wǎng)友:這一刻他就是媽媽的“守護(hù)天使”

媽媽帶3歲兒子送外賣不幸遭遇車禍,孩子滿臉傷痕不哭不鬧一直守在身旁,網(wǎng)友:這一刻他就是媽媽的“守護(hù)天使”

洪觀新聞
2026-05-06 11:24:50
太寒心!鹽城龍鳳胎事件,孩子早產(chǎn),老公把彩禮8.8萬驟降至3.8萬

太寒心!鹽城龍鳳胎事件,孩子早產(chǎn),老公把彩禮8.8萬驟降至3.8萬

魔都姐姐雜談
2026-05-06 13:19:53
五星體育:東南亞多國同樣未官宣世界杯版權(quán);FIFA需重新審視市場

五星體育:東南亞多國同樣未官宣世界杯版權(quán);FIFA需重新審視市場

懂球帝
2026-05-06 23:17:40
高市這一跪,“里外不是人”!

高市這一跪,“里外不是人”!

國是直通車
2026-05-06 17:38:18
素人時期的Angelababy,我是星探我也第一個發(fā)現(xiàn)她

素人時期的Angelababy,我是星探我也第一個發(fā)現(xiàn)她

可樂談情感
2026-05-07 00:31:49
故事:湖南一爺爺照顧小孫女,父親發(fā)現(xiàn)女兒越來越圓潤,誤會弒父

故事:湖南一爺爺照顧小孫女,父親發(fā)現(xiàn)女兒越來越圓潤,誤會弒父

卡西莫多的故事
2025-02-26 22:18:16
海參崴軍裝鬧劇再評:誰在借“紅軍符號”操弄歷史?幕后黑手必須現(xiàn)形!

海參崴軍裝鬧劇再評:誰在借“紅軍符號”操弄歷史?幕后黑手必須現(xiàn)形!

土家鐵拳
2026-05-06 12:19:38
謝娜演唱會這一夜,半個娛樂圈捧場,網(wǎng)友直呼票價不值,吃相難看

謝娜演唱會這一夜,半個娛樂圈捧場,網(wǎng)友直呼票價不值,吃相難看

青梅侃史啊
2026-05-07 07:28:32
安徽宿州一燒烤店主為捐髓救人停業(yè)13天,重新營業(yè)后生意火爆,市委書記帶隊“擼串”捧場,店主:書記自掏腰包,消費300多元

安徽宿州一燒烤店主為捐髓救人停業(yè)13天,重新營業(yè)后生意火爆,市委書記帶隊“擼串”捧場,店主:書記自掏腰包,消費300多元

農(nóng)視網(wǎng)
2026-05-06 15:52:21
2026-05-07 13:12:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1476文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!馬斯克租22萬塊GPU給“死敵”

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

頭條要聞

北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

體育要聞

阿森納巴黎會師歐冠決賽!5月31日開戰(zhàn)

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業(yè)照

財經(jīng)要聞

特朗普:美伊“很有可能”達(dá)成協(xié)議

汽車要聞

理想為什么不做轎車,有了解釋……

態(tài)度原創(chuàng)

親子
健康
房產(chǎn)
數(shù)碼
軍事航空

親子要聞

大家好呀,我是優(yōu)奈!四個月啦

干細(xì)胞治燒燙傷面臨這些“瓶頸”

房產(chǎn)要聞

五一海南樓市,太淡了!

數(shù)碼要聞

三星筆記本版Exynos 2800芯片曝光:1.4nm十核CPU

軍事要聞

特朗普:美伊"很可能"達(dá)成協(xié)議

無障礙瀏覽 進(jìn)入關(guān)懷版