国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

扎克伯格重開一局

0
分享至

文 | 強(qiáng)調(diào)Next

這是過去一年里Meta最需要一個(gè)好消息的時(shí)刻。Llama4的基準(zhǔn)造假丑聞讓開發(fā)者社區(qū)徹底寒了心,旗艦項(xiàng)目Behemoth遲遲沒有下文,與此同時(shí)OpenAI、Anthropic和Google的軍備競(jìng)賽越打越猛。

扎克伯格今天把Muse Spark推到了臺(tái)前。

這是Meta超級(jí)智能實(shí)驗(yàn)室(MSL)交出的第一份答卷,也是汪韜(Alexandr Wang)加入Meta九個(gè)月后,第一次向外界證明這筆143億美元的賭注沒有白下。發(fā)布當(dāng)日,Meta股價(jià)盤中最高漲超10%,收漲約9%,市場(chǎng)給出了它想看到的那個(gè)答案。

一、九個(gè)月,從廢墟里蓋起來

要理解Muse Spark,先得理解它是怎么來的。

去年夏天,Llama4的基準(zhǔn)測(cè)試被抓了現(xiàn)行:Meta承認(rèn)拿了針對(duì)特定任務(wù)微調(diào)的專用版本去刷分,普通用戶能用到的那個(gè),跟公布的數(shù)據(jù)壓根對(duì)不上。這件事對(duì)Meta AI的品牌傷害不小,但更深的問題在于,就算沒有造假,Llama4也沒能在前沿模型序列里站穩(wěn)腳跟。

扎克伯格再次推倒重來。

他找來了時(shí)年29歲的Scale AI聯(lián)合創(chuàng)始人汪韜,花143億美元買下Scale AI 49%的非投票股權(quán),把汪韜塞進(jìn)Meta首席AI官的位置,同時(shí)成立Meta超級(jí)智能實(shí)驗(yàn)室,從OpenAI、Anthropic、Google高薪挖人,據(jù)報(bào)道部分研究員的薪酬包含股權(quán)在內(nèi)達(dá)到數(shù)億美元。

然后是整整九個(gè)月的沉默。

汪韜在X上寫道:“九個(gè)月前,我們從零開始重建了AI技術(shù)棧。新的基礎(chǔ)設(shè)施、新的架構(gòu)、新的數(shù)據(jù)流水線?!辈皇窃谠谢A(chǔ)上打補(bǔ)丁,是字面意義上的重頭來過。


結(jié)果就是Muse Spark。內(nèi)部代號(hào)Avocado,是Meta新Muse系列的首個(gè)型號(hào),定位輕量、快速,但具備完整的推理能力。

二、“思維壓縮”:效率才是真正的護(hù)城河

Muse Spark最讓人意外的數(shù)字,不是某個(gè)基準(zhǔn)測(cè)試的排名,而是計(jì)算效率。

Meta聲稱,Muse Spark達(dá)到Llama4 Maverick同等性能水平所需的計(jì)算量,減少了十倍以上。背后是一種叫做“思維壓縮(Thought Compression)”的訓(xùn)練技術(shù):在強(qiáng)化學(xué)習(xí)階段,對(duì)模型過度思考的行為施加懲罰,迫使它用更少的推理token解決同樣的問題,同時(shí)不犧牲準(zhǔn)確率。


這件事的戰(zhàn)略意義比表面看起來大得多。

AI軍備競(jìng)賽進(jìn)入2026年,算力成本依然是最核心的約束之一。Meta今年的AI基礎(chǔ)設(shè)施支出上限調(diào)至1350億美元,比上年幾乎翻倍。但光砸錢不夠,燒得更高效才是差異點(diǎn)。如果十分之一的計(jì)算量能跑出同等智力水平,那意味著同樣的預(yù)算可以跑更多次實(shí)驗(yàn)、迭代更多代模型。

從這個(gè)角度看,“思維壓縮”不只是一個(gè)技術(shù)細(xì)節(jié),它意味著這套新架構(gòu)是可以規(guī)?;摹?/p>

三、偏科的“視覺天才”

評(píng)估一個(gè)新模型,先看它的長(zhǎng)板和短板分別在哪里。Muse Spark的性格相當(dāng)鮮明。

長(zhǎng)板:多模態(tài)與健康

第三方機(jī)構(gòu)Artificial Analysis的獨(dú)立評(píng)測(cè),給Muse Spark打出了52分(滿分參照系中),在Intelligence Indexv 4.0排名第四,位列Gemini3.1 Pro(57)、GPT-5.4(57)和Claude Opus4.6(53)之后。

但在具體科目上,Muse Spark的多模態(tài)能力是真實(shí)的強(qiáng)項(xiàng)。視覺理解(MMMU-Pro)排名第二,得80.5,僅次于Gemini 3.1 Pro的82.4。圖表推理(CharXiv Reasoning)得86.4,力壓Gemini的80.2和GPT-5.4的82.8,全場(chǎng)第一。

Health Bench Hard上,Muse Spark拿了42.8,超過GPT-5.4的40.1,把Gemini 3.1 Pro的20.6甩開一大截。Meta號(hào)稱與超過1000名醫(yī)生合作,專門為健康場(chǎng)景定制了訓(xùn)練數(shù)據(jù)。


短板:邏輯推理與代碼

然后是短板,同樣明顯。

ARCAGI 2(抽象推理):Muse Spark得42.5,而Gemini 3.1 Pro得76.5,GPT-5.4得76.1。差距將近一倍,這個(gè)分布不像是追分的問題,更像是架構(gòu)層面的結(jié)構(gòu)性缺口。

終端編程(Terminal-Bench2.0):Muse Spark得59.0,GPT-5.4是75.1,Gemini是68.5。Meta自己的技術(shù)博客里也直接承認(rèn),“長(zhǎng)程agentic系統(tǒng)和代碼工作流”是當(dāng)前的重點(diǎn)投入方向。

三級(jí)推理模式

模型提供三種模式:Instant(即時(shí))、Thinking(思考)、Contemplating(沉思)。Contemplating模式最有意思——它并行啟動(dòng)多個(gè)子智能體,分頭處理任務(wù)再綜合結(jié)論。Meta宣稱在這個(gè)模式下,HLE(人類最后考試)得分達(dá)到58%,F(xiàn)rontier Science Research達(dá)到38%,能跟Gemini DeepThink和GPT Pro在同一個(gè)場(chǎng)上競(jìng)爭(zhēng)。


值得一提的是,Muse Spark的token效率也很出色。在Intelligence Index測(cè)評(píng)中使用了約5800萬輸出token,與Gemini 3.1 Pro相當(dāng),遠(yuǎn)低于Claude Opus4.6的1.57億。

四、深水炸彈:這對(duì) DeepSeek 意味著什么?

Muse Spark 走向閉源,不僅是 Meta 的轉(zhuǎn)型,更是全球 AI 生態(tài)的一次大洗牌。首當(dāng)其沖的,就是一直以“開源高效率”著稱的 DeepSeek。

DeepSeek 此前憑借極致的算力利用率在開源界封神,但 Muse Spark 提出的“思維壓縮”直接在閉源側(cè)把效率拉到了新高度。如果閉源模型不僅智力更強(qiáng),連推理成本都下探到開源模型的水平,DeepSeek 這種“平替”的性價(jià)比優(yōu)勢(shì)將被大幅削弱。

當(dāng)然,Meta 撤出開源,意味著開源界失去了一根定海神針。這給 DeepSeek 留下了巨大的市場(chǎng)空間去接管那些“被背叛”的開發(fā)者,但同時(shí)也讓 DeepSeek 陷入了孤軍奮戰(zhàn)。沒有了 Llama 作為行業(yè)標(biāo)準(zhǔn),DeepSeek 必須獨(dú)自面對(duì)閉源巨頭們更厚的技術(shù)壁壘。

不過,汪韜主導(dǎo)的這次重建,在多模態(tài)融合和推理效率上的思路,與 DeepSeek 追求的方向高度重合。這意味著接下來的競(jìng)賽將不再是“開源 vs 閉源”的意識(shí)形態(tài)之爭(zhēng),而是純粹的、關(guān)于“誰能用更少的卡跑出更強(qiáng)的智力”的終極對(duì)決。

五、最大的新聞:開源時(shí)代結(jié)束了

從2023年開始,Llama系列是硅谷“開源AI”的精神圖騰。開發(fā)者靠Llama做了無數(shù)應(yīng)用,學(xué)術(shù)界用它做研究,初創(chuàng)公司用它起家,甚至競(jìng)爭(zhēng)對(duì)手也拿它作為參照系。Meta在這件事上賺到的品牌資產(chǎn),是其AI業(yè)務(wù)最重要的護(hù)城河之一。

Muse Spark放棄了這個(gè)護(hù)城河。

官方說法很溫和:“我們希望未來版本能夠開源?!钡珱]有時(shí)間表,沒有承諾,沒有框架。當(dāng)下這個(gè)版本,只能通過MetaAI應(yīng)用、meta.ai網(wǎng)站使用,部分合作伙伴可以申請(qǐng)API私測(cè)資格。架構(gòu)和權(quán)重不公開。

這是徹底的閉源。

從商業(yè)邏輯上不難理解。Meta今年AI基礎(chǔ)設(shè)施支出上限1350億美元,這個(gè)數(shù)字需要收入來支撐,單靠開源的生態(tài)聲望顯然不夠用。當(dāng)競(jìng)爭(zhēng)對(duì)手的每一代模型都在拉開能力差距時(shí),把最先進(jìn)的架構(gòu)創(chuàng)新保持私密,是避免自己的研發(fā)成果直接養(yǎng)肥對(duì)手的理性選擇。

但從開發(fā)者社區(qū)的視角,這是一次背叛。Llama之所以有價(jià)值,恰恰因?yàn)樗梢员幌螺d、被修改、被本地部署。Muse Spark做不到這些。開發(fā)者失去的不只是一個(gè)可用的模型,而是一整套建立在Meta開放性信譽(yù)上的工作流。

汪韜在X上說得很直白:“這是第一步,更大的模型已經(jīng)在開發(fā)中?!毖韵轮?,Muse Spark只是Muse系列的起點(diǎn),后面的Muse才是真正的重頭戲。這個(gè)表述在技術(shù)上可能是真的,但對(duì)那些已經(jīng)依賴Llama生態(tài)的開發(fā)者來說,這個(gè)“未來的承諾”能不能兌現(xiàn)不好說。

六、扎克伯格真正在下的那盤棋

把Muse Spark放在產(chǎn)品層面看,它有點(diǎn)像今天的字節(jié)。

個(gè)人超級(jí)智能,這是扎克伯格在Facebook帖子里用的詞。Muse Spark將直接驅(qū)動(dòng)Facebook、Instagram、WhatsApp、Messenger上的MetaAI助手,以及Ray-BanMetaAI眼鏡。超過35億人的觸點(diǎn),這是OpenAI和Anthropic沒有的分發(fā)優(yōu)勢(shì)。

購物模式最能說明問題。MetaAI識(shí)別用戶在Instagram上看到的穿搭或家具,結(jié)合用戶的興趣數(shù)據(jù)和行為信號(hào),直接推薦商品并完成購買。這不只是個(gè)好用的功能,這是Meta的社交圖譜和用戶數(shù)據(jù),第一次被系統(tǒng)性地接入AI推理鏈條。

健康場(chǎng)景的布局同樣值得注意。與1000名醫(yī)生合作定制訓(xùn)練數(shù)據(jù),這是Meta試圖在醫(yī)療健康信息領(lǐng)域占據(jù)位置的明確信號(hào)。這個(gè)場(chǎng)景的黏性高、用戶需求真實(shí),但同時(shí)也意味著隱私風(fēng)險(xiǎn)極高——用戶需要用Facebook或Instagram賬號(hào)登錄才能使用Muse Spark,而Meta的隱私政策對(duì)于如何使用這些健康查詢數(shù)據(jù),措辭相當(dāng)模糊。

從競(jìng)爭(zhēng)格局來看,Muse Spark的發(fā)布時(shí)機(jī)很有意思。就在前一天,Anthropic剛剛公布了Claude Mythos,初始僅向少數(shù)企業(yè)客戶開放,重點(diǎn)指向網(wǎng)絡(luò)安全防御。中國(guó)的Z.AI本周也在代碼基準(zhǔn)SWE-BenchPro上刷了新高。前沿AI的戰(zhàn)線越來越寬,入局的玩家越來越多。

在這個(gè)背景下,Muse Spark想做的事,是把Meta重新釘回頂層牌桌——不一定是最強(qiáng),但得夠格參與對(duì)話。

七、Llama4的幽靈還在

最后還有一個(gè)問題,沒有人能假裝忘掉Llama 4的基準(zhǔn)造假。

那次事件之后,Meta對(duì)所有自己公布的測(cè)試數(shù)據(jù)都欠下了一筆信譽(yù)債。Muse Spark發(fā)布時(shí)附上了大量基準(zhǔn)數(shù)字,Artificial Analysis也拿到了早期測(cè)試資格并獨(dú)立評(píng)測(cè)。

但這個(gè)問題始終存在,你怎么知道這次是真實(shí)的?

Muse Spark的Contemplating模式,是所有用戶都能用到的那個(gè),還是又是一個(gè)專為基準(zhǔn)測(cè)試微調(diào)的特供版本?

Meta說Contemplating模式會(huì)“逐步推出”,這個(gè)措辭留了太多解釋空間。

結(jié)語

Muse Spark是一張入場(chǎng)券,不是終點(diǎn)。

它證明汪韜主導(dǎo)的九個(gè)月重建是有產(chǎn)出的,證明”思維壓縮”這個(gè)新技術(shù)能跑出比Llama4 Maverick高得多的效率,也證明Meta在多模態(tài)和健康領(lǐng)域找到了真實(shí)的差異化空間。

但它同時(shí)也是一個(gè)信號(hào):Meta放棄了它在AI領(lǐng)域最獨(dú)特的定位。Llama時(shí)代,Meta是那個(gè)把尖端模型免費(fèi)開放給所有人的硅谷巨頭,這件事讓它在開發(fā)者心中的地位跟OpenAI和Anthropic完全不同?,F(xiàn)在這個(gè)定位沒了。

接下來Muse系列會(huì)涌出更強(qiáng)大的模型。更大的基建,更多的工程師,更高的算力密度。扎克伯格說得很清楚,這場(chǎng)賭局還在中場(chǎng)。

但有一件事已經(jīng)確定:開源的Meta,結(jié)束了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
張雪公布自己設(shè)計(jì)的跨界踏板車設(shè)計(jì)圖,最新回應(yīng):正在制作踏板摩托,這款踏板偏運(yùn)動(dòng)越野風(fēng)格,售價(jià)可能比傳統(tǒng)的貴一點(diǎn)

張雪公布自己設(shè)計(jì)的跨界踏板車設(shè)計(jì)圖,最新回應(yīng):正在制作踏板摩托,這款踏板偏運(yùn)動(dòng)越野風(fēng)格,售價(jià)可能比傳統(tǒng)的貴一點(diǎn)

魯中晨報(bào)
2026-04-07 17:13:05
伊朗軍方發(fā)言人稱擊落敵方一架先進(jìn)戰(zhàn)斗機(jī)

伊朗軍方發(fā)言人稱擊落敵方一架先進(jìn)戰(zhàn)斗機(jī)

財(cái)聯(lián)社
2026-04-09 14:01:11
陳麗華長(zhǎng)子身份曝光:北大畢業(yè),31歲成為富華掌舵人

陳麗華長(zhǎng)子身份曝光:北大畢業(yè),31歲成為富華掌舵人

李橑在北漂
2026-04-09 11:48:49
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
只差1場(chǎng):文班亞馬的肋骨,與NBA最荒誕的規(guī)則

只差1場(chǎng):文班亞馬的肋骨,與NBA最荒誕的規(guī)則

茅塞盾開本尊
2026-04-09 12:42:15
安徽6歲童遇害案:兇手殘忍程度超乎想象

安徽6歲童遇害案:兇手殘忍程度超乎想象

李侽在北漂
2026-04-09 00:53:33
14.2萬富豪大遷徙:他們用腳投票,資本流向告訴你未來20年去哪

14.2萬富豪大遷徙:他們用腳投票,資本流向告訴你未來20年去哪

蘇格拉高
2026-04-08 07:40:00
大風(fēng)+雷電!目前申城“一黃一藍(lán)”雙預(yù)警高掛

大風(fēng)+雷電!目前申城“一黃一藍(lán)”雙預(yù)警高掛

上觀新聞
2026-04-09 12:20:13
彭偉國(guó):33歲退役,坐寶馬開酒樓,財(cái)富自由,每天在約球和找美食

彭偉國(guó):33歲退役,坐寶馬開酒樓,財(cái)富自由,每天在約球和找美食

白面書誏
2026-04-08 13:59:47
為什么全國(guó)有這么多“交大”?一木生四枝,百載共芳華

為什么全國(guó)有這么多“交大”?一木生四枝,百載共芳華

上觀新聞
2026-04-08 18:40:05
別走錯(cuò)!深圳地鐵最新公告:這里臨時(shí)關(guān)閉!

別走錯(cuò)!深圳地鐵最新公告:這里臨時(shí)關(guān)閉!

深圳晚報(bào)
2026-04-09 18:49:33
俄媒這句話直接封神,“只有把中國(guó)惹急了,世界才會(huì)安靜?!?>
    </a>
        <h3>
      <a href=俄媒這句話直接封神,“只有把中國(guó)惹急了,世界才會(huì)安靜。” 流史歲月
2026-04-09 13:55:03
廣東男籃新大外援基本確定,崔永熙被用成工具人,黃明依有意離隊(duì)

廣東男籃新大外援基本確定,崔永熙被用成工具人,黃明依有意離隊(duì)

中國(guó)籃壇快訊
2026-04-09 17:28:18
陳麗華告別儀式于北京八寶山殯儀館舉辦,六小齡童、馬德華、白巖松等人到場(chǎng)悼念;馬德華:遲重瑞心里很難過,希望他節(jié)哀

陳麗華告別儀式于北京八寶山殯儀館舉辦,六小齡童、馬德華、白巖松等人到場(chǎng)悼念;馬德華:遲重瑞心里很難過,希望他節(jié)哀

大象新聞
2026-04-09 11:45:05
“祖先給的特權(quán)”,河南網(wǎng)友稱祖墳在景區(qū)祭祖免票,景區(qū)回應(yīng):沒過檢票口,一般是附近住戶的祖墳

“祖先給的特權(quán)”,河南網(wǎng)友稱祖墳在景區(qū)祭祖免票,景區(qū)回應(yīng):沒過檢票口,一般是附近住戶的祖墳

大風(fēng)新聞
2026-04-06 15:06:12
WTT太原賽爆冷!中日6場(chǎng)對(duì)決,日本冠軍被逆轉(zhuǎn),溫瑞博硬剛強(qiáng)敵

WTT太原賽爆冷!中日6場(chǎng)對(duì)決,日本冠軍被逆轉(zhuǎn),溫瑞博硬剛強(qiáng)敵

八斗小先生
2026-04-09 16:59:12
“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

“留學(xué)回來,15次相親失敗”,杭州女孩被拆穿:連繁殖能力都沒有

千言娛樂記
2026-04-09 09:17:50
“副縣長(zhǎng)蘇某飛被舉報(bào)出軌致孕”最新進(jìn)展:已免職降級(jí)調(diào)往鄉(xiāng)鎮(zhèn),女方發(fā)聲:要求他當(dāng)面道歉

“副縣長(zhǎng)蘇某飛被舉報(bào)出軌致孕”最新進(jìn)展:已免職降級(jí)調(diào)往鄉(xiāng)鎮(zhèn),女方發(fā)聲:要求他當(dāng)面道歉

極目新聞
2026-04-09 10:05:25
日本醫(yī)院發(fā)聲明致歉!中國(guó)籍女護(hù)士或?qū)⒚媾R巨額賠償,這事千萬別干!

日本醫(yī)院發(fā)聲明致歉!中國(guó)籍女護(hù)士或?qū)⒚媾R巨額賠償,這事千萬別干!

東京在線
2026-04-08 20:35:54
三位唐僧現(xiàn)狀:一位已是大學(xué)教授,一位已是富豪,只有他混的最慘

三位唐僧現(xiàn)狀:一位已是大學(xué)教授,一位已是富豪,只有他混的最慘

青橘罐頭
2026-04-08 17:11:46
2026-04-09 19:27:00
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
131986文章數(shù) 862078關(guān)注度
往期回顧 全部

科技要聞

Meta凌晨首發(fā)閉源大模型 扎克伯格又行了?

頭條要聞

一群人闖進(jìn)女子剛買的新房砸了兩面墻 物業(yè)稱出于好心

頭條要聞

一群人闖進(jìn)女子剛買的新房砸了兩面墻 物業(yè)稱出于好心

體育要聞

8萬人面前心臟驟停 現(xiàn)在他還站在球場(chǎng)上

娛樂要聞

金莎官宣結(jié)婚 與老公孫丞瀟相差18歲

財(cái)經(jīng)要聞

?;鹗兹?,霍爾木茲僅有4艘船通過

汽車要聞

文飛的回歸 給神行者帶來什么?

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
數(shù)碼
家居
本地

ED網(wǎng)紅病,正在掏空年輕女性

藝術(shù)要聞

龐茂琨 2026油畫寫生新作

數(shù)碼要聞

技嘉Z890 AORUS TACHYON DUO X ICE上線:八層板,10400MT/s

家居要聞

清新自然 復(fù)古風(fēng)尚

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

無障礙瀏覽 進(jìn)入關(guān)懷版