国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

我用Meta“華人天團(tuán)”打造的新模型,一張圖復(fù)刻了一個(gè)“豆包App”

0
分享至


智東西
作者 陳駿達(dá)
編輯 云鵬

Meta的“牛油果”模型,終于熟了!

智東西4月9日報(bào)道,今天,在成立9個(gè)月后,Meta超級智能實(shí)驗(yàn)室(MSL)發(fā)布了其首款模型Muse Spark(內(nèi)部代號牛油果)。這是一個(gè)原生的多模態(tài)推理模型,支持工具使用、視覺思維鏈和多智能體編排。

在大模型測評平臺Artificial Analysis上,Muse Spark的智能指數(shù)直接從Llama 4 Maverick的18分,跳到了52分,介于Claude Sonnet 4.6和Claude Opus 4.6之間,算是進(jìn)入第一梯隊(duì)了。


我們第一時(shí)間對模型做了體驗(yàn),上傳了一張豆包App的截圖,要求Muse Spark復(fù)刻??梢钥吹組use Spark的回復(fù)風(fēng)格比較口語化,甚至有一股“豆包味兒”,這可能是因?yàn)檫@一模型主要面向C端用戶。


Muse Spark的生成速度很快,效果也不錯(cuò),基本1:1復(fù)刻了豆包的頁面,連圖像都還原了。


Muse Spark還通過了小球彈跳測試。有網(wǎng)友感嘆道,時(shí)隔1年多,Meta終于發(fā)了一款能通過六邊形小球彈跳測試的大模型,這一歷史性時(shí)刻值得記錄。


Muse Spark是ScaleAI創(chuàng)始人、Meta首席AI官汪滔(Alexandr Wang)加入Meta 10個(gè)月后,交出的首份答卷。


這一結(jié)果來的并不容易,此前,在Llama 4遭遇史詩級滑鐵盧后,Meta大刀闊斧地重組了AI團(tuán)隊(duì),唱衰大語言模型的楊立昆也最終離開。

汪滔稱,Meta在過去9個(gè)月從零開始打造AI技術(shù)棧,基礎(chǔ)設(shè)施、架構(gòu)、數(shù)據(jù)管線都是全新的,Muse Spark正是這些努力的成果。

加入Meta的不少華人AI大牛紛紛轉(zhuǎn)發(fā)了這一成果,包括趙晟佳、畢樹超、余家輝、Jason Wei等等。值得一提的是,MSL團(tuán)隊(duì)的華人濃度很高,在轉(zhuǎn)發(fā)新模型的Meta研究員中,從領(lǐng)導(dǎo)到基層員工,許多都是華人。


另據(jù)Top華人科創(chuàng)社的報(bào)道,Meta還迎來了一位新的華人大牛,前螞蟻集團(tuán)RL實(shí)驗(yàn)室首席科學(xué)家吳翼加盟了Meta MSL,直接向Meta副總裁和MSL聯(lián)合負(fù)責(zé)人Nat Friedman匯報(bào)。


Muse Spark是MSL Muse系列模型中的首款,未來還會(huì)有更多該系列模型發(fā)布。目前Muse Spark已開始逐步推送至Meta旗下的應(yīng)用和Meta.ai網(wǎng)頁端,不過仍有用戶反映自己使用的模型仍是Llama 3。


同時(shí),“開源”兩個(gè)字在相關(guān)博客中,一次也未被提及。

體驗(yàn)鏈接:meta.ai

一、多模態(tài)、醫(yī)療健康表現(xiàn)突出,智能體和編程仍是短板

從基準(zhǔn)測試結(jié)果來看,Muse Spark在多模態(tài)感知、推理、醫(yī)療健康和智能體等領(lǐng)域的表現(xiàn)處于行業(yè)第一梯隊(duì)。不過,MSL承認(rèn)這一模型在長程智能體系統(tǒng)和編程工作流方面性能尚有差距。

以下是Muse Spark完整的基準(zhǔn)測試成績。需要注意的是,Meta在這里采用了一些有“圖表詐騙”嫌疑的數(shù)據(jù)呈現(xiàn)方式。乍一看,Muse Spark的所有成績都被標(biāo)藍(lán),似乎全面領(lǐng)先,但實(shí)際上這一模型在圖中的20項(xiàng)基準(zhǔn)測試中,拿到的SOTA數(shù)量為4個(gè)。


在多模態(tài)能力維度,Muse Spark的表現(xiàn)較有競爭力,在美國大模型圈沒有被拉開明顯代差,基本和GPT-5.4處在同一水平線上。Muse Spark的表現(xiàn)也符合其原生多模態(tài)大模型的定位。

作為一款將部署于Meta旗下眾多社交媒體、面向廣大個(gè)人用戶的模型,Muse Spark在用戶高頻關(guān)注的醫(yī)療健康領(lǐng)域同樣沒有掉隊(duì)。在HealthBench Hard與MedXpertQA(多模態(tài))兩項(xiàng)評測中均斬獲SOTA,顯然對此進(jìn)行了重點(diǎn)優(yōu)化。

Muse Spark本次還發(fā)布了“沉思模式(Contemplating mode)”,該模式可協(xié)調(diào)多個(gè)智能體并行推理。這使得Muse Spark能夠與Gemini Deep Think和GPT Pro等前沿模型的極限推理模式相媲美。

開啟“沉思模式”后,Muse Spark在復(fù)雜任務(wù)中的能力得以提升,比如它在HLE“人類最后的考試”基準(zhǔn)測試中,取得了58%的正確率在“前沿科學(xué)研究”基準(zhǔn)測試中取得了38%的正確率。


二、所需算力資源比Llama 4少一個(gè)量級,采用新型強(qiáng)化學(xué)習(xí)技術(shù)棧

跑分之外,這一模型的新定位和背后技術(shù),也值得關(guān)注。

Meta稱,Muse Spark是邁向個(gè)人超級智能的第一步,它能夠理解用戶所處的世界,多模態(tài)能力和醫(yī)療健康就是當(dāng)前的兩個(gè)重點(diǎn)。

Muse Spark從底層架構(gòu)層面,整合了跨領(lǐng)域和工具的視覺信息,在識別、定位方面的能力不錯(cuò)。這些功能結(jié)合起來,可以實(shí)現(xiàn)各種交互式體驗(yàn)。

例如,用戶可以上傳一張游戲畫面截圖,然后讓Muse Spark把它變成一個(gè)能真正互動(dòng)的游戲。


或是告知Muse Spark自己有高膽固醇的問題,并讓Muse Spark基于多模態(tài)能力和醫(yī)療知識,做一個(gè)動(dòng)態(tài)的食物推薦頁面。


Meta在博客中分享的demo也僅僅涉及多模態(tài)和醫(yī)療健康領(lǐng)域,這或許意味著Muse系列模型最終的用途,仍然是服務(wù)于扎克伯格的個(gè)人超級智能愿景,而不是單純地追求智能上限。

在技術(shù)方面,MSL大幅度提升了算力利用率,與之前的模型Llama 4 Maverick相比,Muse Spark用少一個(gè)數(shù)量級以上的計(jì)算資源就能達(dá)到相同的性能。


同時(shí),MSL還在強(qiáng)化學(xué)習(xí)階段采用了新技術(shù)棧,在大規(guī)模強(qiáng)化學(xué)習(xí)中帶來平穩(wěn)、可預(yù)測的性能提升。


三、一手實(shí)測:精準(zhǔn)識別食物熱量,還給Meta AI眼鏡造了個(gè)新品

Muse Spark發(fā)布后,我們進(jìn)行了更多實(shí)測。

Muse Spark的多模態(tài)能力確實(shí)不錯(cuò),我們上傳了一個(gè)啤酒瓶的照片,讓它分析熱量。Muse Spark一眼就看出了啤酒的品牌、大小,甚至連原圖中肉眼都難以分辨的酒精度都準(zhǔn)確識別出來了。


它對于熱量的分析則來自搜索,還把熱量轉(zhuǎn)換成了我們?nèi)粘3缘氖澄?,并給出要消耗這些熱量對應(yīng)的運(yùn)動(dòng)量,是比較實(shí)用的。


我們緊接著讓Muse Spark給Meta的AI眼鏡做一個(gè)宣傳網(wǎng)頁,沒給任何參考??梢钥吹?,在思考過程中Muse Spark主動(dòng)調(diào)用AI生圖模型打造了對應(yīng)的產(chǎn)品圖片,然后編寫完整頁面代碼,整個(gè)過程耗時(shí)2分鐘左右,效果如下:


這一網(wǎng)頁的完成度不錯(cuò),直接給Meta設(shè)計(jì)出了一款搭載Muse Spark的新品AI眼鏡。模型還自夸道,這是一個(gè)旗艦級的官網(wǎng),不是普通的落地頁,是按Apple Vision Pro發(fā)布會(huì)標(biāo)準(zhǔn)做的。

Muse Spark還可用于購物推薦。我們試著讓它搜索一款汽車雨刮器,幾秒鐘就拿到了好幾個(gè)選項(xiàng),并且有對每款產(chǎn)品優(yōu)勢劣勢的分析和最終購買建議。


結(jié)語:牛油果熟了,但Meta的“個(gè)人超級智能”仍需耐心

作為Meta超級智能實(shí)驗(yàn)室的首秀,Muse Spark已經(jīng)展現(xiàn)出躋身第一梯隊(duì)的水準(zhǔn),足夠讓人期待未來的Muse系列后續(xù)產(chǎn)品。

不過,扎克伯格想要的“個(gè)人超級智能”,目前還停留在醫(yī)療健康問答、網(wǎng)頁復(fù)刻、購物推薦這些相對可控的場景里。距離真正改變數(shù)億用戶的交互方式,還有很長的路要走。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
印尼發(fā)生7.6級地震

印尼發(fā)生7.6級地震

海外網(wǎng)
2026-04-02 07:27:02
霍爾木茲海峽開了,又關(guān)了

霍爾木茲海峽開了,又關(guān)了

中國新聞周刊
2026-04-10 18:41:40
江蘇一商場女廁360°無遮擋引熱議,商場回應(yīng):正在施工改造,新隔斷到貨后會(huì)安裝

江蘇一商場女廁360°無遮擋引熱議,商場回應(yīng):正在施工改造,新隔斷到貨后會(huì)安裝

大象新聞
2026-04-10 21:44:09
阿耳忒彌斯2號最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來大考

阿耳忒彌斯2號最終一搏:13分鐘穿越2760℃,時(shí)隔53年月球歸來大考

三體引力波
2026-04-11 01:02:06
如愿以償!鄭麗文終于見到了大陸行最重要的人物!

如愿以償!鄭麗文終于見到了大陸行最重要的人物!

阿龍聊軍事
2026-04-10 18:02:00
鎖定東部第二+大西洋冠軍!綠軍橫掃鵜鶘 29三分追平歷史紀(jì)錄

鎖定東部第二+大西洋冠軍!綠軍橫掃鵜鶘 29三分追平歷史紀(jì)錄

醉臥浮生
2026-04-11 09:51:18
中東迎來關(guān)鍵24小時(shí):伊朗額外提了兩個(gè)條件,特朗普邊談邊增兵

中東迎來關(guān)鍵24小時(shí):伊朗額外提了兩個(gè)條件,特朗普邊談邊增兵

阿芒娛樂說
2026-04-11 09:23:47
高市沒想到,對華關(guān)系降級當(dāng)天,中方反應(yīng)迅速,53條航線全取消

高市沒想到,對華關(guān)系降級當(dāng)天,中方反應(yīng)迅速,53條航線全取消

共工之錨
2026-04-11 00:54:51
鄭麗文大陸第4天:北京頂格接待,中南海保鏢護(hù)送,更多細(xì)節(jié)曝光

鄭麗文大陸第4天:北京頂格接待,中南海保鏢護(hù)送,更多細(xì)節(jié)曝光

影像溫度
2026-04-11 09:20:22
蓄電池生產(chǎn)企業(yè)要求員工體檢前吃排鉛藥“不吃藥不讓上班” 官方確認(rèn)情況屬實(shí)

蓄電池生產(chǎn)企業(yè)要求員工體檢前吃排鉛藥“不吃藥不讓上班” 官方確認(rèn)情況屬實(shí)

閃電新聞
2026-04-10 10:21:21
又有官二代要坑爹?找茬刁難服務(wù)人員,并威脅:你知道我爹是咱們區(qū)的誰嗎?

又有官二代要坑爹?找茬刁難服務(wù)人員,并威脅:你知道我爹是咱們區(qū)的誰嗎?

小蘿卜絲
2026-04-10 18:37:25
8888奔馳陪葬當(dāng)事人已經(jīng)認(rèn)識到錯(cuò)誤,他也確實(shí)非常有錢

8888奔馳陪葬當(dāng)事人已經(jīng)認(rèn)識到錯(cuò)誤,他也確實(shí)非常有錢

映射生活的身影
2026-04-10 19:15:23
伊朗權(quán)貴有三千多親屬在美過奢侈生活,盧比奧正在考慮全部驅(qū)逐

伊朗權(quán)貴有三千多親屬在美過奢侈生活,盧比奧正在考慮全部驅(qū)逐

小院之觀
2026-04-09 21:35:10
鎖定東部第三!尼克斯賽季五殺猛龍 布倫森29分唐斯22+10

鎖定東部第三!尼克斯賽季五殺猛龍 布倫森29分唐斯22+10

醉臥浮生
2026-04-11 10:09:11
比亞迪9分鐘閃充惹眾怒,奇瑞、蔚來等老總為何集體力挺換電?

比亞迪9分鐘閃充惹眾怒,奇瑞、蔚來等老總為何集體力挺換電?

老特有話說
2026-04-08 13:18:01
巴基斯坦被激怒!出動(dòng)大量中械裝備,以色列若膽敢妄動(dòng),一律擊落

巴基斯坦被激怒!出動(dòng)大量中械裝備,以色列若膽敢妄動(dòng),一律擊落

面包夾知識
2026-04-11 00:23:27
文班復(fù)出40+13!馬刺橫掃獨(dú)行俠62勝平隊(duì)史第三 弗拉格33+6

文班復(fù)出40+13!馬刺橫掃獨(dú)行俠62勝平隊(duì)史第三 弗拉格33+6

醉臥浮生
2026-04-11 10:17:19
門店腰斬2萬家!一線撤離、雜牌泛濫,國民快餐巨頭徹底扛不住了

門店腰斬2萬家!一線撤離、雜牌泛濫,國民快餐巨頭徹底扛不住了

毒sir財(cái)經(jīng)
2026-04-09 16:14:36
莫氏雞煲老板:現(xiàn)在想快點(diǎn)死,不想孩子跟著我受苦,對媒體罵臟話

莫氏雞煲老板:現(xiàn)在想快點(diǎn)死,不想孩子跟著我受苦,對媒體罵臟話

北緯的咖啡豆
2026-04-10 19:50:54
全紅嬋后續(xù):四人已被帶走,全網(wǎng)追問群主,陳芋汐確認(rèn)在群里!

全紅嬋后續(xù):四人已被帶走,全網(wǎng)追問群主,陳芋汐確認(rèn)在群里!

眼光很亮
2026-04-10 13:53:56
2026-04-11 10:40:49
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11555文章數(shù) 117026關(guān)注度
往期回顧 全部

科技要聞

阿爾忒彌斯2號成功濺落,隔熱罩驚險(xiǎn)過關(guān)

頭條要聞

牛彈琴:伊朗很悲壯 向美國提高了"要價(jià)"

頭條要聞

牛彈琴:伊朗很悲壯 向美國提高了"要價(jià)"

體育要聞

17歲賺了一百萬美元,25歲被CBA裁員

娛樂要聞

黃景瑜王玉雯否認(rèn)戀情!聚會(huì)細(xì)節(jié)被扒

財(cái)經(jīng)要聞

從日本翻身看:這次誰能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬起

態(tài)度原創(chuàng)

親子
本地
手機(jī)
時(shí)尚
公開課

親子要聞

小朋友們在幼兒園上生活勞動(dòng)課,忙著和面、縫紉、種菜

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

手機(jī)要聞

華為乾崑智駕大賽收官:三人并列第一 獲獎(jiǎng)三折疊手機(jī)

推廣中獎(jiǎng)名單-更新至2026年3月31日推廣

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版