国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

能力太強(qiáng),Mythos被Anthropic“凍結(jié)”

0
分享至


出品|虎嗅科技組

作者|趙致格

編輯|苗正卿

頭圖|視覺中國(guó)

4月8日,關(guān)注AI圈動(dòng)態(tài)的極客們收到了一個(gè)好消息和一個(gè)壞消息。好消息是Anthropic那個(gè)被傳得神乎其神的新模型Claude Mythos終于發(fā)布了預(yù)覽版,而各種公開的數(shù)據(jù)也顯示出Mythos確實(shí)全方面碾壓了Opus4.6。

但壞消息是,因?yàn)橄嚓P(guān)防護(hù)機(jī)制尚未成熟,Mythos當(dāng)前不對(duì)公眾開放,Anthropic還為其定制了一個(gè)安全項(xiàng)目玻璃墻計(jì)劃(Project Glasswing)。根據(jù)這一安全項(xiàng)目,僅有12家機(jī)構(gòu)能訪問Mythos。與此同時(shí),Anthropic還承諾提供最高1億美元的模型使用額度,用于防御性網(wǎng)絡(luò)安全研究。


過去一段時(shí)間,關(guān)于Mythos的傳聞一直在滿天飛。早在3月26日,Anthropic的一個(gè)內(nèi)容管理系統(tǒng)出現(xiàn)了錯(cuò)誤,曝光了一篇還沒有正式發(fā)布的草稿。這篇草稿稱Mythos是“史上最強(qiáng)大的模型”。

X上同樣有人爆料稱,某家實(shí)驗(yàn)室完成了迄今為止最大的一次成功訓(xùn)練,而新模型的表現(xiàn)遠(yuǎn)遠(yuǎn)超過內(nèi)部預(yù)期,也超過了大家根據(jù)模型縮放定律(scaling law)能預(yù)測(cè)的水平。


雖然普通人無(wú)法親自體會(huì)這個(gè)傳說(shuō)中的又一次“GPT時(shí)刻”,但Anthropic公布的一系列數(shù)據(jù)確實(shí)顯示出Mythos 強(qiáng)得可怕。

在專業(yè)漏洞復(fù)現(xiàn)測(cè)試CyberGym上,Mythos的得分是83.1%,而此前Anthropic 的最強(qiáng)模型Opus4.6的分?jǐn)?shù)是66.6%。


在編程能力方面,Mythos在SWE-bench Pro、Terminal-Bench 2.0、SWE-bench Multimodal (internal implementation)、SWE-bench Multilingual、SWE-bench Verified中的測(cè)試分?jǐn)?shù)均顯著高于Opus4.6。Anthropic稱,新模型的能力已經(jīng)達(dá)到“可以與最頂尖人類安全專家競(jìng)爭(zhēng)”的水平。

在考驗(yàn)計(jì)算機(jī)操作能力的BrowseComp和OSWorld-Verified 測(cè)試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。


Mythos不僅是在編程能力上表現(xiàn)強(qiáng)悍。在研究生水平科學(xué)問答測(cè)試(GPQA Diamond)測(cè)試中,Mythos以94.6%的分?jǐn)?shù)超過Opus4.6的91.3%;在Humanity‘s Last Exam的有工具和無(wú)工具測(cè)試中,Mythos 56.8%和64.7%的分?jǐn)?shù)均超過Opus4.6十個(gè)百分點(diǎn)。

在考驗(yàn)計(jì)算機(jī)操作能力的BrowseComp和OSWorld-Verified 測(cè)試中,Mythos取得了86.9%和79.6%的高分并超過了Opus4.6。

不過,上述維護(hù)的優(yōu)異表現(xiàn)并不是Anthropic不敢上線Mythos的原因。Mythos真正的可怕之處在它突破軟件安全防線的能力太強(qiáng)了。

理論上,所有軟件都可能會(huì)有漏洞,但是Mythos在發(fā)現(xiàn)并攻擊漏洞上的能力遠(yuǎn)超人類水平。根據(jù)Anthropic的博文介紹,Mythos已經(jīng)在在操作系統(tǒng)、網(wǎng)絡(luò)瀏覽器和其他軟件中發(fā)現(xiàn)了“幾千個(gè)”重大漏洞,其中包括OpenBSD中一個(gè)存在27年的錯(cuò)誤,以及FFmpeg中一個(gè)存在16年、在自動(dòng)測(cè)試工具運(yùn)行500萬(wàn)次后仍未被檢測(cè)到的漏洞。

可以說(shuō),全世界所有的軟件和系統(tǒng)在Mythos面前都顯得漏洞百出,脆弱不堪。假如Mythos的能力在當(dāng)下被黑客掌握,無(wú)疑會(huì)有無(wú)數(shù)數(shù)字基礎(chǔ)設(shè)施會(huì)遭殃。

Anthropic的CEO達(dá)里奧·阿莫迪(Dario Amodei)Mythos發(fā)布的同時(shí)也在X上表達(dá)了自己的擔(dān)憂和信心。他表示:“網(wǎng)絡(luò)安全是前沿AI模型帶來(lái)的首個(gè)明確且現(xiàn)實(shí)的危險(xiǎn),但絕不會(huì)是最后一個(gè)。若我們能共同迎接挑戰(zhàn)、應(yīng)對(duì)這一風(fēng)險(xiǎn),這或?qū)⒊蔀橐环菟{(lán)圖,用以解決未來(lái)更為艱巨的挑戰(zhàn)?!?/p>

達(dá)里奧隨后又進(jìn)一步解釋:“一旦應(yīng)對(duì)失誤,其危險(xiǎn)顯而易見;但倘若應(yīng)對(duì)得當(dāng),我們將真正迎來(lái)機(jī)遇:建造一個(gè)比AI網(wǎng)絡(luò)安全能力出現(xiàn)之前更加安全的互聯(lián)網(wǎng)與世界?!?/p>


面對(duì)AI發(fā)展帶來(lái)的危險(xiǎn)和機(jī)遇,Anthropic 提出的應(yīng)對(duì)方法是發(fā)起玻璃翼計(jì)劃(Project Glasswing)。這個(gè)項(xiàng)目將向特定組織開放其未公開發(fā)布的通用AI模型“Claude Mythos預(yù)覽版”,用于防御性網(wǎng)絡(luò)安全工作。12個(gè)合作伙伴包括亞馬遜、微軟、蘋果、谷歌、英偉達(dá)、CrowdStrike和Palo Alto Networks等科技與網(wǎng)絡(luò)安全公司。


這12家公司覆蓋了云計(jì)算、瀏覽器、芯片、金融基礎(chǔ)設(shè)施、操作系統(tǒng)等各個(gè)領(lǐng)域的巨頭??梢哉f(shuō),全球數(shù)字基礎(chǔ)設(shè)施的核心參與者都在其中了。而這些參與者將作為防守方搶先一步用上頂級(jí)的AI模型,補(bǔ)上現(xiàn)有的系統(tǒng)漏洞。

一直以來(lái),Anthropic都被認(rèn)為是最重視安全的AI的科技公司,不過與之伴隨的也有不少爭(zhēng)議,很多人認(rèn)為Anthropic只是說(shuō)說(shuō)漂亮話,真實(shí)目的是想通過提升AI安全標(biāo)準(zhǔn)來(lái)提升中小公司的入場(chǎng)門檻。

但就此次的玻璃翼計(jì)劃(Project Glasswing)而言,Anthropic的行動(dòng)無(wú)疑是值得人們贊許的。在研發(fā)出了最強(qiáng)模型后,Anthropic沒有將它第一時(shí)間推向市場(chǎng)謀取最大曝光,而是先讓全球信息基礎(chǔ)設(shè)施來(lái)完善自己,為全球軟件安全筑起新一代屏障,也為為未來(lái)高風(fēng)險(xiǎn) AI 治理提供了可復(fù)制的藍(lán)圖。

本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4848866.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人氣斷層第一!立場(chǎng)問題被投訴?曾沛慈退出《浪姐7》沖熱搜第一

人氣斷層第一!立場(chǎng)問題被投訴?曾沛慈退出《浪姐7》沖熱搜第一

小邵說(shuō)劇
2026-04-11 20:34:42
人民幣大幅升值,全球資本正在加速涌入中國(guó)

人民幣大幅升值,全球資本正在加速涌入中國(guó)

楓冷慕詩(shī)
2026-04-11 12:05:06
太突然!知名品牌宣布:停止運(yùn)營(yíng)、全部退款!網(wǎng)友唏噓:用了十幾年啊,舍不得

太突然!知名品牌宣布:停止運(yùn)營(yíng)、全部退款!網(wǎng)友唏噓:用了十幾年啊,舍不得

環(huán)球網(wǎng)資訊
2026-04-10 16:52:28
【特稿】承諾多兌現(xiàn)少 “和平委員會(huì)”被曝囊中羞澀

【特稿】承諾多兌現(xiàn)少 “和平委員會(huì)”被曝囊中羞澀

新華社
2026-04-11 15:48:19
U20女足重返世青賽!四連勝晉級(jí)四強(qiáng),隊(duì)史第一次,破8年魔咒

U20女足重返世青賽!四連勝晉級(jí)四強(qiáng),隊(duì)史第一次,破8年魔咒

奧拜爾
2026-04-11 22:54:33
馬杜羅被綁97天,委內(nèi)瑞拉人沖向總統(tǒng)府!特朗普這次真的麻煩大了

馬杜羅被綁97天,委內(nèi)瑞拉人沖向總統(tǒng)府!特朗普這次真的麻煩大了

易昂楊
2026-04-11 16:39:08
突然“爆雷”!600423,或被*ST

突然“爆雷”!600423,或被*ST

中國(guó)基金報(bào)
2026-04-11 17:24:27
伊朗最高領(lǐng)袖被曝已毀容?或失去一條腿!已成以色列最害怕的人

伊朗最高領(lǐng)袖被曝已毀容?或失去一條腿!已成以色列最害怕的人

丁丁鯉史紀(jì)
2026-04-11 23:55:04
越南已被逼入絕境,總理臨卸任死磕中國(guó),賭上國(guó)運(yùn)也要換掉米軌

越南已被逼入絕境,總理臨卸任死磕中國(guó),賭上國(guó)運(yùn)也要換掉米軌

丁丁鯉史紀(jì)
2026-04-12 00:12:11
吊射絕殺!韓鵬完成救贖,泰山險(xiǎn)勝!1大中超俊才:徐陽(yáng)高度褒獎(jiǎng)

吊射絕殺!韓鵬完成救贖,泰山險(xiǎn)勝!1大中超俊才:徐陽(yáng)高度褒獎(jiǎng)

話體壇
2026-04-11 22:13:14
福建一市公安局,4位干部職務(wù)調(diào)整

福建一市公安局,4位干部職務(wù)調(diào)整

新浪財(cái)經(jīng)
2026-04-11 19:46:24
新華社快訊:伊朗稱已迫使美軍驅(qū)逐艦從霍爾木茲海峽返航

新華社快訊:伊朗稱已迫使美軍驅(qū)逐艦從霍爾木茲海峽返航

新華社
2026-04-11 21:23:02
實(shí)話實(shí)說(shuō),今年斯諾克世錦賽,中國(guó)只有三人有望奪冠,沒有丁俊暉

實(shí)話實(shí)說(shuō),今年斯諾克世錦賽,中國(guó)只有三人有望奪冠,沒有丁俊暉

老高說(shuō)體育
2026-04-11 10:32:38
張家界“愛國(guó)賊事件”:傻X式愛國(guó),是個(gè)巨大禍害

張家界“愛國(guó)賊事件”:傻X式愛國(guó),是個(gè)巨大禍害

麥大人
2025-10-13 15:29:56
老鷹后衛(wèi)麥科勒姆談大勝騎士:哈登足夠出色&結(jié)果對(duì)彼此意義不同

老鷹后衛(wèi)麥科勒姆談大勝騎士:哈登足夠出色&結(jié)果對(duì)彼此意義不同

體育一點(diǎn)就通
2026-04-12 00:26:00
中紀(jì)委:禁止機(jī)關(guān)事業(yè)單位在編職工去做這幾種副業(yè)!

中紀(jì)委:禁止機(jī)關(guān)事業(yè)單位在編職工去做這幾種副業(yè)!

細(xì)說(shuō)職場(chǎng)
2026-04-09 15:34:47
賴清德收到了“參會(huì)通知”,一看身份欄那行標(biāo)注當(dāng)場(chǎng)破防:不去!

賴清德收到了“參會(huì)通知”,一看身份欄那行標(biāo)注當(dāng)場(chǎng)破防:不去!

時(shí)尚的弄潮
2026-04-11 20:23:00
一年虧損四千萬(wàn),全國(guó)陷“關(guān)停潮”,曾經(jīng)的金飯碗如今正慘遭拋棄

一年虧損四千萬(wàn),全國(guó)陷“關(guān)停潮”,曾經(jīng)的金飯碗如今正慘遭拋棄

忠于法紀(jì)
2026-04-06 15:10:31
上海這些房子賣爆了....

上海這些房子賣爆了....

新浪財(cái)經(jīng)
2026-04-11 10:42:45
30分鐘直撲東北!美國(guó)派48架F-35兵臨城下,解放軍:敢動(dòng)就全殲!

30分鐘直撲東北!美國(guó)派48架F-35兵臨城下,解放軍:敢動(dòng)就全殲!

起喜電影
2026-04-11 18:54:16
2026-04-12 01:19:00
虎嗅APP incentive-icons
虎嗅APP
個(gè)性化商業(yè)資訊與觀點(diǎn)交流平臺(tái)
26084文章數(shù) 687670關(guān)注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

頭條要聞

霍爾木茲海峽突傳大消息 特朗普最新發(fā)聲

體育要聞

換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

娛樂要聞

鄭鈞回應(yīng)兒子走路:會(huì)監(jiān)督他挺直腰板

財(cái)經(jīng)要聞

從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

汽車要聞

煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

態(tài)度原創(chuàng)

親子
教育
房產(chǎn)
本地
公開課

親子要聞

擁有超絕性價(jià)比的一套家居服,唯一的缺點(diǎn)就是預(yù)售,我等了一個(gè)禮拜才發(fā)貨。 楊雪呀

教育要聞

留學(xué)為什么不香了?

房產(chǎn)要聞

土地供應(yīng)突然暴跌!2026??跇鞘校窬执笞?!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版