国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Claude全球最強AI模型來了!但普通人別想用,太危險

0
分享至

昨天夜里,Anthropic 最新發(fā)布的 Claude Mythos(神話)預(yù)覽版,又讓整個 AI 圈炸鍋了。

Claude Mythos 預(yù)覽版,官方自稱「迄今為止最強大的 AI 模型」,一個全新能力層級,甚至大幅甩開了之前自家最強的 Claude Opus 4.6。

至少從目前展現(xiàn)出的數(shù)據(jù)和結(jié)果來看,這不是營銷話術(shù),是真正質(zhì)的飛躍。首先在幾乎所有公開基準測試上,Claude Mythos 預(yù)覽版都是第一,更為驚艷的是它的進步幅度:

面向軟件工程的 SWE-bench Verified 從 Opus 4.6 的 80.8% 暴漲到 93.9%,SWE-bench Pro 從 53.4% 沖到 77.8%;面向高難度數(shù)學(xué)推理的 USAMO 2026,更是從從 42.3% 直接飆到 97.6%——幾乎滿分。



圖片來源:Anthropic

可以說是目前的地球最強模型。

這還只是一些「小」例子,更驚艷我們的是,Anthropic 在過去幾周進行了實際測試,Mythos 預(yù)覽版在主流操作系統(tǒng)和主流瀏覽器中自主發(fā)現(xiàn)了數(shù)千個高危零日漏洞(zero-day),包括 Linux 內(nèi)核、OpenBSD、Firefox 瀏覽器、FFmpeg 等核心組件。

很多漏洞連人類安全團隊審了十幾、二十年都沒發(fā)現(xiàn),比如在以安全著稱的 OpenBSD 里,Mythos 預(yù)覽版就找到了一個藏了 27 年沒被發(fā)現(xiàn)的遠程崩潰漏洞。Anthropic 官方甚至很肯定地表示,Mythos 預(yù)覽版在網(wǎng)絡(luò)安全能力上遠超任何其他 AI 模型。

這不是一個「更好用的 Claude」,它寫代碼、做推理、搞安全,全都達到了前所未有的自主性和深度,開發(fā)者們本來期待著「終于能徹底解放生產(chǎn)力了」,但結(jié)果:

Anthropic 直接把門關(guān)上了。

是的,至少目前,Claude Mythos 預(yù)覽版并不對公眾開放。按照官方說法,Mythos 預(yù)覽版目前僅用于「防御性網(wǎng)絡(luò)安全」,并且僅 12 家合作伙伴(AWS、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會、微軟、英偉達、Palo Alto Networks)以及 40 多個構(gòu)建或維護關(guān)鍵軟件基礎(chǔ)設(shè)施的組織,擁有 Mythos 預(yù)覽版的訪問和使用權(quán)限。



圖片來源:Anthropic

這就是 Anthropic 同時推出的 Project Glasswing(玻璃翼計劃)。Anthropic 甚至還砸了 1 億美元的額度,支持 40 多家額外組織使用 Mythos 預(yù)覽版維護開源生態(tài)的「地基」。

但為什么一個「最強模型」要藏著掖著,不給人用?

武器太強,需要過渡

首先是明確的是,Claude Mythos 預(yù)覽版,或者類似水平的超級大模型一定會開放公眾使用。Anthropic 官方寫得非常直白:

「雖然我們目前沒有計劃向公眾開放 Claude Mythos 預(yù)覽版,但我們的最終目標是讓用戶能夠安全地大規(guī)模部署 Mythos 級模型——這不僅是為了網(wǎng)絡(luò)安全,也是為了這些功能強大的模型將帶來的無數(shù)其他好處?!?br/>

就像官方博客字里行間說的,這個模型「太危險」。

去年底,Google Threat Intelligence Group(GTIG)就發(fā)現(xiàn)了 PromptFlux 和 PromptSteal 這兩個真實樣本:它們會在運行時直接連接商業(yè)大模型(比如 Gemini API)時,動態(tài)生成惡意腳本、實時混淆自身代碼,還能根據(jù)目標環(huán)境「現(xiàn)場」創(chuàng)建新功能,完全繞過傳統(tǒng)簽名檢測進行攻擊。

這不是孤例。根據(jù)市場研究機構(gòu) SQmagazine 的報告,全球報道的 AI 驅(qū)動網(wǎng)絡(luò)攻擊數(shù)量增長了 47%,預(yù)計超過 2800 萬起。

回過頭來,Mythos 預(yù)覽版尋找漏洞的能力已經(jīng)初見端倪。尤其對比之前 Claude 最強模型 Opus 4.6 自主發(fā)現(xiàn)并利用漏洞的成功率接近 0%,Mythos 預(yù)覽版的表現(xiàn)可以堪稱逆天。

以 Mozilla Firefox 147 JavaScript 引擎中發(fā)現(xiàn)的漏洞(已修復(fù))為例,Claude Opus 4.6 在利用漏洞上嘗試了數(shù)百次,只成功了 2 次;而 Claude Mythos 預(yù)覽版則在同樣測試中成功利用漏洞 181 次。



圖片來源:Anthropic

另外從測試報告來看,在過去幾周的內(nèi)部紅隊測試里,Mythos 預(yù)覽版展現(xiàn)出的進攻能力,已經(jīng)遠超人類頂尖安全專家。它不只是「能找漏洞」,而是能自主發(fā)現(xiàn)、鏈式利用、數(shù)千個高危零日漏洞。

眾所周知,黑客也分白帽和黑帽,白帽黑客發(fā)現(xiàn)安全漏洞通常會提醒項目管理者,在開源項目中甚至主動修補。但黑帽黑客就不一樣了,他們很可能利用安全漏洞攻擊系統(tǒng)。

既能攻,也能守,但 Mythos 預(yù)覽版的進攻潛力還是大到讓人擔(dān)憂。一旦落入不懷好意的人手里,就能瞬間武裝起 AI 級別的攻擊鏈。Anthropic 自己都說,這不是普通的前沿模型,通用能力已經(jīng)強到能把網(wǎng)絡(luò)戰(zhàn)直接拉到新維度。

而計算機安全領(lǐng)域的攻防戰(zhàn),一向都是「魔高一丈,道高一尺」,過去兩年圍繞 AI 大模型的安全攻防戰(zhàn)也是行業(yè),尤其是大廠關(guān)注的重點之一。遠的不說,國內(nèi)的字節(jié)跳動、螞蟻這兩年都有舉辦類似的 AI 大模型攻防戰(zhàn),通過紅(攻擊方)、藍(防御方)對抗發(fā)現(xiàn)和解決 AI 時代的安全挑戰(zhàn)。



圖片來源:全球 AI 大模型攻防挑戰(zhàn)賽

不過 Anthropic 也指出,長遠來看像 Mythos 預(yù)覽版這樣強大的語言模型,更利于「藍隊」進行防御。但在短期內(nèi),Mythos 預(yù)覽版如果開放公眾使用很快就會被攻擊者利用,用前所未有的效率攻擊現(xiàn)在的全球網(wǎng)絡(luò)。關(guān)鍵問題在于,防御行為更被動,攻擊行為更主動,考慮到利益,攻擊方也更有動力積極使用 Mythos 預(yù)覽版這樣的模型。

所以為了「平穩(wěn)過渡」,Anthropic 推出了「玻璃翼計劃」。

這里額外一提,這個項目名的靈感來自一種廣泛分布在美洲的寬紋黑脈綃蝶,因為透明的翅膀更多被稱為「玻璃翼蝶」,盡管看起來很脆弱,但實際上它們的翅膀可以承載相當于自身體重 40 倍的重量。



玻璃翼蝶,圖片來源:Pixabay

「玻璃翼計劃」的邏輯也很簡單,就是讓防御方先拿到武器,在攻擊方拿到同級別 AI 之前,先把漏洞全堵上,并學(xué)會基于先進 AI 的安全防御。

所以從這個角度來說,Claude 的最強模型,不給人用是對的。但不僅如此,就算從普通 Claude 用戶的角度來看,暫時不開放 Claude Mythos 預(yù)覽版也是利大于弊。

最強模型不開放,Claude 反而更好用?

很多人看到 Mythos 預(yù)覽版不開放,第一反應(yīng)是失望:這么強的模型,為什么不給大家用?

但如果你是普通 Claude 用戶,或者每天靠 Claude Code 寫代碼、做項目的開發(fā)者,你可能會發(fā)現(xiàn)一個有點反直覺的事實,暫時不開放 Mythos 預(yù)覽版,對我們反而利大于弊。

先說說最近大家最有感的痛點。

大概從今年 2 月開始,Claude 和 Claude Code 就迎來了「史詩級性能削弱」。Reddit 的 r/ClaudeCode 和 r/ClaudeAI 里,相關(guān)帖子刷屏,有人直接發(fā)帖《4.6 Regression is real!》,有人吐槽「Claude Code has been dumb over the last 1.5-2 days」。



圖片來源:Reddit

還有開發(fā)者用數(shù)據(jù)追蹤,文件讀取次數(shù)從以前的 6-7 次掉到只剩 2 次左右,復(fù)雜任務(wù)里模型越來越「懶」,思考深度明顯變淺,經(jīng)常直接 edit-first 而不是先調(diào)研。

AMD AI 總監(jiān) Stella Laurenzo 甚至公開說 Claude Code 變得「dumber and lazier」,不能信任它做復(fù)雜工程任務(wù)。

Boris(Claude Code 團隊成員)則在 Hacker News 上回復(fù),承認部分 agentic 用例出現(xiàn)了 regression,核心變化是 2 月引入的 「redact-thinking」 和 Adaptive Thinking,讓模型自己決定思考多久,結(jié)果復(fù)雜任務(wù)的深度下降了大約 67%。



圖片來源:Linkedln

類似的聲音在 X 上也一直有,開發(fā)者抱怨 Claude Code 已經(jīng)退化成了需要全程盯著的「實習(xí)生」。

為什么會出現(xiàn)這種情況?

超大參數(shù)模型訓(xùn)練的規(guī)律擺在這里:每當大廠全力沖刺下一代「最強模型」時,都需要海量算力。Gemini 在推 3.0 / 3.1 前,2.5 Pro 就多次被開發(fā)者吐槽 silent update 后變蠢,長上下文忘記內(nèi)容、邏輯任務(wù)失敗率上升。類似的情況也發(fā)生在 GPT-5 發(fā)布前,4o 就出現(xiàn)過輸出變短、變懶、復(fù)雜指令機械化等「降智」反饋。

算力是有限的,訓(xùn)練 Mythos 這樣全新層級的模型,成本極高,只能從當前「擠」資源,通過動態(tài)負載均衡、自適應(yīng) effort 降低、甚至輕度優(yōu)化等方式,但結(jié)果就是大家感覺到的「變笨、變懶」。

此外,Claude Code 用戶量增長遠超預(yù)期,基礎(chǔ)設(shè)施多次吃緊,而 Mythos 預(yù)覽版(內(nèi)部 Capybara)的訓(xùn)練和測試又要優(yōu)先占用頂級 GPU。所以,當 Mythos 預(yù)覽版發(fā)布卻不開放給公眾時,不用擔(dān)心算力進一步被稀釋,導(dǎo)致 Claude 或者 Claude Code 的質(zhì)量繼續(xù)下滑。

對普通 Claude 用戶來說,體驗反而會更穩(wěn)定。



圖片來源:Anthropic

另一方面,Anthropic 用 Mythos 在「玻璃翼計劃」里幫大廠和開源項目修漏洞,這些漏洞修好后,最終也會間接惠及所有用戶。

而等 Anthropic 把風(fēng)險控制和基礎(chǔ)設(shè)施準備得更充分,再安全地大規(guī)模部署 Mythos 級模型,那時候普通用戶拿到的,才是真正穩(wěn)定、強大、不會三天兩頭「降智」的體驗,而不是現(xiàn)在急著放出來、然后大家一起承受算力擠占的陣痛。

Claude Mythos 預(yù)覽版的出現(xiàn),把一個殘酷卻現(xiàn)實的問題擺在了所有人面前:AI 越強大,風(fēng)險就越真實。

當最強模型的進攻能力已經(jīng)遠超當前防御體系時,Anthropic 選擇「不給人用」,不是保守,而是把時間買給了整個行業(yè),讓防守方先把地基加固,讓普通用戶先擁有相對穩(wěn)定的 Claude 體驗,而不是一起卷入算力擠占和安全失控的混亂。

對大部分來說,這或許就是當下最好的安排。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
美稱獲以色列總理尊重?;鹂陬^承諾

美稱獲以色列總理尊重停火口頭承諾

財聯(lián)社
2026-04-08 10:25:13
中國股市:如果手中有20萬,建議死啃這兩條線,幾乎吃掉所有利潤

中國股市:如果手中有20萬,建議死啃這兩條線,幾乎吃掉所有利潤

股經(jīng)縱橫談
2026-04-08 21:49:55
莫言:你細心觀察一下你的身邊人,凡是動不動就生氣的人,沒有一個是智者,生活多半過得一團糟糕

莫言:你細心觀察一下你的身邊人,凡是動不動就生氣的人,沒有一個是智者,生活多半過得一團糟糕

二胡的歲月如歌
2025-10-21 18:57:28
鄭麗文向全島喊話,必須徹查民進黨,沒想到對大陸露出了狐貍尾巴

鄭麗文向全島喊話,必須徹查民進黨,沒想到對大陸露出了狐貍尾巴

看盡人間百態(tài)
2026-03-10 08:25:05
無視停戰(zhàn)協(xié)議,以色列瘋狂打擊,特朗普罕見失聲,巴總理前后兩難

無視停戰(zhàn)協(xié)議,以色列瘋狂打擊,特朗普罕見失聲,巴總理前后兩難

書紀文譚
2026-04-08 13:45:53
2萬炒到2000萬!“中國第一股民”楊百萬臨終遺言:股市訣竅就4字

2萬炒到2000萬!“中國第一股民”楊百萬臨終遺言:股市訣竅就4字

一方聊市
2026-04-02 19:35:03
北大連夜報喜!1納米芯片繞開光刻機,中國換道超車,西方失算了

北大連夜報喜!1納米芯片繞開光刻機,中國換道超車,西方失算了

豬小艷吖
2026-04-08 13:41:40
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
炸場!半個娛樂圈和頂級富豪都來了,抬頭千萬名畫,低頭億萬身家

炸場!半個娛樂圈和頂級富豪都來了,抬頭千萬名畫,低頭億萬身家

藝能八卦局
2026-03-29 07:09:54
很嚴重!全紅嬋已經(jīng)報警,280人群主放任成員辱罵運動員涉嫌違法

很嚴重!全紅嬋已經(jīng)報警,280人群主放任成員辱罵運動員涉嫌違法

蜜桔娛樂
2026-04-08 15:19:10
超越香農(nóng)芯創(chuàng)!天華新能一季度凈利最高預(yù)增32120%,暫列A股“預(yù)增王”

超越香農(nóng)芯創(chuàng)!天華新能一季度凈利最高預(yù)增32120%,暫列A股“預(yù)增王”

北京商報
2026-04-08 17:41:04
特朗普:我同意暫停對伊朗的轟炸和襲擊行動,為期兩周

特朗普:我同意暫停對伊朗的轟炸和襲擊行動,為期兩周

極目新聞
2026-04-08 07:00:22
解放戰(zhàn)爭最悲壯的一戰(zhàn),一個師全軍覆沒,戰(zhàn)后前線總指揮連降四級

解放戰(zhàn)爭最悲壯的一戰(zhàn),一個師全軍覆沒,戰(zhàn)后前線總指揮連降四級

浩舞默畫
2026-04-07 09:06:55
達里奧撰文警告:世界大戰(zhàn)正在“醞釀”中,美伊戰(zhàn)爭只是其中之一!

達里奧撰文警告:世界大戰(zhàn)正在“醞釀”中,美伊戰(zhàn)爭只是其中之一!

財聯(lián)社
2026-04-08 15:24:12
1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

1998年數(shù)萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

哄動一時啊
2026-02-17 22:21:25
1977年,李敏見到失散多年的親姐楊月花,楊月花卻向李敏提一要求

1977年,李敏見到失散多年的親姐楊月花,楊月花卻向李敏提一要求

磊子講史
2025-12-23 20:04:20
此人屠殺百萬民眾,卻被專家吹捧為千古完人、民族英雄,實在可笑

此人屠殺百萬民眾,卻被專家吹捧為千古完人、民族英雄,實在可笑

長風(fēng)文史
2026-04-07 20:53:07
伊朗革命衛(wèi)隊前指揮官蘇萊曼尼親屬在美隱秘生活:車內(nèi)堆滿奢侈品

伊朗革命衛(wèi)隊前指揮官蘇萊曼尼親屬在美隱秘生活:車內(nèi)堆滿奢侈品

梁濆愛玩車
2026-04-06 09:09:52
以色列仍在打擊伊朗導(dǎo)彈發(fā)射設(shè)施

以色列仍在打擊伊朗導(dǎo)彈發(fā)射設(shè)施

新京報
2026-04-08 09:39:18
榮耀官宣與張雪機車戰(zhàn)略合作!張雪發(fā)聲感謝

榮耀官宣與張雪機車戰(zhàn)略合作!張雪發(fā)聲感謝

小南看車
2026-04-08 21:20:38
2026-04-09 00:47:00
雷科技 incentive-icons
雷科技
專注AI硬科技
36768文章數(shù) 812001關(guān)注度
往期回顧 全部

科技要聞

造出地表最強AI,卻死活不給你用!

頭條要聞

央視披露:78億變1億 河南三地現(xiàn)巨額數(shù)據(jù)造假

頭條要聞

央視披露:78億變1億 河南三地現(xiàn)巨額數(shù)據(jù)造假

體育要聞

40歲,但實力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財經(jīng)要聞

天津海河乳業(yè)回應(yīng)直播間涉黃

汽車要聞

20萬級滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

房產(chǎn)
教育
手機
時尚
旅游

房產(chǎn)要聞

正式動工!珠城馬場地塊,簽約華爾道夫!

教育要聞

今日出版丨《教育文摘周報》2026年第14期轉(zhuǎn)載稿源目錄

手機要聞

蘋果折疊屏或命名iPhone Ultra,屏幕由三星獨供,仍計劃九月發(fā)布

50歲,我媽在戀綜搶男人

旅游要聞

三大花海已浪漫盛放!來這里“花”點時間!

無障礙瀏覽 進入關(guān)懷版