国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI 強(qiáng)到這一步了?發(fā)布上線,但不敢讓普通人用

0
分享至

我覺(jué)得,人類(lèi)或許正在以一種超出常規(guī)認(rèn)知的速度在被 AI 追趕。

不知道你們的現(xiàn)狀是怎樣的,至少我現(xiàn)在已經(jīng)完全離不開(kāi) AI 了,我每天的工作中至少有 50% 是 AI 輔助完成的。

而且,這個(gè)比例還在持續(xù)提升。

與此同時(shí),隨著一代又一代新模型的推出,不管是我的工作效率和質(zhì)量,還是我在 Token 上的每月消費(fèi),都在快速增長(zhǎng)。

昨晚我看了個(gè)消息,Anthropic 發(fā)布了一個(gè)連他們自己都不敢公開(kāi)給所有人使用的模型,因?yàn)檎娴奶珡?qiáng)了。

這個(gè)新模型的名字叫「Mythos」,翻譯成中文就是「神話」的意思。

目前是預(yù)覽版,所以官方叫它「Mythos Preview」。不過(guò),這次是以一個(gè)叫「Project Glasswing」的項(xiàng)目形式推出的。

關(guān)于這個(gè)項(xiàng)目,我后面會(huì)講。


上個(gè)月,Anthropic 一份內(nèi)部文檔意外泄露,里面提到有一個(gè)比 Opus 更大、更強(qiáng)的模型正在開(kāi)發(fā),代號(hào)就是 Mythos。

隨后,Anthropic 把這次泄露歸因于「人為錯(cuò)誤」,也沒(méi)有進(jìn)一步說(shuō)明理由。

現(xiàn)在,這個(gè)代號(hào)是 Mythos 的模型算是正式官宣了。

官宣歸官宣,但它并沒(méi)有公開(kāi)發(fā)布上線。也就是說(shuō),普通用戶還不能使用。

原因很直接,Anthropic 覺(jué)得這個(gè)模型太強(qiáng)了,在安全機(jī)制到位之前不適合向所有人開(kāi)放。

我覺(jué)得,這句話值得停下來(lái)想一秒。

通常,一家 AI 公司發(fā)布新模型巴不得第一時(shí)間上線搶占市場(chǎng),但這次 Anthropic 的做法明顯有點(diǎn)反常。

在我看來(lái),不是他們不想發(fā),而是不敢發(fā)。

因?yàn)?,這個(gè)叫 Mythos 的模型的確很強(qiáng)大。

先看幾個(gè)官方公布的測(cè)試數(shù)據(jù)。

在編碼能力上,Mythos 和目前公開(kāi)最強(qiáng)的 Claude Opus 4.6 之間的差距不小,在各項(xiàng)基準(zhǔn)測(cè)試中,Mythos 基本是完勝 Opus 4.6。


推理能力上,在 GPQA Diamond(研究生水平科學(xué)問(wèn)答)測(cè)試中,結(jié)果是 94.6% vs 91.3%,Mythos 勝。

在 Humanity's Last Exam 有工具和無(wú)工具測(cè)試中,也都是 Mythos 完勝。


跟 Agent 有關(guān)的計(jì)算機(jī)操作能力上,OSWorld-Verified(自主完成電腦任務(wù)),Mythos 以 79.6% 超過(guò) Oputs 4.6 的 72.7%。

每一個(gè)維度上,Mythos 都強(qiáng)于 Opus 4.6,有些甚至是碾壓式超過(guò)。


在一些任務(wù)表現(xiàn)上,差距已經(jīng)不是小步迭代,而是大幅躍升。比如 SWE-bench Multimodal 從 27.1% 跳到 59%,幾乎翻了一倍。

讓他們不敢上線 Mythos 的一個(gè)最核心原因,就是它突破軟件世界的安全防線能力太強(qiáng)了。

說(shuō)白了,全世界所有的系統(tǒng)和軟件都有漏洞,而 Mythos 可以用超過(guò)人類(lèi)的水平發(fā)現(xiàn)并攻擊這些漏洞。

假設(shè),這種能力被黑客掌握,那全世界的操作系統(tǒng)和軟件都會(huì)遭殃,尤其是一些公共基礎(chǔ)設(shè)施和國(guó)家安全。

Anthropic 在公告里有這么一句話,看完后我覺(jué)得細(xì)思極恐。


翻譯過(guò)來(lái)就是:「 AI 模型的編碼能力已經(jīng)達(dá)到了極高水平,在發(fā)現(xiàn)和利用軟件漏洞方面,它們幾乎可以超越除最熟練的人類(lèi)之外的所有人」。

關(guān)于這句話,我想多展開(kāi)一下。

我是程序員出身,所以我知道軟件的構(gòu)建方式是怎樣的,以及不同人寫(xiě)出來(lái)的代碼差異有多大。

還有,沒(méi)有哪個(gè)軟件敢說(shuō)自己沒(méi)有漏斗,即便這個(gè)漏洞從來(lái)沒(méi)被發(fā)現(xiàn)過(guò)。

以前的漏洞之所以能幾十年安靜地躺在系統(tǒng)里,并不是因?yàn)橄到y(tǒng)足夠安全。

而是因?yàn)檎衣┒催@件事,需要極高的專(zhuān)業(yè)能力,極大的耐心和精力,以及大量的時(shí)間。

會(huì)的人太少,敢投入的人就更少了。

這種「能力稀缺」,構(gòu)成了整個(gè)軟件安全世界的隱性前提。AI 介入之后,這個(gè)前提就開(kāi)始松動(dòng)了。

AI 能以超過(guò)大多數(shù)非頂尖人類(lèi)能力的方式開(kāi)展工作,我們可以用它來(lái)攻擊漏洞,當(dāng)然也可以用它來(lái)堵住漏洞。

為了解決這個(gè)問(wèn)題,接下來(lái)我說(shuō)下 Anthropic 搞的這個(gè) Project Glasswing 是什么。

簡(jiǎn)單說(shuō),這是一個(gè)利用 Mythos 的能力幫全世界基礎(chǔ)設(shè)施系統(tǒng)找 bug 的項(xiàng)目。

參與方包括 AWS、蘋(píng)果、微軟、谷歌、英偉達(dá)、思科、Linux 基金會(huì)等共計(jì) 12 家機(jī)構(gòu)。


這個(gè)陣容覆蓋了云計(jì)算、操作系統(tǒng)、芯片、瀏覽器、金融基礎(chǔ)設(shè)施、網(wǎng)絡(luò)安全和開(kāi)源生態(tài)。

換句話說(shuō),全球數(shù)字基礎(chǔ)設(shè)施的核心參與者幾乎都在這個(gè)項(xiàng)目里了。

這個(gè)項(xiàng)目的核心邏輯只有一條,讓防守方先用上這個(gè)頂級(jí) AI 模型的能力。

因?yàn)槿绻舴较饶玫酵燃?jí)的工具,窗口一旦打開(kāi)就很難關(guān)上。Anthropic 承諾提供 1 億美元的模型使用額度,覆蓋研究預(yù)覽期。

除了 12 家核心機(jī)構(gòu),還有超過(guò) 40 個(gè)維護(hù)關(guān)鍵軟件基礎(chǔ)設(shè)施的組織獲得了訪問(wèn)權(quán)限,可以用 Mythos 掃描自家系統(tǒng)和開(kāi)源項(xiàng)目。

同時(shí),Anthropic 向 Linux 基金會(huì)捐了 250 萬(wàn)美元,向 Apache 軟件基金會(huì)捐了 150 萬(wàn)美元,這二者都是軟件世界的基礎(chǔ)設(shè)施。

這么說(shuō)吧,我們現(xiàn)在使用的各種 App、網(wǎng)站、系統(tǒng),基本上都是以他們?yōu)榈讓蛹軜?gòu)的。

在我看來(lái),Anthropic 這次算是干了件好事,不僅推出了更強(qiáng)的模型,還花錢(qián)給全球信息基礎(chǔ)設(shè)施讓他們來(lái)完善自己。

畢竟,如果裸上的話,對(duì)誰(shuí)都沒(méi)有好處。

可能說(shuō)到這你還是感覺(jué)不到 Mythos 到底有多強(qiáng),我從官方原文里看到了三個(gè)具體案例,我覺(jué)得比數(shù)字更能說(shuō)明問(wèn)題。


第一個(gè),OpenBSD。

這是公認(rèn)安全性極高的操作系統(tǒng),很多關(guān)鍵基礎(chǔ)設(shè)施會(huì)跑在上面,包括我們用的蘋(píng)果手機(jī) iOS 系統(tǒng)、Android 系統(tǒng)、甚至一些企業(yè)和機(jī)構(gòu)內(nèi)部系統(tǒng)。

Mythos 在里面發(fā)現(xiàn)了一個(gè)存在了 27 年的漏洞,攻擊者只要連上目標(biāo)機(jī)器,就能讓它遠(yuǎn)程崩潰。

27 年!不是沒(méi)人在意,是壓根沒(méi)人找到。

第二個(gè),F(xiàn)Fmpeg。

幾乎所有需要處理視頻的軟件都依賴(lài)它,你們用的各種視頻播放軟件基本上都有它的身影。

有個(gè)漏洞躲在一行寫(xiě)于 16 年前的代碼里,自動(dòng)化測(cè)試工具反復(fù)攻擊了整整 500 萬(wàn)次,每次都沒(méi)找到。

但是,Mythos 找到了。

第三個(gè),Linux 內(nèi)核。

這個(gè)就不用多說(shuō)了,基本上可以說(shuō)是整個(gè)互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施,也最值得警惕。

Mythos 不只是發(fā)現(xiàn)了幾個(gè)獨(dú)立漏洞,而是把多個(gè)漏洞串聯(lián)成一條攻擊鏈。

從普通用戶權(quán)限開(kāi)始,一路提權(quán),最終實(shí)現(xiàn)對(duì)整臺(tái)機(jī)器的完全控制。

關(guān)于 Linux 這個(gè),和前兩個(gè)案例的性質(zhì)完全不一樣。

找漏洞,是分析能力。

但串漏洞,就是策略能力了。

就像很多產(chǎn)品經(jīng)理,會(huì)畫(huà)原型圖會(huì)寫(xiě)文檔會(huì)做數(shù)據(jù)分析,這些是單點(diǎn)能力。但把業(yè)務(wù)、產(chǎn)品、商業(yè)串起來(lái),就是策略能力了。

一個(gè)能規(guī)劃攻擊路徑的模型,已經(jīng)不只是審計(jì)工具了,它更接近于一個(gè)可以在數(shù)字環(huán)境里主動(dòng)行動(dòng)的智能體。

以上三個(gè)案例,Anthropic 采取的都是先發(fā)現(xiàn)、先報(bào)告、先修復(fù)、再披露的方式,目前均已修復(fù)。

看到這,你就知道 Mythos 有多強(qiáng)了,就像一頭暫時(shí)不敢被放出籠的猛獸,現(xiàn)實(shí)世界需要先做好適應(yīng)它的準(zhǔn)備。

我想在這里說(shuō)幾個(gè)觀察,或許也是接下來(lái)真正變化的開(kāi)始。

第一,軟件世界的安全假設(shè)正在失效。

今天我們習(xí)以為常的軟件穩(wěn)定性,并不完全來(lái)自系統(tǒng)設(shè)計(jì)足夠好。很大程度上,它依賴(lài)的是攻擊能力的稀缺。

說(shuō)得直白點(diǎn),不是軟件足夠強(qiáng),而是人不夠強(qiáng)。

找漏洞需要成本,構(gòu)造利用鏈需要時(shí)間,大規(guī)模掃描需要資源。所以很多技術(shù)債、陳年 bug、老舊系統(tǒng)就那樣活著,從沒(méi)被認(rèn)真清理過(guò)。

就像我們做產(chǎn)品一樣,我們覺(jué)得邏輯閉環(huán)了,沒(méi)問(wèn)題了,并不代表真的萬(wàn)事無(wú)憂了,很可能是我們的能力上限到了。

Mythos 展現(xiàn)的能力,是漏洞從被發(fā)現(xiàn)到被利用的時(shí)間窗口從過(guò)去的幾個(gè)月被壓縮到了幾分鐘。

幾分鐘意味著什么?

意味著補(bǔ)丁的節(jié)奏,修復(fù)的流程,已經(jīng)開(kāi)始跟不上攻擊的速度了。

第二,開(kāi)源世界會(huì)最先感受到壓力。

今天大多數(shù)現(xiàn)代軟件,底下都?jí)褐罅块_(kāi)源依賴(lài)。平時(shí)看不見(jiàn),一旦被打穿,就是全行業(yè)同時(shí)受影響。

可能有讀者不是很了解這個(gè)邏輯,用大白話說(shuō),就是我們現(xiàn)在使用的所有軟件都有開(kāi)源項(xiàng)目作為底層,而這些項(xiàng)目的源代碼是對(duì)所有人可見(jiàn)的。

以后當(dāng)模型能持續(xù)地、大規(guī)模地掃描開(kāi)源項(xiàng)目,開(kāi)源社區(qū)維護(hù)者們面對(duì)的壓力級(jí)別會(huì)完全不一樣。

這也是為什么 Anthropic 要給 Linux 基金會(huì)和 Apache 基金會(huì)捐錢(qián)的原因。

不是做公益,而是承認(rèn)開(kāi)源基礎(chǔ)設(shè)施是 AI 時(shí)代整個(gè)數(shù)字世界最脆弱、也最不能倒的那層地基,他們不想被當(dāng)做壞人和惡人而已。

第三,人會(huì)被弱化,AI 開(kāi)始和 AI 博弈。

以前互聯(lián)網(wǎng)產(chǎn)品安全團(tuán)隊(duì)的價(jià)值,在于人的判斷力、經(jīng)驗(yàn)積累和對(duì)系統(tǒng)的深度理解。

未來(lái),這件事會(huì)換個(gè)邏輯。

比的是誰(shuí)的模型更強(qiáng),誰(shuí)的工具接得更快,誰(shuí)能把 AI 審計(jì)嵌進(jìn)開(kāi)發(fā)流程的最前端。

這不是程序員被替代的問(wèn)題,而是安全行業(yè)本身的生產(chǎn)方式會(huì)重組。

好的那面,是數(shù)千個(gè)高危漏洞可以在幾周內(nèi)被找出來(lái)。麻煩的是,攻擊方遲早也會(huì)有同等級(jí)的工具。

到那個(gè)時(shí)候,軟件產(chǎn)品的安全不再是人和人的對(duì)抗,而是模型和模型之間的攻防博弈。

這次,Anthropic 不只發(fā)布了能力,還發(fā)布了風(fēng)險(xiǎn)??赡苁悄壳斑@個(gè)階段,整個(gè)行業(yè)最需要看到的那種誠(chéng)實(shí)。

所有人都在談 AI 如何改變工作效率,這沒(méi)毛病。

但 Mythos 也在提醒我們,AI 能力的躍最終會(huì)從內(nèi)容世界傳導(dǎo)到軟件世界,再傳導(dǎo)到整個(gè)數(shù)字世界的基礎(chǔ)設(shè)施。

內(nèi)容世界被改寫(xiě),影響的是流量邏輯。

軟件世界被改寫(xiě),動(dòng)的是地基。

此時(shí),我想起了電影《2012》里的一句臺(tái)詞,也作為這篇文章的結(jié)尾吧。

「無(wú)論你是誰(shuí),不分種族,不分國(guó)家,明天我們都沒(méi)有區(qū)別!」

PS:我很少寫(xiě)這種長(zhǎng)文,看到這你至少已經(jīng)花了10分鐘,說(shuō)明你是擁抱變化喜歡思考的人。那么,就來(lái)個(gè)點(diǎn)贊、在看、轉(zhuǎn)發(fā),讓更多人加入對(duì)明天的期待中。

················· 唐韌出品 ·················

安可時(shí)刻

昨天看完 Mythos 的官方介紹后,我起身走到窗邊發(fā)了一會(huì)兒呆。

沒(méi)想什么,只是有點(diǎn)恍惚,而我的幾個(gè) AI 員工還在電腦上幫我干活,有的在分析數(shù)據(jù)、有的在搭建文章框架、有的在寫(xiě)項(xiàng)目文檔。

昨天我還新招了個(gè) AI 員工,取名唐小藝,以后我所有的封面圖、海報(bào)、甚至我的日常攝影需求都交給他了。


以下,就是他給我「拍」的一張照片,還原了上面我描述的場(chǎng)景。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
王鈺棟:小米不在我應(yīng)承擔(dān)更多進(jìn)攻責(zé)任,球隊(duì)統(tǒng)一性做得不錯(cuò)

王鈺棟:小米不在我應(yīng)承擔(dān)更多進(jìn)攻責(zé)任,球隊(duì)統(tǒng)一性做得不錯(cuò)

懂球帝
2026-04-17 22:24:00
《人民日?qǐng)?bào)》:多帶孩子去這2種場(chǎng)合,孩子的內(nèi)核會(huì)越來(lái)越強(qiáng)大

《人民日?qǐng)?bào)》:多帶孩子去這2種場(chǎng)合,孩子的內(nèi)核會(huì)越來(lái)越強(qiáng)大

育兒讀書(shū)樂(lè)
2026-03-12 16:49:38
薩姆納傷退背后的玄機(jī) 宏遠(yuǎn)雙外援暗藏殺招 季后賽生死戰(zhàn)誰(shuí)是X因素

薩姆納傷退背后的玄機(jī) 宏遠(yuǎn)雙外援暗藏殺招 季后賽生死戰(zhàn)誰(shuí)是X因素

銜春信
2026-04-18 00:04:37
足壇俱樂(lè)部單賽季歷史射手榜:C羅第8、梅西第2、榜首數(shù)據(jù)太離譜

足壇俱樂(lè)部單賽季歷史射手榜:C羅第8、梅西第2、榜首數(shù)據(jù)太離譜

仰臥撐FTUer
2026-04-17 19:43:04
爆了爆了!極氪8X上市29分鐘大定10000臺(tái) 限時(shí)售32.98萬(wàn)起

爆了爆了!極氪8X上市29分鐘大定10000臺(tái) 限時(shí)售32.98萬(wàn)起

太平洋汽車(chē)
2026-04-17 22:42:26
可愛(ài)值拉滿!廣東拍到中華穿山甲“薅樹(shù)葉”

可愛(ài)值拉滿!廣東拍到中華穿山甲“薅樹(shù)葉”

新快報(bào)新聞
2026-04-16 22:20:07
漲價(jià),再漲價(jià),這個(gè)方向要起爆?。?!

漲價(jià),再漲價(jià),這個(gè)方向要起爆?。?!

新浪財(cái)經(jīng)
2026-04-17 04:40:19
官方:切爾西與凱塞多漲薪續(xù)約至2033年

官方:切爾西與凱塞多漲薪續(xù)約至2033年

懂球帝
2026-04-17 21:19:14
沒(méi)有如果,只有可惜:殘陣海港客平泰山...

沒(méi)有如果,只有可惜:殘陣海港客平泰山...

五星體育
2026-04-17 21:58:16
貝森特通告全球,將對(duì)中方二級(jí)制裁,話音剛落,中國(guó)被曝美債余額

貝森特通告全球,將對(duì)中方二級(jí)制裁,話音剛落,中國(guó)被曝美債余額

為了更好
2026-04-17 13:48:16
意甲前瞻|國(guó)際米蘭3-0卡利亞里:藍(lán)黑軍團(tuán)意甲第21冠在望

意甲前瞻|國(guó)際米蘭3-0卡利亞里:藍(lán)黑軍團(tuán)意甲第21冠在望

體育世界
2026-04-17 17:50:37
被噪音逼到失眠崩潰,男子在自制隔音艙里一住就是5年,2020年,他憑借建筑專(zhuān)業(yè)知識(shí)自制了第一個(gè)隔音艙,目前已接到100多個(gè)訂單

被噪音逼到失眠崩潰,男子在自制隔音艙里一住就是5年,2020年,他憑借建筑專(zhuān)業(yè)知識(shí)自制了第一個(gè)隔音艙,目前已接到100多個(gè)訂單

觀威海
2026-04-17 18:12:06
北京一35歲程序員辭職擺攤賣(mài)肉蛋堡月入5萬(wàn),當(dāng)事人:?jiǎn)蝺r(jià)5元,日均銷(xiāo)量超1000個(gè),食材來(lái)自胖東來(lái)、山姆

北京一35歲程序員辭職擺攤賣(mài)肉蛋堡月入5萬(wàn),當(dāng)事人:?jiǎn)蝺r(jià)5元,日均銷(xiāo)量超1000個(gè),食材來(lái)自胖東來(lái)、山姆

大象新聞
2026-04-09 23:45:01
00年以來(lái)晉級(jí)歐戰(zhàn)4強(qiáng)最多的10位主帥:穆帥12次第1,埃梅里第4

00年以來(lái)晉級(jí)歐戰(zhàn)4強(qiáng)最多的10位主帥:穆帥12次第1,埃梅里第4

懂球帝
2026-04-18 01:35:20
全紅嬋不再隱瞞!坦言身材發(fā)胖原因,原來(lái)高敏4年內(nèi)提醒過(guò)2次

全紅嬋不再隱瞞!坦言身材發(fā)胖原因,原來(lái)高敏4年內(nèi)提醒過(guò)2次

青橘罐頭
2026-04-01 17:09:37
“你真美,是不是嫌我老?”:手機(jī)被沒(méi)收后,女子用手表錄16分鐘

“你真美,是不是嫌我老?”:手機(jī)被沒(méi)收后,女子用手表錄16分鐘

江山揮筆
2026-04-14 10:48:18
匈牙利撤軍:人還沒(méi)走,茶就涼了

匈牙利撤軍:人還沒(méi)走,茶就涼了

寰宇大觀察
2026-04-16 17:20:43
卡尼再現(xiàn)歷史,特朗普“上大分”

卡尼再現(xiàn)歷史,特朗普“上大分”

鳳凰WEEKLY
2026-04-16 21:17:26
五一調(diào)休引眾怒:看似放5天,其實(shí)只放1天,何必呢?

五一調(diào)休引眾怒:看似放5天,其實(shí)只放1天,何必呢?

苗苗情感說(shuō)
2026-04-17 19:14:23
十二星座2026年4月18號(hào)運(yùn)勢(shì):周末愉快……

十二星座2026年4月18號(hào)運(yùn)勢(shì):周末愉快……

YAO叔星座
2026-04-17 21:04:49
2026-04-18 02:08:49
唐韌 incentive-icons
唐韌
用產(chǎn)品思維解決難題
1454文章數(shù) 2026關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒(méi)35.97億元

頭條要聞

特朗普:感謝伊朗開(kāi)放霍爾木茲海峽

頭條要聞

特朗普:感謝伊朗開(kāi)放霍爾木茲海峽

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂(lè)要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車(chē)要聞

又快又穩(wěn)的開(kāi)掛動(dòng)力! 阿維塔06T全系搭分布式電驅(qū)

態(tài)度原創(chuàng)

親子
家居
本地
房產(chǎn)
公開(kāi)課

親子要聞

心理學(xué)安全距離法:孩子躺平的最佳療愈方法

家居要聞

法式線條 時(shí)光靜淌

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

房產(chǎn)要聞

重磅利好!2500個(gè)學(xué)位,??跒I江片區(qū),要建九年一貫制學(xué)校!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版