国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

曝三家中國AI通過"蒸餾攻擊"非法提取 Claude 模型的能力來訓練自家模型

0
分享至



Anthropic 發(fā)布調(diào)查報告,稱發(fā)現(xiàn) DeepSeek、月之暗面(Moonshot/Kimi)和 MiniMax 三家中國 AI 實驗室,通過大規(guī)模"蒸餾攻擊"非法提取 Claude 模型的能力來訓練自家模型。

三家公司共創(chuàng)建了約2.4萬個虛假賬戶,與 Claude 產(chǎn)生超過1600萬次對話交互。所謂"蒸餾",就是用強模型的輸出來訓練弱模型——相當于讓學生抄優(yōu)等生的作業(yè)來提高成績。

這種方法本身是合法的訓練技巧,各大 AI 公司也用它來制作自家模型的輕量版本,但未經(jīng)授權對競爭對手的模型進行蒸餾則違反了服務條款。三家公司的操作手法類似:通過代理服務繞過 Anthropic 對中國的訪問限制,用大量虛假賬戶分散流量以躲避檢測。

其中 MiniMax 規(guī)模最大,產(chǎn)生超過1300萬次交互,主要提取編程和工具使用能力;月之暗面超過340萬次,瞄準智能體推理和計算機視覺;DeepSeek 雖然量級最?。?5萬次),但手法最值得關注——他們讓 Claude 反向“復述”自己的推理過程來生成思維鏈訓練數(shù)據(jù),還讓 Claude 生成政治敏感問題的"安全回答",疑似用于訓練自家模型的審查回避能力。

Anthropic 表示已通過 IP 地址、請求元數(shù)據(jù)等信息將攻擊溯源到具體實驗室甚至具體研究人員,并稱這一發(fā)現(xiàn)說明中國 AI 公司的快速進步并非完全靠自主創(chuàng)新,也在一定程度上依賴對美國模型能力的提取。

Anthropic 報告原文:

檢測與防范蒸餾攻擊

2026年2月23日

我們已識別出三家人工智能實驗室——DeepSeek、Moonshot 和 MiniMax——發(fā)起的工業(yè)規(guī)模行動,試圖通過非法方式提取 Claude 的能力,以提升它們自身的模型。這些實驗室通過大約24,000個欺詐賬戶,與 Claude 進行了超過1600萬次交互,違反了我們的服務條款以及區(qū)域訪問限制。

這些實驗室使用了一種名為“蒸餾”(distillation)的技術,即讓一個能力較弱的模型學習更強模型的輸出。蒸餾是一種被廣泛使用且合法的訓練方法。例如,前沿 AI 實驗室通常會對自家模型進行蒸餾,以便為客戶創(chuàng)建更小、更便宜的版本。但蒸餾也可能被用于非法目的:競爭對手可以用它在遠低于自主研發(fā)所需時間與成本的情況下,獲取強大的能力。

這些行動正在迅速升級,強度和復雜性不斷提高。采取行動的窗口期十分有限,這一威脅也早已超出任何單一公司或地區(qū)的范疇。解決這一問題需要行業(yè)參與者、政策制定者以及全球 AI 社區(qū)之間迅速而協(xié)調(diào)的合作。

為什么蒸餾問題至關重要

通過非法蒸餾得到的模型缺乏必要的安全防護,從而帶來重大國家安全風險。Anthropic 及其他美國公司構(gòu)建的系統(tǒng),會防止國家或非國家行為體利用 AI 開發(fā)生物武器或?qū)嵤阂饩W(wǎng)絡活動等。通過非法蒸餾構(gòu)建的模型,很可能無法保留這些安全防護措施,這意味著危險能力可能在大量安全機制被剝離的情況下擴散。

對美國模型進行蒸餾的外國實驗室,隨后可能將這些缺乏防護的能力輸入到軍事、情報和監(jiān)控系統(tǒng)中——使他國政府能夠?qū)⑶把?AI 用于進攻性網(wǎng)絡行動、虛假信息宣傳和大規(guī)模監(jiān)控。如果蒸餾模型被開源,這種風險將成倍放大,因為這些能力會在任何單一政府控制之外自由傳播。

蒸餾攻擊與出口管制

Anthropic 一直支持出口管制,以幫助維持美國在 AI 領域的領先地位。蒸餾攻擊削弱了這些管制措施,因為它允許外國實驗室通過其他方式縮小出口管制試圖保留的競爭優(yōu)勢。

在缺乏對這些攻擊可見性的情況下,這些實驗室看似迅速的技術進步,往往被錯誤解讀為出口管制無效、可以通過創(chuàng)新繞過。事實上,這些進步在很大程度上依賴于從美國模型中提取的能力,而要大規(guī)模執(zhí)行這種提取,則需要先進芯片的支持。因此,蒸餾攻擊反而強化了出口管制的合理性:限制芯片獲取不僅限制直接模型訓練,也限制了非法蒸餾的規(guī)模。

我們的發(fā)現(xiàn)

下文詳述的三起蒸餾行動采用了相似的操作模式:使用欺詐賬戶和代理服務,大規(guī)模訪問 Claude,同時規(guī)避檢測。其提示語的規(guī)模、結(jié)構(gòu)和集中方向均明顯不同于正常使用模式,反映出其目的是刻意提取能力,而非合法使用。

我們通過 IP 地址關聯(lián)、請求元數(shù)據(jù)、基礎設施指標,以及在某些情況下來自行業(yè)合作伙伴的佐證,高置信度地將每次行動歸因于特定實驗室。這些行動都集中針對 Claude 最具差異化的能力:代理式推理、工具使用和編程。

DeepSeek

規(guī)模:超過15萬次交互

該行動目標包括:

  • 各類任務中的推理能力

  • 基于評分標準(rubric)的打分任務,使 Claude 充當強化學習的獎勵模型

  • 生成“審查安全”的敏感問題替代表述

DeepSeek 在多個賬戶之間生成同步流量。相同的模式、共享支付方式以及協(xié)調(diào)的時間安排表明其進行了“負載均衡”,以提高吞吐量、增強可靠性并規(guī)避檢測。

一個顯著手法是,提示 Claude 想象并逐步闡述某個已完成回答背后的內(nèi)部推理過程——實質(zhì)上是在大規(guī)模生成思維鏈(chain-of-thought)訓練數(shù)據(jù)。我們還觀察到任務要求 Claude 為敏感問題生成“審查安全”的替代表述,很可能是為了訓練 DeepSeek 自身模型在這些話題上進行回避引導。通過請求元數(shù)據(jù)分析,我們能夠?qū)⑦@些賬戶追溯到該實驗室的具體研究人員。

Moonshot AI

規(guī)模:超過340萬次交互

目標包括:

  • 代理式推理與工具使用

  • 編程與數(shù)據(jù)分析

  • 計算機使用代理開發(fā)

  • 計算機視覺

Moonshot(Kimi 模型)使用了數(shù)百個欺詐賬戶,橫跨多種訪問路徑。多樣化的賬戶類型使該行動更難被識別為協(xié)調(diào)操作。我們通過請求元數(shù)據(jù)進行歸因,其信息與 Moonshot 高級員工的公開資料相匹配。在后期階段,Moonshot 采用了更具針對性的方式,試圖提取并重建 Claude 的推理軌跡。

MiniMax

規(guī)模:超過1300萬次交互

目標包括:

  • 代理式編程

  • 工具使用與編排

我們通過請求元數(shù)據(jù)和基礎設施指標將該行動歸因于 MiniMax,并結(jié)合其公開產(chǎn)品路線圖驗證時間節(jié)點。我們在 MiniMax 發(fā)布其訓練模型之前,就在其行動仍在進行時檢測到了該蒸餾行為,這為我們提供了前所未有的視角,觀察蒸餾攻擊從數(shù)據(jù)生成到模型發(fā)布的完整生命周期。

我們在 MiniMax 行動期間發(fā)布新模型時,對方在24小時內(nèi)迅速調(diào)整策略,將近一半流量轉(zhuǎn)向捕捉我們最新系統(tǒng)的能力。

蒸餾方如何獲取前沿模型

出于國家安全考慮,Anthropic 目前不向中國或其境外子公司提供 Claude 的商業(yè)訪問。

為繞過這一限制,這些實驗室使用商業(yè)代理服務,以規(guī)?;绞睫D(zhuǎn)售 Claude 及其他前沿模型的訪問權限。這些服務運行所謂的“九頭蛇集群”(hydra cluster)架構(gòu):由大量欺詐賬戶構(gòu)成的龐大網(wǎng)絡,將流量分散到我們的 API 以及第三方云平臺。該網(wǎng)絡范圍廣泛,沒有單點故障。一個賬戶被封禁后,新的賬戶立即頂替。在一個案例中,單一代理網(wǎng)絡同時管理超過20,000個欺詐賬戶,并將蒸餾流量與其他正??蛻粽埱蠡旌希栽黾訖z測難度。

一旦獲得訪問權限,這些實驗室就會生成大量精心設計的提示語,以提取特定能力。目標要么是收集高質(zhì)量回答用于直接模型訓練,要么是生成數(shù)萬條獨特任務,用于運行強化學習。

區(qū)別蒸餾攻擊與正常使用的關鍵在于模式。例如以下提示語(與我們觀察到的大規(guī)模重復提示近似)單獨看似無害:

“你是一名專家級數(shù)據(jù)分析師,結(jié)合統(tǒng)計嚴謹性與深厚領域知識。你的目標是提供基于真實數(shù)據(jù)、具備完整透明推理過程的數(shù)據(jù)驅(qū)動洞察,而非摘要或可視化?!?/p>

但當該提示的變體在數(shù)百個協(xié)調(diào)賬戶間被重復數(shù)萬次,并集中針對同一狹窄能力時,其模式便顯而易見:在少數(shù)能力領域集中爆發(fā)的巨大流量、高度重復的結(jié)構(gòu),以及內(nèi)容與 AI 模型訓練核心價值的高度映射——這正是蒸餾攻擊的典型特征。

我們的應對措施

我們持續(xù)大力投入防御機制,使蒸餾攻擊更難實施、更易識別,包括:

  • 檢測機制:構(gòu)建多個分類器與行為指紋系統(tǒng),用于識別 API 流量中的蒸餾攻擊模式,包括識別用于構(gòu)建推理訓練數(shù)據(jù)的思維鏈誘導行為,以及跨大量賬戶的協(xié)調(diào)活動。

  • 情報共享:與其他 AI 實驗室、云服務提供商及相關機構(gòu)共享技術指標,形成對蒸餾生態(tài)的更全面認知。

  • 訪問控制:加強對教育賬戶、安全研究項目及創(chuàng)業(yè)組織的驗證流程——這些是欺詐賬戶最常利用的渠道。

  • 反制措施:開發(fā)產(chǎn)品級、API 級及模型級防護機制,在不影響合法用戶體驗的前提下,降低模型輸出對非法蒸餾的有效性。

但任何一家公司都無法獨自解決這一問題。正如前文所述,這種規(guī)模的蒸餾攻擊需要 AI 行業(yè)、云服務提供商及政策制定者之間的協(xié)調(diào)響應。我們發(fā)布此文,是為了讓所有關心這一結(jié)果的人都能看到相關證據(jù)。

相關新聞

還好意思說別人蒸餾?馬斯克抨擊Anthropic大規(guī)模盜用訓練數(shù)據(jù)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國防部直接把話挑明了,家里有滿18歲男青年必須辦的就是兵役登記

國防部直接把話挑明了,家里有滿18歲男青年必須辦的就是兵役登記

南權先生
2026-02-12 15:38:28
兩性關系:65-75歲夫妻必看,真正惜命的是守住這7條底線!

兩性關系:65-75歲夫妻必看,真正惜命的是守住這7條底線!

新時代的兩性情感
2026-02-24 04:05:41
1987年,越軍獲悉27軍老軍長之子獨守貓耳洞:活捉或擊斃王鎮(zhèn)疆!

1987年,越軍獲悉27軍老軍長之子獨守貓耳洞:活捉或擊斃王鎮(zhèn)疆!

混沌錄
2026-02-24 19:37:06
新加坡大滿貫賽:大獲全勝!張本美和3:0非洲冠軍,大藤沙月3:1

新加坡大滿貫賽:大獲全勝!張本美和3:0非洲冠軍,大藤沙月3:1

國乒二三事
2026-02-24 13:34:19
新春走基層|從塔克拉瑪干到紅其拉甫,28歲小伙為國門送上“年味”

新春走基層|從塔克拉瑪干到紅其拉甫,28歲小伙為國門送上“年味”

新華社
2026-02-23 19:51:13
顧順章叛變后,交代了四名中共負責人,第一個名字就讓徐恩曾傻眼

顧順章叛變后,交代了四名中共負責人,第一個名字就讓徐恩曾傻眼

大運河時空
2026-02-23 11:10:03
別再存定期了!央行釋放重要信號:普通人的財富保衛(wèi),主戰(zhàn)場已變

別再存定期了!央行釋放重要信號:普通人的財富保衛(wèi),主戰(zhàn)場已變

復轉(zhuǎn)小能手
2026-02-24 17:31:33
打伊朗前,美國找到中國,特朗普知道:他錯一步,中國就不戰(zhàn)而勝

打伊朗前,美國找到中國,特朗普知道:他錯一步,中國就不戰(zhàn)而勝

劉浶開挖機
2026-02-24 18:05:17
別再罵太平天國了!他們干掉的洋人,比清軍兩次鴉片戰(zhàn)爭還多

別再罵太平天國了!他們干掉的洋人,比清軍兩次鴉片戰(zhàn)爭還多

老達子
2026-02-23 06:20:06
中國男籃“生死戰(zhàn)”名單公布,趙繼偉回歸,徐杰、曾凡博落選

中國男籃“生死戰(zhàn)”名單公布,趙繼偉回歸,徐杰、曾凡博落選

湖報體育
2026-02-24 19:10:03
真沒落了!歐戰(zhàn)積分對比英超領跑實至名歸,意甲跌落至第五名

真沒落了!歐戰(zhàn)積分對比英超領跑實至名歸,意甲跌落至第五名

里芃芃體育
2026-02-24 00:10:10
誰懂?。∫俏沂峭跛嚨?,新加坡大滿貫一打完,

誰懂??!要是我是王藝迪,新加坡大滿貫一打完,

小光侃娛樂
2026-02-24 16:07:06
國家給我5個億我就上交!福建男花2億元珍藏了一張皇帝所睡的龍床

國家給我5個億我就上交!福建男花2億元珍藏了一張皇帝所睡的龍床

南權先生
2026-02-12 15:41:39
越南視角:越軍少將評價解放軍,我給美軍打9分中國軍隊5分

越南視角:越軍少將評價解放軍,我給美軍打9分中國軍隊5分

混沌錄
2026-02-13 23:29:06
詹姆斯10中10!湖人三項數(shù)據(jù),聯(lián)盟第一!

詹姆斯10中10!湖人三項數(shù)據(jù),聯(lián)盟第一!

范動舍長
2026-02-24 13:31:38
哥哥高考復讀5年,錄取滑檔仍要復讀,母親發(fā)現(xiàn)5張高校錄取通知書

哥哥高考復讀5年,錄取滑檔仍要復讀,母親發(fā)現(xiàn)5張高校錄取通知書

小秋情感說
2026-02-24 09:54:03
這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

蜉蝣說
2026-01-29 14:46:50
臺灣知名網(wǎng)紅鐘明軒在新疆旅游過年的Vlog火了,網(wǎng)友們直呼太贊了

臺灣知名網(wǎng)紅鐘明軒在新疆旅游過年的Vlog火了,網(wǎng)友們直呼太贊了

總在茶余后
2026-02-23 23:17:09
導致7名中國游客在貝加爾湖死亡的俄羅斯司機,是個問題司機

導致7名中國游客在貝加爾湖死亡的俄羅斯司機,是個問題司機

我心縱橫天地間
2026-02-21 18:34:01
42歲佟麗婭和36歲金晨同框,一個臉腫一個干癟,骨相皮相差距明顯

42歲佟麗婭和36歲金晨同框,一個臉腫一個干癟,骨相皮相差距明顯

往史過眼云煙
2026-02-24 19:20:41
2026-02-24 20:19:00
爆角追蹤
爆角追蹤
全球熱點事,一起來追蹤。
1233文章數(shù) 213927關注度
往期回顧 全部

科技要聞

AI顛覆發(fā)展最新犧牲品!IBM跳水重挫超13%

頭條要聞

20家日本實體被列入管制名單 中方:完全正當 合理合法

頭條要聞

20家日本實體被列入管制名單 中方:完全正當 合理合法

體育要聞

蘇翊鳴總結(jié)米蘭征程:我仍是那個熱愛單板滑雪的少年

娛樂要聞

汪小菲官宣三胎出生:承諾會照顧好3個孩子

財經(jīng)要聞

縣城消費「限時繁榮」了十天

汽車要聞

入門即滿配 威蘭達AIR版上市 13.78萬元起

態(tài)度原創(chuàng)

健康
本地
家居
藝術
軍事航空

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

本地新聞

春花齊放2026:《駿馬奔騰迎新歲》

家居要聞

本真棲居 愛暖伴流年

藝術要聞

2025年第八屆全國青年美展 | 油畫作品選刊

軍事要聞

美軍參聯(lián)會主席警告:對伊朗動武可能帶來重大風險

無障礙瀏覽 進入關懷版