国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

百萬 Token 也能無損壓縮?C3 模型用“級(jí)聯(lián)壓縮”重新定義長(zhǎng)上下文挑戰(zhàn)

0
分享至


【編者按】百萬級(jí)別 Token 的輸入,正在成為大型語言模型(LLMs)長(zhǎng)上下文任務(wù)中的計(jì)算與內(nèi)存“噩夢(mèng)”。DeepSeekOCR 憑借“上下文光學(xué)壓縮”技術(shù)實(shí)現(xiàn)了 10 倍 Token 壓縮率,引發(fā)全網(wǎng)熱議。但透過現(xiàn)象看本質(zhì),高壓縮率的秘密,真的在于“圖像化”嗎?

作者 | 劉帆帆

出品丨作者投稿

DeepSeekOCR 的成功讓許多人誤以為“視覺編碼”是壓縮的關(guān)鍵。然而,研究團(tuán)隊(duì)經(jīng)過深入分析發(fā)現(xiàn),高壓縮率的核心其實(shí)源自 Latent Tokens(潛在 Token)本身——這是一種比離散文本 Token 更高效、密度更高的信息載體。

基于這一洞察,作者所在的研究團(tuán)隊(duì)提出了一種直擊本質(zhì)的全新路徑:Context Cascade Compression (C3,上下文級(jí)聯(lián)壓縮)。

將兩種路徑進(jìn)行對(duì)比:

  • DeepSeek OCR 路徑: 文本 → 圖像 → 視覺 Token → 語言模型(引入了布局、噪點(diǎn)、視覺編碼器等無關(guān)干擾)

  • C3 路徑: 文本 → 文本 Latent Tokens → 語言模型(純粹、無損、直接)

具體來說,一個(gè)小型 LLM 作為第一級(jí),通過將長(zhǎng)上下文壓縮成一組潛在 token(例如,長(zhǎng)度為 32 或 64),實(shí)現(xiàn)高比例的文本 token 到潛在 token 的壓縮。 一個(gè)大型 LLM 作為第二級(jí),然后對(duì)這個(gè)壓縮的上下文執(zhí)行解碼任務(wù)。

這一設(shè)計(jì)也驗(yàn)證了近期熱門論文《LANGUAGE MODELS ARE INJECTIVE AND HENCE INVERTIBLE》中關(guān)于「LLM 本質(zhì)是無損壓縮」的論斷。

實(shí)驗(yàn)表明,在 20 倍壓縮比(文本 token 數(shù)量是潛在 token 數(shù)量的 20 倍)下,C3 實(shí)現(xiàn)了 98% 的解碼準(zhǔn)確率,而 DeepSeek OCR 大約為60%。當(dāng)我們進(jìn)一步將壓縮比增加到 40 倍時(shí),準(zhǔn)確率仍保持在約 93%。這表明在上下文壓縮領(lǐng)域,C3 壓縮比光學(xué)字符壓縮展示了更優(yōu)越的性能和可行性。

目前模型與代碼現(xiàn)已開源:

  • 原文:https://arxiv.org/pdf/2511.15244

  • 代碼:https://github.com/liufanfanlff/C3-Context-Cascade-Compression

  • 模型:https://huggingface.co/liufanfanlff/C3-Context-Cascade-Compression


架構(gòu)

在介紹 C3 之前,先帶大家來了解一下 DeepSeek-OCR 的工作原理。DeepSeek-OCR 采用了一種創(chuàng)新的"視覺壓縮"思路,這種方法的優(yōu)勢(shì)在于利用了視覺編碼器強(qiáng)大的特征提取能力,但也面臨著圖像布局復(fù)雜性、低分辨率下的模糊等固有限制。C3 提出了一個(gè)更直接的壓縮思路:跳過視覺中介,沒有中間商賺差價(jià),直接在文本域進(jìn)行壓縮。其核心架構(gòu)包括:

1.雙 LLM 級(jí)聯(lián)設(shè)計(jì)

  • 小型 LLM(算力消耗低)作為壓縮編碼器,壓縮上下文信息。

  • 大型 LLM(推理生成能力強(qiáng))作為解碼器執(zhí)行下游任務(wù)。

2.壓縮機(jī)制

  • 引入可學(xué)習(xí)的"上下文查詢"(Context Query)嵌入

  • 將長(zhǎng)文本壓縮為固定長(zhǎng)度的潛在token(如32或64個(gè))。

  • 完全保留預(yù)訓(xùn)練 LLM 的語言壓縮能力



性能表現(xiàn)

在 Fox 基準(zhǔn)測(cè)試中,C3 展現(xiàn)出顯著優(yōu)勢(shì):

  • 在約 20 倍壓縮時(shí),C3 保持 98.4% 精度,而D eepSeek-OCR 降至59.1%

  • 即使在極限的 40 倍壓縮率下(32 個(gè)潛在 token),C3 仍能維持 93% 以上的重建精度

獨(dú)特的"遺忘模式":更接近人類記憶


研究還發(fā)現(xiàn)了 C3 的一個(gè)有趣特性:當(dāng)壓縮率過高導(dǎo)致信息損失時(shí),錯(cuò)誤往往集中在文本末尾,呈現(xiàn)序列性信息衰減。這與光學(xué)壓縮方法的"全局模糊"不同,反而更類似人類記憶的漸進(jìn)式遺忘過程。

這種特性使得 C3 在實(shí)際應(yīng)用中更具可預(yù)測(cè)性——重要信息可以優(yōu)先放置在文本前部,確保關(guān)鍵內(nèi)容的完整保留。

測(cè)試


無論是在長(zhǎng)英文文本還是中文古文上均做到了近乎完美的壓縮還原

甚至對(duì)于 LLM 一直難以處理的亂序文本也能精準(zhǔn)還原


應(yīng)用前景

1. 超長(zhǎng)上下文處理:C3 可作為現(xiàn)有 LLM 的"前端壓縮器",將百萬級(jí) token 的輸入(如整本書籍、大型代碼庫)壓縮到可處理范圍,降低計(jì)算成本。

2. 多模態(tài):級(jí)連輕量級(jí) VLM 和 LLM,輕量級(jí) VLM 作為視覺 encoder 進(jìn)行信息壓縮,處理視覺信息豐富的長(zhǎng)文檔等。

3. 下一代模型的基礎(chǔ)組件 :C3 的編碼-解碼架構(gòu)可直接應(yīng)用于擴(kuò)散語言模型和潛在自回歸模型,將可變長(zhǎng)度文本轉(zhuǎn)換為固定長(zhǎng)度潛在表示。

這是一個(gè)在有限的人力、算力與數(shù)據(jù)背景下誕生的“小而美”項(xiàng)目。

目前 C3 的代碼與權(quán)重開源,希望開源社區(qū)的研究者們能接過這一棒,激發(fā)出C3 的巨大潛能。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《阿凡達(dá)3》全球票房5.9億美元!阿凡達(dá)3全球票房已超41億元

《阿凡達(dá)3》全球票房5.9億美元!阿凡達(dá)3全球票房已超41億元

動(dòng)物奇奇怪怪
2025-12-27 14:24:45
原來是他娶了譚維維!被譽(yù)為“不老男神”,曾在海拔5600米上求婚

原來是他娶了譚維維!被譽(yù)為“不老男神”,曾在海拔5600米上求婚

韓馳
2025-12-25 20:04:01
中國(guó)不跟美國(guó)談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

中國(guó)不跟美國(guó)談判?特朗普以最高統(tǒng)帥的身份,下令美軍造更多航母

議紀(jì)史
2025-12-27 17:25:02
擺爛!曼聯(lián)24歲懶王獻(xiàn)戰(zhàn)犯表演:7數(shù)據(jù)掛零 場(chǎng)上蠕動(dòng)+跑都不想跑

擺爛!曼聯(lián)24歲懶王獻(xiàn)戰(zhàn)犯表演:7數(shù)據(jù)掛零 場(chǎng)上蠕動(dòng)+跑都不想跑

風(fēng)過鄉(xiāng)
2025-12-27 06:44:54
當(dāng)黑人選民看到,奧巴馬越老越白的時(shí)候,產(chǎn)生了強(qiáng)烈的被背叛感!

當(dāng)黑人選民看到,奧巴馬越老越白的時(shí)候,產(chǎn)生了強(qiáng)烈的被背叛感!

看盡人間百態(tài)
2025-12-24 01:28:42
美劇老友記又一演員去世,帕特·芬恩因癌癥病逝,享年60歲

美劇老友記又一演員去世,帕特·芬恩因癌癥病逝,享年60歲

叨叨話影
2025-12-27 15:50:45
7年賠光2個(gè)億,中年返貧的鄒市明,終究還是向生活低頭了

7年賠光2個(gè)億,中年返貧的鄒市明,終究還是向生活低頭了

娛小北
2025-07-10 08:54:33
投資5億元的甜蜜城堡已成廢墟!曾被稱為“南京迪士尼”,已荒廢10年!背后公司已退市一年,“創(chuàng)二代”醞釀回歸?

投資5億元的甜蜜城堡已成廢墟!曾被稱為“南京迪士尼”,已荒廢10年!背后公司已退市一年,“創(chuàng)二代”醞釀回歸?

每日經(jīng)濟(jì)新聞
2025-12-27 17:57:08
一艘民船=半艘驅(qū)逐艦?美媒:“武裝貨輪”曝光,配備60單元垂發(fā)

一艘民船=半艘驅(qū)逐艦?美媒:“武裝貨輪”曝光,配備60單元垂發(fā)

墨山看客
2025-12-26 11:28:59
俄方稱烏克蘭要再征兵200萬

俄方稱烏克蘭要再征兵200萬

環(huán)球網(wǎng)資訊
2025-12-27 07:06:25
南博新消息,徐鶯被曝領(lǐng)國(guó)家專項(xiàng)補(bǔ)助,還有人冒出頭為她站臺(tái)

南博新消息,徐鶯被曝領(lǐng)國(guó)家專項(xiàng)補(bǔ)助,還有人冒出頭為她站臺(tái)

奇思妙想草葉君
2025-12-26 23:17:24
俄國(guó)防部前副部長(zhǎng)薩多文科上將在莫斯科突然去世,享年56歲

俄國(guó)防部前副部長(zhǎng)薩多文科上將在莫斯科突然去世,享年56歲

山河路口
2025-12-26 19:47:21
不給洪森父子拼命,柬軍跑了:泰國(guó)繳獲中械擺一地,越南武器參戰(zhàn)

不給洪森父子拼命,柬軍跑了:泰國(guó)繳獲中械擺一地,越南武器參戰(zhàn)

愛史紀(jì)
2025-12-27 17:21:11
34年前殺人案再審維持原判,當(dāng)事人:不認(rèn)可判決將申訴

34年前殺人案再審維持原判,當(dāng)事人:不認(rèn)可判決將申訴

新京報(bào)
2025-12-26 17:14:08
1949年,一個(gè)師跑錯(cuò)路闖進(jìn)敵窩,林彪看了一眼地圖:全師歸我直接指揮

1949年,一個(gè)師跑錯(cuò)路闖進(jìn)敵窩,林彪看了一眼地圖:全師歸我直接指揮

歷史回憶室
2025-12-25 10:40:05
徐鶯身份成謎!曝前院長(zhǎng)老小情人不計(jì)其數(shù) 玩弄本院翻譯被撞上

徐鶯身份成謎!曝前院長(zhǎng)老小情人不計(jì)其數(shù) 玩弄本院翻譯被撞上

小虎新車推薦員
2025-12-27 01:10:41
中國(guó)駐墨西哥使館:奉勸納瓦羅之流認(rèn)真反思錯(cuò)誤,停止自欺欺人的表演

中國(guó)駐墨西哥使館:奉勸納瓦羅之流認(rèn)真反思錯(cuò)誤,停止自欺欺人的表演

環(huán)球網(wǎng)資訊
2025-12-27 06:43:19
美軍玩砸了,后悔搶中國(guó)原油,新令開啟“熬鷹游戲”,看誰先眨眼

美軍玩砸了,后悔搶中國(guó)原油,新令開啟“熬鷹游戲”,看誰先眨眼

野史日記
2025-12-26 08:42:08
北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

小哥很OK
2025-12-12 14:33:01
法國(guó)拒不接受中國(guó)反制,馬克龍轉(zhuǎn)身發(fā)現(xiàn)不妙,特朗普也對(duì)歐盟出手

法國(guó)拒不接受中國(guó)反制,馬克龍轉(zhuǎn)身發(fā)現(xiàn)不妙,特朗普也對(duì)歐盟出手

歷史有些冷
2025-12-26 17:50:03
2025-12-27 19:24:49
CSDN incentive-icons
CSDN
成就一億技術(shù)人
26215文章數(shù) 242203關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

刑滿釋放人員任職國(guó)有控股企業(yè)"高管" 企業(yè)陷困境

頭條要聞

刑滿釋放人員任職國(guó)有控股企業(yè)"高管" 企業(yè)陷困境

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

健康
數(shù)碼
家居
房產(chǎn)
手機(jī)

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

多款小米手表/手環(huán)澎湃OS更新計(jì)劃公布 部分功能下線

家居要聞

格調(diào)時(shí)尚 智慧品質(zhì)居所

房產(chǎn)要聞

年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

手機(jī)要聞

無懼蘋果起訴,爆料人再發(fā)iPhone Fold折疊屏手機(jī)渲染圖

無障礙瀏覽 進(jìn)入關(guān)懷版