国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

不得了,這個新技術把視頻壓縮到了0.02%!

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

感謝AI!

原生1個G的視頻,現(xiàn)在只需要傳200K數(shù)據(jù)就能看了——

視頻數(shù)據(jù)的壓縮率干到了0.02%,但依舊能保持畫面的高清、連貫和畫面細節(jié)。

或許你會問,這又有什么用呢?

想象一下,你身處于太平洋的一艘遠洋貨輪中,衛(wèi)星信號只有一兩格,刷個朋友圈,加載內容的圈圈都要轉好久。

但正是因為有了這項AI技術,現(xiàn)在在如此極端的環(huán)境之下,你甚至可以直接看高清的世界杯直播!



沒錯,視頻傳輸?shù)奈锢矸▌t,算是被重寫了。

而這項新研究,正是來自中國電信人工智能研究院(TeleAI)的技術——生成式視頻壓縮(GVC,Generative Video Compression)

作為國資央企、全球領先的綜合智能信息服務運營商,中國電信不僅擁有覆蓋海陸空天的通信網絡基礎設施,更具備將前沿AI技術與實際通信場景深度融合的能力。

這種“云網融合+AI原生”的獨特優(yōu)勢,使得GVC技術從實驗室走向遠洋船舶、應急現(xiàn)場等真實極端環(huán)境成為可能。



那么這項研究到底是如何做到的,以及又能給我們現(xiàn)實生活帶來什么改變,我們繼續(xù)往下看。

用計算,換寬帶

在介紹這項黑科技之前,我們需得先聊聊現(xiàn)在的視頻是怎么傳輸?shù)摹?/p>

無論是你要看的Netflix、B站,還是微信視頻通話,背后主要依靠的是HEVC(H.265)或VVC(H.266)這類傳統(tǒng)視頻編碼標準。

這些技術的底層邏輯,說白了是像素的極致搬運:編碼器拼命計算哪些像素是不變的、哪些是移動的,然后盡可能多地保留像素信息,再想辦法塞進有限的帶寬里。

這種邏輯在寬帶富裕時很完美,但在極限環(huán)境下(極低帶寬)會迅速崩盤。

一旦帶寬不夠,傳統(tǒng)編碼器為了湊合傳輸,只能瘋狂丟棄高頻信息。結果我們都見過:畫面糊成一團,甚至直接卡死。

但 TeleAI 團隊換了個思路,如果我不傳像素了呢?

GVC的核心邏輯是:不再傳遞畫面本身,而是傳遞“如何畫出這幅畫面”的指令。

打個比方:

  • 傳統(tǒng)壓縮:就像是把《蒙娜麗莎》拍一張照片,盡量壓縮這張照片發(fā)給你。如果網不好,照片就糊得像一堆色塊。
  • 生成式視頻壓縮(GVC):我不發(fā)照片了。我發(fā)給你一段描述——“一位女士,神秘微笑,背景是山水,光影是從左側來的……”,以及她嘴角上揚的精確弧度數(shù)據(jù)。你的接收端坐著一位AI畫師(生成式模型),聽到描述后,現(xiàn)場給你畫出一幅《蒙娜麗莎》。



剛剛說的只是打個比方,實際情況要復雜得多,傳輸?shù)膬热菀膊⒎侵挥形淖帧?/p>

這就是技術報告中提到的核心理念:用計算,換寬帶(Trading computation for bandwidth)。

把傳輸?shù)膲毫?,轉移到了推理計算上。



視頻地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

GVC到底壓了些什么?

既然不傳像素,那這0.02%的數(shù)據(jù)里到底裝了什么?

技術報告揭示了GVC系統(tǒng)的內部構造,它主要由神經編碼器(Neural Encoder)生成式視頻解碼器(Generative Video Decoder)兩部分組成。

里面?zhèn)鬏數(shù)氖且环N被稱為壓縮Token的極小數(shù)據(jù)包,這些Token里包含了視頻的靈魂,主要分為兩類:

  1. 語義信息(Semantic Information): 這是一個什么場景?有人嗎?有車嗎?物體的大致結構是什么?這是畫面的骨架。
  2. 運動信息(Motion Dynamics): 這些物體下一秒往哪動?風怎么吹?車輪怎么轉?這是畫面的靈魂。

經過 TeleAI 團隊的測試,這些Token的大小可以被壓縮到極致的0.005 bpp - 0.008 bpp(bits per pixel,比特每像素)。

這是什么概念?通常我們看的高清視頻,bpp至少在0.1以上。GVC直接把數(shù)據(jù)量砍掉了兩個數(shù)量級。

除此之外,在接收端,還有一個擴散模型(Diffusion Model)嚴陣以待。

它接收到這些簡短的Token指令后,利用預訓練好的海量世界知識(比如它本來就知道海浪長什么樣,足球長什么樣),結合指令中的特征,開始腦補并生成視頻。

這在通信理論上,實現(xiàn)了一次巨大的跨越。

香農-韋弗(Shannon-Weaver)通信模型將通信分為三個層級:

  • Level A:技術問題(傳得準不準?)
  • Level B:語義問題(意思對不對?)
  • Level C:有效性問題(能不能完成任務?)

傳統(tǒng)視頻壓縮在死磕Level A,而GVC直接跳到了Level C



它不在乎每一個像素點是否和原圖一模一樣(比如這片樹葉的紋理是否100%重合),它在乎的是:在人眼看來,這是否是一場連貫、清晰、真實的球賽?在機器看來,能否準確識別出這是否是越位?

數(shù)據(jù)實測:非常省流

極端壓縮聽起來很玄,但具體指標并不含糊。

技術報告中展示了在MCL-JCV權威數(shù)據(jù)集上的測試結果,數(shù)據(jù)非常硬核。

畫質吊打傳統(tǒng)算法

在極低碼率下(0.005 bpp左右),使用LPIPS(一種更符合人類視覺感知的畫質評價指標)進行對比:

  • 傳統(tǒng)霸主HEVC已經徹底崩潰,畫面基本是馬賽克亂舞,LPIPS數(shù)值飆升(越低越好)。
  • GVC生成的畫面依然保持了清晰的紋理和結構,LPIPS數(shù)值顯著低于HEVC。

技術報告中給出了一個驚人的對比結論:傳統(tǒng)方法(如HEVC)要想達到和GVC同樣的視覺畫質,需要消耗6倍以上的帶寬!



這意味著,在同樣的渣畫質網絡下,GVC能讓你看清C羅的表情,而HEVC只能讓你看清C羅是個移動的色塊。

不只是給人看,機器也能用

有人會問:AI生成的視頻,會不會失真?比如把球生成沒了?

這是一個非常犀利且實在的問題。

為此,團隊在DAVIS2017視頻分割任務上進行了驗證;結果顯示,在bpp=0.01的極限壓縮下,GVC重建視頻的J&F指標(衡量分割準確度)顯著高于HEVC。



這說明GVC傳輸?shù)牟粌H僅是“好看”的皮囊,更是“準確”的語義。即使是AI重繪的,關鍵物體(人、車、球)的位置和輪廓也是精準的,完全不影響后續(xù)的AI分析。

消費級顯卡也能跑

計算換寬帶,那會不會把電腦算爆?

確實,生成式模型通常是算力黑洞。但 TeleAI 通過模型小型化、知識蒸餾等手段,搞定了落地的最后一公里。

報告數(shù)據(jù)顯示,經過優(yōu)化的GVC模型,在消費級GPU(如RTX 4090)上,生成一組29幀的畫面大約只需要0.95秒到1.35秒。

雖然比不上傳統(tǒng)解碼器的毫秒級速度,但在很多非實時或準實時的場景下(比如直播延遲幾秒),這已經是完全可用的狀態(tài)了。

當然不只是為了看個世界杯

0.02%,這篇技術報告所展現(xiàn)的關鍵數(shù)據(jù)已然非常驚艷,但它背后更加可期的,還是這項技術給未來帶來的改變。

除了開頭我們提到的世界杯的例子外,在報告展示的Demo場景中,GVC還展現(xiàn)了其它極端網絡環(huán)境下的情況:

  • 遠洋海事通信: 船員通過窄帶衛(wèi)星網絡(帶寬極其昂貴且稀缺)接收數(shù)據(jù)。用GVC,200K的數(shù)據(jù)流就能還原出連貫的球賽直播。這不僅是娛樂,對于海上遠程醫(yī)療、設備維修指導來說,是救命的技術。
  • 應急救援: 地震或洪水災區(qū),基站損毀,只有微弱的應急通信信號。救援無人機傳回的如果是4K畫面,根本發(fā)不出來;如果是GVC壓縮后的Token,指揮中心就能實時看到清晰的現(xiàn)場生成畫面,哪怕細節(jié)紋理是AI補全的,但受災人數(shù)、房屋倒塌結構等核心信息是準確無誤的。
  • 深空探測與車載視頻: 想象一下火星車發(fā)回的視頻,或者數(shù)百萬輛自動駕駛汽車每天上傳的路測數(shù)據(jù)。如果都能壓縮到0.02%,存儲和傳輸成本將呈指數(shù)級下降。



視頻地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

實際上,GVC并非孤立的技術突破,而是建立在“智傳網(AI Flow)”理論體系之上。

智傳網(AI Flow)是人工智能與通信、網絡交叉領域的一項關鍵技術,即通過網絡分層架構,基于連接和交互,實現(xiàn)智能的傳遞和涌現(xiàn)。

在去年的世界人工智能大會(WAIC)上,中國電信集團 CTO、首席科學家、中國電信人工智能研究院(TeleAI)院長李學龍教授,介紹了 TeleAI 在智傳網(AI Flow)研究中所發(fā)現(xiàn)的三個定律:信容律、同源律、集成律。

信容律描述大模型的本質規(guī)律和能力邊界,通過數(shù)據(jù)壓縮的方式來衡量模型的知識密度,也就是智能能力。

同源律則展現(xiàn)大模型的“部分”與“整體”關系,在相同訓練計算開銷下,能指導得到數(shù)量更多、性能更好的不同大小的家族模型。

集成律能指導大模型“單體”與“群體”的協(xié)同,通過多個模型集成的方式,實現(xiàn)智能能力的提升與涌現(xiàn)。



視頻地址:https://mp.weixin.qq.com/s/GG1BFS8mFugifO9xzA33Tg

基于智傳網(AI Flow)的信容律,在AI時代,通信的本質不再是單純的數(shù)據(jù)傳輸,而是智能的分發(fā)與協(xié)同。

在此體系下,GVC通過“用計算換帶寬”的資源置換策略,實現(xiàn)了通信效率與感知質量的最優(yōu)平衡。

GVC就是這一理論的最佳實踐:當帶寬成為瓶頸時,我們就燃燒算力來換取自由。

從像素還原到語義生成,視頻壓縮技術正在經歷一場類似從功能機到智能機的范式轉移。

GVC標志著視頻通信正從像素搬運邁向語義生成的新階段。

作為央企在AI+通信融合創(chuàng)新中的重要成果,它不僅為遠洋通信、應急救援、邊緣智能等場景提供了高效可行的解決方案,更開啟了以任務有效性為核心的下一代視頻傳輸范式:

在未來的互聯(lián)網里,流淌在光纖和電波中的,可能不再是龐大的原始數(shù)據(jù),而是高度濃縮的智慧和指令。

技術報告地址:
https://www.arxiv.org/abs/2512.24300

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
意大利撕毀同中國簽訂的合約,本需賠償70億之巨,而今正為自己的違約行徑付出代價

意大利撕毀同中國簽訂的合約,本需賠償70億之巨,而今正為自己的違約行徑付出代價

老杉說歷史
2026-01-13 19:04:11
伊朗高層48小時緊急轉移15億美元至迪拜,哈梅內伊之子涉3.28億

伊朗高層48小時緊急轉移15億美元至迪拜,哈梅內伊之子涉3.28億

老馬拉車莫少裝
2026-01-15 14:41:59
貿易規(guī)則變了!歐盟啟動CPTPP對話,一場遲來的自救能否成功?

貿易規(guī)則變了!歐盟啟動CPTPP對話,一場遲來的自救能否成功?

安珈使者啊
2026-01-15 14:19:30
全球最小的發(fā)達國家,快被中國人“買”下了,中國移民占比87%!

全球最小的發(fā)達國家,快被中國人“買”下了,中國移民占比87%!

財叔
2025-12-28 22:59:30
化身嘆息之墻!U23亞洲杯小組賽撲救榜:李昊16次大幅領先

化身嘆息之墻!U23亞洲杯小組賽撲救榜:李昊16次大幅領先

懂球帝
2026-01-15 00:27:09
為貼合蔣介石的審美觀,宋美齡一輩子始終在踐行的是哪一件事?

為貼合蔣介石的審美觀,宋美齡一輩子始終在踐行的是哪一件事?

清風鑒史
2025-12-30 23:11:18
天哪,中鐵某局都發(fā)不出工資了?

天哪,中鐵某局都發(fā)不出工資了?

黯泉
2026-01-15 10:45:56
快船119-105奇才!泰倫盧不該棄用一人,倫納德表態(tài)也成重中之重

快船119-105奇才!泰倫盧不該棄用一人,倫納德表態(tài)也成重中之重

魚崖大話籃球
2026-01-15 15:52:10
要么投降,要么死在洞里——內塔尼亞胡拒絕放走被困地道的哈馬斯

要么投降,要么死在洞里——內塔尼亞胡拒絕放走被困地道的哈馬斯

桂系007
2025-11-05 23:52:21
去了北京才發(fā)現(xiàn):沒人穿大衣、皮草,滿大街都是“海淀風3件套”

去了北京才發(fā)現(xiàn):沒人穿大衣、皮草,滿大街都是“海淀風3件套”

小虎新車推薦員
2026-01-13 11:24:22
東風-27再受矚目,五角大樓稱:中國反艦導彈開啟洲際打擊時代

東風-27再受矚目,五角大樓稱:中國反艦導彈開啟洲際打擊時代

百科密碼
2026-01-15 15:56:44
程瀟大腿有點粗

程瀟大腿有點粗

可樂談情感
2026-01-15 11:03:34
伊朗開展突擊行動 查獲大量武器彈藥

伊朗開展突擊行動 查獲大量武器彈藥

財聯(lián)社
2026-01-13 18:41:42
抗癌歸來的馮提莫,力挺“直播禁美顏”,素顏后惡心的一幕上演了

抗癌歸來的馮提莫,力挺“直播禁美顏”,素顏后惡心的一幕上演了

跳跳歷史
2026-01-09 11:32:07
英國這次玩大了,導彈沒落在俄烏前線,直接飛到了俄羅斯本土

英國這次玩大了,導彈沒落在俄烏前線,直接飛到了俄羅斯本土

忠于法紀
2026-01-13 20:40:37
左鐵鏞在京逝世,官網已變黑白

左鐵鏞在京逝世,官網已變黑白

極目新聞
2026-01-14 23:46:15
突發(fā)!曝特斯拉停止開發(fā)戰(zhàn)略車型Model 2

突發(fā)!曝特斯拉停止開發(fā)戰(zhàn)略車型Model 2

電動知家
2026-01-15 11:21:47
撒切爾夫人在回憶錄中坦言:當年并不想歸還香港,考慮過發(fā)動戰(zhàn)爭

撒切爾夫人在回憶錄中坦言:當年并不想歸還香港,考慮過發(fā)動戰(zhàn)爭

泠泠說史
2025-12-15 18:05:17
StatMuse:沃克賽季總得分已超越倫納德字母哥申京等球星

StatMuse:沃克賽季總得分已超越倫納德字母哥申京等球星

林子說事
2026-01-15 12:13:46
從壟斷95%到僅剩2.3%,日本的崩潰循環(huán),中國親手按下終止鍵

從壟斷95%到僅剩2.3%,日本的崩潰循環(huán),中國親手按下終止鍵

墨蘭史書
2025-11-19 11:35:03
2026-01-15 16:35:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12019文章數(shù) 176359關注度
往期回顧 全部

科技要聞

阿里最狠的一次“自我革命”

頭條要聞

媒體:不論美國是否會立即攻打伊朗 中方態(tài)度相當鮮明

頭條要聞

媒體:不論美國是否會立即攻打伊朗 中方態(tài)度相當鮮明

體育要聞

棋圣千古!聶衛(wèi)平俠氣豪情寄國足 一生情緣亦成憾

娛樂要聞

傳奇棋圣聶衛(wèi)平離世,網友集體悼念

財經要聞

央行下調結構性貨幣政策工具利率0.25%

汽車要聞

今年推出超40款新車,BBA要把失去的奪回來

態(tài)度原創(chuàng)

本地
旅游
手機
公開課
軍事航空

本地新聞

云游內蒙|黃沙與碧波撞色,烏海天生會“混搭”

旅游要聞

清照泉城 泉韻茶香|如果李清照有朋友圈,或許會邀您來喝個茶~

手機要聞

紅魔產品經理姜超:所有目前跟進了風扇的同行,都欠紅魔一句感謝

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國已正式開始出售委內瑞拉石油

無障礙瀏覽 進入關懷版