国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

視覺幻象還是真實突破?中日聯(lián)合研究質(zhì)疑DeepSeek“讀圖”新成果

0
分享至


據(jù)scmp報道,人工智能領域爆發(fā)了一場罕見的技術(shù)遭遇戰(zhàn),焦點直指中國當紅AI獨角獸DeepSeek的核心技術(shù)。

來自日本東北大學與中國科學院的聯(lián)合研究團隊,今日發(fā)布了一份名為《視覺優(yōu)勢還是語言拐杖?深入研究DeepSeek-OCR》的重磅報告,直接質(zhì)疑了DeepSeek數(shù)月前引發(fā)轟動的“視覺文本壓縮”技術(shù)。

這項曾被譽為能讓AI“一目十行”甚至“過目不忘”的革命性創(chuàng)新,在科學家的顯微鏡下顯露出了尷尬的一面:它可能并不是真的“看懂”了文件,而是憑借強大的語言直覺在“猜”內(nèi)容。

這場學術(shù)界的正面交鋒,不僅給DeepSeek的高速發(fā)展踩了一腳剎車,也讓整個科技界開始重新審視多模態(tài)大模型的真實能力邊界。

“降維打擊”背后的技術(shù)隱憂

要理解這場爭議的嚴重性,我們需要先回顧一下DeepSeek到底做出了什么驚艷的承諾。

在幾個月前,DeepSeek推出了一項名為DeepSeek-OCR的技術(shù),宣稱找到了一條處理超長文本的捷徑,即“視覺感知壓縮”。

傳統(tǒng)的AI閱讀長篇小說或法律文檔時,是將文字逐個轉(zhuǎn)化成Token(計算機能理解的詞元),這不僅昂貴而且計算量巨大。


DeepSeek-OCR技術(shù)利用視覺感知作為壓縮媒介,能夠處理大型復雜文檔。圖片:路透社

DeepSeek的工程師們另辟蹊徑,他們讓AI把文本直接當成圖片來看,利用視覺信息的高密度特性,將原本冗長的文字壓縮成極其精簡的視覺信號。

根據(jù)當時的數(shù)據(jù),這種方法能將長文本的信息處理效率提升10到20倍,甚至有媒體驚呼這是通向“無限上下文”的圣杯。

然而,中科院與東北大學的最新研究卻給這盆熱火澆了一盆冷水。

研究人員發(fā)現(xiàn),當DeepSeek的模型面對一份由于掃描質(zhì)量不佳或字體模糊的文檔時,它依然能流暢地輸出內(nèi)容,但這恰恰是問題所在。

在嚴格的受控實驗中,研究者故意遮擋了文檔中的關(guān)鍵視覺信息,或者輸入了一些視覺上極難辨認的亂碼圖片,DeepSeek的模型竟然依然能“讀”出通順的句子。

這揭示了一個令人不安的真相:模型在很大程度上并非依賴“眼睛”去識別圖片中的字形,而是依賴大腦中預存的“語言先驗知識”在進行填空游戲。

換句話說,就像一個偷懶的學生,雖然看不清黑板上的字,但憑借對課文的背誦和上下文的理解,硬是把筆記抄全了。

這種“腦補”能力在處理常規(guī)文章時或許能蒙混過關(guān),甚至顯得表現(xiàn)優(yōu)異,但在處理財務報表、醫(yī)療檔案或法律合同等容錯率為零的場景時,就埋下了巨大的雷。

一旦文檔中出現(xiàn)了不符合常規(guī)邏輯的真實數(shù)據(jù),過度依賴“語言直覺”的模型極有可能無視眼前的視覺證據(jù),強行輸出它認為“合理”但實際錯誤的各種信息。

被誤導的性能指標與行業(yè)反思

這份研究報告最尖銳的指控在于,它指出DeepSeek此前公布的性能指標具有“誤導性”。

在標準測試集中,由于文本內(nèi)容大多符合人類語言的通用規(guī)律,模型的“猜詞”命中率極高,從而掩蓋了其視覺識別能力的短板。

研究團隊創(chuàng)造性地引入了“語義干擾”測試,即在文檔圖片中故意插入一些語義不通順但視覺清晰的文字。

結(jié)果顯示,DeepSeek-OCR的性能瞬間大幅跳水,它往往會忽略那些真實的“亂語”,而試圖將其糾正為通順的“人話”。

這種現(xiàn)象在心理學上被稱為“空想性錯視”,如今卻生動地發(fā)生在最前沿的人工智能身上。

對于急于將AI落地到金融審核、自動駕駛等高風險領域的企業(yè)來說,這無異于一記警鐘。

如果AI只是在“假裝”看見,那么它所構(gòu)建的安全大廈可能建立在沙灘之上。

這篇論文的發(fā)表在各大技術(shù)社區(qū)引發(fā)了激烈的討論,許多開發(fā)者開始復盤自己在使用DeepSeek接口時遇到的“幻覺”問題。

一位不愿透露姓名的硅谷工程師在社交媒體上表示,這解釋了為什么他們的文檔分析工具偶爾會“創(chuàng)造”出原文件中不存在的日期和金額。

這種對“先驗知識”的過度依賴,本質(zhì)上是目前所有大語言模型面臨的通病,即模型太聰明了,聰明到學會了如何走捷徑來通過考試。

DeepSeek此次遭遇的質(zhì)疑,實際上是整個AI行業(yè)從“暴力美學”向“精細化認知”轉(zhuǎn)型過程中必須經(jīng)歷的陣痛。

依靠堆算力、堆數(shù)據(jù)帶來的能力提升,終究會撞上邏輯與物理現(xiàn)實的墻壁。

真正的多模態(tài)智能,不應僅僅是視覺與語言模塊的簡單拼接,而應建立在對物理世界真實感知的因果鏈條之上。

打破黑盒:邁向可信賴的AI

盡管面臨嚴厲的學術(shù)指控,但我們不應全盤否定DeepSeek在探索新型架構(gòu)上的勇氣。

將文本視覺化壓縮依然是一個極具潛力的研究方向,它試圖打破語言模型對文本序列長度的物理限制。

此次中日研究團隊的發(fā)現(xiàn),更像是一次必要的“糾偏”,它迫使研究人員從單純追求壓縮比和跑分,轉(zhuǎn)向關(guān)注模型內(nèi)部的運作機理。

這也給中國乃至全球的AI初創(chuàng)公司提了一個醒:在激烈的軍備競賽中,發(fā)布的每一項“黑科技”都將被置于全球同行的顯微鏡下。

科學的進步往往不是直線向上的,而是在不斷的提出假設、驗證假設和推翻假設中螺旋上升。

東北大學與中科院的這項研究,為我們提供了一套全新的檢測工具,即如何區(qū)分AI是在“看”還是在“猜”。

這對于未來構(gòu)建更加魯棒、可信的AI系統(tǒng)至關(guān)重要。

我們期待DeepSeek團隊能正面回應這一技術(shù)挑戰(zhàn),通過改進算法架構(gòu),平衡視覺感知與語言推理的權(quán)重。

也許下一代的DeepSeek-OCR,能夠真正學會像人類一樣,既能利用經(jīng)驗快速閱讀,又能在關(guān)鍵細節(jié)上“眼見為實”。

這場關(guān)于“視覺優(yōu)勢”與“語言拐杖”的辯論,注定將成為2026年AI發(fā)展史上一個重要的注腳。

它提醒我們,在通往通用人工智能的道路上,誠實地面對技術(shù)的局限性,比盲目地歡呼每一個高分榜單都要重要得多。

畢竟,我們需要的是一個真正能幫人類解決問題的助手,而不是一個擅長腦補的“差不多先生”。

隨著更多第三方獨立研究的介入,人工智能技術(shù)祛魅的過程正在加速,這對于整個行業(yè)的健康發(fā)展而言,無疑是一件幸事。

閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828


未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
鈞正平發(fā)文:中國人民永遠都要保持居安思危的清醒

鈞正平發(fā)文:中國人民永遠都要保持居安思危的清醒

閃電新聞
2026-03-02 12:29:06
伊朗大阿亞圖拉宣布圣戰(zhàn),他的地位如何?其發(fā)言會引發(fā)什么結(jié)果?

伊朗大阿亞圖拉宣布圣戰(zhàn),他的地位如何?其發(fā)言會引發(fā)什么結(jié)果?

之乎者也小魚兒
2026-03-02 09:13:10
演都不演了!剛復出就開演唱會,票價賣到1280,到底誰給的自信

演都不演了!剛復出就開演唱會,票價賣到1280,到底誰給的自信

樂悠悠娛樂
2026-03-01 10:27:25
中國人月薪過萬很普遍了嗎?網(wǎng)友:據(jù)說沿海基本上都過萬哦

中國人月薪過萬很普遍了嗎?網(wǎng)友:據(jù)說沿海基本上都過萬哦

帶你感受人間冷暖
2026-03-01 04:35:13
A股:剛剛,中央四部門聯(lián)合發(fā)布,不出意外,周二將迎來新的轉(zhuǎn)變

A股:剛剛,中央四部門聯(lián)合發(fā)布,不出意外,周二將迎來新的轉(zhuǎn)變

另子維愛讀史
2026-03-02 19:31:01
悄無聲息的從21漲到254,因為一個概念,近一年低調(diào)的漲了12倍

悄無聲息的從21漲到254,因為一個概念,近一年低調(diào)的漲了12倍

有范又有料
2026-03-02 16:16:13
基辛格坦言:如果爆發(fā)核戰(zhàn)爭,中國可能只有5個地方可以躲避危險

基辛格坦言:如果爆發(fā)核戰(zhàn)爭,中國可能只有5個地方可以躲避危險

混沌錄
2026-03-02 17:15:04
男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

男子送相親對象回家遇其忘帶鑰匙,開房遭拒后女子怒斥男子真沒用

朗威談星座
2026-03-02 16:54:30
“91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

“91女神”琪琪堪稱該系列知名度最高的女生,男方只給自己打碼

挪威森林
2026-03-02 14:18:46
小米車主敗訴!小米SU7Ultra挖孔機蓋案宣判,法院:不涉及虛假宣傳銷售欺詐

小米車主敗訴!小米SU7Ultra挖孔機蓋案宣判,法院:不涉及虛假宣傳銷售欺詐

DeepAuto車探
2026-03-02 11:45:43
羅永浩不知要卸妝一年沒卸 結(jié)果長了黃褐斑 現(xiàn)狀已失控

羅永浩不知要卸妝一年沒卸 結(jié)果長了黃褐斑 現(xiàn)狀已失控

快科技
2026-03-02 09:27:07
吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進店小心翼翼的怕說錯話

吃蘭州拉面的人為什么越來越少了?網(wǎng)友:進店小心翼翼的怕說錯話

另子維愛讀史
2026-02-27 20:31:34
金正恩一句話讓全球震驚,韓國顫抖,中方第二天就出面發(fā)聲

金正恩一句話讓全球震驚,韓國顫抖,中方第二天就出面發(fā)聲

青煙小先生
2026-03-02 10:19:13
網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

網(wǎng)友詢問:哈梅內(nèi)伊為何不給民主發(fā)槍抵抗,評論區(qū)炸鍋,輿論撕裂

眼光很亮
2026-03-01 16:12:51
中國藝人被困中東!黃渤驚險逃離,玄子一家7000租車,周雨彤回京

中國藝人被困中東!黃渤驚險逃離,玄子一家7000租車,周雨彤回京

潮鹿逐夢
2026-03-02 22:48:22
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
油價或飆升至每桶130美元?伊朗警告:若油氣設施遭襲,將摧毀地區(qū)所有國家油氣設施

油價或飆升至每桶130美元?伊朗警告:若油氣設施遭襲,將摧毀地區(qū)所有國家油氣設施

紅星新聞
2026-03-02 11:33:13
伊朗殺瘋了:伊朗空軍立了大功,擊落美F-15戰(zhàn)機,飛行員被俘虜?

伊朗殺瘋了:伊朗空軍立了大功,擊落美F-15戰(zhàn)機,飛行員被俘虜?

墨羽怪談
2026-03-03 00:36:56
突發(fā):莫斯科遭襲擊

突發(fā):莫斯科遭襲擊

臺州交通廣播
2026-03-03 01:02:43
寧波一旅游團所乘郵輪滯留迪拜,船上有約200名中國游客

寧波一旅游團所乘郵輪滯留迪拜,船上有約200名中國游客

上觀新聞
2026-03-02 16:27:07
2026-03-03 02:19:00
人工智能學家 incentive-icons
人工智能學家
人工智能領域權(quán)威媒體
4555文章數(shù) 37413關(guān)注度
往期回顧 全部

科技要聞

蘋果中國官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國留學生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國留學生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

娛樂要聞

李亞鵬與哥哥和解 只有一條真心話短信

財經(jīng)要聞

油價飆升 美伊沖突將如何攪動全球經(jīng)濟

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

教育
手機
親子
健康
公開課

教育要聞

特別猛,但在留學生心中存在感很低的英國大學!

手機要聞

iPhone 17e發(fā)布:4499元起,e系列首次搭載靈動島

親子要聞

45歲這年,我這個二胎媽媽決定做一件“瘋狂”的事

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版