国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型不再是壁壘,高質(zhì)量文檔解析正成為AI落地的“生死線”

0
分享至

最近,辦公軟件圈的風(fēng)向徹底變了。如果說兩年前的“百模大戰(zhàn)”讓大家還沉浸在參數(shù)量級(jí)、算力競(jìng)賽的狂歡中,甚至產(chǎn)生了一種“只要模型足夠強(qiáng),萬事皆可靈”的幻覺,那么現(xiàn)在的市場(chǎng)信號(hào)已經(jīng)冷酷且直白:用戶對(duì)AI的新鮮感正在耗盡,單純的聊天陪聊撐不起AI的下半場(chǎng)。



(圖為:中金公司研究部執(zhí)行總經(jīng)理、計(jì)算機(jī)行業(yè)首席分析師于鐘海)

在1月27日的WPS 365 AI協(xié)同辦公上海峰會(huì)上,中金公司研究部執(zhí)行總經(jīng)理、計(jì)算機(jī)行業(yè)首席分析師于鐘海拋出了一個(gè)引人深思的觀察:頂尖AI實(shí)驗(yàn)室的模型更新周期已縮短至數(shù)月。這意味著,企業(yè)試圖通過自研或深度綁定某一模型來建立競(jìng)爭(zhēng)優(yōu)勢(shì),不僅成本高昂,且“保鮮期”極短。他提出了一個(gè)關(guān)鍵斷言:數(shù)據(jù)才是AI時(shí)代企業(yè)唯一可持續(xù)的護(hù)城河。這一觀點(diǎn)折射出一個(gè)行業(yè)共識(shí)——企業(yè)級(jí)AI的競(jìng)爭(zhēng)重心,正在從“比拼模型有多聰明”,全面轉(zhuǎn)向“比拼數(shù)據(jù)治理有多深”。

很多企業(yè)在做AI轉(zhuǎn)型時(shí),都會(huì)遇到一個(gè)尷尬的困境:AI在演示寫周報(bào)、潤色郵件時(shí)表現(xiàn)驚艷,可一旦進(jìn)入真實(shí)的業(yè)務(wù)深水區(qū),面對(duì)那些積攢了十幾年的合同、設(shè)計(jì)圖紙、工藝手冊(cè),AI就開始“間歇性胡言亂語”。這種“演示很牛,落地就走”的癥結(jié)往往不在于模型不夠聰明,而在于業(yè)務(wù)數(shù)據(jù)的“沉睡”與“無序”。

企業(yè)中80%以上的數(shù)據(jù)是以文檔、報(bào)表、郵件等形式存在的非結(jié)構(gòu)化數(shù)據(jù)。它們散落在不同的煙囪式系統(tǒng)里,格式五花八門,充滿了只有內(nèi)部人才懂的“黑話”和復(fù)雜的邏輯嵌套。如果你喂給模型的“原材料”是亂序、低質(zhì)、甚至邏輯斷裂的,那么產(chǎn)出的只能是誤導(dǎo)。



(圖為:金山辦公副總裁吳慶云)

金山辦公副總裁吳慶云在現(xiàn)場(chǎng)給出了一個(gè)極其直接的判斷:建設(shè)企業(yè)級(jí)AI的首要任務(wù),不再是盲目尋找更先進(jìn)的模型,而是優(yōu)先完成對(duì)企業(yè)非結(jié)構(gòu)化數(shù)據(jù)的收集和治理。如果把大模型比作心臟,數(shù)據(jù)就是血液。血液里如果全是雜質(zhì),心臟再強(qiáng)也帶不動(dòng)身體。而目前大多數(shù)企業(yè)面臨的現(xiàn)狀是,由于缺乏有效的數(shù)據(jù)治理,AI在面對(duì)復(fù)雜業(yè)務(wù)文檔時(shí)會(huì)產(chǎn)生嚴(yán)重的“幻覺”,導(dǎo)致決策參考價(jià)值歸零。

想要治理好這些數(shù)據(jù),最難的一關(guān)其實(shí)是被行業(yè)長期忽視的硬手藝——文檔解析。外界往往認(rèn)為解析文檔就是簡(jiǎn)單的OCR文字識(shí)別,但在真實(shí)的辦公場(chǎng)景中,這卻是一道極高的技術(shù)天花板。能不能精準(zhǔn)解析一份跨頁的嵌套表格,能不能看懂技術(shù)手冊(cè)里的手寫批注,甚至能不能在復(fù)雜的排版中準(zhǔn)確提取出核心要素,直接決定了后續(xù)AI應(yīng)用的效果上限。



(圖為:華中科技大學(xué)教授、博士生導(dǎo)師劉禹良)

在這次峰會(huì)上,華中科技大學(xué)劉禹良教授分享了一個(gè)細(xì)節(jié):他們與金山辦公聯(lián)合研發(fā)的MonkeyOCR模型,在3B的小參數(shù)規(guī)模下,其文檔解析性能竟然超越了GPT-4o、Gemini-2.5 Pro等大參數(shù)閉源模型,在國際權(quán)威榜單OmniDocBench上拿下綜合性能全球第一。

這背后反映了一個(gè)真相:通用大模型雖然“博學(xué)”,但對(duì)中國企業(yè)極其復(fù)雜的文檔格式——尤其是那些充滿行業(yè)壁壘的非標(biāo)準(zhǔn)文檔——缺乏深度理解。而金山辦公憑借38年在文檔領(lǐng)域的底層積淀,對(duì)上萬種文檔格式有著解構(gòu)級(jí)的拆解能力。這種對(duì)復(fù)雜文檔的精準(zhǔn)解析與知識(shí)化能力,正是金山辦公在AI新賽道上構(gòu)建的降維打擊。當(dāng)別的廠商還在卷對(duì)話框的交互UI時(shí),金山辦公正在死磕怎么把一份復(fù)雜的醫(yī)藥不良事件報(bào)告里的表格識(shí)別準(zhǔn)確率做到99%,這種“苦活累活”才是真正拉開差距的護(hù)城河。

這種深厚的數(shù)據(jù)治理能力,直接決定了企業(yè)“大腦”是否真的懂業(yè)務(wù)。金山辦公提出的KAG(知識(shí)增強(qiáng)生成)新范式,本質(zhì)上就是讓AI從單純的“看到文檔”進(jìn)階到“掌握知識(shí)”。它不再是簡(jiǎn)單的關(guān)鍵詞檢索,而是通過多模態(tài)、多結(jié)構(gòu)的知識(shí)提取,讓AI理解企業(yè)知識(shí)間的內(nèi)在邏輯關(guān)聯(lián)。

這種技術(shù)進(jìn)階正在真實(shí)的生產(chǎn)力場(chǎng)景中產(chǎn)生質(zhì)變。在上海金融圈,申萬宏源證券依托這套全域知識(shí)治理方案,將原本散落在不同系統(tǒng)、格式迥異的精算報(bào)告和制度文檔進(jìn)行了集中上云與結(jié)構(gòu)化解析。這讓財(cái)富經(jīng)理在面對(duì)客戶咨詢時(shí),可以通過AI問答替代傳統(tǒng)的人工搜索,平均對(duì)客延時(shí)縮短了3倍以上,整體知識(shí)獲取效率提升了80%。

而在船舶制造這種重工業(yè)領(lǐng)域,中船動(dòng)力正利用這套體系將原本依賴?yán)蠋煾祵<医?jīng)驗(yàn)傳承的工藝手冊(cè)、研發(fā)筆記轉(zhuǎn)化成可流轉(zhuǎn)的知識(shí)圖譜。供應(yīng)鏈團(tuán)隊(duì)借此實(shí)現(xiàn)了原本極其依賴人工的市場(chǎng)價(jià)格分析與政策變動(dòng)追蹤的自動(dòng)化,不僅大幅縮短了審查周期,更顯著降低了人為疏漏帶來的風(fēng)險(xiǎn)。即使在規(guī)則極其嚴(yán)苛的汽車研發(fā)領(lǐng)域,聯(lián)合汽車電子也通過將數(shù)千頁的復(fù)雜制度規(guī)范喂給AI,讓員工不再需要翻閱厚重的手冊(cè),通過精準(zhǔn)的問答即刻獲得業(yè)務(wù)支撐,確保了制度執(zhí)行的準(zhǔn)確性。

這些真實(shí)的業(yè)務(wù)反饋說明了一個(gè)趨勢(shì):AI正從“好玩的工具”變成“好用的員工”。它不再是辦公軟件的一個(gè)點(diǎn)綴,而是成為了企業(yè)的業(yè)務(wù)中樞和決策大腦。WPS 365所構(gòu)建的這種“懂?dāng)?shù)據(jù)、懂組織、懂業(yè)務(wù)”的能力,實(shí)際上是在幫助企業(yè)將沉睡的數(shù)字資產(chǎn)轉(zhuǎn)化為活躍的生產(chǎn)力要素。

站在科技產(chǎn)研的角度看,企業(yè)級(jí)AI的競(jìng)爭(zhēng)已經(jīng)進(jìn)入了下半場(chǎng)。當(dāng)模型本身逐漸變成像水電一樣的基礎(chǔ)設(shè)施,企業(yè)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的治理深度,就成了AI落地成敗的唯一變量。



(圖為:金山辦公助理總裁朱熠鍔)

金山辦公的策略非常清晰:與其參與虛無的模型參數(shù)大戰(zhàn),不如死磕“文檔解析”與“知識(shí)治理”這兩項(xiàng)基本功。這種“先修內(nèi)功,再出招”的打法,源于其幾十年在國產(chǎn)化適配和復(fù)雜辦公場(chǎng)景中的厚積薄發(fā)。正如金山辦公助理總裁朱熠鍔所強(qiáng)調(diào)的,讓大模型真正“掌握”企業(yè)真正的知識(shí)資產(chǎn),才是WPS 365的核心愿景。

在這個(gè)浮躁的、動(dòng)輒談?wù)擃嵏驳臅r(shí)代,與其追逐飄在云端的風(fēng)口,不如像金山辦公這樣,在自己最擅長的領(lǐng)域里把護(hù)城河筑得更深、更寬。畢竟,在AI的漫長競(jìng)賽里,最后能留在桌上的,往往是那些真正理解用戶痛點(diǎn)、并愿意在基礎(chǔ)技術(shù)上長期深耕的“長期主義者”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“穿靴子的一看就是窮養(yǎng)女”,大學(xué)女寢視頻火了,4號(hào)深不可測(cè)

“穿靴子的一看就是窮養(yǎng)女”,大學(xué)女寢視頻火了,4號(hào)深不可測(cè)

澤澤先生
2026-03-06 21:45:15
特朗普大禍臨頭!伊朗已公開放話,全球?qū)⒆兊酶靵y?

特朗普大禍臨頭!伊朗已公開放話,全球?qū)⒆兊酶靵y?

毛豆論道
2026-03-06 18:26:34
成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒給他留一絲體面

成龍安排好身后事才2個(gè)月,翁靜晶再曝大瓜,沒給他留一絲體面

星星沒有你亮
2026-02-28 20:40:21
陳立夫:從高官到雞農(nóng),58歲患糖尿病,活102歲的長壽秘訣是什么

陳立夫:從高官到雞農(nóng),58歲患糖尿病,活102歲的長壽秘訣是什么

林雁飛
2026-03-06 14:35:14
三婚又要離,越扒越窒息,他也太渣了!

三婚又要離,越扒越窒息,他也太渣了!

背包旅行
2026-03-07 20:05:55
中植系終判之后——萬億金融廢墟下,未清資產(chǎn)與家族信托的隱秘角落丨【思維深潛】

中植系終判之后——萬億金融廢墟下,未清資產(chǎn)與家族信托的隱秘角落丨【思維深潛】

新浪財(cái)經(jīng)
2026-03-08 08:10:00
印前參謀長終于承認(rèn):印軍白死了!加勒萬那夜,輸?shù)母静皇悄懥?>
    </a>
        <h3>
      <a href=知識(shí)TNT
2026-03-08 11:00:08
澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

澳大利亞驚現(xiàn)封閉亂倫家族:4代人近親繁衍38名成員全是亂倫產(chǎn)物

第7情感
2026-02-23 20:45:16
沒想到,2026兩會(huì)最火的提案不是醫(yī)療和就業(yè),而是靳東的這一建議

沒想到,2026兩會(huì)最火的提案不是醫(yī)療和就業(yè),而是靳東的這一建議

天天熱點(diǎn)見聞
2026-03-07 10:11:29
渤海完全屬于中國!因當(dāng)年毛主席的一句話,如今沒有一艘外船敢進(jìn)

渤海完全屬于中國!因當(dāng)年毛主席的一句話,如今沒有一艘外船敢進(jìn)

抽象派大師
2025-12-11 17:05:41
伊朗玫瑰宮遭炸!圓明園之痛重現(xiàn)?英美“文明”面具下的文物之殤

伊朗玫瑰宮遭炸!圓明園之痛重現(xiàn)?英美“文明”面具下的文物之殤

眼界看視野
2026-03-05 09:07:21
G聯(lián)賽:楊瀚森15+9+5+5失誤5犯遭肘擊 混音罰球準(zhǔn)絕殺太陽

G聯(lián)賽:楊瀚森15+9+5+5失誤5犯遭肘擊 混音罰球準(zhǔn)絕殺太陽

醉臥浮生
2026-03-08 09:12:42
中戲北電藝考擠破頭,林棟哲、溫宜公主都來了,今年好多明星考生

中戲北電藝考擠破頭,林棟哲、溫宜公主都來了,今年好多明星考生

大鐵貓娛樂
2026-03-07 21:30:03
1952年,蔣介石看到報(bào)紙氣得手抖:敗光我55萬大軍的“豬將軍”,竟然在印尼干這個(gè)?

1952年,蔣介石看到報(bào)紙氣得手抖:敗光我55萬大軍的“豬將軍”,竟然在印尼干這個(gè)?

歷史回憶室
2026-02-15 23:57:12
油價(jià)即將調(diào)整 調(diào)整幅度以國家發(fā)改委官方宣布為準(zhǔn)

油價(jià)即將調(diào)整 調(diào)整幅度以國家發(fā)改委官方宣布為準(zhǔn)

每日經(jīng)濟(jì)新聞
2026-03-08 11:29:34
智能電網(wǎng)龍頭三連板 智能配電和電網(wǎng)自動(dòng)化領(lǐng)域A股名單及相關(guān)業(yè)務(wù)一覽

智能電網(wǎng)龍頭三連板 智能配電和電網(wǎng)自動(dòng)化領(lǐng)域A股名單及相關(guān)業(yè)務(wù)一覽

中國能源網(wǎng)
2026-03-08 07:55:28
又揪出來一個(gè)巨貪,金額高達(dá)9.7億,首富夫人郝斌跨境逃亡失敗了

又揪出來一個(gè)巨貪,金額高達(dá)9.7億,首富夫人郝斌跨境逃亡失敗了

墨蘭史書
2026-01-17 08:30:09
【微特稿】以軍士兵空降黎巴嫩 黎民眾流離失所加劇

【微特稿】以軍士兵空降黎巴嫩 黎民眾流離失所加劇

新華社
2026-03-07 21:22:06
王思聰送珠寶高調(diào)表白懶懶:老婆我愛你,兩人同框照曝光很恩愛

王思聰送珠寶高調(diào)表白懶懶:老婆我愛你,兩人同框照曝光很恩愛

觀察鑒娛
2026-03-08 09:35:31
老賴黃淑芬把人撞成植物人, 寧可坐牢也不賠償, 后續(xù)結(jié)局大快人心

老賴黃淑芬把人撞成植物人, 寧可坐牢也不賠償, 后續(xù)結(jié)局大快人心

觀察鑒娛
2026-03-07 10:26:48
2026-03-08 16:48:49
技術(shù)領(lǐng)導(dǎo)力 incentive-icons
技術(shù)領(lǐng)導(dǎo)力
Mr.K,出過書,做過CTO
70文章數(shù) 579關(guān)注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

伊朗軍方公布"家底":具備打至少6個(gè)月高強(qiáng)度戰(zhàn)爭(zhēng)能力

頭條要聞

伊朗軍方公布"家底":具備打至少6個(gè)月高強(qiáng)度戰(zhàn)爭(zhēng)能力

體育要聞

大傷后被交易,他說:22歲的我已經(jīng)死了

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財(cái)經(jīng)要聞

油價(jià)要失控?

汽車要聞

9分鐘充飽 全新騰勢(shì)Z9GT首搭閃充技術(shù)26.98萬起

態(tài)度原創(chuàng)

游戲
健康
時(shí)尚
親子
本地

外媒盤點(diǎn)六大利器!新Xbox能否終結(jié)主機(jī)戰(zhàn)爭(zhēng)劣勢(shì)?

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

2026春夏一定要擁有的6只包,好看又百搭

親子要聞

泰國老丈人滿心是欣欣 上班都沒心思 就想早點(diǎn)回家陪娃

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

無障礙瀏覽 進(jìn)入關(guān)懷版