国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

數(shù)博對話|北京交通大學(xué)教授張向宏:高質(zhì)量數(shù)據(jù)集是決定大模型質(zhì)量的關(guān)鍵因素

0
分享至

  2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(以下簡稱數(shù)博會)將于8月28日在貴州貴陽啟幕。本屆數(shù)博會以“數(shù)聚產(chǎn)業(yè)動能 智啟發(fā)展新篇”為主題,旨在推動數(shù)據(jù)資源的高效匯聚和開發(fā)利用,為產(chǎn)業(yè)轉(zhuǎn)型升級和經(jīng)濟高質(zhì)量發(fā)展注入強勁動力。北京交通大學(xué)信息管理理論與技術(shù)國際研究中心教授張向宏作為數(shù)據(jù)領(lǐng)域的深耕者和數(shù)博會的長期參與者,近日接受對話專訪,圍繞數(shù)字化轉(zhuǎn)型成效、數(shù)據(jù)要素市場化破局、基礎(chǔ)設(shè)施挑戰(zhàn)與機遇、數(shù)博會平臺價值及未來發(fā)展等核心議題,分享了他的深刻洞察與前瞻建議。

  問:從您的研究視角看,目前哪些場景的數(shù)字化轉(zhuǎn)型已初見成效?還有哪些領(lǐng)域的數(shù)據(jù)價值尚未被充分挖掘?

  張向宏:國家數(shù)據(jù)局成立以來,通過實施“數(shù)據(jù)要素×”行動計劃、國家數(shù)據(jù)要素綜合示范區(qū)、國家數(shù)字經(jīng)濟創(chuàng)新發(fā)展試驗區(qū)、公共數(shù)據(jù)“跑起來”、國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)、國家數(shù)據(jù)標(biāo)注基地建設(shè)、城市全域數(shù)字化轉(zhuǎn)型、數(shù)據(jù)產(chǎn)業(yè)集聚區(qū)、高質(zhì)量數(shù)據(jù)集建設(shè)、可信數(shù)據(jù)空間建設(shè)等一系列試點示范工程,逐步探索出了一條行之有效的數(shù)據(jù)資源“供得出、流的動、用的好、保安全”路徑,有效促進了各行各業(yè)的數(shù)據(jù)資源開發(fā)利用和數(shù)字化轉(zhuǎn)型??傮w來看,各領(lǐng)域數(shù)字化轉(zhuǎn)型可以分為四個梯隊:

  第一梯隊是互聯(lián)網(wǎng)、金融、商貿(mào)流通等行業(yè),數(shù)字化轉(zhuǎn)型深度和廣度不斷拓展,面向數(shù)據(jù)的生產(chǎn)經(jīng)營、管理決策、供應(yīng)鏈管理、客戶管理等垂直大模型、智能體等數(shù)據(jù)系統(tǒng)應(yīng)用越來越廣泛,正在快速替代面向流程和業(yè)務(wù)的信息化系統(tǒng)。

  第二梯隊是氣象、時空、醫(yī)療、交通等行業(yè),數(shù)據(jù)采集匯聚規(guī)模大、質(zhì)量高,數(shù)據(jù)在本行業(yè)和跨領(lǐng)域的應(yīng)用越來越普遍,人工智能垂直大模型和智能體等應(yīng)用不斷增多。

  第三梯隊是政務(wù)服務(wù)、社會管理、高端制造業(yè)等領(lǐng)域,大多數(shù)處于信息系統(tǒng)建設(shè)運營階段,數(shù)據(jù)資源采集匯聚不斷增強,但數(shù)據(jù)資源加工處理仍然滯后,數(shù)據(jù)應(yīng)用還處于初級階段。

  第四梯隊是中小企業(yè)、農(nóng)業(yè)等領(lǐng)域,大多數(shù)還處于信息化初級階段,信息系統(tǒng)還沒有建設(shè)應(yīng)用,數(shù)據(jù)資源還未得到充分重視,數(shù)據(jù)還沒有得到應(yīng)用。

  問:數(shù)據(jù)要素市場化是當(dāng)前的熱點,您認(rèn)為不同行業(yè)在數(shù)據(jù)確權(quán)、定價、交易等環(huán)節(jié)存在哪些共性難題?結(jié)合您的研究,有哪些針對性的解決思路?

  張向宏:數(shù)據(jù)是一種新型生產(chǎn)要素,具有與土地、勞動力、技術(shù)、資本等傳統(tǒng)生產(chǎn)要素迵然不同的新特點,如數(shù)據(jù)的多環(huán)節(jié)性和低成本易復(fù)制性特點,決定了數(shù)據(jù)要素很難確權(quán)或者確權(quán)成本很高;數(shù)據(jù)的阿羅信息悖論效應(yīng)特征,決定了數(shù)據(jù)很難實現(xiàn)場內(nèi)規(guī)模交易;數(shù)據(jù)價值不確定性特征,決定了數(shù)據(jù)價值易變、很難定價。

  面向人工智能的行業(yè)高質(zhì)量數(shù)據(jù)集構(gòu)建是解決數(shù)據(jù)要素化價值化的一條可行路徑。從數(shù)據(jù)要素化的具體實踐來看,數(shù)據(jù)要素化價值化絕不能陷入傳統(tǒng)要素的慣性路線中,或者說,簡單地將傳統(tǒng)要素的做法移植到數(shù)據(jù)要素中,是行不通的。當(dāng)前,一方面是人工智能應(yīng)用普及對數(shù)據(jù)資源需求日益迫切,另一方面是國家層面對數(shù)據(jù)資源開發(fā)利用制度供給不斷加大,兩端相向而行,已形成一條清晰的面向人工智能的數(shù)據(jù)產(chǎn)業(yè)鏈條。

  數(shù)據(jù)產(chǎn)業(yè)鏈條的下游是垂域大模型在千行百業(yè)的應(yīng)用;中下游是在基礎(chǔ)大模型上加上大規(guī)模的行業(yè)高質(zhì)量數(shù)據(jù)集,訓(xùn)練和調(diào)優(yōu)而成的各種垂域大模型;中上游是在各行業(yè)采集匯聚的海量數(shù)據(jù)資源基礎(chǔ)上,加工生產(chǎn)出的規(guī)?;?、標(biāo)準(zhǔn)化、體系化高質(zhì)量數(shù)據(jù)集;上游是各行各業(yè)的數(shù)據(jù)資源供給。而這條“數(shù)據(jù)資源—高質(zhì)量數(shù)據(jù)集—垂域大模型—千行百業(yè)應(yīng)用”數(shù)據(jù)產(chǎn)業(yè)鏈,都需要在數(shù)據(jù)基礎(chǔ)設(shè)施中實現(xiàn)。

  問:隨著各行業(yè)數(shù)據(jù)量爆發(fā)式增長,數(shù)據(jù)存儲、算力支撐、算法優(yōu)化等基礎(chǔ)設(shè)施層面面臨哪些新挑戰(zhàn)?您覺得技術(shù)突破的關(guān)鍵方向在哪里?

  張向宏:算力和模型對人工智能應(yīng)用的制約已大大緩解。算力、算法和數(shù)據(jù)是人工智能的三個關(guān)鍵要素,長期以來,高耗算力、模型閉源和數(shù)據(jù)短缺一直制約著人工智能大模型的應(yīng)用普及。以DeepSeek為代表的人工智能企業(yè),實現(xiàn)了MOE等關(guān)鍵技術(shù)重大突破,并采取了模型開源策略,實現(xiàn)了“算力平權(quán)”和“算法平權(quán)”,突破了人工智能三要素中的兩大要素制約,促進人工智能大模型向通信、互聯(lián)網(wǎng)、汽車、能源、金融、醫(yī)療、科技等各行各業(yè)加速滲透,顯著降低了成本,提高了效率,并優(yōu)化了用戶體驗,人工智能大模型廣泛應(yīng)用的時代已經(jīng)到來。

  高質(zhì)量數(shù)據(jù)集是成為決定大模型質(zhì)量的關(guān)鍵因素。DeepSeek實現(xiàn)“算力平權(quán)”和“算法平權(quán)”后,“數(shù)據(jù)平權(quán)”已成為人工智能大模型發(fā)展的最后一個堡壘,高質(zhì)量數(shù)據(jù)集的供給規(guī)模和質(zhì)量已成為決定人工智能大模型在各行業(yè)領(lǐng)域滲透速度和應(yīng)用水平的最關(guān)鍵因素。在同等計算資源下,決定生成模型的因素中,高質(zhì)量數(shù)據(jù)集的規(guī)模大小遠(yuǎn)比算法模型規(guī)模大小更加重要。而在使用醫(yī)學(xué)數(shù)據(jù)訓(xùn)練大模型過程中,即使醫(yī)療數(shù)據(jù)集中含有0.001%的錯誤信息,也可能導(dǎo)致模型輸出不準(zhǔn)確的醫(yī)學(xué)答案。

  垂域大模型正廣泛應(yīng)用于企業(yè)的生產(chǎn)、管理、經(jīng)營,企業(yè)的核心競爭力取決于其垂域大模型的“聰明”程度和“熟練”程度等大模型能力。垂域大模型的訓(xùn)練和推理高度依賴高質(zhì)量數(shù)據(jù)集的供給。高質(zhì)量數(shù)據(jù)集的規(guī)模和質(zhì)量直接影響人工智能大模型的“智商”水平,高質(zhì)量數(shù)據(jù)集已成為企業(yè)的核心競爭力和真正的“護城河”。

  私域數(shù)據(jù)安全流通成為制約高質(zhì)量數(shù)據(jù)集建設(shè)的關(guān)鍵瓶頸。全球數(shù)據(jù)資源中20%是公域數(shù)據(jù),也稱作可流通數(shù)據(jù),80%是私域數(shù)據(jù),或稱不可流通數(shù)據(jù)。在20%的公域數(shù)據(jù)中,只有4%的數(shù)據(jù)是能在互聯(lián)網(wǎng)上流通的格式化數(shù)據(jù),其他16%的多模態(tài)數(shù)據(jù)不能在互聯(lián)網(wǎng)上直接流通。當(dāng)前,人工智能大模型對數(shù)據(jù)的消耗量越來越大,預(yù)計2028年互聯(lián)網(wǎng)上流通的數(shù)據(jù)將全部耗盡。

  在互聯(lián)網(wǎng)上可流通數(shù)據(jù)將全部耗盡的背景下,人工智能大模型的聰明程度、智商水平和應(yīng)用普及程度,將越來越多地取決于多模態(tài)數(shù)據(jù)和私域數(shù)據(jù)的安全高效流通程度,特別是私域數(shù)據(jù)的安全流通已成為世界各國必須解決的一個普遍性問題。這就需要從思想觀念和管理體制機制方面,從傳統(tǒng)數(shù)據(jù)靜態(tài)安全轉(zhuǎn)變到數(shù)據(jù)動態(tài)安全上來。建設(shè)一個既能促進私域數(shù)據(jù)大規(guī)模、高效流通,又能確保流通過程中安全的數(shù)據(jù)流通利用基礎(chǔ)設(shè)施,成為私域數(shù)據(jù)安全高效流通的基礎(chǔ)和前提。

  問:數(shù)博會作為數(shù)據(jù)領(lǐng)域的重要平臺,您有什么樣的參會經(jīng)歷或印象?您認(rèn)為它在推動數(shù)據(jù)技術(shù)創(chuàng)新、促進產(chǎn)學(xué)研合作方面,起到了哪些關(guān)鍵作用?

  張向宏:數(shù)博會是全球首個以大數(shù)據(jù)為主題的博覽會,也是我國數(shù)據(jù)領(lǐng)域的兩大國家級平臺之一,得到了黨中央、國務(wù)院的高度肯定和支持,傾注了國家數(shù)據(jù)局和貴州省、貴陽市的大量心血,吸引了全國乃至世界各地數(shù)據(jù)領(lǐng)域政府、企業(yè)、大學(xué)、科研機構(gòu)等參與,不僅已成為數(shù)據(jù)成果展示、技術(shù)交流、應(yīng)用合作的一個全球性平臺,更是推動產(chǎn)學(xué)研深度融合、促進數(shù)字經(jīng)濟高質(zhì)量發(fā)展的重要引擎。在推動數(shù)據(jù)技術(shù)創(chuàng)新和產(chǎn)學(xué)研合作方面發(fā)揮了重要作用,主要體現(xiàn)在以下幾個方面:

  一是引領(lǐng)行業(yè)技術(shù)方向,促進前沿技術(shù)應(yīng)用。數(shù)博會聚焦大數(shù)據(jù)、人工智能、云計算等前沿技術(shù),為職業(yè)教育和技術(shù)研發(fā)提供了清晰的行業(yè)風(fēng)向標(biāo)。

  二是搭建校企合作平臺,深化產(chǎn)教融合。數(shù)博會聚集了華為、騰訊、螞蟻等科技企業(yè),為高校和企業(yè)搭建合作平臺,促進訂單班、實訓(xùn)基地共建等深度合作。2025數(shù)博會還通過“數(shù)字人才培養(yǎng)”活動,匯聚政府、高校、企業(yè)、研究機構(gòu)等多方力量,探討產(chǎn)學(xué)研用協(xié)同育人模式。

  三是促進跨區(qū)域、跨領(lǐng)域協(xié)同創(chuàng)新。數(shù)博會連接了全國甚至世界各地在數(shù)據(jù)領(lǐng)域的合作。如深圳市大數(shù)據(jù)研究院與香港中文大學(xué)(深圳)合作,在貴陽大數(shù)據(jù)科創(chuàng)城開展人工智能研究,賦能區(qū)域數(shù)字化轉(zhuǎn)型。

  問:您認(rèn)為未來數(shù)博會在聚焦數(shù)據(jù)領(lǐng)域的深度、推動產(chǎn)業(yè)落地等方面,還有哪些可以優(yōu)化或加強的地方?

  張向宏:未來的數(shù)博會,應(yīng)在三個維度上更加突出應(yīng)用、突出產(chǎn)業(yè)。

  一是更加重視面向人工智能應(yīng)用的高質(zhì)量數(shù)據(jù)集建設(shè)。建議設(shè)立人工智能+專場和高質(zhì)量數(shù)據(jù)集建設(shè)專場,展示和交流各行各業(yè)人工智能最新應(yīng)用和行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)最佳實踐。

  二是更加重視傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。建議設(shè)立傳統(tǒng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型專場,引導(dǎo)和示范不同領(lǐng)域不同階段的傳統(tǒng)產(chǎn)業(yè),梯度開展信息系統(tǒng)(IT)、商業(yè)智能(BI)、人工智能(AI)應(yīng)用。

  三是更加重視數(shù)據(jù)要素的普惠化應(yīng)用。建議設(shè)立國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)專場,引導(dǎo)各級政府和技術(shù)服務(wù)企業(yè),一方面不斷突破數(shù)據(jù)安全流通技術(shù),另一方面加大數(shù)據(jù)安全流通技術(shù)的應(yīng)用范圍,建設(shè)普惠互聯(lián)、協(xié)調(diào)有力的全國一體化數(shù)據(jù)基礎(chǔ)設(shè)施,為數(shù)據(jù)大規(guī)模流通提供可信安全環(huán)境,實現(xiàn)“數(shù)據(jù)自由”。

  問:站在數(shù)據(jù)領(lǐng)域發(fā)展的角度,您對數(shù)博會舉辦地貴州的長遠(yuǎn)發(fā)展有什么寄語或期待?

  張向宏:數(shù)博會已走過了11年的不平凡歷程,面向下一個10年,以至將來50年,希望貴州打造成為全國乃至全球的“兩地四區(qū)”,“兩地”即數(shù)據(jù)技術(shù)策源地和數(shù)據(jù)制度新高地;“四區(qū)”即數(shù)據(jù)應(yīng)用引領(lǐng)區(qū)、數(shù)據(jù)安全先行區(qū)、數(shù)據(jù)資源匯聚區(qū)和數(shù)據(jù)流通示范區(qū)。


責(zé)任編輯:張薇

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
徐鶯的身份之謎:現(xiàn)在南博把壓力給到了杭師大

徐鶯的身份之謎:現(xiàn)在南博把壓力給到了杭師大

錢塘胡公子
2025-12-25 22:15:29
美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

美國人的斬殺線,將成為新的互聯(lián)網(wǎng)圣經(jīng)

楓冷慕詩
2025-12-25 14:39:02
多位央企董事長集中被撤委員資格,釋放哪些從嚴(yán)信號?

多位央企董事長集中被撤委員資格,釋放哪些從嚴(yán)信號?

運營商段子手
2025-12-26 00:14:14
國民黨2026首波提名公布,島內(nèi)學(xué)者:鄭麗文已具備協(xié)調(diào)能力和魄力

國民黨2026首波提名公布,島內(nèi)學(xué)者:鄭麗文已具備協(xié)調(diào)能力和魄力

海峽導(dǎo)報社
2025-12-25 10:04:02
國家發(fā)改委:2026年春節(jié)放假9天并減少調(diào)休,回應(yīng)了社會期待

國家發(fā)改委:2026年春節(jié)放假9天并減少調(diào)休,回應(yīng)了社會期待

新京報
2025-12-25 12:37:42
徐湖平履歷被扒!曾是印刷廠工人,掌管南博25年,高中學(xué)歷成院長

徐湖平履歷被扒!曾是印刷廠工人,掌管南博25年,高中學(xué)歷成院長

葉公子
2025-12-21 22:41:27
“孩子都腺樣體了,還吃烤腸呢?”廉價早餐,暴露家長的認(rèn)知低下

“孩子都腺樣體了,還吃烤腸呢?”廉價早餐,暴露家長的認(rèn)知低下

妍妍教育日記
2025-12-25 19:02:14
阿維塔宣稱南極-50℃極寒測試,被網(wǎng)友打假:南極現(xiàn)在是夏季

阿維塔宣稱南極-50℃極寒測試,被網(wǎng)友打假:南極現(xiàn)在是夏季

玩車專家1
2025-12-25 17:24:33
面對抗議參拜靖國神社,高市選擇充耳不聞

面對抗議參拜靖國神社,高市選擇充耳不聞

中國日報網(wǎng)
2025-12-25 09:52:05
蔡英文發(fā)文悼北捷案傷亡民眾,鄭麗文諷:高聲量讓賴清德芒刺在背

蔡英文發(fā)文悼北捷案傷亡民眾,鄭麗文諷:高聲量讓賴清德芒刺在背

海峽導(dǎo)報社
2025-12-25 15:24:04
賈國龍:假如西貝活不下來,絕對不會再創(chuàng)業(yè)了,和夫人回草原養(yǎng)羊

賈國龍:假如西貝活不下來,絕對不會再創(chuàng)業(yè)了,和夫人回草原養(yǎng)羊

好賢觀史記
2025-12-25 22:34:27
一個炸鍋消息,從2026年1月1號開始,我國要對白銀實施出口管制。

一個炸鍋消息,從2026年1月1號開始,我國要對白銀實施出口管制。

南權(quán)先生
2025-12-25 16:57:46
菲律賓主動給中方發(fā)邀請,不到72小時通告全球:雙方聯(lián)手做成大事

菲律賓主動給中方發(fā)邀請,不到72小時通告全球:雙方聯(lián)手做成大事

書紀(jì)文譚
2025-12-25 15:20:18
他們?yōu)楹渭庇谧N攜程?

他們?yōu)楹渭庇谧N攜程?

智識漂流
2025-12-25 20:09:36
今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

今冬最冷時間表出爐,何時最冷?2026年春節(jié)冷不冷?早看早知道

好賢觀史記
2025-12-25 10:07:03
首批中國游客赴俄遭“天價宰殺”落地即“失聯(lián)”支付系統(tǒng)全面失靈

首批中國游客赴俄遭“天價宰殺”落地即“失聯(lián)”支付系統(tǒng)全面失靈

深度報
2025-12-23 22:47:10
湖北牌場老板歐陽光去世,年僅40歲,原因公開,別人欠百萬難要回

湖北牌場老板歐陽光去世,年僅40歲,原因公開,別人欠百萬難要回

天天熱點見聞
2025-12-25 07:03:47
重磅!字節(jié)跳動的校招圖,把就業(yè)市場的遮羞布扯得粉碎…

重磅!字節(jié)跳動的校招圖,把就業(yè)市場的遮羞布扯得粉碎…

慧翔百科
2025-12-25 09:05:26
75歲姜昆翻車了,與友人在美國豪宅聚會慶祝圣誕,合唱歌曲惹爭議

75歲姜昆翻車了,與友人在美國豪宅聚會慶祝圣誕,合唱歌曲惹爭議

李健政觀察
2025-12-25 17:46:18
養(yǎng)老院里的性與愛

養(yǎng)老院里的性與愛

一條
2022-11-13 09:11:08
2025-12-26 05:19:00
數(shù)據(jù)觀 incentive-icons
數(shù)據(jù)觀
數(shù)據(jù)觀是專業(yè)的大數(shù)據(jù)內(nèi)容平臺
14869文章數(shù) 3134關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報復(fù)

頭條要聞

俄軍中將在汽車炸彈爆炸中身亡 俄軍報復(fù)

體育要聞

約基奇有多喜歡馬?

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財經(jīng)要聞

新規(guī)來了,年化超24%的小貸被即刻叫停

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

本地
健康
時尚
家居
公開課

本地新聞

這輩子要積多少德,下輩子才能投胎到德國當(dāng)狗

這些新療法,讓化療不再那么痛苦

冬季穿衣別顯得太臃腫!大衣收腰、搭配圍巾,有質(zhì)感又高級

家居要聞

經(jīng)典彌新 品味浪漫居所

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版