国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

行政區(qū)劃沿革知識圖譜構(gòu)建——以上海市為例

0
分享至


江西地名研究

關(guān)注我們,獲取更多地名資訊



摘要:針對行政區(qū)劃沿革數(shù)據(jù)分散、結(jié)構(gòu)不一、缺乏語義關(guān)聯(lián)等問題,文章研發(fā)了一種面向地方行政區(qū)劃演變的知識建模與語義組織方法。文章以上海市1949年以來的行政區(qū)劃變遷為例,采用自上而下與自下而上相結(jié)合的混合策略,設(shè)計一種通用的行政區(qū)劃沿革本體。通過復用GeoSPARQL、EVENT等語義本體,構(gòu)建基于RDF的行政區(qū)劃知識圖譜。通過數(shù)據(jù)抽取、語義映射、圖譜構(gòu)建、規(guī)則推理與圖數(shù)據(jù)庫部署,實現(xiàn)對行政區(qū)劃沿革信息的結(jié)構(gòu)化表達與可視化管理。該方法具備通用性、可拓展性與語義表達能力,并支持行政沿革可視化查詢、地理編碼與統(tǒng)計數(shù)據(jù)修正對齊,為歷史地理信息建模與智能化服務(wù)提供有效技術(shù)路徑。

關(guān)鍵詞:知識圖譜;本體知識庫;時空數(shù)據(jù)組織;行政區(qū)劃沿革;上海市

0

引言

行政區(qū)劃(又稱行政區(qū)域劃分),是國家治理體系的重要組成部分,通常依據(jù)相關(guān)法律和標準,并綜合考慮地理環(huán)境、人口分布和經(jīng)濟發(fā)展等因素,對地方治理、資源配置和統(tǒng)計分析等領(lǐng)域具有基礎(chǔ)性支撐作用。行政區(qū)劃沿革則指行政區(qū)劃在隸屬關(guān)系、名稱和空間形態(tài)等方面的變更過程,反映了國家政治格局的調(diào)整、社會結(jié)構(gòu)的演進與區(qū)域經(jīng)濟的動態(tài)發(fā)展,是理解區(qū)域變遷的重要視角。

隨著“數(shù)字中國”和智慧政務(wù)建設(shè)的推進,行政區(qū)劃數(shù)據(jù)的時空建模需求日益凸顯。當前關(guān)于行政區(qū)劃數(shù)據(jù)多以靜態(tài)方式處理,對歷史變更信息的系統(tǒng)記錄與語義表達尚顯不足,易導致跨時期數(shù)據(jù)分析失真、空間定位存在偏差等。因而亟須探索行政區(qū)劃沿革的系統(tǒng)建模與動態(tài)表達,開展結(jié)構(gòu)化、語義化和時空化的組織與管理,以支撐跨時空數(shù)據(jù)的準確對齊與綜合利用。知識圖譜作為新一代的信息組織技術(shù),在知識表示、推理與互聯(lián)等方面具有顯著優(yōu)勢,并已在地理信息管理中展現(xiàn)潛力。然而,在行政區(qū)劃沿革領(lǐng)域,知識圖譜的應(yīng)用仍處于起步階段,尚缺乏系統(tǒng)的本體設(shè)計與實踐范式。

本研究從行政區(qū)劃沿革知識提取和表達視角出發(fā),提出一套面向行政區(qū)劃沿革的知識圖譜構(gòu)建框架。研究結(jié)合本體建模技術(shù),綜合地名、時間與演變類型等要素,以上海市1949年以來的行政區(qū)劃變遷為實證,構(gòu)建上海市行政區(qū)劃沿革知識圖譜實例,并探索其語義組織方式及應(yīng)用潛力。本研究旨在建立行政區(qū)劃數(shù)據(jù)的統(tǒng)一語義表達體系,為跨時空分析提供方法論支持與技術(shù)實現(xiàn)。通過實現(xiàn)行政沿革的可視化查詢、提升地理編碼的準確性以及改進統(tǒng)計數(shù)據(jù)的對齊機制,本研究不僅豐富了知識圖譜在歷史地理信息領(lǐng)域的應(yīng)用場景,也為相關(guān)服務(wù)的智能化與精細化發(fā)展奠定了基礎(chǔ)。

1

相關(guān)研究

當前行政區(qū)劃沿革數(shù)據(jù)主要存在分散異構(gòu)、時空信息表達有限等問題?,F(xiàn)有研究在組織與表達方式上大致包括:純文本組織、靜態(tài)空間數(shù)據(jù)建模、時空數(shù)據(jù)模型表達及知識圖譜建模。純文本的行政區(qū)劃沿革數(shù)據(jù)組織不涉及地理空間維度,雖便于因果分析和統(tǒng)計研究,但缺乏空間表達能力。中國國家地名信息庫等靜態(tài)空間數(shù)據(jù)雖具備地理定位功能,但由于缺乏時間維度與歷史版本支持,其與其他動態(tài)數(shù)據(jù)(如人口)的關(guān)聯(lián)性較低,無法滿足時序查詢與分析需求。為彌補這一不足,學者提出了多種時空數(shù)據(jù)建模方式,大致可以分為系列快照、基態(tài)修正、基于事件與基于生存期模型4種,但均存在一定局限性。序列快照模型在空間信息存儲中容易造成數(shù)據(jù)冗余,查詢效率較低;基態(tài)修正模型數(shù)據(jù)更新復雜,性能表現(xiàn)依賴于基態(tài)選擇;基于事件的模型雖能反映時空變化,但構(gòu)建的數(shù)據(jù)庫結(jié)構(gòu)相對復雜,實體演變鏈式過程不夠直觀;以中國歷史地理信息系統(tǒng)(China Historical GIS,CHGIS)為代表的“生存期”模型能夠較好地描述基于點的行政區(qū)劃沿革,但因?qū)⒉煌瑫r間序列的行政區(qū)劃單元存儲在同一矢量文件中,較難實現(xiàn)動態(tài)可視化表達。此外,該模型在演變邏輯、語義建模與推理能力方面也有待發(fā)展。

近年來,知識圖譜逐步應(yīng)用于行政區(qū)劃沿革建模,通過本體設(shè)計與圖數(shù)據(jù)庫技術(shù)實現(xiàn)結(jié)構(gòu)化、語義化表達,支持跨時間的查詢與推理。鄭國軸等在中文開放知識圖譜(OpenKG)上發(fā)布了涵蓋多級行政區(qū)劃的資源描述框架(Resource Description Framework,RDF)數(shù)據(jù),雖實現(xiàn)了隸屬與空間關(guān)系建模,但未涉及空間幾何與歷史演變信息。李曉敏等構(gòu)建了地名演化圖譜,采用事件邏輯實現(xiàn)區(qū)劃沿革的時間關(guān)聯(lián),但未融合空間數(shù)據(jù)。陳玉冰與陳書慧分別聚焦區(qū)域行政變更,融合地圖集等資料,構(gòu)建了包含空間信息的沿革圖譜,并探索了知識推理與歷史模式挖掘方法。國際上,GeoNames提供了全球范圍內(nèi)的行政區(qū)劃標準名稱、層級結(jié)構(gòu)與經(jīng)緯度等地理信息,并支持RDF格式的數(shù)據(jù)下載與API調(diào)用,是結(jié)構(gòu)化地理數(shù)據(jù)的重要來源,但其數(shù)據(jù)主要反映當前狀態(tài),對歷史沿革支持有限。

在語義網(wǎng)與知識圖譜構(gòu)建中,本體作為抽象建模工具,用于描述特定領(lǐng)域內(nèi)的概念集合及其之間的關(guān)系,可在語義層對行政區(qū)劃概念、實體及其關(guān)系進行結(jié)構(gòu)化表達。針對行政區(qū)劃沿革中的時空復雜性,已有研究借鑒地理本體的建模思路,將要素、幾何、空間關(guān)系和時態(tài)納入建??蚣堋@?,宋佳等基于GML范式,構(gòu)建了包含要素、幾何、空間關(guān)系和時態(tài)四部分的本體模型;杜萍將中國行政區(qū)劃本體劃分為地理實體、空間、幾何、時間和事件五部分,實現(xiàn)基于本體的行政區(qū)劃地名識別與抽??;陳健等以測繪學敘詞表為基礎(chǔ),構(gòu)建了包含地名實體、語義類型與空間關(guān)系的本體模型;李曉敏則提出包括演變前身、變更過程等類別的演化本體,有效支持了沿革數(shù)據(jù)的語義關(guān)聯(lián)。上述研究為本體在行政區(qū)劃數(shù)據(jù)建模中的應(yīng)用奠定了基礎(chǔ),但多數(shù)模型在空間表達方面仍較為簡化,缺乏對完整幾何邊界與空間變化過程的支持。

國際上,眾多學者也在積極探索地理知識圖譜與時空建模的新路徑。YUAN等提出Spatiotemporal Evolution Hierarchical Representation Graph(STEHRG),通過本體層、演化層和要素層統(tǒng)一表達地理實體生命周期,強調(diào)時空演化的層級表示。LI等構(gòu)建了HGeoKG,以層級結(jié)構(gòu)和語義推理增強地理知識組織能力。WEI等提出FineGeoKG,能夠精細建模地理實體之間的鄰接關(guān)系,并支持復雜空間查詢。盡管這些研究在方法論和技術(shù)層面豐富了時空知識圖譜的發(fā)展,但仍未針對行政區(qū)劃沿革這一特殊領(lǐng)域提出系統(tǒng)化解決方案。

綜上,現(xiàn)有研究在空間表達、語義推理和沿革邏輯建模方面仍存在不足,限制了行政區(qū)劃數(shù)據(jù)跨時空分析的深度。為此,本研究以上海市為例,梳理區(qū)劃沿革歷程,構(gòu)建通用行政區(qū)劃沿革本體,并探索知識圖譜在該領(lǐng)域的應(yīng)用潛力與方法論價值。

2

研究方法

2.1總體框架

知識圖譜的構(gòu)建策略分為3種,分別是自頂向下、自底向上以及兩者的混合應(yīng)用。自頂向下策略主要基于領(lǐng)域?qū)<抑R與已有分類體系,構(gòu)建整體框架與關(guān)系類型;自底向上策略則依托大規(guī)模文本數(shù)據(jù)的實體識別與關(guān)系抽取,以補充和修正框架;混合兩者的方法,是通過預先定義一個基礎(chǔ)的框架,并在該框架的指引下填充實例層知識;同時,在填充過程中,通過不斷對實例層知識的分析與總結(jié),對原框架進行更新,實現(xiàn)模式層與實例層的共同優(yōu)化。本研究兼具任務(wù)導向與數(shù)據(jù)驅(qū)動的特點,采用自頂向下與自底向上相結(jié)合的混合模式來構(gòu)建知識圖譜(圖1)。首先,從歷史地理志書、相關(guān)政府公告及論文中抽取行政區(qū)劃沿革領(lǐng)域的關(guān)鍵概念,在宏觀層面自頂向下確定知識圖譜的核心結(jié)構(gòu);其次,收集1949年以來上海市的相關(guān)歷史行政區(qū)劃圖與行政區(qū)劃沿革文本,并進行必要的預處理;最后,整合成符合拓撲規(guī)則的矢量數(shù)據(jù)集與結(jié)構(gòu)化二維表數(shù)據(jù),根據(jù)已有的地理概念和應(yīng)用目的,在微觀層面自底向上不斷豐富知識實例。自頂向下與自底向上兩種策略通過迭代反饋機制使框架與數(shù)據(jù)保持一致。頂層設(shè)計保障了體系結(jié)構(gòu)的完整性與可控性,底層數(shù)據(jù)則支撐了知識獲取的廣度與實時性。


圖2描述了研究的總體框架,涵蓋了多源數(shù)據(jù)抽取、本體構(gòu)建、知識映射、圖譜構(gòu)建、知識補全與檢查、知識圖譜評估6個環(huán)節(jié),具體包括:(1)從《上海市行政區(qū)劃變遷圖集》、中國國家地名信息庫等不同數(shù)據(jù)源收集整理1949年以來上海市縣級及以上行政區(qū)劃的歷史沿革數(shù)據(jù),通過數(shù)據(jù)清洗和整合,獲取對應(yīng)的歷史行政區(qū)劃圖和非結(jié)構(gòu)化沿革文本;(2)提取如“行政區(qū)劃實體”“沿革事件”等核心概念及其關(guān)系,為保證語義一致性與可互操作性,盡可能復用現(xiàn)有本體,并使用Protégé等工具定義本體中的類、屬性、約束與推理規(guī)則等,構(gòu)建適用于行政區(qū)劃沿革領(lǐng)域的本體結(jié)構(gòu);(3)構(gòu)建邊界正確的矢量數(shù)據(jù)集,并采用半人工的方式對沿革的文本信息進行梳理,將非結(jié)構(gòu)化沿革文本數(shù)據(jù)轉(zhuǎn)化為二維表,根據(jù)已構(gòu)建的本體結(jié)構(gòu)中所定義的類與屬性規(guī)則,對數(shù)據(jù)文本中識別出的語義信息進行結(jié)構(gòu)化映射,實現(xiàn)時間、地名、變更類型等要素與知識圖譜中的類、屬性、實體的關(guān)聯(lián)和匹配(如矢量信息與Geometry類進行關(guān)聯(lián)匹配),若數(shù)據(jù)在關(guān)聯(lián)匹配時遇到困難,意味著原始構(gòu)建本體中仍存在概念不清的問題,需要進一步從數(shù)據(jù)層出發(fā)進行抽象、分類與本體優(yōu)化,自底向上完成本體的優(yōu)化;(4)使用RDFLib,Neo4j等相關(guān)工具將行政區(qū)劃幾何數(shù)據(jù)、行政區(qū)劃屬性數(shù)據(jù)以及行政區(qū)劃沿革事件數(shù)據(jù)進行實例化,實現(xiàn)知識圖譜的生成與存儲,同時支持后續(xù)在其它軟件的可視化與查詢操作;(5)為保證知識圖譜的一致性與完整性,根據(jù)本體中預設(shè)的約束規(guī)則(如對象屬性的相關(guān)函數(shù))和實體間的邏輯關(guān)系等,對缺失信息進行推理補全,并通過語義一致性與結(jié)構(gòu)完整性檢查確保圖譜質(zhì)量;(6)從本體建模的合理性、知識推理、應(yīng)用能力等維度對圖譜效能進行綜合評估,為其在歷史沿革分析、地理信息服務(wù)等場景中的可擴展應(yīng)用提供保障。


2.2行政區(qū)劃沿革知識圖譜構(gòu)建

2.2.1本體構(gòu)建參考相關(guān)領(lǐng)域的既有研究成果,并結(jié)合當前應(yīng)用較為廣泛的本體框架體系,盡可能復用已有本體定義的類與屬性,提高本體的通用性與共享性,將行政區(qū)劃沿革本體概念模型(圖3)歸納為:(1)沿革信息(Event),參考事件本體的組織方式,提出沿革事件子本體,在概念層面納入沿革時間、沿革類型、沿革對象及沿革結(jié)果等核心要素,為行政區(qū)劃演變的系統(tǒng)化建模提供理論框架。用于表達行政區(qū)劃實體的演變過程,通過設(shè)立、并入等事件,實現(xiàn)變更前后的實體關(guān)聯(lián);(2)要素信息(Feature),借鑒現(xiàn)有地名本體的框架體系,從要素的基礎(chǔ)屬性(如官方名稱、行政代碼、起止時間)、層次結(jié)構(gòu)(如行政等級)等多個維度進行設(shè)計,以全面刻畫行政區(qū)劃實體的基本特征;(3)幾何信息(Geometry),采用多邊形作為行政區(qū)劃的主要表達方式,對實體的邊界、空間范圍與幾何尺度進行精確刻畫,并通過引入幾何特征、拓撲關(guān)系,實現(xiàn)點、線、面等空間對象的序列化表示;(4)相關(guān)資料(Document),參考通用本體的資源組織方式,從整體上抽象出多模態(tài)資料的組織框架,旨在為地圖、文獻、新聞報道及網(wǎng)絡(luò)資源等多源信息提供統(tǒng)一的描述視角,強調(diào)對資料類型、資料名稱與資料來源等關(guān)鍵要素的抽象表達,從而為后續(xù)的屬性定義與實例化奠定基礎(chǔ)。


通過復用已有成熟本體的框架與語義約定,可在保證語義一致性和標準化的基礎(chǔ)上,提高知識資源的利用效率,減少重復建設(shè)。成熟本體的框架為眾人所熟悉,能夠降低其它領(lǐng)域研究者或用戶知識獲取和應(yīng)用的成本,提升研究成果在國際語義網(wǎng)絡(luò)環(huán)境中的可共享性和可擴展性。尤其在跨領(lǐng)域的本體構(gòu)建中,復用本體技術(shù)可以整合多領(lǐng)域知識,形成統(tǒng)一的知識庫?;诟拍钅P?,對GeoSPARQL和EVENT等本體進行復用,并自定義補充相關(guān)對象屬性與數(shù)據(jù)屬性,構(gòu)建適用于行政區(qū)劃沿革領(lǐng)域數(shù)據(jù)管理與分析的行政區(qū)劃沿革本體。

在要素表達方面,GeoNames本體提供了行政區(qū)劃的基本屬性、層級結(jié)構(gòu)與空間關(guān)系建模方案。OSM(OpenStreetMap)Semantic Network則通過“節(jié)點—路徑—關(guān)系”模式增強了空間拓撲描述能力,為建模行政單元的層級與相鄰關(guān)系提供了良好參考。在幾何信息建模方面,GeoSPARQL本體作為開放地理空間聯(lián)盟(OGC)空間數(shù)據(jù)語義標準,支持對行政區(qū)劃多邊形邊界的序列化表示及空間查詢與計算,適用于表達區(qū)劃對象的邊界變化與空間覆蓋,實現(xiàn)空間推理能力的擴展。在沿革事件建模方面,EVENT支持“前后事件”“子事件”等語義,提供了對事件的時間、地點、參與實體及結(jié)果等要素的抽象描述,適用于表達如設(shè)立、合并、撤銷等區(qū)劃變更過程的語義邏輯,能夠?qū)崿F(xiàn)變更事件與前后地理實體的關(guān)聯(lián)建模,擴展時間推理能力。在資料組織方面,F(xiàn)OAF與GCIS等本體為歷史圖片、報紙、地圖等多模態(tài)數(shù)據(jù)提供了結(jié)構(gòu)化表達方法,支持描述人、組織、網(wǎng)頁、文檔之間的關(guān)系,實現(xiàn)本研究數(shù)據(jù)與外部數(shù)據(jù)的互通,支持更豐富的跨知識庫推理。此外,通用知識圖譜本體如DBpedia、Wikidata等也提供了豐富的地名、空間屬性與歷史名稱等復用資源,并能夠?qū)︻惻c屬性進行了約束,為提升本體互聯(lián)性與語義聯(lián)通提供了基礎(chǔ)。

在語義建模過程中,不同本體可能存在同名類或?qū)傩?。為明確語義和促進不同本體的交互與共享,需通過國際化資源標識符(IRI)實現(xiàn)唯一標識,減少歧義。IRI一般由命名空間(Namespace)+本地名(Local Name)組成,并以“#”或“/”隔開,可避免語義沖突并提升本體互聯(lián)能力。例如,EVENT本體中定義的event類對應(yīng)的IRI為“http://purl.org/NET/c4dm/event.owl#event”,其中“http://purl.org/NET/c4dm/event.owl#”為EVENT本體的命名空間,event為本地名稱(即類名)。本研究在繼承現(xiàn)有本體命名空間的同時,自定義了命名空間“https://www.ade.org/”,其中“ade”為命名空間的縮寫(前綴)。

2.2.2實例化本研究將行政區(qū)劃變更中涉及的多種變更過程定義為事件,包含設(shè)立、隸屬關(guān)系變更、名稱變更三類屬性變化事件,以及并入、分割出兩類空間變化事件,具體描述如表1所示。


使用的上海市行政區(qū)劃沿革文本主要來源于2個渠道:其一為全國行政區(qū)劃信息查詢平臺的“縣級以上行政區(qū)劃變更情況”;其二為利用OCR技術(shù)從《上海市行政區(qū)劃變遷地圖集》掃描件中提取的文本數(shù)據(jù)。為盡可能保留詳盡的歷史信息,同時參考了各區(qū)地理志,對相關(guān)內(nèi)容進行適當補充與校正。

由于行政區(qū)劃名稱存在重復的情況,管理實踐中通常使用全國統(tǒng)一的行政區(qū)劃代碼對行政區(qū)劃主體進行唯一標識。本研究遵循GB/T 2260—2007《中華人民共和國行政區(qū)劃代碼》國家標準,對行政區(qū)劃代碼的編制方式進行了規(guī)范。根據(jù)憲法與中華人民共和國發(fā)布的國務(wù)院令規(guī)定,我國的行政區(qū)劃體系大致由省級、地級、縣級、鄉(xiāng)級四級構(gòu)成。相比之下,國外的行政區(qū)劃多為三級結(jié)構(gòu),大致對應(yīng)于我國的省級、縣級與鄉(xiāng)級。為便于數(shù)據(jù)的共享與比較,本研究將行政區(qū)劃劃分為3個基本層級,即省級行政區(qū)(第1級)、縣級行政區(qū)(第2級)和鄉(xiāng)級行政區(qū)(第3級),并將我國地方特有的地級行政區(qū)定義為1.5級,如表2所示。


在行政區(qū)劃地名演變研究中,變更情況具有重要意義。一個行政區(qū)劃主體的“生命”始于設(shè)立事件,終結(jié)于因更名、并入等導致其名稱消失的事件之時。所謂“生命周期”,是指行政區(qū)劃實體在名稱、空間范圍、行政隸屬及等級屬性保持不變的階段,其起點為某一沿革事件的結(jié)束,終點為下一事件的發(fā)生。圖4展示了南市區(qū)自1960年設(shè)立以來,經(jīng)歷并入與分割等事件,直至2000年并入黃浦區(qū)而結(jié)束的完整生命周期過程。在這一時間序列中,任意2個相鄰變更事件之間均構(gòu)成一個獨立的生命周期區(qū)間,為行政區(qū)劃沿革的表達提供了系統(tǒng)的時間維度分析框架。


本研究借鑒CHGIS的數(shù)據(jù)組織方式,利用ArcGIS 10.4軟件對相關(guān)空間數(shù)據(jù)進行采集與整理。以2019年的上海市行政區(qū)劃矢量邊界為基準,逐年逆序回溯,對各個變更年份的歷史地圖進行精確數(shù)字化處理。

為兼顧文件存儲與圖數(shù)據(jù)庫的優(yōu)勢,本研究采用二者結(jié)合的方式存儲知識圖譜,以提升數(shù)據(jù)的可擴展性、查詢靈活性和維護便捷性。在存儲策略上結(jié)合了RDF文件存儲與圖數(shù)據(jù)庫存儲的優(yōu)勢,以保證數(shù)據(jù)的可擴展性、語義一致性和查詢效率。在實現(xiàn)層面,選用GraphDB作為支撐平臺,其內(nèi)置的RDF處理與SPARQL查詢能力能夠高效管理和檢索知識圖譜數(shù)據(jù)。本研究將要素、幾何和沿革事件三類知識分別構(gòu)建為RDF數(shù)據(jù)集,并在圖數(shù)據(jù)庫中統(tǒng)一加載,實現(xiàn)了多維度知識的關(guān)聯(lián)與可視化表達。

2.3知識圖譜評估

知識推理能力是衡量圖譜智能水平的重要指標。本研究采用一階謂詞邏輯規(guī)則、OWL推理器與語義分類增強機制,并結(jié)合SPARQL查詢和Python腳本,實現(xiàn)了自動化推理與結(jié)果存儲。這一方法不僅能夠?qū)v史與現(xiàn)存地名進行時間維度的劃分,還可擴展至行政區(qū)劃隸屬關(guān)系的演變推理、地名別稱的語義歸并等多類任務(wù),具備較強的通用性。在地名分類場景中,用戶可根據(jù)研究需求在既有要素類中定義新的子類或?qū)傩浴@?,新增“歷史地名(historicalFeature)”與“現(xiàn)存地名(currentFeature)”,并設(shè)定二者不相交。判定規(guī)則基于行政區(qū)劃實體的有效終止日期(gadm:valid_to),從而保證分類的客觀性與可操作性。

應(yīng)用能力評估可展示知識圖譜的實際應(yīng)用價值,本研究以地理編碼和統(tǒng)計數(shù)據(jù)對齊為案例進行驗證。

3

結(jié)果與討論

3.1行政區(qū)劃沿革知識圖譜

3.1.1行政區(qū)劃沿革本體行政區(qū)劃沿革本體邏輯關(guān)系如圖5所示。使用的命名空間及其前綴如表3所示。


表4為行政區(qū)劃沿革本體類,皆為頂層類Thing下的子類。其中,行政區(qū)劃實體要素類(geos:Feature)和幾何類(geos:Geometry)共同構(gòu)成,前者描述屬性信息,后者描述空間邊界。事件類(event:Event)通過與地理要素的連接,表達變更前后狀態(tài)的關(guān)聯(lián);文檔類(foaf:Document)用于存儲輔助資料,提升解釋能力。


表5展示了行政區(qū)劃沿革本體中所定義的對象屬性。其中,行政區(qū)劃實體之間的隸屬關(guān)系通過gn:parent Feature表示,要素實體和幾何實體通過geos:hasGeometry相連。沿革事件的具體變更信息通過event:place存儲。例如,分割事件中的分割線,其所連接的左、右多邊形則通過ade:leftPolygon和ade:rightPolygon連接具體的左、右?guī)缀螌ο蟆vent:agent與event:product是實現(xiàn)沿革過程推理的關(guān)鍵,用于構(gòu)建實體的時間演變鏈。例如,“南市區(qū)并入黃浦區(qū)”事件中,前者為agent,后者為product,通過事件節(jié)點實現(xiàn)語義實體的連接。此外,本研究使用了逆函數(shù)(Inverse Of)與傳遞函數(shù)(Transitive)對部分對象屬性進行了約束。具有函數(shù)定義的對象屬性見表6。


數(shù)據(jù)屬性主要用于存儲節(jié)點的具體數(shù)值或文本信息,涵蓋ID、名稱、代碼、時間、幾何信息等字段(表7)。其中,gn:name和gn:officialName區(qū)分要素實體的實體名稱與官方名稱(即地名)。例如,“黃浦區(qū)1992”和“黃浦區(qū)2001”雖然是2個不同的實體,具有不同的實體名稱(gn:name),但它們擁有相同的主體名稱(gn:officialName)“黃浦區(qū)”。gadm:valid_from/valid_to用于表達行政區(qū)劃的生命周期,以支持時間維度的查詢與推理;geos:hasSerialization以WKT格式存儲空間邊界;ade:eventType與event:time描述事件的類型與發(fā)生時間。


為支持沿革鏈條的自動構(gòu)建與數(shù)據(jù)校驗,引入以下推理規(guī)則:(1)所有演變事件必然產(chǎn)生一個新地理實體,該實體的起始時間等于事件時間;(2)設(shè)立事件中,event:product與event:agent所對應(yīng)實體之間應(yīng)建立gn:parentFeature隸屬關(guān)系;(3)分割事件可通過記錄分割線及左右?guī)缀螌ο蠼⑼負潢P(guān)聯(lián),基于基態(tài)修正的幾何數(shù)據(jù)推理,并依托python的Shapely庫實現(xiàn);(4)合并、隸屬關(guān)系變更、名稱變更事件可不存儲新圖形,系統(tǒng)將默認調(diào)用關(guān)聯(lián)event:agent對應(yīng)幾何;(5)非設(shè)立類事件中,event:agent對應(yīng)的行政區(qū)劃實體的valid_to應(yīng)與event:product對應(yīng)的行政區(qū)劃實體的valid_from在時間上連續(xù),前者早于后者,形成生命周期連續(xù)性。

3.1.2知識圖譜基于行政區(qū)劃沿革事件數(shù)據(jù)、行政區(qū)劃屬性數(shù)據(jù)以及行政區(qū)劃空間數(shù)據(jù)構(gòu)建上海市行政區(qū)劃沿革知識圖譜,共覆蓋行政區(qū)劃幾何實體153個,行政區(qū)劃要素實體149個、行政區(qū)劃沿革事件216個。其中,并入事件119例(55.09%)、分割事件15例(6.94%)、隸屬關(guān)系變更事件13例(6.02%)、名稱變更事件7例(3.24%)、設(shè)立事件62例(28.70%)。圖6為分割事件示例,將分割線建模為獨立的geos:Geometry實體,并通過event:place與分割事件綁定。同時,左右多邊形分別通過ade:leftPolygon與ade: rightPolygon與該幾何實體相連,構(gòu)成清晰的拓撲結(jié)構(gòu)。事件Event3通過place屬性指向分割線GeoEvent3這一幾何實體,該幾何實體以WKT格式存儲線狀邊界,并通過左多邊形(leftPolygon)和右多邊形(rightPolygon)對象屬性與“Geo洋涇區(qū)1952”和“Geo東昌區(qū)1952”相連。


利用OWL詞匯表中的inverseOf與TransitiveProperty對象屬性,對具有逆關(guān)系或可傳遞特性的對象屬性進行自動化推理補全(圖7)。若存在三元組event:EVENT104—event:agent—geos:“南市區(qū)1993”,表示“EVENT104”事件的參與者為“南市區(qū)1993”,則可根據(jù)inverseOf補全逆向三元組geos:“南市區(qū)1993”—event:agent_of—event:EVENT104,意味著“南市區(qū)1993”作為“EVENT104”這一事件的參與者,實現(xiàn)了知識的補充。


在文件層面,圖譜遵循RDF標準,并堅持“本體與實例分離”原則:規(guī)模較小且需共享的本體單獨存儲;實例數(shù)據(jù)則按語義劃分為“要素子圖”“幾何子圖”和“沿革事件子圖”,各自獨立成庫,便于更新和跨子圖檢索。


不同類別的實體在圖譜中通過語義關(guān)系連接(圖9),既反映了行政區(qū)劃的層級與邊界屬性,也揭示了事件演變的鏈式邏輯。


3.2知識圖譜評估

3.2.1知識推理能力

知識推理結(jié)果從4個方面進行評估:其一,一致性檢查表明,所有分類均符合互斥約束;其二,可解釋性體現(xiàn)在所有結(jié)論均可追溯至RDF三元組與規(guī)則來源;其三,覆蓋率通過統(tǒng)計具備gadm:valid_to屬性的實體比例衡量,顯示出良好的數(shù)據(jù)完備性;其四,人工抽樣比對《上海地方志》和官方區(qū)劃資料,結(jié)果與權(quán)威資料和普遍認知高度一致。案例顯示,1993年撤銷的上??h被正確推理為歷史地名,而浦東新區(qū)被判定為現(xiàn)存地名,驗證了方法的可靠性。雖然在數(shù)據(jù)缺失情況下推理結(jié)果仍可能存在誤差,但整體趨勢與領(lǐng)域知識保持一致,說明該框架在知識分類與演變分析中具有實際應(yīng)用價值與可擴展性。


3.2.2應(yīng)用能力

(1)地理編碼

在地理編碼應(yīng)用中,現(xiàn)有服務(wù)往往難以正確處理歷史地名,導致定位結(jié)果存在偏差。以“南市區(qū)福佑路”為例,由于南市區(qū)在2000年被撤銷并并入黃浦區(qū),傳統(tǒng)地理編碼方法會出現(xiàn)匹配不準的情況。通過引入上海市行政區(qū)劃沿革知識圖譜,可在查詢過程中調(diào)用歷史區(qū)劃與現(xiàn)行區(qū)劃的對應(yīng)關(guān)系,自動將歷史地名映射為現(xiàn)存地名,從而實現(xiàn)定位結(jié)果的校正。該方法表明,沿革知識圖譜在解決跨時期地名解析與空間定位中的誤差方面具有顯著優(yōu)勢,為長期時空數(shù)據(jù)的地名準確對齊提供了新的技術(shù)路徑。


(2)統(tǒng)計數(shù)據(jù)對齊

行政區(qū)劃調(diào)整對長期統(tǒng)計分析影響顯著。以上海市黃埔區(qū)為例,1999年人口為24.36萬,而2000年則為66.18萬。若僅從統(tǒng)計結(jié)果表面觀察,黃浦區(qū)人口在一年內(nèi)出現(xiàn)大幅增長,但實則這一變化主要源于行政區(qū)劃范圍的調(diào)整,而并非真實的人口遷移或增長。具體而言,2000年公布的黃浦區(qū)人口統(tǒng)計數(shù)據(jù),實際上對應(yīng)的是1999年原黃浦區(qū)與南市區(qū)行政范圍內(nèi)人口合并結(jié)果。將1999年原黃浦區(qū)(24.36萬人)與南市區(qū)人口數(shù)據(jù)合并后,總?cè)丝诩s為68.65萬人,略高于2000年公布的66.18萬人,說明在統(tǒng)一行政區(qū)劃口徑下,人口規(guī)模并未出現(xiàn)顯著增長,反而呈現(xiàn)小幅下降趨勢。

基于上海市行政區(qū)劃沿革知識圖譜,本研究通過逆序遍歷行政區(qū)劃演化關(guān)系,推導目標年份對應(yīng)的歷史區(qū)劃構(gòu)成,并結(jié)合多邊形疊置分析方法,對不同年份的統(tǒng)計數(shù)據(jù)進行空間口徑對齊。其中,對齊前數(shù)據(jù)指直接采用統(tǒng)計年鑒中按當年行政區(qū)劃口徑發(fā)布的黃浦區(qū)人口數(shù)據(jù),未考慮區(qū)劃調(diào)整帶來的空間范圍變化;對齊后數(shù)據(jù)則指將歷史年份中與當前黃浦區(qū)空間范圍對應(yīng)的各行政單元人口進行合并后得到的結(jié)果。

如圖12所示,對齊前的人口時間序列在2000年和2010年附近出現(xiàn)明顯突變,而對齊后的數(shù)據(jù)曲線則更加平滑,能夠更真實地反映當前黃浦區(qū)行政范圍內(nèi)人口變化的長期趨勢。這表明,引入行政區(qū)劃沿革知識圖譜,有助于有效消除因區(qū)劃調(diào)整導致的統(tǒng)計斷裂問題,為跨時期人口變化分析提供更加可靠的數(shù)據(jù)基礎(chǔ)。


3.3討論

本研究以上海市自1949年以來的行政區(qū)劃沿革為對象,構(gòu)建了集地理要素、幾何形態(tài)和演變事件于一體的時空知識圖譜,在行政區(qū)劃領(lǐng)域?qū)崿F(xiàn)了語義建模與圖數(shù)據(jù)表達的融合,為歷史地理信息建模提供了可復用框架。然而,從系統(tǒng)擴展性、數(shù)據(jù)完備性及智能化應(yīng)用等方面仍存在改進空間。

在數(shù)據(jù)覆蓋與多尺度表達方面,盡管本研究實現(xiàn)了縣級及以上區(qū)劃的系統(tǒng)建模,但鄉(xiāng)鎮(zhèn)街道等更細尺度的歷史區(qū)劃仍缺乏系統(tǒng)表達??紤]到城市空間治理與人口社會經(jīng)濟分析的精細化趨勢,未來若能向更細粒度行政層級延伸,并引入自然村落、社區(qū)等地方性地理單元,將進一步增強模型的時空表達能力與應(yīng)用場景適配性。

盡管研究復用了GeoSPARQL與EVENT等標準本體并構(gòu)建了規(guī)則推理機制,但當前知識補全仍依賴顯式規(guī)則與半人工審查。面對歷史文獻中的非結(jié)構(gòu)化信息、地名歧義、邊界模糊等特征,未來可結(jié)合大語言模型驅(qū)動的信息抽取、遙感影像輔助邊界識別以及多源可信度評價體系,以提升知識自動獲取與演化鏈條構(gòu)建的智能化水平。

本研究的圖譜構(gòu)建與推理過程主要側(cè)重語義一致性與邏輯連貫性,對計算性能與查詢效率關(guān)注相對有限。在行政區(qū)劃知識圖譜規(guī)模持續(xù)擴張的情況下,如何在大規(guī)模圖數(shù)據(jù)上實現(xiàn)高效推理與實時查詢,將成為影響其服務(wù)能力的關(guān)鍵??煽紤]采用圖數(shù)據(jù)庫并行計算優(yōu)化、圖嵌入與向量索引技術(shù),以保障跨時空復雜查詢與批量演算的可用性。

行政區(qū)劃演變不僅是時空結(jié)構(gòu)變化的技術(shù)問題,也包含政策邏輯、區(qū)域功能調(diào)整及城市社會經(jīng)濟動態(tài)演化等多重因素。未來研究可進一步融合政策文本、歷史報刊、人口與經(jīng)濟統(tǒng)計、土地利用與城市形態(tài)數(shù)據(jù)等多模態(tài)信息,構(gòu)建“行政區(qū)劃—社會結(jié)構(gòu)—空間格局”綜合知識體系,推動行政區(qū)劃研究從靜態(tài)表征邁向動態(tài)解釋與情景模擬。

4

結(jié)論

快速城市化推動行政區(qū)劃持續(xù)調(diào)整,形成了多源異構(gòu)的時空數(shù)據(jù)。如何有效組織與表達沿革文本、邊界矢量與統(tǒng)計屬性,是當前地理信息系統(tǒng)研究的重要議題。本研究以上海市1949年以來的行政區(qū)劃變遷為例,提出基于知識圖譜的建??蚣?,構(gòu)建了結(jié)構(gòu)規(guī)范、語義明確的行政區(qū)劃沿革知識圖譜。

本研究設(shè)計了通用行政區(qū)劃沿革本體,復用EVENT、SPARQL、FOAF等標準,實現(xiàn)語義共享與擴展性,從地理實體、空間幾何、沿革事件與輔助資源4個維度整合數(shù)據(jù),系統(tǒng)表達區(qū)劃屬性、層級、邊界拓撲及設(shè)立、撤銷、合并等演化過程,并統(tǒng)一接入地圖、統(tǒng)計年鑒與文獻資料。圖譜通過標準化映射與實例化構(gòu)建,具備規(guī)則推理、一致性檢查與空間—屬性復合查詢能力,在圖計算與時空推理方面表現(xiàn)突出。

本研究表明,知識圖譜能夠彌補傳統(tǒng)方法在空間表達與時間推理方面的不足,提升歷史區(qū)劃研究的可計算性與解釋性,為區(qū)域社會經(jīng)濟分析、政策評估與歷史復原提供了新的技術(shù)路徑。

作者:姚申君,呂沐涵,吳健平,祁寧寧

來源:《華南地理學報》2025年第4期

選稿:宋柄燃

編輯:江 桐

校對:宋柄燃

審訂:杜佳玲

責編:宋柄燃

(由于版面內(nèi)容有限,文章注釋內(nèi)容請參照原文)




微信掃碼加入

中國地名研究交流群

QQ掃碼加入

江西地名研究交流群

歡迎來稿!歡迎交流!

轉(zhuǎn)載請注明來源:“江西地名研究”微信公眾號

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
巴拿馬賠款不足,中方擴大反制港口管控升級

巴拿馬賠款不足,中方擴大反制港口管控升級

徐醇老表哥
2026-03-26 04:41:05
朝鮮通告全球,確定“頭號敵國”,不到24小時,李在明做出選擇

朝鮮通告全球,確定“頭號敵國”,不到24小時,李在明做出選擇

浪子阿邴聊體育
2026-03-26 05:02:23
特朗普談及3架美軍戰(zhàn)機在科威特被擊落,稱其為“小意外”,系被“愛國者”導彈擊落

特朗普談及3架美軍戰(zhàn)機在科威特被擊落,稱其為“小意外”,系被“愛國者”導彈擊落

環(huán)球網(wǎng)資訊
2026-03-25 19:08:38
許利民:上場失利后教練組開會到深夜,賽季漫長不可能不出問題

許利民:上場失利后教練組開會到深夜,賽季漫長不可能不出問題

懂球帝
2026-03-26 00:45:08
郵報:曼聯(lián)將卡塞米羅的替代人選名單縮減至3人

郵報:曼聯(lián)將卡塞米羅的替代人選名單縮減至3人

MUREDS
2026-03-25 23:27:29
終于不用折騰了!2026兩會建議私家車年檢取消形式檢查

終于不用折騰了!2026兩會建議私家車年檢取消形式檢查

沙雕小琳琳
2026-03-26 01:39:33
知名演員于榮光到昆明一高校任職!成龍胡歌吳京等打Call

知名演員于榮光到昆明一高校任職!成龍胡歌吳京等打Call

掌上春城
2026-03-25 21:37:55
日媒通知全球:如果中日開戰(zhàn),中國人會搶著當先鋒,引發(fā)高度關(guān)注

日媒通知全球:如果中日開戰(zhàn),中國人會搶著當先鋒,引發(fā)高度關(guān)注

花寒弦絮
2026-03-23 00:31:50
陜西檢察長陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

陜西檢察長陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

午夜故事會
2024-04-15 18:31:39
張雪峰落幕!8億資本殘局,11家公司失去靈魂,估值或?qū)⒀鼣?>
    </a>
        <h3>
      <a href=笑熬漿糊111
2026-03-26 00:05:10
辛納再現(xiàn)神奇2-5,小弟替阿卡報仇,紫薇搶七險勝火娃雙殺小姆

辛納再現(xiàn)神奇2-5,小弟替阿卡報仇,紫薇搶七險勝火娃雙殺小姆

網(wǎng)球之家
2026-03-25 13:34:53
伊朗外長:伊朗經(jīng)調(diào)解方與美“交流信息”,沒有談判

伊朗外長:伊朗經(jīng)調(diào)解方與美“交流信息”,沒有談判

澎湃新聞
2026-03-26 04:51:39
落后就要挨打!美智庫真正擔心的不是中東戰(zhàn)局,而是中國“蜂群”

落后就要挨打!美智庫真正擔心的不是中東戰(zhàn)局,而是中國“蜂群”

阿校談史
2026-03-26 05:29:31
陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

許三歲
2026-03-16 10:18:04
40歲菲爾普斯現(xiàn)狀曝光!退役后暴瘦到無人識,老婆長得很漂亮

40歲菲爾普斯現(xiàn)狀曝光!退役后暴瘦到無人識,老婆長得很漂亮

小徐講八卦
2026-03-23 14:19:30
特朗普支持率公布

特朗普支持率公布

第一財經(jīng)資訊
2026-03-25 08:31:57
從這座廣東小城“畢業(yè)”的人,統(tǒng)治半個家電圈

從這座廣東小城“畢業(yè)”的人,統(tǒng)治半個家電圈

最華人
2026-03-24 14:51:58
伊萬不用,邵佳一也不待見,歸化悍將一次次慘遭無視,原因找到了

伊萬不用,邵佳一也不待見,歸化悍將一次次慘遭無視,原因找到了

零度眼看球
2026-03-25 06:52:56
央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個明星也出了口惡氣

央視發(fā)文,60歲釋永信再迎噩耗,被他害慘的4個明星也出了口惡氣

阿傖說事
2026-03-25 07:11:23
林葳是走是留?俄勒岡大學主力后衛(wèi)謝爾斯塔德申請轉(zhuǎn)學

林葳是走是留?俄勒岡大學主力后衛(wèi)謝爾斯塔德申請轉(zhuǎn)學

懂球帝
2026-03-25 09:10:08
2026-03-26 07:04:49
江西地名研究 incentive-icons
江西地名研究
分享地名研究信息、行業(yè)資訊。
3299文章數(shù) 303關(guān)注度
往期回顧 全部

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機 現(xiàn)場畫面披露

頭條要聞

伊朗軍方稱擊落美軍F-18戰(zhàn)機 現(xiàn)場畫面披露

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產(chǎn)分割復雜!是否立遺囑成關(guān)鍵

財經(jīng)要聞

管濤:中東局勢如何影響人民幣匯率走勢?

科技要聞

紅極一時卻草草收場,Sora宣布正式關(guān)停

汽車要聞

智己LS8放大招 30萬內(nèi)8系旗艦+全線控底盤秀實力

態(tài)度原創(chuàng)

游戲
教育
時尚
房產(chǎn)
數(shù)碼

PS6升級動力遭質(zhì)疑!玩家或當“PS5釘子戶”

教育要聞

中考數(shù)學,幾何求面積,學霸的方法想不到

女人過了40歲別胡亂穿衣,趕緊看看這些日系穿搭,舒適又耐看

房產(chǎn)要聞

41億!259畝!建學校…三亞這個大城更,最新方案曝光!

數(shù)碼要聞

英特爾發(fā)布基于第三代酷睿Ultra處理器vPro平臺

無障礙瀏覽 進入關(guān)懷版