- 相關(guān)推薦
地理信息數(shù)據(jù)錄入的數(shù)據(jù)質(zhì)量控制研究
【摘要】 隨著地理信息技術(shù)的發(fā)展,針對(duì)空間數(shù)據(jù)庫(kù)的應(yīng)用越來(lái)越廣泛,空間數(shù)據(jù)庫(kù)中的數(shù)據(jù)源包括各種異構(gòu)的可操作的數(shù)據(jù)庫(kù)及其他數(shù)據(jù)。數(shù)據(jù)源中可能包含地形圖數(shù)據(jù)、管線數(shù)據(jù)、氣象數(shù)據(jù)、人口數(shù)據(jù)、噪聲數(shù)據(jù)、重復(fù)數(shù)據(jù)和不一致數(shù)據(jù)。以上數(shù)據(jù)的生產(chǎn)過(guò)程和質(zhì)量,常常只是對(duì)數(shù)據(jù)的生產(chǎn)者來(lái)說(shuō)是透明的,而對(duì)數(shù)據(jù)的使用者卻不透明,這樣必然導(dǎo)致數(shù)據(jù)生產(chǎn)過(guò)程中大量的重復(fù)采集數(shù)據(jù)的工作。為防止造成大量的人力、物力等資源的浪費(fèi),關(guān)于數(shù)據(jù)共享的研究成為現(xiàn)代GIS技術(shù)的熱點(diǎn)問(wèn)題,然而這些地理信息數(shù)據(jù)要實(shí)現(xiàn)在網(wǎng)絡(luò)上共享,就要解決目前地理信息數(shù)據(jù)不同格式集成的問(wèn)題,更進(jìn)一步說(shuō),數(shù)據(jù)的質(zhì)量問(wèn)題是實(shí)現(xiàn)集成的根本因素,因此,地理信息數(shù)據(jù)共享問(wèn)題的研究與地理信息數(shù)據(jù)的質(zhì)量有直接關(guān)系。所以實(shí)現(xiàn)地理數(shù)據(jù)集成的首要問(wèn)題是控制地理信息數(shù)據(jù)的質(zhì)量。論文本著精簡(jiǎn)實(shí)用的原則,設(shè)計(jì)面向?qū)ο蠹s束條件的數(shù)據(jù)特征模型來(lái)對(duì)不同格式的原始數(shù)據(jù)進(jìn)行質(zhì)量檢查和質(zhì)量加強(qiáng)。這個(gè)面向?qū)ο蟮臄?shù)據(jù)質(zhì)量檢查模型,可以通過(guò)對(duì)要素關(guān)系、行為和有效規(guī)則的定義來(lái)實(shí)現(xiàn)對(duì)現(xiàn)實(shí)世界系統(tǒng)更好地表達(dá)和描述。它必須對(duì)任何兩個(gè)特征之間所具備的聯(lián)系、每個(gè)特征所允許的聯(lián)系的個(gè)數(shù),任何需要的屬性數(shù)值或者幾何約束和特征操作,以及各種有效法則,比如屬性域、應(yīng)用語(yǔ)義關(guān)系和拓?fù)鋷缀侮P(guān)系規(guī)則等等。然后利用ESRI公司的Geodatabase這種已有的能夠支持特征關(guān)系、行為和規(guī)則定義的高級(jí)特征模型來(lái)演示這種面向?qū)ο笏枷氲臄?shù)據(jù)檢查模型是如何對(duì)不同格式的原始地理數(shù)據(jù)質(zhì)量進(jìn)行控制檢查和約束加強(qiáng)。為了實(shí)現(xiàn)這種基于對(duì)數(shù)據(jù)屬性設(shè)定約束條件思想的的表達(dá)以及原有的仍然有效的歷史地理數(shù)據(jù)的集成、共享,本論文把數(shù)據(jù)質(zhì)量檢查模型內(nèi)部的基本幾何元素、屬性域、關(guān)系類以及拓?fù)潢P(guān)系類用GML模式進(jìn)行了編碼。這也為能夠把海量原始地理空間數(shù)據(jù)(數(shù)據(jù)庫(kù)文件或文檔)進(jìn)一步用編程語(yǔ)言轉(zhuǎn)換成GML文檔提供了檢驗(yàn)標(biāo)準(zhǔn)。在轉(zhuǎn)換到GML這種能表達(dá)各種數(shù)據(jù),并且可以在數(shù)據(jù)庫(kù)間非常容易進(jìn)行交換的格式后,海量原始地理信息數(shù)據(jù)也就實(shí)現(xiàn)了最大意義上的地理數(shù)據(jù)的集成和共享。
【Abstract】 Along with the development of GIS, more and more data are produced. But magnanimous historical Geo-data and new-produced Geo-data are being wasted without efficient disposal and using. Because there are relative obturating among technologies of different GIS and different requests on Geo-data from different specialties, the spatial data produced by different departments with individual method is stored in different medium . As we all know, if we want to realize the real data sharing, we must solve the bottle-neck problem of data integration .In addition, there is another key factor as Geo-data quality which can influence the realization of Geo-data sharing. As a result, the research of Geo-data sharing has something to do with the quality of spatial data. So we must ensure the quality of Geo-data before we integrate and share the Geo-data.The reliability of the historical Geo-data which is mostly produced by digitalization usually is unknown to the users because the original material and relative information may not be available to users. this paper designs the constraint-based Data quality check model which includes three parts: attribute domain, relationship class and topology class.Then, select Geodatabase that can support relationships, behaviors and validation rules to demonstrate how the constraint-based AFM check and control the Geo-data application quality .In this paper, different validation rules are used to check and control the quality of Geo-data. In addition, GML Schema-based spatial data is the important approach for integrating and sharing spatial data and the use of GML is useful for the realization of distributed GIS in addition to the key technology for solving WebGIS problem.
【關(guān)鍵詞】 約束條件; 數(shù)據(jù)質(zhì)量檢查模型; 數(shù)據(jù)集成; 共享; GML模式
【Key words】 CONSTRAINED CONDITION; DATA QUALITY CHECK MODEL; DATA INTEGRATION; SHARING; GEOGRAPHY MARKUP LANGUAGE SCHEMA
地理信息數(shù)據(jù)錄入的數(shù)據(jù)質(zhì)量控制研究
摘要 5-6
ABSTRACT 6
1 地理信息系統(tǒng)發(fā)展現(xiàn)狀 9-17
1.1 論文選題背景和研究意義 9-14
1.1.1 國(guó)內(nèi)外空間基礎(chǔ)數(shù)據(jù)庫(kù)組成及應(yīng)用現(xiàn)狀 9-10
1.1.2 地理數(shù)據(jù)是GIS 系統(tǒng)的關(guān)鍵因素 10
1.1.3 不斷積累增加的海量地理數(shù)據(jù) 10-12
1.1.4 數(shù)據(jù)格式轉(zhuǎn)換模式中的質(zhì)量約束與加強(qiáng) 12-13
1.1.5 空間基礎(chǔ)數(shù)據(jù)共享平臺(tái)建設(shè) 13-14
1.2 研究的主要目的和內(nèi)容 14-15
1.2.1 研究的主要目的 14
1.2.2 論文的主要內(nèi)容 14-15
1.3 實(shí)現(xiàn)方法 15-17
1.3.1 從現(xiàn)實(shí)世界抽象到地理要素集合的數(shù)字化轉(zhuǎn)換模型 15
1.3.2 從基于約束的數(shù)據(jù)模型研究到設(shè)計(jì)數(shù)據(jù)質(zhì)量檢查模型 15
1.3.3 通過(guò)Geodatabase 定義屬性域及規(guī)則來(lái)檢查和加強(qiáng)空間數(shù)據(jù)質(zhì)量 15-16
1.3.4 用GML Schema 表達(dá)數(shù)據(jù)模型 16-17
2 數(shù)據(jù)質(zhì)量檢查模型的研究背景和現(xiàn)狀 17-25
2.1 數(shù)據(jù)模型 17-19
2.1.1 數(shù)據(jù)模型概述 17
2.1.2 現(xiàn)代GIS 發(fā)展對(duì)數(shù)據(jù)模型提出新的要求 17-19
2.2 基于約束規(guī)則數(shù)據(jù)模型的提出 19-21
2.2.1 早期的Coverage 模型 19-20
2.2.2 ESRI 的Geodatabase 20-21
2.3 地理數(shù)據(jù)質(zhì)量的描述 21-23
2.3.1 數(shù)據(jù)質(zhì)量的決定意義 21-22
2.3.2 關(guān)于地理數(shù)據(jù)質(zhì)量的描述框架 22-23
2.4 傳統(tǒng)的數(shù)據(jù)質(zhì)量檢查和控制措施 23-25
2.4.1 傳統(tǒng)GIS 數(shù)據(jù)的質(zhì)量檢查和控制措施 23
2.4.2 傳統(tǒng)GIS 數(shù)據(jù)的質(zhì)量檢查控制方法的弊端 23-25
3 地理數(shù)據(jù)質(zhì)量檢查模型的設(shè)計(jì)和應(yīng)用 25-42
3.1 數(shù)據(jù)檢查模型的設(shè)計(jì) 25-35
3.1.1 屬性的定義 25-27
3.1.2 關(guān)系類的定義 27-30
3.1.3 拓?fù)潢P(guān)系類的定義 30-35
3.2 GEODATABASE在地理數(shù)據(jù)質(zhì)量檢查和加強(qiáng)中的應(yīng)用 35-42
3.2.1 屬性數(shù)據(jù)質(zhì)量檢查和控制 35-37
3.2.2 利用拓?fù)潢P(guān)系規(guī)則來(lái)檢查和控制空間數(shù)據(jù)的空間分布正確性 37-42
4 用GML SCHEMA 實(shí)現(xiàn)數(shù)據(jù)檢查模型 42-58
4.1 XML 概述 43-44
4.1.1 XML 技術(shù) 43
4.1.2 XML 對(duì)萬(wàn)維網(wǎng)空間數(shù)據(jù)技術(shù)產(chǎn)生的影響 43-44
4.2 GML 概述 44-45
4.2.1 GML 的優(yōu)勢(shì) 44-45
4.2.2 GML 模型 45
4.3 數(shù)據(jù)檢查模型中基本幾何要素的GML 模式編碼 45-51
4.3.1 數(shù)據(jù)檢查模型中基本幾何要素的編碼 45-49
4.3.2 特征編碼 49-51
4.4 數(shù)據(jù)檢查模型的GML 表達(dá) 51-58
4.4.1 屬性域約束的GML 編碼 51
4.4.2 關(guān)系類約束的GML 編碼 51-55
4.4.3 拓?fù)潢P(guān)系類的GML 編碼 55-58
5 結(jié)論與展望 58-61
5.1 論文結(jié)論 58-59
5.2 展望 59-61
參考文獻(xiàn) 61-63
致謝 63
【地理信息數(shù)據(jù)錄入的數(shù)據(jù)質(zhì)量控制研究】相關(guān)文章:
統(tǒng)計(jì)數(shù)據(jù)質(zhì)量控制問(wèn)題研究03-25
交通數(shù)據(jù)質(zhì)量控制的可靠度理論分析03-07
探討元數(shù)據(jù)的地理信息服務(wù)方式03-02
對(duì)書目數(shù)據(jù)規(guī)范控制問(wèn)題的思考03-22
淺談圖書館館藏書目數(shù)據(jù)的質(zhì)量控制11-27
JDBC數(shù)據(jù)庫(kù)編程的研究03-15
企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)化中數(shù)據(jù)元素理論的應(yīng)用研究03-21