摘要:通过对DLG数据质量元素、数据生产平台及数据整理流程的介绍,论述数据在不同平台间转换时存在的问题,进而说明数据质量控制的内容和方法,并重点说明跨平台数据转换一致性检查自动化的实现方法。
关键词:数据质量,质量元素,内容和方法,一致性检查
1概述
1.1数据质量控制的意义
近十来,在科技进步与自身需求的推动下,我国数字化建设的势头迅猛发展,“数字地球”“数字省区”“数字城市”的呼声越来越高。在此基础上,基础地理信息系统(GIS)的发展也如火如荼,GIS应用也逐步深入到各行各业。目前国内不少省区的测绘部门早已不在满足于测绘的数字化,开始向测绘的信息化迈进。
各种专题的地理信息系统都是以图形作为基础数据的,图形数据是信息系统建设的核心,其质量的优劣直接影响到系统的质量和稳定性直至应用效果。试想,若没有完善的空间数据质量控制手段,存在着问题、误差、甚至错误的空间数据库,是“倾斜的”、“不牢固的”、“存在问题的”,以此为基础建立的数字城市工程显然不能为政府决策提供科学的数据支撑,有关部门及社会也无法应用。
1.2数据质量的基本概念
数据质量是指数据适用于不同应用的能力。只有了解数据质量之后才能判断数据对某种应用的适宜性。在测量学中通常用误差来度量,在对地理空间信息数据库中的数据(特别是DLG数据)整理与建库过程中,有许多生产环节,每个环节均产生一定的误差,按误差传播理论,每项误差的传播直接影响到最终数据的质量。
数据质量用质量元素来衡量。质量元素是说明质量的定量、定性组成部分。即成果满足规定要求和使用目的的基本特性。将其与测绘产品结合起来,质量元素的内容和形式也不尽相同。
DLG产品的质量元素[1]一般包括:空间参考系、位置精度、属性精度、完整性、逻辑一致性、时间精度、表征质量、附件质量等八个方面。每项质量元素又包含质量子元素,质量子元素下在细分具体的检查项。
空间参考系一般包含以下质量子元素:大地基准、高程基准、地图投影;
位置精度一般包含以下质量子元素:平面精度、高程精度;
属性精度一般包含以下质量子元素:分类正确性、属性正确性;
完整性一般包含以下质量子元素:多余、遗漏;
逻辑一致性一般包含以下质量子元素:概念一致性、格式一致性、拓扑一致性;
时间精度一般包含以下质量子元素:现势性;
表征质量一般包含以下质量子元素:几何表达、地理表达、符号、注记、整饰;
附件质量一般包含以下质量子元素:元数据、图例簿、附属文档。
2DLG数据整理建库的一般流程
2.1面向GIS的DLG数据生产采用的主要平台
目前,已有的DLG成果和正在生产的DLG的成果,多数是CAD平台下的成果,其数据格式为*.dwg。CAD系统侧重于图形编辑的实用性、操作的便捷性并能挂接属性,实现属性与图形能以面向对象的方式操作,极大的提高了生产效率。而现在大多数的GIS软件的在图形编辑功能上都有所欠缺,一定程度上影响了数据整理加工的速度和质量。因此,在面向GIS的DLG数据生产过程中,多数是在CAD平台下进行二次开发,对DLG数据进行分层、匹配地物代码以及与要素有关的属性的挂接等。
2.2数据整理建库的一般流程
按照项目的具体要求,首先对项目基础数据、数据标准及其他相关资料进行收集、整理、分析,确定生产方案和技术路线;其次,按照数据库要求,在CAD平台下对要素进行分层归类,同时对CAD数据各要素的点、线、面几何类型拓扑关系进行编辑处理,并按照数据库对各要素的数据结构要求进行属性项的录入,形成标准化CAD数据;接下来,利用格式转换工具(目前,大多数转换工具都是ArcGIS自身的转换功能和专业的转换工具FMESuite)对标准化CAD数据进行格式转换,拓扑处理、属性完善,形成GIS格式的分区MDB入库数据;最后,对分区MDB入库数据进行汇总合并,同步进行接边融合,图形、属性、接边等方面的全面质量检查,形成一个无缝的DLG数据库。具体流程图如下。
2.3CAD格式数据向转换GIS数据转换过程存在的问题
尽管大部分GIS软件都提供了数据格式转换功能,由于CAD软件在数据存储、图元定义、管理风格等方面同GIS软件的差别,格式转换的效果不尽如人意。数据转换存在的问题主要表现在两个方面,一方面是空间数据,另一方面是属性信息。
空间数据主要表现在要素丢失和要素变形。有些CAD软件中图形实体数据结构,GIS软件不接受,或者转换前后数据的对应关系没有处理好,有的内容没有转过来,转换后就造成要素丢失。CAD软件中的图形数据结构定义与GIS软件中的不一致,例如CAD中的圆、弧等,在GIS中可能多边形和线,或者原CAD数据在作业过程中操作不规范等,都能造成要素变形,这将导致数学精度的损失。
CAD数据往往是分层管理的,属性信息与实体要素之间的关联大多数是通过CAD的扩展属性来实现的,这些属性是内嵌在CAD的图形数据中。同时,由于CAD和GIS系统描述同一空间对象的数据模型与语义存在一定的差别,以及要素分层的不正确,在转换过程中容易导致一些信息的丢失。例如,当数据从AutoCAD转换到ESRI的shape文件或者Coverage时,就会丢失AutoCAD中定义的图形对象扩充属性。
3DLG数据整理建库质量控制的内容和方法
3.1质量控制的内容
对于同一平台下的数据生产,质量控制应该按照设计中的质量规定以及国家关于《数字测绘成果质量检查与验收》中规定的质量元素进行检验。DLG测绘成果质量元素如上文1.2中所述。
那么,不同平台间的数据质量检查有些方面的需求的呢?通过总结,一般应从以下三个方面着手。第一、数学精度。检查数据在转换过程中,实体要素会不会发生移位(点、线、面)、变形(线、面)。第二、丢漏。检查实体要素是否丢漏、拓扑关系是否丢漏,重点检查各种岛面转换是否正确。第三、属性精度。检查实体要素的属性转换前后是否保持一致,包括内容、数据类型、属性值等。
3.2质量控制的方法[2]
数据质量检查的手段包括计算机自动检查、人机交互的计算机辅助检查和人工判别检查。①计算机自动检查,通过软件自动分析和判断结果。如可计算值(属性)的检查、逻辑一致性的检查、值域的检查、各类统计计算等。②计算机辅助检查,通过人机交互检查、筛选并人工分析和判断结果。如检查有向点的方向等。③人工判别检查,不能通过软件检查,只能人工检查。如矢量要素的遗漏、属性值的正确性等。
数据生产过程中综合应用上述三种检查手段进行数据质量检查。考虑到计算机辅助检查与人工判别检查都需要人工参与确定错误,将计算机辅助检查与人工判别检查统称为人工检查,即数据质量检查手段分为:自动检查和人工检查,质量检查顺序原则上先自动检查再人工检查。
人工检查通常采用的方法有:①叠合比较法:是空间数据正确与否和最佳检核方法,是把转换前数据定位导入GIS软件中与格式转换后数据进行比较,不完整和不正确的马上就可以发现。②目视检查法:是指在屏幕上利用双屏显示的技术,将转换前后不同格式的数据,分别利用对应的软件(转换前是CAD格式,转换后ARCGIS格式),采用数据联动的方式,检查一些明显的数据丢漏和转换错误。③逻辑检查法:是根据数据拓扑不完整或属性列表等,检查属性数据的合理性以及正确性等。
3.3跨平台数据转换一致性检查自动化的实现
一种平台下的数据质量控制,目前随着各种GIS软件的完善,使数据质量得到了很好的控制。但是,经过从一种格式数据岛另外一种格式的数据转换后,实际上就是两种不同的产品或成果。因此,在进行格式转换时的质量检查是确保数据质量的一道重要工序。目前主流数据生产软件,基本都是满足本平台内部的质量控制,没有实现跨平台的数据质量检查,即没有做到要素在不同平台下的一一对应检查。
目前,市场上还没有商业化的跨平台的数据检查软件。但是,从方法上还是可行的。就目前了解到的情况而言,可以用以下方法来实现。
在CAD平台下对每一个实体要素添加唯一标识码GLOBALID,并输出要素(点、线、面)的统计表【点统计坐标,线统计长度和中点(取要素的最小和最大坐标计算),面统计面积和中心点(取要素的最小和最大坐标计算)】;依据GLOBALID在对GIS格式的数据依次统计要素(点、线、面)的统计表,最后将两种平台下的统计表对比,检查要素的丢漏、变形、位移等问题。此方法,已经在大连市“十一五”基础测绘中得到了很好的应用,在不同格式数据间转换的一致性方面实现了数据的无缝转换,取得了成功的经验。
4结束语
只有充分中重视数据质量,有效的使用质量控制方法,特别是计算机自动化的质量控制方法,才能高效、准确的保障数据质量,实现不同格式间数据的无缝隙转换,避免了转换过程中数据的变形、丢失和属性的丢漏等,为DLG的顺利入库提供保障。
参考文献:
1、GB/T18316-2008.数字测绘成果质量检查与验收
2、李恩宝主编:测绘工程监理.-北京:测绘出版社,2008.4