摘要:空间数据是GIS的重点所在,对GIS空间数据的结构与管理的探讨更是当前对GIS数据库研究的重要方向。本文计算机应用论文主要集中就GIS空间数据的管理方式进行探讨。
关键词:GIS;空间数据;管理;探讨
一、地理信息系统的相关概念
GIS是地理信息系统的简称,主要指基于计算机硬件与软件系统,对地球表层空间的地理分布数据信息进行采集、分析、管理、计算以及描述。其管理对象是有关地理空间的数据及其关系,其中包括图形数据、属性数据以及定位数据等。
GIS空间数据的特征主要包括五个方面:1,空间特征。主要指空间定位的特征。一般来说,每个空间的对象都会有相应的空间坐标,这就是说空间对象隐含着自身的空间分布特点。2,非结构化。对于目前通用的关系数据库管理系统来说,其数据记录是结构化的,能够满足关系数据模型的第一范式的要求。但是空间数据则不适应这种要求,因为如果将一条记录只表达一个空间对象,那么其数据项就有可能变长,这就使空间图形数据只能间接的运用当前通用的关系型数据库管理系统进行管理。3,空间拓扑关系。在空间数据中的拓扑关系一般表达多种空间关系,极大的方便了对空间数据的查询,但是同时也增加了保持空间数据一致性的困难,尤其是对于一些几何对象,没有空间坐标信息的相关记录,使得在查找与显示时必须要检索多个数据文件才能实现。4,分类编码。一般每个空间对象对应一个分类编码,该编码一般属于国家标准或者地区标准以及行业标准,每个地物的类型在地理信息系统中的属性项个数是一致的。5,海量数据。主要指空间数据量的巨大。一个城市的GIS的数据量能够达到几十GB,考虑到影像数据的保存,就能达到几百GB,这要比一般的通用数据库大很多,因此要通过在二维空间划分块,在垂直方向划分层的方式来组织。
二、常见地理信息系统空间数据管理
(一)文件—关系数据库混合管理。这主要运用于早期的GIS数据库,有代表性的有:ArcInfo。这种混合管理方法通常将地理空间以及拓扑关系存放在一组文件中,把属性数据存储在关系数据库中,并借助惟一的标识建立两者间的联系,这时,一般来说,属性数据以及几何数据是互相独立的管理与组织,而只依靠OID达到关联,此时,常常需要操作两个系统,使用不便。数据库技术的不断发展使得很多数据库系统也开始提供和高级语言的接口,就可以利用高级语言设计地理信息系统的图形界面,但是由于数据库厂商开发的数据库并不能符合高级语言的需要,地理数据信息系统也就需要针对数据库设计不同的接口程序。
(二)全关系型数据库管理。一般采取两种方式变长结构的空间几何数据。1,依据关系数据库组织数据的原则,进行关系范式的分解,使之成为定长记录的数据表。一般来说需要进行大量的连接,就需要很多的时间操作,影响效率。2,把变长的图形数据处理为二进制Block块字段。Oracle公司引进了LongRaw数据类型,SQLServer则采用MAGE数据类型。由于BLOB在SQL-99中被定义为新的数据类型,因此当前通用的数据库访问接口均支持BLOB访问,能够对其数据库进行删除或者修改等操作。地理信息系统能够利用关系数据管理系统来存放与管理图形的坐标数据,但是虽然这种方式能够省去不少操作,但是与定长的属性字段相比,二进制块的读写效率相对较慢,尤其是当涉及到对象的嵌套,其速度就更慢了。
(三)对象—关系数据库管理。由于通常直接采取通用的关系数据库管理系统本身效率不高,但是空间数据又非常重要,开发商就对关系数据库管理系统实施扩展,使得空间数据能够得以存放与管理。此外还对一些空间对象,比如操纵点、线、面以及圆等进行定义,成为API函数,预先定义了各种中间对象的数据结构,在使用时要求必须适应其数据结构的要求,而不能依据地理信息系统的要求进行再定义。ERSI公司和一些数据库开发商,比如Oracle开发出空间数据库引擎,简称SDE,能够将空间图形数据存储到大型的数据库里。数据库厂商依靠自己的核心技术上的优势,对关系数据库管理系统进行扩展,用以支持空间数据管理,例如Oracle的Spatial,空间数据管理模块,其在原有的数据库模型中对空间数据库进行扩展,达到了对简单要素的存放,当时并不能实现对复杂的拓扑关系的存放,也不能建立相应的空间几何网络。ERSI与其它数据开发商合作开发的ArcSDE,较好的解决了以上问题,并且能够利用空间索引机制提高查询效率,运用版本机制确保多用户可以同时使用同一类型的数据。该空间对象管理模块改变了对空间数据变长记录的管理,因为由软件开发商进行系统的扩展,在效率方面要比二进制块的管理高很多。但是开发SDE有许多方面的限制,没有又有效解决对象的嵌套问题,用户也不能任意定义空间数据。
三、多源数据融合
在江河的整治、铁路与公路的设计等方面,传统的以图像文件为对象的GIS难以满足实际的需要,因此进行多源数据融合管理研究是十分重要的课题。目前有很多方法正被引进到GIS应用中,以提高数据管理的效率与速度。
(一)实体对象层次模型。主要用以处理GIS应用中存在的海量空间数据处理、矢量栅格存储不一致、忽略时空等问题。因为原有的空间数据组织不能进行高效的跨图幅计算,是一种基于图层的模型。一般来说,多图幅空间运算中批量运算受到限制,无法满足多用户情况下空间数据的同步处理。实体对象层次模型主要是把空间数据变成具有分布式结构的数据对象的结合,把地理世界分成四个实体模型即元数据库模型、空间参考系模型、空间数据库模型以及地理几何对象模型。其中元数据库用以表现自身属性,空间参考系模型是实体世界以及现实世界进行转换的坐标系统。空间数据库模型用以表现拓扑关系与其关联属性。地理几何对象模型则是实现现实世界想地理几何单位的转换。
(二)群集多服务器分布管理。主要指依靠网络互连,通过单一系统对计算机组合进行管理,能够把PC机与其它低档机组合成为虚拟的高级机,实现性能并行超级计算机化。其优点是高度的可用性、高效的并行运算以及良好的可伸缩性能,该技术为解决大型的关系数据库的性能问题,尤其是在海量空间分布式数据中的应用问题提供新的思路,有望在将来实现对多服务器的海量空间信息进行高效管理。
(三)网格计算。一般来说是指把机群、大规模储存器、数据库、甚至个人计算机以及其他分散的仪器设备等等连接起来,实现一体化,达到方便快捷的解决复杂问题的目的。由于地理空间的自然特征以及经济社会发展的不稳定性,能够适应网格计算环境的空间信息多级网格体系应运而出。其思想主要是把全国,甚至全球按照不同的经纬划分成不同层次的玩个够,其中不同层次的网格具有涵盖关系。网格通过其中心点的经纬度定位,记录与网格相关的基础数据,例如各类投影参数下的坐标。把不同的网格层次与省、市、县建立关联,结合我国当前空间信息基础设施以及信息网络技术的现状,构筑我国空间信息多级网格结构迫在眉睫。目前空间信息多级网格拥有三大功能:未来动态时空坐标下的空间数据的表示方法;网格计算下操作现有各空间的数据库;网格计算下新的空间信息产品。
论文参考文献:
[1]龚建雅.空间信息系统基础[M].北京:科学出版社,2001.
[2]吴信才.地理信息系统原理与方法[M].北京:电子工业出版社,2004.
[3]方裕,周成虎.第四代GIS软件系统[J].中国图像图形学报,2001,6(9):817—823.
[4]刘南,刘仁义,谢炯等.基于实体对象层次模型的海量空间数据管理[J].浙江大学学报(工学版),2004,38(11):1391—1397.