摘要:针对地图扫描矢量化的作业特点,数据误差来源及误差性质,作者总结出提高精度减少误差的一些方法,供同行进行参考。
关键词: 地图扫描,矢量化
1 前言
所谓地图矢量化,就是把栅格数据转换成矢量数据的处理过程。当纸质地图经过计算机图形、图像系统光—电转换量化为点阵数字图像,经图像处理和曲线矢量化,或者直接进行手扶跟踪数字化后,生成可以为地理信息系统显示、修改、标注、漫游、计算、管理和打印的矢量地图数据文件,这种与纸质地图相对应的计算机数据文件称为矢量化电子地图。
地理信息系统技术的创立和发展,与地理空间信息的表示、处理、分析和应用手段的不断发展紧密相连。地理信息系统起源于地图,它们都是地理信息的载体,具有获取、存储、编辑、处理、分析与显示地理数据的功能。随着技术的发展,人们对地图的要求进一步提高。由于传统纸质地图效率、速度和精度很低,因此难以适应现代和未来科技的发展。通过GIS工具,可以把纸质地图经过一系列处理转换成能够在屏幕上显示的电子化地图,满足人们使用地图的新要求。
2 地图扫描矢量化作业流程及特点
扫描数字化是对扫描得到的栅格图像利用绘图软件编辑成矢量化地图,扫描数字化精度与收手扶跟踪数字化比,其对原图的质量要求较高,受人为因素影响较小,采用了半自动和全自动方式矢量化,操作人员劳动强度较小,作业效率高且数据可靠性较强。目前国内地图扫描矢量化有两种作业方式: ⑴.把栅格图像作为底图定向,定位后由操作员在屏幕上用鼠标对特征点逐点采集进行矢量数字化;⑵.用软件对栅格图像进行分析,在少量的人工干预下自动追踪线状符号得到数字化信息。
3 地图扫描矢量化的误差来源及分析
3.1 材料变形误差
材料变形误差是由于图纸在存储过程中受湿度和温度影响而产生的。在温度不变的情况下,若湿度由0 %增至25 % , 图纸的尺寸可能改变116 % ,即一张36 英寸的图纸因湿度变化而产生的误差可能高达01576 英寸。并且图纸的膨胀率和收缩率也不相同,即使温度恢复原来的大小,图纸也不可能恢复原来的尺寸。而聚脂薄膜的底图与纸质地图相比,材料变形产生的误差相对较小,是一种较为理想的介质。
3.2 栅格图像扫描误差及控制
在对地图进行扫描时,扫描仪本身的精度及稳定性、操作人员的熟练程度、扫描软件的处理能力等都是影响扫描精度的因素。为提高图像扫描精度,可适当提高扫描仪的扫描分辨率,但随着分辨率的提高,图像扫描数据也相应增大。譬如,对一幅1∶500 的40cm ×50cm 的地图以300dpi 的分辨率进行扫描时,约需500kb 的空间来存储TIF 格式文件,如将扫描分辨率提高到600dpi ,则约需115Mb的存储空间。对于BMP 格式的文件,所需的存储空间约为TIF 格式的8 倍。为解决分辨率和存储空间的矛盾,一种更高压缩比的图像文件格式有待问世。
在实际工作中,通常采用几何纠正来减少材料变形误差和扫描过程中产生的随机误差。栅格图几何纠正一般以图廓四个角点粗略纠正,然后选择多个十字格网精确纠正。纠正所用的数字模型视每幅图的具体情况而采用线性或非线性变换公式。为确保扫描图像的质量,矢量化之前需要对栅格图像进行细化处理,细化就是把扫描图像线条的图形中心线抽取出来。为减少细化误差、避免图像失真,细化前一般采用消噪声和平滑等预处理除去图像上的黑色斑点、孔洞、毛刺和凹陷等噪声。
3.3 矢量化过程中产生的误差
矢量化是一种单调乏味、容易出错的工作,手和眼所引起的坐标误差随操作员和时间而变化,经常会出现过头线、不达结点、多边形未封闭等错误(如图2 所示) 。另外,要素本身的宽度、密度和复杂程度对矢量化误差也有显著影响,例如,矢量化一条线时,不可能总在线的中央采样。这些都影响数据精度并增加图形编辑工作量。
3.4 其它误差
除位置误差外,还存在属性识别、高程注记识别、属性注记等误差。与位置误差相比,属性误差经常不被重视。事实上,在许多情况下,属性误差的影响是很大的。这一方面有人为的因素,另一方面也与软件的自动识别能力有关。
4 矢量化数据后处理
对现阶段国内使用的矢量化软件,矢量化后的数据仍存在一些问题需要在以下几个方面进行处理。
4.1 曲线点稀释
矢量化追踪得到的矢量数据大多点数较多,数据量大,占用的空间较多,特别是等高线,所以对矢量线条还要进行抽稀处理。抽稀要在保证矢量化曲线形状不变的情况下,最大限度地减少曲线上点的个数。如果按曲线上相邻两点间的最小距离来定义抽稀因子,则曲线上的特征点如曲线弧段起始处、曲线拐弯处、曲率变化较大处的点均可能被抽稀而引起曲线变形。因此,结合间距与曲率来考虑抽稀因子是比较合理的。
4.2 房屋直角化
对于矢量化后不规则的房屋,需进行直角改正。虽然,矢量化软件一般都具有直角化功能,问题是房屋的直角改正以改正多大为宜,直角化后房屋的点位误差、房屋与邻近地物间的距离误差是否仍满足规范和说明书的有关规定。
4.3 直线中间点与重复点、线处理
为准确反映空间拓扑关系,又最大限度地节省存储空间,适当删除直线中间点与重复点、线是很必要的。
4.4 悬挂点处理
矢量化时弧段相交处如不吻合,则会出现悬挂点。这是矢量化产品质量标准所不允许的,必须进行处理,正确反映出地物间的位置关系。
4.5 数字、文本、符号等的识别及其位置的调整
4.6 接边处理
接边是矢量化后一个非常重要的环节。每幅图矢量化完成后都需与相邻图幅进行接边检查,确保矢量化后的整体图形忠实于原图。实际上,由于纸张伸缩和矢量化误差,相邻图幅公共图廓线两侧本应相互连接的地图要素会发生错位。传统的接边方法是将具有相同特征码的点进行最近距离匹配。但对于多点匹配时,容易产生距离搜索错误。最有效的方法是设置程序进行接边拟合,将公共图廓点视为已知点,并加以分析诊断和剔除粗差的功能。
以上矢量化后处理工作,主要是在图形编辑中进行加工,但也可以利用编程语言来实现矢量化软件的处理能力。
5 矢量化产品及其质量管理
矢量化产品的主要形式是数字地图。过去存在一种误解,认为只要有了数字化的地图,用户就可以根据需要以任意比例输出。这对依比例的地物是可行的,但对不依比例的符号、地物及注记就行不通了,如稻田、围墙、管线、陡坎等。针对这种情况,一方面是从数据源端想办法,要求软件开发商扩展其软件功能,但这种办法只能对该系统生产的数字地图工作。另一方面是从数据输出端想办法,如从Autocad 上想办法,这种办法难度较大,其工具是编程。
另外,矢量化产品的质量管理也是一个急需解决的问题。至今还没有简便有效的检核条件和完善的检验理论。目前对矢量化地图的检验方法主要是屏幕检查与图检(即与底图对照检查) 。这种方法充分利用了图形的直观性与一览性特点,但只停留在“看”的水平,即看屏幕与看回放图。这无异于将“数字产品”当“模拟产品”来检验。且缺乏检验规范与验收标准,人为的因素很多。为突出“数字”检测的特点,可开发通过“数据处理过程”来检测矢量化产品质量水平的处理软件。
结语:
扫描数字化是一种值得推广的高效率的地图数字化方法,但是其数据质量的控制也是一个复杂的过程,要控制好及质量必须从各环节入手,采用一定的方法减少各种误差。我们相信随着GIS技术的发展,未来对扫描矢量化的技术,质量会更加完美。