线细化:就是不断去除曲线上不影响连通性的轮廓像素的过程。
对细化的一般要求是:保证细化后曲线的连通性;细化结果是原曲线 的中心线;保留细线端点。细化算法对二值图像进行处理。 4)链式编码:链式编码将细化后的图像转换成为点链的集合,其中每个
点链对应于一条弧段。(弗里曼码:用曲线的出发点坐标和线的斜率来描 述二值线。)
5)矢量线提取:将每个点链转化成为一条矢量线。每条线由一系列点组成,点的数目取决于线的弯曲程度和要求的精度。(D-P)
24.图像拼接/裁剪:(数据录入后的处理)
1)图像拼接:以两相邻地图图像的部分重叠区为基础,把它们合成为一幅 整图的过程。
2)图像裁剪:把一幅图像裁成两两相邻的规则图块的过程称为地图裁剪。 PPT思考题:
1. 假设一条矢量等高线上点过于密集,如何减少占用系统存储空间你能给出多少方法各有什么适用范围
2. 二值图像的处理对于GIS有什么意义有哪些常用方法
3. 为什么数字化地图进行编辑与处理后才能入GIS数据库 数字化过程中哪 些主要错误形式
第六章 空间数据的管理
25. 地理信息系统的数据库:(简称空间数据库或地理数据库)是某一区域内关
于一定地理要素特征的数据集合。
特点:数据量大、信息复杂;数据记录是变长的;不仅存放属性数据, 还存放空间数据,维护空间拓扑关系,实现对数据的关联、联通、包含、 叠加等操作;需要一些复杂的图形功能;数据应用广泛。
26.数据库(database,DB):就是为一定目的服务,以特定的数据存储的相关
联的数据集合,它是数据管理的高级阶段,是从文件管理系统发展而来 的。
27. 数据组织的分级
数据库中的数据组织一般可以分为四级:
数据项:是可以定义数据的最小单位,也叫元素、基本项、 字段等,不可分割,具有独立的逻辑意义。
记录:由若干相关联的数据项(或数据项组)组成,是文件存储的
基本单位。
文件:是一给定类型的(逻辑)记录的全部具体值的集合。 数据库:数据库是具有特定联系的数据的集合,也可以看成是具有
特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合, 这些文件之间存在某种联系,不能孤立存在。
28.常用数据文件:顺序文件、索引文件、直接文件、倒排文件。
顺序文件:是最简单的文件组织形式,对记录按照主关键字的顺序
进行组织。
索引文件:索引文件除了存储记录本身(主文件)以外,还建立了
若干索引表,这种带有索引表的文件叫索引文件。索引表中列出记录 关键字和记录在文件中的位置(地址)。 直接文件:直接文件又称随机文件,其存储是根据记录关键字的值,
通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置 上。
倒排文件;是带有辅索引的文件,其中辅索引是按照一些辅关键字
来组织索引的。
29. 空间数据编码:是空间数据结构的实现。
栅格结构的主要编码方式有直接栅格编码、链码、游程长度编码、块 码、死叉树码等;
矢量数据结构主要有坐标序列编码、树状索引编码、二元拓扑编码等。
30.栅格数据结构:栅格结构是最简单最直接的空间数据结构,是指将地球表面
划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素 由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅 仅包括指向其属性记录的指针。 点——用一个栅格单元表示;
线——沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有 两个相邻单元在线上;
面——用记有区域属性的相邻栅格单元的集合表示,每个栅格单元 可有多于两个的相邻单元同属一个区域。
栅格结构的显著特点是:属性明显;定位隐含;易于存储;算法简单;
地表不连续,是量化和近似离散的数据。
栅格结构的建立:手工获取、扫描仪扫描、由栅格数据转换而来、遥 感影像数据、格网DEM数据。
栅格坐标系的确定:由于栅格编码一般用于区域性GIS,原点的选择 常具有局部性质,但为了便于区域的拼接,栅格系统的起始坐标应与 国家基本比例尺地形图公里网的交点相一致,并分别采用公里网的纵 横坐标轴作为栅格系统的坐标轴。
栅格单元尺寸确定原则:有效地逼近空间对象的分布特征,又减少数 据的冗余度。
31. 决定栅格单元代码的方式:中心点法、面积占优法、重要性法、百分比法。 中心点法常用于具有连续分布特性的地理要素,如降雨量分布、人口
密度图等。
面积占优法常用于分类较细,地物类别斑块较小的情况。
重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线
状地理要素,如城镇、交通枢纽、交通线、河流水系等,在栅格中代 码应尽量表示这些重要地物。
百分比法(长度占优法)根据矩形区域内各地理要素所占面积的百分 比数确定栅格单元的代码
32. 栅格编码方法:
直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记
录代码。
数据压缩编码用尽可能少的数据量记录尽可能多的信息,分为信息有 损编码和信息无损编码。常用方法有链码、游程长度编码、块码、四 叉树码。
链码即弗里曼链码,优点是可以有效压缩栅格数据,对于估算面积、 长度、转折方向凹凸度等运算十分方便;缺点是修改编辑困难,局 部修改将变为全局修改。
游程长度编码:按行或列扫描,将相邻等值的像元合并,并记录代 码的重复个数。一种编码方案是只在各行(或列)数据的代码发生 变化时依次记录该代码以及相同的代码重复的个数(代码、个数); 另一种编码方法是逐个记录各行(或列)代码发生变化的位置和相 应代码(位置,代码)。优点是:压缩效率高、运算简单、易于检 索,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的 编码解码运算增加处理和操作时间的情况。
块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单 元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、 列号)和半径,再加上记录单元的代码组成。(具有可变分辨率) 四叉树(具有可变分辨率)
基本思想:将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。
定义:将2n2n像元阵列连续地进行4象限等分,一直分到子象限中像素值单调为止,这查即形成一颗四分叉的倒向树。根:整个区域;高:深度、分几级,几次分割;叶:不能再分割的块;树叉:还需分割的块; 每个树叉均有4个分叉,叫四叉树。 编码方法
四叉树编码要求图像必须为2n×2n的栅格阵列。
1)常规四叉树:指针不仅增加了数据的存储量,而且增加了复杂 性,常规四叉树并不广泛用于存储数据,其价值在于建立索引文 件,进行数据检索。
2)线性四叉树:记录叶结点的位置,深度(几次分割)和属性。 地址码:Morton码、四进制码、十进制码。
Morton码(四进制):码的位数表示分割的次数;每一个位 均是不大于3的四进制数,表达位置。
Morton码(十进制):行列号二进制表示,交叉,转换为十 进制
具有以下优点:
存贮量小,只对叶结点编码,节省了大量中间结点的存 储,地址码隐含着结点的分割路径和分割次数。
线性四叉树可直接寻址,通过其坐标值直接计算Morton
码,而不用建立四叉树。
定位码容易存储和执行实现集合相加等组合操作。 四叉树优缺点 优点: 1)对于团块图像,四叉树表示法占用空间比其他表示法要少得多,四叉树表示法基本上是一种非冗余表示法。
2)四叉树特别适用于处理分布不均匀的块状空间数据,但不适用于连续表面(如地形)或线状地物。 缺点:
1) 栅矢转换不理想;
2) 建立四叉树费时、修改四叉树困难; 3) 四叉树未能直接表示物体的拓扑关系; 4) 转换时发生滑动异变;
5) 一个物体的图像在构成四叉树时会被分割到若干个象限中,使它失去了内在的相关性。
33. 矢量数据结构:通过记录坐标的方式,尽可能精确地表示点、线和多边形
等地理实体,坐标空间设为连续,允许任意位置、长度和面积的精确 定义。
点——由一对X、Y坐标表示;
线——由一串的X、Y坐标表示;
面——由一串或几串有序且首尾坐标相同的坐标对及面标识表示。 矢量数据的获取方式:由外业测量获得、由栅格数据转换获得、跟踪
数字化;
矢量数据的特点:定位明显,属性隐含;其定位是根据坐标直接存储 的,而属性则一般存于文件头或数据结构中某些特定的位置上,
34. 矢量编码方法
坐标序列法、树状索引编码法、拓扑结构编码法。
坐标序列法只记录空间对象的位置坐标和属性信息,不记录拓扑关
系。这种方法可用于简单的粗精度制图系统中。 无拓扑关系,主要用于显示、输出及一般查询 多边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形;
每个多边形自成体系而缺少邻域信息,难以进行邻域处理,如消除某两个多边形之间的共同边界;
岛只作为一个单个的图形建造,没有与外包多边形的联系; 不易检查拓扑错误。
树状索引编码对所有边界点进行数字化,将坐标对以顺序方式存储,
由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状 索引结构。树状索引减少了数据冗余并间接增加邻域信息。 拓扑结构编码解决邻域和岛状信息处理问题。
完整的拓扑关系结构,这种结构应包括以下内容:唯一标识,多边形 标识,外包多边形指针,邻接多边形指针,边界链接,范围(最大和 最小x、y坐标值)。
双重独立式编码:线号-左多边形-右多边形-起点-终点