最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

2地理空间表达

来源:动视网 责编:小OO 时间:2025-10-03 08:45:03
文档

2地理空间表达

2地理空间表达矢量表达法地理空间的表达地理信息系统中的空间概念常用"地理空间"来表达。地理空间上至大气电离层、下至地幔莫霍面。一般说来,地理空间被定义为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集合,它由一系列的空间坐标值组成。相对空间是具有空间属性特征的实体的集合,它是由不同实体之间的空间关系构成。地理空间的表达是地理数据组织、存储、运算、分析的理论基础。尽管地理空间中的空间对象复杂多变,但通过抽象和归类,其表达方法主要有如下几种类型。2.1.1矢量表达法矢量表达法主要表
推荐度:
导读2地理空间表达矢量表达法地理空间的表达地理信息系统中的空间概念常用"地理空间"来表达。地理空间上至大气电离层、下至地幔莫霍面。一般说来,地理空间被定义为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集合,它由一系列的空间坐标值组成。相对空间是具有空间属性特征的实体的集合,它是由不同实体之间的空间关系构成。地理空间的表达是地理数据组织、存储、运算、分析的理论基础。尽管地理空间中的空间对象复杂多变,但通过抽象和归类,其表达方法主要有如下几种类型。2.1.1矢量表达法矢量表达法主要表
2地理空间表达

矢量表达法

地理空间的表达 

  地理信息系统中的空间概念常用"地理空间"来表达。地理空间上至大气电离层、下至地幔莫霍面。一般说来,地理空间被定义为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集合,它由一系列的空间坐标值组成。相对空间是具有空间属性特征的实体的集合,它是由不同实体之间的空间关系构成。地理空间的表达是地理数据组织、存储、运算、分析的理论基础。

尽管地理空间中的空间对象复杂多变,但通过抽象和归类,其表达方法主要有如下几种类型。

2.1.1矢量表达法

  矢量表达法主要表现了空间实体的形状特征。

(1) 0维矢量

  0维矢量为空间中的一个点(point)。点在二维、三维欧氏空

间中分别用(x,y)和(x,y,z)来表示。在数学上,点没有大小、方向。

点包括如下几类实体:

  ·实体点(Entity point):代表一个实体。如钻孔点、高程点、建筑物和公共设施。

  ·注记点(Text point):用于定位注记。

  ·内点(Label point):存在于多边形内,用于标识多边形的属性。

  ·结点(Node):表示弧段的起点和终点。

  ·角点(Vertex)或中间点:表示线段或弧段的内部点。

(2) 一维矢量

  一维矢量表示空间中的线划要素,它包括线段、边界、弧段、

网络等。在二维(见(2-1)式)、三维(见(2-2)式)欧氏空间中用有序的坐标对表示:

  结合具体的应用,一维矢量自身的空间关系主要有如下几种(这里只介绍二维欧氏空间,三维欧氏空间相似):

  (1)坐标序列中的首点 和末点 统称为结点,且分别为首结点和末结点。位于首尾结点间的点 为拐点或中间点或角点(见图2-1(a));

  (2)首尾结点可以重合,即弧段首尾相接。相应的数学表达式

为(图2-2(b)):

  (3)弧段不能与自身相交。如果相交,需以交点为界把弧段分为

几个一维矢量(见图2-1(c))。在图2-1(c)中,弧段数为3,而不

图2-1 一维矢量空间关系示意图

是1。三个弧段分别为AK,KBCDEFGHK,KIJ。

此外,一维矢量有折线和曲线之分。

一维矢量具有如下特征:

  ·长度:从起点到终点的总长。

  ·弯曲度:表示像道路拐弯时弯曲的程度。

  ·方向性:开始于首结点,结束于末结点。如河流中的水流方向,高速公路允许的车流方向等等。

(3)二维矢量

  二维矢量表示空间的一个面状要素,在二维欧氏平面上是指由一组闭合弧段所包围的空间区域。所以,二维矢量又称多边形,是对岛、湖泊、地块、储量块段、行政区域等现象的描述(见图2-2(a)、(b))。在三维欧氏空间中二维矢量为空间曲面。目前通过二维矢量对空间曲面的表达主要有等高线和剖面法两种(图2-2(c)、(d))。前者通过设置等间距,把具有相同高程值的点连接起来形成等高线(一维矢量),这些等高线就可完成对空间曲面的描述。后者是按一

(a)

图2-2 二维矢量相关图形示意图

定的间距和剖面方向切割空间曲面,切割而成的多组剖面就完成了对空间曲面的描述。

二维矢量的主要参数如下:

·面积:指封闭多边形的面积。对于三维欧式空间中的空间曲面而言,还包括其在水平面上的投影面积。

·周长:如果形成多边形的弧段为折线,那么,周长为各折线段长度之和;多边形由曲线组成,则计算方法较为复杂,如积分法。 

·凹凸性:用于二维矢量的形态描述。凸多边形是指多边形内所有边之间的夹角小于180 。反之,则为凹多边形。

·走向、倾角和倾向:在描述地形、地层的特征要素时常使用这些参数。

图2-3 三维矢量示意图

(4)三维矢量

  三维矢量用于表达三维空间中的现象和物体,是由一组或多组空间曲面所包围的空间对象,它具有体积、长度、宽度、高度、空间曲面的面积、空间曲面的周长等属性(见图2-3)。

栅格表达法

2.1.2栅格表达法

图2-4 栅格表达法示意图 

  栅格表达法主要描述空间实体的级别分布特征及其位置。

栅格类似于矩阵。在栅格表达中,对空间实体的最小表达单位为一个单元或象素(Cell或Pixel),依行列构成的单元矩阵叫栅格(Grid),每个单元通过一定的数值表达方式(如颜色、灰度级)表达诸如环境污染程度、植被覆盖类型等空间地理现象(图2-4)。

  除了航空、航天技术获取的影象资料可以直接通过栅格加以表达外,通过矢量到栅格的转换算法,栅格表达法同样可以表达0维、一维、二维等矢量图形或地理现象。此时、0维矢量就是表现为具有一定数值的栅格单元,一维矢量就表现为按线性特征相连接的一组相邻单元,二维矢量则表现为按二维形状特征连续分布的一组单元。 

  栅格表示法的精度与分辨率有关。在图2-5(a)、(b)、(c)中,栅格的分辨率分别为7*5,15*11,24*13。分辨率的大小与下面两个问题有关:

  ·记录和存储栅格数据的硬件设备的性能。近几十年的发展证明,随着技术的进步,硬件设备的分辨率肯定会越来越高,能够满足实际应用的需求。

  ·与实际应用需求有关。对于那些研究程度较低或者无需精确研究的地理现象而言,栅格表达法的分辨率可以相对较低,反之,分辨率高。实际上,分辨率越高,其影象就越能表达地理空间现象的细微特征。

图2-5 栅格表达法分辨率示意图

面向对象的表达方法

2.1.4 面向对象的表达方法 

  实际上,矢量表达方法中的点、线、面也是对象(Object),但它们是简单对象。面向对象(Object-Oriented,简称00)的表达方法是近年来发展起来的一种新的程序设计方法。00方法的基本含义就是无论多么复杂的空间实体,都可以用一个对象来准确表示,而无需把复杂对象分解为单一的对象实体(如点、线、面、体),然后利用矢量表达方法加以表示。结合程序设计方法,通过分类、概括、联合、聚集四种数据处理技术就可以实现OO的各种表达方法。

  (1)分类(classification):把一组具有相同结构的实体归纳成类(Class),而这些实体就属于这个类的对象。例如,对于地图,无论是等高线,还是等值线,我们都可以把它们定义为等值线类。

  (2)概括(generalization):把一组具有部分相同结构和操作方法的类归纳成为一个更高层次、更具一般性的类。前者成为子类,后者称为超类。例如,无论是何种建筑物,都可以形成以结构类型、高度、层数等参数的基础的超类。

  (3)联合(association):把一组类似的对象集合起来,形成一个更高级别的集合对象(set-object)。集合中的每个对象称为它的成员对象(member-object),成员和集合对象间的关系是member-of的关系。例如,无论是线状地物,还是面状地物,都可以看成是弧段类的有序集合。

  (4)聚集(aggregation):与联合相似,但它是把一组不同类型的对象组合起来,形成一个更高级的复合对象(composed-object),每个不同类型的对象是该复合对象的一部分,成为组件对象(component-object)。组件对象和复合对象间的关系是part-of。例如,与某一城市有关的空间实体类型包罗万象,从建筑物、道路、河流到污水、煤气、通讯管网工程,但可以把它们聚集成为一个复杂对象。

图2-9 复杂对象示意图

利用面向对象的表达方法,图2-9就是一个对象,而不是六个的多边形矢量实体。 

2.2 空间数据的特征及其表示方法

图2-10 空间数据的基本特征

主要包括空间数据的基本特征、空间数据的类型和表示方法,空间数据的拓扑关系及其表示等内容

空间数据的基本特征

2.1 空间数据的基本特征 

  空间数据一般具有如下三个基本特征(图2-10):

  (1)空间特征数据:表示空间实体的位置或现在所处的地理位置以及拓扑关系和几何特征。几何特征又称为定位特征,一般以坐标加以表示。

  (2)属性特征数据:这里主要指的是专题属性,也是非定位数据。专题属性是指实体所具有的各种性质,如房屋的结构、高度、层数、使用的主要建筑材料、功能等。专题属性通常以数字、符号、文本和图象等方式表达。专题属性的表达方式主要有两种:表格和图象。

  ·表格:通过固定的表格格式详细列出空间实体的参数和描述数据。一般情况下,表格数据精确、明了,易于理解。

图2-11 环境污染程度图

  ·图形或图象:见图2-11。无论是通过矢量还是栅格表达地理空间中的实体,如果属性特征是通过属性值的级别来表达的,那么,就可以在同一级别的空间范围内充填一定的颜色或图例符号。例如,在绘制或显示某一城市的污染专题图时,任意级别的污染区域就可以通过颜色来加以表示。以图形图象表达的属性数据具有隐含的性质,必须通过图例或有关技术规范才能加以理解。

  (3)时间特征数据:指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的、超长期的。

空间特征数据和属性特征数据常常呈相互的变化,即在不同的时间,空间位置不变,但属性数据可能发生变化,或者相反。

对于现有的大量GIS系统,由于它们并非是时态(temporal) GIS系统,所以,把专题属性和时间特征数据统称为属性数据。 

空间数据的类型和表示方法

2.2.2 空间数据的类型和表示方法 

  随着信息和通讯技术的进步,空间数据的类型更加复杂多样。归纳起来,地理空间中的空间数据可以被分为十种类型。类型及相关的表示方法如下:

  ·分类或分级数据:如环境污染类型、土地类型数据,测量、地质、水文、城市规划等的分类数据等;

  ·面域数据:如多边形的中心点,行政区域界线及行政单元等;

  ·网络数据:如道路交点、街道和街区等;

  ·样本数据:如气象站,环境污染监测点,用于航空、航天影象校正的野外控制数据等;

  ·曲面数据:如高程点,等高线或等值线区域;

  ·文本数据:如地名、河流名称和区域名称;

  ·符号数据:如点状符号、线状符号和面状符号(晕线)等;

  ·音频数据:如电话录音、运动中的汽车产生的噪音;

  ·视频数据:交通路口的违章摄影、工矿企业大量使用的工业电视;

  ·图象数据:航空、航天图象,野外摄影照片等。

  根据应用需求和不同的处理方法,通过矢量(点、线、面)、栅格、TIN就可以表达上述所有类型的空间数据

空间数据的拓扑关系及其表示

2.2.3 空间数据的拓扑关系及其表示 

1.拓扑属性和非拓扑属性

  "拓扑"(Topology)一词来源于希腊文,它的愿意是"形状的研究"。拓扑学是几何学的一个重要分支,它研究在拓扑变换下能够

保持不变的几何属性----拓扑属性。拓扑变换在各种类型的空间研究中有着广泛的应用。

为了更好地理解拓扑变换和拓扑属性,我们列举下面的例子加以形象说明:假设一块高质量的橡皮,它的表面为欧氏平面,而且 

表面上有由结点、弧段、多边形组成的任意图形。如果我们只对橡皮进行拉伸、压缩,而不进行扭转和折叠,那么,在橡皮形状变化的过程中,图形的一些属性将继续存在,而一些属性则将发生变化。例如,如果多边形中有一点A,那么,点A和多边形边界间的空间位置关系不会改变,但多边形的面积会发生变化。这时,我们称多边形内的点具有拓扑属性,而面积则不具有拓扑属性,拉伸和压缩这样的变换称为拓扑变换。表2-1列出了欧氏平面上空间对象具有的部分拓扑和非拓扑属性。 

2.空间数据的拓扑关系

  在地理信息系统中,为了真实地描述空间实体,不仅需要反映

实体的大小、形状及属性,而且还要反映出实体之间的相互关系。一般说来,通过结点、弧段、多边形就可以表达任意复杂程度的地理空间实体。所以,结点、弧段、多边形之间的拓扑关系就显得十分重要。归纳起来,结点、弧段、多边形间的拓扑关系主要有如下三种:

  (1)拓扑邻接:指存在于空间图形的同类图形实体之间的拓扑关系。如结点间的邻接关系和多边形间的邻接关系。在图2-12中,结点N1与结点N2、N3相邻,多边形P1与P2、P3相邻。

  (2)拓扑关联:指存在于空间图形实体中的不同类图形实体之间的拓扑关系。如弧段在结点处的联结关系和多边形与弧段的关联关系。在图2-12中,N1结点与弧段A1、A5、A3相关联,多边形P2与弧段A3、A5、A6相关联。

图2-12 空间数据拓扑关系示意图

  (3)拓扑包含:指不同级别或不同层次的多边形图形实体之间的拓扑关系。图2-12,2-13(a)、(b)、(c)分别有2、、3、4个层次。

  同一层次的含义是:在同一有限的空间范围内(如同一外接多边形),那些具有邻接和关联拓扑关系或完全不具备邻接和关联拓扑关系的多边形处于同一级别或同一层次。实际上,属于二维矢量的多边形与0维矢量间也存在拓扑包含,只是0维矢量空间范围内(假设0维矢量占据有限的空间)不可能存在其它多边形或点状图形实体了。

图2-13 拓扑包含示意图

  空间数据的拓扑关系,在地理信息系统的数据处理和空间分析中具有十分重要的作用。

  ·根据拓扑关系,不需要利用坐标和距离就可以确定一种空间实体相对于另一种空间实体的空间位置关系。因为拓扑数据已经清楚地反映出空间实体间的逻辑结构关系,而且这种关系较之几何数据有更大的稳定性,即它不随地图投影而变化。

  ·利用拓扑数据有利于空间数据的查询。例如判别某区域与那些区域邻接;某条河流能为那些居民区提供水源,某行政区域包括那些土地利用类型等等。

  ·利用拓扑数据进行道路的选取,进行最佳路径的计算等。

3.空间关系

  空间关系是指地理空间实体对象之间的空间相互作用关系。通 

常将空间关系分为三大类:拓扑空间关系(Topological Spatial Relationship),顺序空间关系(Order Spatial Relationship),度量空间关系(Metric Spatial Relationship)。下面对三种空间关系进行较为详细的论述。

  (1)拓扑空间关系:描述空间实体之间的相邻、包含和相交等空间关系。

拓扑空间关系在地理信息系统和空间数据库的研究和应用中具有十分重要的意义。图2-13形象地表达了各种空间目标的拓扑空间关系。拓扑空间关系的建立较为容易。只需利用线段相交和包含分析等算法就可以达到建立拓扑空间关系的目的。 

  (2)顺序空间关系:描述空间实体之间在空间上的排列次序,如实体之间的前后、左右和东南西北等方位关系。

  在实际应用中,建立和判别三维欧氏空间中的顺序空间关系比二维欧氏空间中更加具有现实意义。三维欧氏空间中顺序空间关系的建立将为空间实体的三维可视化和虚拟环境的建立奠定必要的技术基础。

  (3)度量空间关系:描述空间实体的距离或远近等关系。距离是定量描述,而远近则是定性描述。

到目前为此,对拓扑空间关系和度量空间关系的研究较为成熟,算法也较为简单,而顺序空间关系的判别方法则较为复杂,特别是在三维欧氏空间中更是如此。 

图2-13 拓扑空间关系示意图

空间数据模型

2.3 空间数据模型 

  空间数据模型是地理信息系统的基础,它不仅决定了系统数据管理的有效性,而且是系统灵活性的关键。空间数据模型是在实体概念的基础上发展起来的,它包含两个基本内容,即实体组和它们之间的相关关系。实体和相关关系可以通过性质和属性来说明。空间数据模型可以被定义为一组由相关关系联系在一起的实体集(D.J.Peuqoet)。

  结合空间数据的具体特点进行空间数据模型的设计是地理信息系统的关键。空间数据模型的设计主要是构建一个能够用真实世界的抽象提取来代表该真实世界的模型。由于空间数据模型的设计与计算机硬件、系统软件和工具软件的发展现状密切相关,所以,就目前的发展现状而言,很难用一个统一的数据模型来表达复杂多变的地理空间实体。例如,某些空间数据模型可能很适合于绘图,但它们对于空间分析来说效率确十分低;有些数据模型有利于空间分析,但对图形的处理则不理想。

  目前,与GIS设计有关的空间数据模型主要有矢量模型,栅格模型,数字高程模型,面向对象模型,矢量和栅格的混合数据模型等。前面四种模型属于定向性模型,在模型设计时只包括与应用目标有关的实体及其相互关系,而混合模型的设计则包括所有能够指出的实体及其相互关系。就目前的应用现状而言,矢量模型、栅格模型、数字高程模型相当成熟(目前成熟的商业化GIS主要采用这三类模型),而其它模型,特别是混合模型则处于大力发展之中。

注意:下面介绍的空间数据模型是针对2DGIS的。

2.3.1 矢量模型(vector model)

图2-14 矢量数据模型

矢量模型是利用边界或表面来表达空间目标对象的面或体要素,通过记录目标的边界,同时采用标识符(Identifier)表达它的属性来描述空间对象实体。矢量模型能够方便地进行比例尺变换、投影变换以及图形的输入和输出。矢量模型处理的空间图形实体是点(point)、线(line)、面(area)。矢量模型的基本类型起源于"Spaghetti"模型(图2-14(a))。在Spaghetti模型中,点用空间坐标对表示,线由一串坐标对表示,面是由线形成的闭合多边形。CAD等绘图系统大多采用Spaghetti模型。

GIS的矢量数据模型与Spaghetti模型的主要区别是,前者通过拓扑结构数据来描述空间目标之间的空间关系,而后者则没有。在矢量模型中,拓扑关系是进行空间分析的关键。

在GIS的拓扑数据模型中,与点、线、面相对应的空间图形实体主要有结点(node)、弧段(arc)、多边形(polygon),多边形的边界被分割成一系列的弧和结点,结点、弧、多边形间的空间关系在数据结构或属性表中加以定义(图2-14(b))。GIS的矢量数据模型具有如下特点:

1. 通过对结点、弧、多边形拓扑关系的描述,相邻弧段的公用

结点,相邻多边形的公用弧段在计算机中只需记录一次(如图2-14(b)中的结点A和弧段AB)。而在Spaghetti模型中的记录次数则>1;

2.空间图形实体的拓扑关系,如拓扑邻接、拓扑关联、拓扑包含不会随着诸如移动、缩放、旋转等变换而变化,而空间坐标及一些几何属性(如面积、周长、方向等)会受到影响。

3.一般情况下,通过矢量模型所表达的空间图形实体数据文件占用的存储空间比栅格模型小;

4.能够精确地表达图形目标,精确地计算空间目标的参数(如周长、面积)。

栅格模型(raster model)

2.3.2 栅格模型(raster model) 

  栅格模型直接采用面域或空域枚举来直接描述空间目标对象(图2-15)。在栅格模型中,点(点状符号)是由一个或多个像元,线是由一串彼此相连的像元构成。在栅格模型中,每一像元的大小是一致的(一般是正方形),而且每一个栅格像元层记录着不同的属性(如植被类型等)。像元的位置由纵横坐标(行列)决定。所以,每个像元的空间坐标不一定要直接记录,因为像元记录的顺序已经隐含了空间坐标。

栅格模型具有如下几个特点:

  1.栅格的空间分辨率指一个像元在地面所代表的实际面积大小(一个正方形的面积);

图2-15 栅格数据模型及空间对象的表示 

  2.对于同一幅图形或图象来说,随着分辨率的增大,存储空间也随之增大。例如,如果每一像元占用一个字节,而且分辨率为100m,那么,一个面积为10km*10km=100km 的区域就有1000*1000=1000000个像元,所占存储空间为1000000个字节;如果分辨率为10m,那么,同样面积的区域就有10000*10000=1亿个像元,所占存储空间近100MB;

  3.表达空间目标、计算空间实体相关参数的精度与分辨率密切相关,分辨率越高,精度越高;

  4.非常适合进行空间分析。例如,同一地区多幅遥感图象的叠加操作等;

  5.不适合进行比例尺变化,投影变换等。

2.3.3 数字高程模型(DEM,Digital Elevation Model)

  数字高程模型是采用规则或不规则多边形拟合面状空间对象的表面,主要是对数字高程表面的描述。根据多边形的形状,我们可以把数字高程模型分为两种,即格网模型和不规则三角网模型。

2.3.3.1 格网模型(Grid model)

  与栅格模型相似,同样是直接采用面域或空域枚举来描述空间目标对象。一般情况下,栅格模型的每一像元或像元的中心点代表一定面积范围内空间对象或实体的各种空间几何特征和属性几何特征(图2-16(a)),而格网模型通常以行列的交点特征值代表交点附近空间对象或实体的各种空间几何特征和属性几何特征(图2-16(b))。栅格模型主要用于图象分析和处理,而格网模型主要进行等值线的自动生成,坡度、坡向的分析等。栅格模型处理的数据主要来源于航空、航天摄影以及视频图象等,而格网模型则主要来源于原始空间数据的插值。

(a) (b)

图2-16 与栅格和格网模型有关的处理方法示意图

2.3.3.2 TIN模型

  TIN模型是利用不规则三角形来描述数字高程表面。在TIN模型中,同样可以建立三角形顶点(数据点)、三角形边、三角形个体间的拓扑关系。TIN模型示意图见图2-17(b)。如果建立了TIN模型图形实体(三角形顶点、三角形边、三角形)的拓扑关系,将大大加快处理三角形的速度。

归纳起来,数字高程模型的主要优点是能够方便地进行空间分析和计算,如对地表坡度、坡向的计算等。

v面向对象的数据模型

2.3.4 面向对象的数据模型(Object-Oriented Data Model) 

  面向对象表示方法的最大优点是便于表达复杂的目标。面向对象的方法为数据模型的建立提供了分类、概括、联合和聚集等四种数据处理技术,这些技术对复杂空间数据的表达较为理想。在概括、联合、聚集等技术的运用中,都要涉及到对象或类型的属性值或属性结构在不同级或层之间的传递或继承。为此,面向对象的方法提供了继承和传播两种工具。

  在类型的层次结构中,子类的属性结构或操作方法可以部分地从超类中获取,这就而继承。继承可以减少数据冗余,并有助于保持数据的完整性。

  无论是联合还是聚集,它们都有一个共同之处,那就是将一组对象合并成为一个更加复杂的对象,这一类复杂对象的属性值来源于两个方面:

  1)一部分属性值由该复杂对象本身定义,与构成它的成员对象(组件对象)无关;

  2)另一部分属性值依赖于这些成员对象。

  为此,复杂对象必须具备获取成员对象属性值的能力。传播正是一种用来描述复杂对象的依赖性并获取成员对象属性值的工具,这种工具所基于的最基本的原理就是成员对象的相关属性只能存储一次,然后再将这些属性值传给复杂对象,这样当成员对象的属性值被改变后,复杂对象的属性值无需修改。显然,这种工具的使用大大减少了数据冗余量并保证了数据的一致性。

图2-18 属性值的传播

  通过采用继承和传播两种工具,将使得原本十分复杂的描述变得自然和简单。例如,一个城市由若干个区组成,因此,城市的人口应为各区人口的总和。对于城市这样一个复杂对象,它的人口数由它的成员对象即各区的人口数求和派生而成(图2-18)。

  分类、概括、联合和聚集等四种数据处理技术和继承及传播工具为面向对象数据模型的建立奠定了坚实的基础。图2-19表明了面向对象的数据模型(又称00模型)。在图中,空间对象是指空间地物的超类,点(POINT)、线(LINE)、面(SURFACE)、复杂地物类(COMPLEX),三角形表示is-a关系(继承关系),而菱形表示member-of关系。

图 2-19 面向对象的数据模型

  在图2-19中,小的红点表示阶数,即复杂地物与其它简单地物和复杂地物的关系可能是一对多的关系,即复杂地物可能是由点、线、面甚至其它复杂地物组成,而某个特定的点、线、面或复杂地物只能用于参与构造一个复杂地物

混合数据模型

2.3.5 混合数据模型(Hybrid Model) 

  由于矢量模型、栅格模型、数字高程模型在处理空间对象时都有各自的优缺点。所以,能否在一个统一模型的基础上充分利用相关模型的优点就是目前GIS界研究的方向之一。到目前为止,有代表性的研究成果主要有TIN与矢量的一体化模型,栅格与矢量一体化的多级格网模型。下面将介绍这方面的内容。 

2.3.5.1 矢量与TIN的一体化的数据模型

  发展矢量与TIN一体化数据模型的主要原因为:它既能发挥TIN的空间分析和计算功能,又能方便地查询属性信息。因为TIN的三角形顶点和边(如测量点,河流走向线,陆上径流路径,封闭洼地边界线等)可能为矢量图形的特征点和线的一部分,所以它们的系统代码或内部码是完全一致的。

图2-20 矢量N与TINS一体化的数据模型

图2-20为一体化的数据模型。从图中可以看出,模型将空间数据类型抽象为点状目标、线状目标、面状目标,这三类图形目标又通过特殊点,结点,一般线段,弧以及多边形加以表达。

图 2-21 矢量与TIN一体化示意图

  TIN与矢量之间存在着部分(part of)或包含的关系,实际上也是通过这种关系实现一体化的。由于TIN是以矢量系统的矢量图形为基础生成的,所以,单个三角形顶点、边、三角形本身包含的空间区域可能是矢量系统点、线、面状图形目标的一部分(图2-21)。如果在TIN和矢量数据结构中保持点和顶点、线和边、面和三角形

有关标识号的统一,那么,就能实现TIN和矢量的一体化。

 

2.3.5.2 多级格网模型

  多级格网模型的本质是在基本格网的基础上细分为256*256或16*16个格网,然后基本格网和细分格网都采用四叉树的编码方法去表达点、线、面的有关参数(见图2-22(a))。具体地讲,就是要遵循如下三点约定:

  (1)点状地物是仅有空间位置没有形状和面积,在计算机内仅有一个位置数据;

  (2)线性地物是有形状,没有面积,在计算机内由一组原子填满路径;

  (3)面状地物是有形状和面积,在计算机内由一组填满路径的原子表达的边界线。

这样,就把矢量转换为栅格的形式,实现了栅格和矢量的统一。多级格网模型的简图如图2-22(b)。

  (a) 多级格网模型空间地物的表达方法

  (a) 矢量的表达方法 (b)模型简图

图 2-22 多级格网模型示意图

2.4 空间数据结构 

  空间数据结构是对空间数据进行合理的组织,以便于计算机的处理。数据结构是数据模型和文件格式之间的中间媒介,是数据模型的具体实现。

到目前为止,矢量结构主要应用于具有强大制图功能的GIS系统,而栅格结构则广泛应用于图象处理系统和栅格地理信息系统。数据结构的选择主要取决于数据的性质和使用的方式。 

2.4.1 矢量数据结构

  下面将要介绍的数据结构指的是空间数据结构,主要是空间图形实体的定位和拓扑关系的建立。

在数据结构中,如果不包含图形实体的局部空间位置,那么,随着图形数据库数据量的增大,对图形实体的操作速度将降低。因为,在此情况下,所有的图形实体都将参与所有的计算和判别步骤。所以,为了加快数据检索和查询的速度,在数据结构中应包括记录图形实体范围的字段。为了达到节约存储空间的目的,与许多商业化的GIS系统一样,本文采用了对图形区域进行网格化的有关算法。具体方法如下:

图2-23 图形目标范围示意图 

  在图2-23中,首先对图形区域网格化,然后分别计算包围图形实体的矩形区域左下角、右上角所在网格的标识。对图形实体A而言,它的标识为(6,3)、(11,6)。利用这些标识,结合系统的状态参数,就可以过滤掉相当多的图形实体,从而达到减少计算量,提高系统运行速度的目的。由于记录矩形网格标识的数据类型为整形,所以,对每一图形实体而言只增加了8个字节存储量。矩形网格X,Y方向的分割数可以自由取定,值越大,网格越小,与网格标识有关的数值越接近包围图形目标的矩形的实际范围值。一般情况下,取150较为合适。

  在下面将要介绍的数据结构中,用(LX,LY),(RX,RY)分别表示矩形区域左下角、右上角的网格标识。

(1)特殊点的数据结构

在地理信息系统中,特殊点指钻孔、井下实测点、注记分隔线端点等点状图形目标,它们一般不与线状目标发生联系,但可能被某一多边形所包围。数据结构见表2-2。

表2-2 特殊点的数据结构

(2)结点的数据结构

数据结构见表2-3。

表2-3 结点的数据结构

  由于与结点相关的弧段数是不确定的,所以,在数据结构中加入了标识弧段数的字段。在平面图形中,Z表示结点的特征值,如高程、厚度等。

(3)一般线段的数据结构

  一般线段为"特殊点"的简单连接,所以无需表达数据点及线段间的相关关系,数据结构十分简单,见表2-4。

表2-4 一般线段的数据结构 

(4)弧段的数据结构 

  在表2-5的数据结构中,MP_NO为弧段两结点间的数据点数,(x,y,z)为数据点的坐标序列。

表2-5 弧段的数据结构

(5)多边形的数据结构

表2-6 多边形的数据结构

  弧段标识号按形成封闭圈线段的先后顺序存放。在数据结构中加入内外多边形标识的目的之一是为了与联网前建立制图边界的拓扑结构算法相统一;其二是储量管理时的需要。在储量计算和管理过程中,A、B、C、D级储量块段的封闭多边形区域大量存在相互包容的现象。

(6)剖面线的数据结构

  地层剖面线见图2-24。由图可以看出,剖面线任意点都有(x,y)和地层的厚度。另外,由于剖面线不可能无限地延长,所以,它的两端都将被其它图形实体所。这些图形实体可能有:断层,冲刷带,火成岩,图形边界等。如果数据结构中包含地层两端的图形实体信息,就可以动态地计算出相应的楔形等数据。数据结构见表2-7。表中的z表示地层的厚度。

表2-7 剖面线的数据结构

图2-24 剖面线示意图

2.4.2 栅格数据结构 

  栅格数据结构是以栅格数据模型或格网模型为基础的,其表达形式十分简单,即空间对象是通过规则、相邻、连续分布的栅格单元或像元表达的。对栅格单元的坐标,可以通过如下方式进行处理:

  (1)直接记录栅格单元的行列号;

  (2)根据规则(如按行或列顺序)记录栅格单元,利用分辨率参数(指行数和列数)计算当前栅格单元的行列号。假设通过如图30所示的方式逐行顺序记录栅格单元, 当前栅格单元的顺序编号为22,栅格区域的行数为5,列数为7,那么,该栅格单元的行列号为(3,1)。

  假设当前栅格单元行列号为(i,j),一个栅格单元所代表的空间区域大小为dlt_x,dlt_y,栅格区域的原点坐标为(x0,y0)(见图30),那么,当前栅格单元的平面坐标(x,y)为:

x=x0+j*dlt_x

y=y0-i*dlt_y

图30 栅格坐标计算示意图

  如果栅格区域的原点在左下角,那么,平面坐标的计算公式为:

x=x0+j*dlt_x

y=y0+I*dlt_y

  在日常应用中,常一个栅格数据层只存储栅格的一种属性,而且采用完全栅格数据结构。在完全栅格结构里,栅格单元顺序一般以行为序,以左上角为起点,按从左到右从上到下的顺序扫描(见图31)。

图 3-31 完全栅格结构扫描顺序示意图

  如果同一研究区域的同一栅格单元具有多个属性,那么,其数据组织方法主要有以下三种:

  (1)以栅格单元为记录的序列。待记录完不同层上同一栅格单元位置上的各属性值后,再顺序处理其它栅格单元(见图32(a));

  (2)以层为基础,每一层又以栅格单元顺序记录它的坐标和属性值,一层记录完后再记录第二层(见图32(b));

  (3)同样以层为基础,但每一层内则以多边形为序记录多边形的属性值和充满多边形的各栅格单元的坐标(见图32(c))。

(a) (b) (c)

图2-32 栅格数据组织方法

方法(1)比(2)占用的存储空间多,因为,无论同一栅格单元的属性有多少,它的坐标只记录一次,而方法(2)则要存储多次(与属性个数相同)。一般情况下,方法(3)节省的存储空间较多,因为同一属性的制图单元中几个栅格单元只记录一次属性值。

(a) (b)

图 33 分辨率与存储单元示意图

栅格文件一般都很大,在高分辨率的情况下所需的存储空间可能达数兆。由于栅格模型的表达与分辨率密切相关,所以,同样属性的空间对象(如公路)在高分辨率的情况下将占据更多的像元或存储单元;另一方面,栅格模型是通过同样颜色或灰度像元来表达具有相同属性的面状区域的(图33(a)、(b))。显然,上述两种情况将可能造成许多栅格单元或像元与其邻近的若干像元都具有相同的属性值。为了节省存储空间,就必须对栅格数据进行压缩。下面,将介绍三种常用的数据压缩方法。 

1. 游程编码

图 34 游程编码示意图

把具有相同属性值的邻近栅格单元合并在一起,合并一次称为

一个游程。游程用一对数字表达,其中,第一个值表示游程长度,第二个值表示游程属性值。每一个新行都以一个新的游程开始。表达游程长度的位数取决于栅格区域的列数,游程属性值则取决于栅格区域属性的最大类别数(分类的级别数)。通常用两个字节表示游程长度(行数可达65536),一个字节表示游程属性值(256级)。见图34。

2.常规四叉树

常规四叉树的基本思想是:首先把一幅图象或一幅栅格地图等分成四部分,如果检查到某个子区的所有格网都含有相同的值(灰度或属性值),那么,这个子区域就不再往下分割;否则,把这个区域再分割成四个子区域,这样递归地分割,直至每个子块都只含有相同的灰度或属性值为止。图35(a)是一个二值图象的区域,图35(b)表明了常规四叉树的分解过程及其关系,图35(c)是它的编码。常规四叉树的特点如下:

(1)运算量较大。因为,大量数据需要重复检查才能确定划分;

(2)占用的存储空间较大。从图35(b)可以看出,每个结点需要六个变量才能加以表达:一个变量表示父结点指针,四个变量代表四个子结点指针,一个变量代表本结点的灰度或属性值。

在常规四叉树中,栅格单元或像元总数为2 2 。这里,n>1,为数的高度或层次。图35(b)中,n=4。

图 2-35 四叉树分割

3.线性四叉树编码

  为了克服常规四叉树占用存储空间大的缺点,人们提出了线性四叉树的算法。线性四叉树只存储最后叶结点的信息,即结点的位置、大小和灰度。叶结点位置采用基于四进制的Morton码表示(加拿大学者Morton于1966年提出);叶结点的大小用结点的深度或层次表示。Morton码又称为M码。

M码的计算公式如下:

M= 

分别为栅格单元行列号的二进制数。表2-8为8行8列研究区域的M码计算成果。

表2-8 基于四进制的Morton码

在M码的基础上生成线性四叉树的方法有两种:

(1)自顶向下(top-down)的分割方法:按常规四叉树的方法进行,并直接生成M码;

图 2-36 Morton码的扫描顺序

(2)从底向上(down-top)的合并方法:首先按M码的升序排列方式依次检查四个相邻M码对应的属性值,如果相同,则合并为一个大块,否则,存储四个格网的参数值(M码、深度、属性值)。第一轮合并完成后,再依次检查四个大块的值(此时,仅需检查每个大块中的第一个值),若其中有一个值不同或某子块已存储,则不作合并而记盘。通过上述方法,直到没有能够合并的子块为止。在合并过程中,扫描顺序如图2-36所示

v

2.4.3 TIN的数据结构 

  TIN的数据结构可以不包含三角形顶点、三角形边、三角形个体间的拓扑关系,此时,数据结构十分简单,只需顺序记录三角形个体本身的信息,如三顶点的坐标。下面将要介绍的是具有拓扑关系且与矢量数据模型一体化的TIN的数据结构,见表2-8。为了优化数据结构,我们引入了结构化的含义。结构化的含义主要有如下两个方面:

  o 建立TIN的拓扑数据结构,以表达不规则三角网点、边、三角形个体间的相关关系;

  o 规定记录顺序,以隐含点、边、三角形个体间的关系,达到节省存储空间的目的。

表2-8 TIN的数据结构 

为了充分理解数据结构中各字段的含义,这里需对三角形结构化含义的要点作一解释(以图2-37(a)为例)。

  (1)扩展或动态修改三角形时,形成三角形的顺序号(如1,2,3,4,...)即为三角形的编号或标识号。以三角形形成的顺序号作为三角形的标识号具有十分明显的优点:在查询三角形时,只要得到三角形的标识号,结合三角形数据结构所占的总字节数,就可快速定位三角形在内存中的位置。假设三角形ABC为联结三角网的初始三角形,它的扩展边BC形成的三角形BCD为第二个三角形,那么三角形ABC、BCD的标识号就分别为1和2。所以三角形的标识号是隐含的,无需在数据结构中反应出来。 

  (2)假设当前扩展边的两数据点及其顺序分别为B、C,寻找到的扩展点为D,那么数据结构中第一、第二、第三点标识的数据点分别为B、D、C。 

(3)以三角形三顶点的顺序为依据,三角形的第一、第二、第三边分别为BD、DC、CB。 

  (4)三角形顶点的标识有两种情况。如果标识值为正,那么顶点为特殊点或结点;为负值,则为弧段的中间点,且为中间点顺序排列的编号。

  (5)如果三角形边的弧段标识 0,那么当前边不是GIS矢量图形弧段的一部分,而是特殊点或弧段上不相邻数据点连接的结果。见图2-37(b)中的三角形ABC的AC、BC边,三角形BCD的三边。

(a)标识为0,表明与边顺序相对应的点为特殊点;

(b)标识为负,那么其绝对值即为与边顺序相对应的三角形顶点所在弧段的标识号。

(a) (b)

图2-36 三角形结构化示意图

从上述规定可以看出,由于三角形边与点的记录顺序密切相关,所以在数据结构中不用记录三角形的边,只需按顺序记录它们的相邻三角形即可。

在利用TIN进行空间分析时,通过三角形与包含它的GIS系统中的多边形(POL_ID)的关系,就可得到三角形的属性等信息。

结构化的三角形数据结构在节省内存空间和三角形的全要素信息方面都是十分有效的。

2.4.4 空间实体拓扑结构关系的建立

这里主要指与矢量数据模型和矢量数据结构有关的空间实体拓扑结构关系表的建立。表2-9表明了图2-37中结点、中间点、弧段、多边形拓扑结构的关系表。

图2-37 空间实体示意图

从图2-37可以看出,拓扑结构具有如下优点:

(1)相邻弧段、多边形之间没有空间坐标的重复,这样就消除了重复线;

(2)拓扑信息与空间坐标分别存储,这样有利于邻接、包含、关联等查询操作。

表2-9 空间实体拓扑结构的关系表

2.5 空间数据的编码和分层 

2.5.1 空间数据的编码

  地理信息系统中的实体一般包含三种信息:语义信息、度量信息和关系结构信息。语义信息表明实体的类型,度量信息用于描述实体的形状和位置等几何属性,关系结构信息用于描述一个实体与其它实体的联系。而空间实体的编码则主要是指语义信息的数据化,它是建立在地理特征的分类及其等级组织基础之上的空间信息数据编码。

  空间数据的编码用于表明实体元素在数据分级中的隶属关系和属性性质。一般情况下,编码由主码和子码共同组成,主码表示实体元素的类别,子码则是对实体元素的标识和描述。子码又可分为识别码和描述码(有时还需参数码),识别码用于唯一地标识具体的实体元素,描述码则是对实体元素的进一步性质描述。如果规定编码格式为,主码占3位,子码占5位,则每个属性编码占一个字节。通常,采用2字节的无符号整数记录属性编码。从理论上讲,用无符号整数可编码65536中不同的实体元素,足以表示现有专业图形规范和图例中的所有类别,并且还有很大的扩展余地。

2.5.2 空间数据的分层

  在栅格数据结构中可按每种属性数据形成一个的层,各层叠置在一起则形成三维数据阵列。原则上,层的数量是无的,主要与具体的应用和有效的存储空间有关。

同样层的概念也用于矢量数据结构。与栅格结构不同的是,矢量结构的层是用来区分实体空间的主要类别,目的是为了制图和显示。

  根据GIS矢量结构的特点及应用,层主要有以下两种类型:

1. 与GIS理论和技术有关的层

  这里指Coverage。Coverage是一个GIS专业术语,意指一个覆

盖面或一个数据层,用于精确地表达点、线和面状要素的形状和边界。在ARC/INFO中,地理特征是描述Coverage的最基本的数据单位。最常见的地理特征数据类型包括弧段(arc)、结点(node)、标识点(label point)、多边形(polygon)。例如,道路、河流Coverage由线状特征(弧段)构成,地块Coverage由面状(多边形)特征构成。这些特征可以看成是对现实世界地理现象的高度抽象和概括。

2.与制图学有关的层

  这里是指Layer。根据制图的需求,把相同或不同的实体类型归为一类,以利于图形的处理和管理。例如,可以把道路、河流、管道归为"线状图形"层,也可以把它们分别归为"道路"层,"河流"层,"管道"层。

一般情况下,一个Coverage可以包括多个Layer。

作业

论述2D-GIS的数据模型和数据结构。

2.6空间数据的管理 

  空间数据管理是以给定的内部数据结构或空间图形实体的数据结构为基础,通过合理的组织管理,力求有效地实现系统的应用需求。假如说内部数据结构是寻求一种描述地理实体的有效的数据表示方法,那么空间数据管理就是根据应用要求建立实体的数据结构和实体之间的关系,并把它们合理的组织起来,以便于应用。显然,数据库管理系统(Database Management System,简称DBMS)应该是解决这一问题的主要途径。但是,由于地理信息系统具有空间信息的特性,而目前通用的DBMS系统(如FoxPro,MS SQL Server,ORACLE等)并不支持空间信息的管理,所以,DBMS系统在GIS中并未得到全面的采用。

通用的DBMS对数据的操作,基本上是对实体属性值的检索或者根据实体之间的关系对属性值的检索。在空间信息的分析应用中,常常要求的是实体之间关系的值,而不是实体的属性值。例如,"找出一组实体中距某个点最近的点"或"找出两个高程值之间的土地面积"。通常,在处理这一类问题时,并不是把所有可能的两两之间的距离或面积都计算好存储起来,因为,用户的询问、查询是多种多样的,无法作出硬性的规定,不可能(也无必要)一一排列组合去计算。显然,这将大大增加存储量。在GIS系统中,一般只存储实体的基本属性(如坐标、名称、参数值等),至于实体间的关系值,只待需要时再通过适当的算法计算。这样,处理方法不仅简单,而且数据量也小。 

  目前,地理信息系统的数据管理基本上是采用数据文件管理方式。设计者根据应用目的,采取它自己认为最方便、最有效的数据组织和存储管理方法,所以,每个系统各不相同。例如,同样采用矢量数据结构的GIS系统,与之相关的实体属性的编码方法、字节安排、记录格式、数据文件的组织都不一定完全一样。数据组织往往与采用的算法相联系。有些系统把图形实体的几何特征数据和属性特征数据组织在同一记录中(如地理信息检索和分析系统GIRAS);有的则完全分开(如ARC/INFO的ARC和INFO系统);有的在同一记录中存在部分属性数据(如Intergraph 公司的Microstation系统)。

通常,数据文件存储在外部存储器上。文件可以按实体的类型来划分,也可以按地区范围来划分。文件之间基本上是的,没有交叉关系。

数据文件的管理方式,对某一具体应用来讲,可能是简单方便的,但他有很大的局限性,难以实现资源信息的共享。为了扩大系统的实用性,增强数据的管理能力,目前的通用做法是:利用文件系统来管理几何特征数据,传统的DBMS管理属性特征数据。

2.6.1 数据库的管理 

  数据库是关于事务及其关系的信息组合。早期的数据库管理是利用文件形式存储,所以,又称为文件处理系统(见图2-38)。文件处理系统是数据库管理最普遍的方法,但是有很多缺点:首先每

图 2-39 共享数据文件的文件处理系统

个应用程序都必须直接访问所使用的数据文件,应用程序完全依赖于数据文件的存储结构,数据文件修改时应用程序也随之修改;另外的问题的数据的共享。由于若干用户或应用程序共享一个数据文件,所以,要修改数据文件必须征得所有用户的认可。由于缺乏集中控制也会带来一系列数据库的安全问题。

由于文件管理系统的缺陷,人们在此基础上发展出了真正的数据库管理系统(DBMS)。DBMS在用户应用程序和数据文件之间起到了桥梁作用。DBMS的最大优点是提供了两者之间的数据性,即应用程序访问数据文件时不必知道数据文件的物理存储结构。当数据文件的存储结构改变时,不必改变应用程序(见图2-39)。 

数据库方法与文件管理方法相比,具有如下优点:

  (1)集中控制:一个数据库在一个人或一个小组的集中管理之下,保证了数据信息的完整性、安全性和数据质量标准的规范性;

图 2-39 在DBMS管理下的数据文件共享

  (2)数据可以充分共享:数据库数据可以被不同用户共享使用,对于应用程序产生的新数据,又可充实数据库的内容;

  (3)数据的性:应用程序与数据的物理存储格式;

  (4)易扩充新的数据库应用:使用DBMS提供的服务工具,易于提供新的的数据库应用程序和数据库查询;

  (5)用户直接访问数据库:数据库系统一般都提供一种界面,使用户不需要编程就能完成复杂的分析,同时,数据库提供一种方法来控制数据库的访问和操作,维护一致性和保护数据库的完整性;

  (6)冗余信息得到控制:通过不同数据库间相关字段的联系,将减少数据存储的时间和空间;

  虽然现有的商业化数据库系统比文件系统具有更多的优越性,但它在GIS的应用中还存在一定的局限性,无法完成对几何特征数据的存储和管理。其原因如下:

  (1)在GIS中,空间数据记录是变长的,因为需要存储的部分参数(如弧段的结点、中间点数,多边形的弧段数)数目是变化的,即记录是变长的,而一般数据库只允许把记录的长度设定为固定长度。不仅如此,在存储和维护空间数据拓扑关系方面DBMS也存在着严重的缺陷。因而,一般要对标准的DBMS增加附加的软件功能。

  (2)DBMS一般都难以实现对空间数据的关联、包含、叠加等操作;

  (3)GIS需要一些复杂的图形功能,一般的DBMS不能支持;

  (4)地理信息是复杂的,对某类地理实体的表达需要多个文件、多条记录,这些文件和记录可能包括经纬网、特征坐标、拓扑关系、空间特征量测值以及非空间专题属性等等。这些复杂的信息,一般的DBMS都难以支持;

  (5)具有高度内部联系的GIS数据记录需要更复杂的安全维护系统。为了保证地理数据库的完整性,保护数据文件的完整性,保护系列必须与空间数据一起存储,否则,一条记录的改变就会使其它数据文件产生错误。一般的DBMS都难以保证这些。

图2-40 GIS数据管理方法示意图

  到目前为此,GIS数据管理方法的发展主要有以下四种类型: 

  (1)对不同的应用模型开发的数据管理服务,这是一种基于文件管理的处理方法;

  (2)在商业化的DBMS基础上开发附加系统。开发一个附加软件用于存储和管理空间数据和空间分析,使用DBMS管理属性特征数据;

  (3)使用现有的DBMS。通常以DBMS为核心,对系统的功能进行必要的扩充,几何特征和属性特征数据在同一个DBMS管理之下。在此情况下,需要开发特殊的软件来提供空间分析和图形处理功能;

  (4)重新设计一个具有几何数据和属性数据管理和分析功能的数据库管理信息系统。

见图2-40

2.6.2数据库模型 

  在GIS属性数据库中,以数据结构方式存储的图形实体或空间对象不仅数量众多,而且数据之间的联系错综复杂。那么,如何在数据结构的基础上组织这些数据呢?正像图书馆管理图书那样,图书馆有大量的藏书(书架上书的排列顺序可以认为是数据结构),这些书籍如何保存?如何管理?组织得好可方便读者使用,组织得不好将会影响读者的使用。对于数据库技术也存在同样的问题,数据组织的好坏会影响系统的效率和用户对数据库的使用。所以,数据库数据的组织是数据库技术的一个核心问题。数据库技术在处理数据组织时,是从全局出发,对数据内部的联系和用户要求进行综合平衡来考虑的。在设计数据库全局逻辑结构时现有的数据库管理系统允许使用如下三种方法:

  (1) 层次方法:将数据库数据按层次结构的形式进行组织;

  (2) 网状方法:将数据库数据按"有向图"的结构形式组织;

  (3) 关系方法:将数据库数据按关系(Relation)形式,即一种表结构的形式进行组织。

对应上述三种方法的数据库模型如下:

(1)层次模型

  数据的层次模型是以记录类型为结点的有向树或森林,能很好的表达1:N的关系。其主要特点为:

  1)除根结点外,任何结点都有且只有一个"父亲";

  2)"父"结点表示的实体与"子"结点表示的实体是一对多的关系。

  层次数据模型实体组织示意图见图2-41(a)。

(2)网状模型

  网状模型与层次模型不同,它是以有向图表示的网状结构,每个结点为一个记录类型。它具有以下几个特点:

  1)可以有一个以上的结点没有"父"结点;

  2)至少有一个结点有多于一个"父"结点;

图2-41 层次和网状模型模型实体组织示意图

3)结点之间可以有多种联系;

4)可以存在回路。

  网状数据模型实体组织示意图见图2-41(b)。

(3)关系模型

  关系模型是把数据的逻辑结构归结为满足一定条件的二维表格,每个二维表格称为一个关系。关系表由许多同类的实体组成,每个实体对应表中的一行,表中的列表示同一种属性。 

图2-42 关系模型实体组织示意图

关系数据模型实体组织示意图见图2-42。

由于层次模型只能表达1:N的关系,而地理信息系统所处理的空间数据不仅千变万化,而且联系复杂(这反应在共享结点以及点、线、面的拓扑结构),所以在设计GIS系统时很少采用层次模型。

网状模型较为真实地反应了地理空间信息的本质,通过指针可以解决数据的共享,所以现有的GIS系统对图形信息的管理模型与网状模型相似。但在图形目标的关系复杂时,通过指针表达图形关系就变得相当复杂,所以在GIS系统中,是以目标标识号代替指针以建立目标之间的联系。从这个意义上说,GIS系统在管理图形数据时所采用的的数据模型并不是完全意义上的网状模型,只是借鉴了它的数学含义和逻辑关系的定义而已。

关系模型是目前GIS系统中应用最广泛的数据模型,与它相应的关系数据库管理系统主要应用于管理属性信息。到目前为此,大多商业化的GIS软件系统,在管理属性信息方面主要采用的是关系性数据库管理系统。

2.6.3 图形数据库的设计 

  如果不利用DBMS管理几何特征数据,那么,就需要设计专门的图形数据库管理系统管理图形数据。对一个图形数据库而言,设计内容包括如下两个部分:

  (1)图形数据库文件的数据结构 主要指文件头的结构。包括版本号,纵横比例尺,图形范围,文件头的字节数(可以固定),图形实体的字节数,线型的字节数等。例如,可以规定开始十个字节存储系统的版本号,第11至第14个字节存储图形的比例尺,第2000-2032共32个字节存储图形左下角、右上角的坐标。

  (2)图形实体数据结构的设计

相关内容在数据结构一节中已经得到了充分的论述,这里不再重复。

2.6.4 属性数据库的设计

  这里指利用商业化的DBMS系统来管理属性特征数据。设计方法与一般的MIS系统完全一样,这里不再祥述。

2.6.5 图形和属性数据库的联结

表2-10 多边形数据结构

  如果在某一个GIS系统中几何特征数据和属性特征数据是分开存储,那么,系统是如何建立两类数据间的联系呢?我们已经知道,在图形实体的拓扑数据结构中存储有系统的唯一标识符(Identifier 简称ID),如果我们把此ID存入属性数据库的相应记录中,那么,系统就在图形数据库和属性数据库间建立了一一对应的关系。这样,用户就可以利用图形记录查询图形实体的相应属性信息,或者依据

存储在属性数据库中的属性信息生成具有地学分析意义的空间图形,如地图。

假设GIS系统中表达多边形的数据结构为表2-10所示,那么图2-43(a)中多边形的属性和几何数据就可利用图2-43(b)、(c)加以表示。显然,图形和属性之间是通过内部码或系统标识码建立唯一联系的

文档

2地理空间表达

2地理空间表达矢量表达法地理空间的表达地理信息系统中的空间概念常用"地理空间"来表达。地理空间上至大气电离层、下至地幔莫霍面。一般说来,地理空间被定义为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集合,它由一系列的空间坐标值组成。相对空间是具有空间属性特征的实体的集合,它是由不同实体之间的空间关系构成。地理空间的表达是地理数据组织、存储、运算、分析的理论基础。尽管地理空间中的空间对象复杂多变,但通过抽象和归类,其表达方法主要有如下几种类型。2.1.1矢量表达法矢量表达法主要表
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top