地图数据处理模型的原理与方法.pdf
地图数据处理模型的原理与方法 何宗宜 编著 武 汉 大 学 出 版 社 前 言 数字地图是国家空间数据基础设施的基础。一幅地图表达的地理空间有 时是一个地段, 有时是一个地区, 有时是整个地球, 并且具有可量测性、 直观性 和一览性。另一方面, 地理信息系统 GIS 以其丰富的地理信息内容作为数字 地图制图生产的基础之一, 须满足输出不同比例尺的地图产品的要求, 因此需 要地图制图综合模型理论和方法来处理地理空间数据。多尺度、 多类型、 多时 态的地理信息是人类研究和解决资源与环境等重大问题时所必需的重要信息 资源。随着地理信息系统在社会各个领域的广泛应用, 对多种尺度空间数据分 析和显示的需求逐渐增加, 各部门、 机构和单位为解决不同的问题对空间图形 数据需求的详细程度是不一样的, GIS 应提供给用户多尺度的空间数据, 以提高 管理、 规划、 监测和决策的效率和水平。因此, 需要空间数据处理与表示的模型 理论和方法知识, 使之从单一的较大比例尺派生出较小比例尺或较概略程度的 多种比例尺空间数据集。空间分析可以对空间数据进行深加工, 向用户提供他 们所需要的结果, 充分发挥地理信息系统在国民经济建设和国防建设中的作 用, 所以, 空间分析的模型方法是地理信息系统应用的理论基础。随着数字地 图制图技术和地理信息系统的快速发展, 地图数据处理的理论和方法显得越来 越重要。 本书主要介绍了地理信息综合、 空间分析和空间数据可视化等地图数据处 理模型的原理和方法, 是作者 20 余年科研和教学成果的积累。学生通过学习可 基本掌握地图数据处理的理论和方法, 为今后在实际工作中的数字地图和地理 信息系统设计与应用打下坚实基础。 书中插图由何晶、 张琳、 陶利佳、 白菁、 谭芬、 关焱、 赵娟、 赵嵘、 曹钦、 刘祥、 唐云妹等绘制。书中还引用了许多参考资料, 在参考文献中未一一列出, 在此 一并致谢 由于作者水平所限, 书中疏漏之处敬请读者批评指正。 何宗宜 2004 年 2 月于珞珈山 目 录 第一章 概 述1⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 1-1 地图制图数据处理模型的发展1⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 1-2 地图制图数据处理模型的应用2⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第二章 地图制图数据处理模型的数学基础4⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 2-1 地图制图数据处理模型的数理统计基础4⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 2-2 地图制图数据处理模型的模糊数学基础12⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 2-3 地图制图数据处理模型的信息论基础16⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 2-4 地图制图数据处理模型的图论基础20⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第三章 地图要素分布特征模型23⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 3-1 海岸线弯曲分布特征模型23⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 3-2 河流长度分布特征模型24⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 3-3 居民地规模大小分布特征模型27⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 3-4 地面高程分布特征模型28⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第四章 地图要素选取指标模型34⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 4-1 居民地选取指标模型34⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 4-2 河流选取指标模型49⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 4-3 其他要素选取指标模型57⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第五章 地图要素结构选取模型63⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 5-1 河流结构选取模型63⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 5-2 道路网结构选取模型73⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 5-3 地貌结构选取模型75⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第六章 地图制图要素分级模型78⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6-1 地图制图要素分级的一般要求78⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6-2 等差分级模型80⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6-3 等比分级模型80⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6-4 统计分级模型82⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6-5 具有数学规则的最优分级模型85⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 1目 录 6-6 最优分割分级模型88⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 6-7 逐步模式识别分级模型90⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第七章 地图制图评价模型93⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 7-1 地图编绘质量评价模型93⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 7-2 地图信息量评价模型102⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 7-3 地图分类分级评价模型110⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 7-4 地图变化信息量评价模型120⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第八章 地图制图要素相关模型127⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 8-1 地图制图要素分布特征相互关系的相关模型127⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 8-2 地图制图要素分布特征相互关系的信息模型132⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 8-3 地图制图要素分布特征相互关系制图模型的建立136⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 8-4 地图制图要素内容结构区域特征相互关系制图模型的建立139⋯⋯⋯⋯⋯⋯⋯ 第九章 地图制图要素分布趋势模型142⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 9-1 地图制图要素分布趋势模型的基本原理142⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 9-2 地图制图要素分布趋势面形态和拟合程度分析143⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 9-3 地图制图要素分布趋势模型的建立方法144⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第十章 地图制图要素预测模型150⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 10-1 地图制图要素预测模型的基本原理150⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 10-2 地图制图要素预测模型的建立方法150⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第十一章 地图制图要素的信息简化模型154⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 11-1 地图制图要素的主成分分析模型154⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 11-2 地图制图要素主因素分析模型155⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 11-3 地图制图要素信息简化模型的应用161⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第十二章 地图制图要素类型划分模型172⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 12-1 类型划分的常用统计量172⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 12-2 类型划分的系统聚类模型175⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 12-3 类型划分的树状图表聚类模型180⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 12-4 类型划分的变量平均值逐步替代 贝利 聚类模型181⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 12-5 类型划分的典型样本单元聚类模型182⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 12-6 类型划分的模糊聚类模型185⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 第十三章 空间数据多尺度处理模型189⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 13-1 数学形态学在空间数据多尺度处理中的应用189⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 2地图数据处理模型的原理与方法 13-2 分形理论在空间数据多尺度处理中的应用209⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 13-3 小波理论在空间数据多尺度处理中的应用221⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 参 考 文 献242⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯ 3目 录 第 一 章 概 述 现代地图制图以空间数据为主要对象,数据处理是当前地图制图的主要研究领域。地 图制图数据处理模型的原理与方法是地图制图与数学模型相结合的一门边缘学科, 它应用 数学方法处理制图数据,用相应的地图制图模型表达数据处理的结果。 1-1 地图制图数据处理模型的发展 数学方法在地图制图中的应用有着很长的历史。公元前 3 世纪地图上就使用了较严密 的数学方法,开始出现经纬线。由于多方面的原因, 两千多年来, 数学方法在地图制图中的 应用仅局限于地图的数学基础方面,使得地图制图学的大部分领域长期处于定性研究阶段, 因而被人们称为 “定性科学” 或 “经验科学” 。 20 世纪 40 年代,数学方法在地图制图学中的应用开始出现了良好的转机, 利用图解计 算法和数理统计方法研究地图要素的选取获得了较好的效果。前苏联地图制图学家根据地 图载负量和视觉变量首先提出图解计算法,较好地解决了居民地选取指标的确定, 接着较系 统地将数理统计引入地图制图。保查罗夫M. K. Ъ ο ц а л ο в等人于 1957 年发表了制图作 业中的数理统计方法 专著, 运用数理统计方法研究了地理要素的分布规律和这些要素的制 图综合选取指标。60 年代, 德国的特普弗尔F. T pfer多次发表论文, 主张用资料地图和 新编地图比例尺分母之比的开方根作为确定新编地图地物选取指标的数学依据,提出了选 取规律公式;70 年代发表了 制图综合 专著,将开方根规律选取公式系统化。1968 年, 捷克 斯洛伐克的斯恩卡E. Srnka用相关解析法, 建立了顾及地物大小和地物密度变化的选取 公式。但是,这些研究只是解决了选取数量问题, 我们称这类制图综合数学模型为 “定额选 取数学模型” 。1976 年,前苏联地图制图学家鲍罗金 A. B.Ь о р о л и н用地图物体本身的大 小和所处的地理环境物体密度两个标志来衡量地图物体的重要性,确定地图物体的取舍。 该方法还可以确定具体选取哪一个物体,使地图制图综合模型大大地进了一步, 我们称这类 制图综合数学模型为 “结构选取数学模型” 。 在我国,20 世纪 50 年代末和 60 年代初, 不少地图制图学者用图解计算法和数理统计 法研究居民地、 河流、 道路网等选取指标的数学模型, 取得了一些成果。70 年代以来, 有人 着手用回归分析方法研究确定居民地和河流选取的数学模型, 后来又有些学者利用多元回 归分析方法建立地图物体的制图综合数学模型, 使确定制图地物选取指标模型的精度有了 很大提高。从 80 年代中期开始, 有人利用模糊数学和图论来研究居民地、 河流和道路网等 的 “结构选取数学模型” ,也取得了不少成果。 地图制图数据处理模型不仅限于地图制图综合数学模型的研究, 实际上数学方法在专 题地图制图数据处理中应用也比较广泛。从 20 世纪 50 年代以来,地学研究方法发生变革, 1第一章 概 述 从定性分析发展到定量分析。60 年代, 有人将多元统计分析应用于地学领域, 推动了地图 制图数据处理模型的发展。70 年代, 不少地图制图学者应用统计分析和信息论分析地图内 容,在此基础上, 形成了比较系统的地图制图数据处理模型的理论与方法,针对不同的问题, 提出了相应的数学模型和地图制图相结合的途径。80 年代, 有些学者开始把模糊数学、 最 优化方法等现代数学引入专题地图制图的研究领域,取得了不少研究成果。 从 20 世纪 90 年代以来,许多地图制图学者利用数学形态学、 分形理论和小波理论等现 代数学对空间数据多尺度处理与表示进行深入地探讨,取得了许多研究成果, 使地图制图数 据处理模型得到进一步发展。 1-2 地图制图数据处理模型的应用 地图制图数据处理模型的研究虽然还处在初级阶段,但随着它的逐步发展, 已在地图制 图综合、 地图设计、 专题地图制图和空间数据处理中发挥着越来越重要的作用。 地图制图综合是地图制图学重要的研究课题之一, 是一种特殊的地图制图数据处理方 法。随着地理信息技术的发展,地图制图综合的数学模型已显示出广阔的应用前景。地图 制图综合模型主要有定额选取模型、 结构选取模型和图形化简模型。 1. 定额选取模型 普通地图,特别是国家基本比例尺地形图的编制, 都是利用大比例尺实测地形图逐步缩 编而成,用数学模型确定缩小后的新编图的地物选取数量, 可提高地图制图综合的质量和科 学性。定额选取模型主要有图解计算法、 方根模型和数理统计模型。 2. 结构选取模型 该模型是确定选取具体地图制图物体的数学模型。根据制图物体的结构关系, 从大比 例尺资料图上的制图物体中寻找出更重要的一部分物体表示在新编地图上。从地物的层次 关系等级关系、 空间关系毗邻与包含和拓扑关系邻接和关联等方面来解决具体选取 哪些物体的问题。结构选取数学模型主要有等比数列法、 模糊数学模型和图论模型。 3. 图形化简模型 该模型是对已选取的制图物体的平面图形进行化简, 并保持平面图形的主要形状特征 的数学模型。 地图制图数据处理模型在专题地图制图中的应用主要有地图制图要素的分级模型、 地 图制图要素的相关模型、 地图制图要素空间分布趋势模型、 地图制图要素预测模型、 地图制 图要素信息简化模型和地图制图要素类型划分模型。 1. 地图制图要素的分级模型 地图制图要素的分级模型主要解决分级数的确定和分级界线的确定两个方面的问题。 其中分级界线的确定是分级的核心问题, 它对分级表示能否保持数据特征起决定性作用。 对制图要素的数量特征进行科学的分级,有利于研究要素空间分布的趋势和差异。针对不 同的目的要求和数据分布本身的特征,采用不同的数学模型。 2. 地图制图要素的相关模型 地图制图要素的相关模型研究要素之间统计相关关系,并编制显示要素或现象地区或 部门相互关系结构特征的相关地图。 2地图数据处理模型的原理与方法 3. 地图制图要素空间分布趋势模型 地图制图要素空间分布趋势模型研究要素空间分布的规律和特点, 并编制要素空间分 布趋势图背景面图和剩余面图。 4. 地图制图要素预测模型 地图制图要素预测模型用回归分析方法研究现象间的制约关系, 确定一个变量随其他 变量的变化而变化的规律,编制预测地图。 5. 地图制图要素信息简化模型 地图制图要素信息简化模型应用主因素分析和主成分分析, 在地图上的多维信息中区 分出最为实质的部分,寻找出最重要的地理规律。信息简化的数学模型可以简化变量结构, 编制综合地图。 6. 地图制图要素类型划分模型 地图制图要素类型划分模型用聚类分析方法研究样品或变量的组合分类,编制类型图、 区划图、 分类图。 当前 GIS 数据库为了满足人们应用空间数据集的不同需求, 不得不存储多种来源、 多 种比例尺、 多种详细程度的空间数据, 造成多重表示现象, 从而会产生大量数据冗余以及内 存开销的增加等相关的弊端,更重要的是在进行跨比例尺综合分析时会产生严重的数据矛 盾。因此,需要研究空间数据多尺度处理与表示的模型方法, 使之在从单一的较大比例尺或 较详细程度的空间数据集派生较小比例尺或较概略程度的多种比例尺空间数据集时, 通过 多尺度变换,能够从一种表示完备地过渡到另一种表示, 这种完备性的要求就是派生过程要 保持相应尺度的空间精度和空间特征,保证空间关系不发生变化。空间数据多尺度处理数 学形态学模型、 分形理论模型和小波理论模型运用现代数学方法, 部分解决了空间图形数据 的多尺度处理与表示。 另外,地图要素分布规律的数学模型, 用于对地图要素分布规律进行模拟; 地图制图评 价数学模型,用于对地图资料、 地图制图综合程度、 地图制图分类分级的评价。这些模型为 地图设计、 地图制图综合和地图制图数据处理提供了科学依据。 3第一章 概 述 第 二 章 地 图 制 图 数 据 处 理 模 型 的 数 学 基 础 地图制图数据处理模型是以数学作为基础的。由于地图制图数据处理极为复杂, 它涉 及许多数学问题,比较集中的有数理统计、 模糊数学、 信息论、 图论、 数学形态学、 分形理论和 小波理论。这里仅介绍与地图制图数据处理有关的数学基本概念, 更深入的数学内容请参 考有关数学专著。数学形态学、 分形理论和小波理论的数学基础将在相关章节进行介绍。 2-1 地图制图数据处理模型的数理统计基础 数理统计是地图制图数据处理模型的重要数学基础,是研究地图制图综合, 制图要素的 分布规律、 相互关系、 组合特征和发展变化趋势的重要数学工具。 一、 地图制图数据类型 地图制图要素的特征和性质是用数据来表示的。地图制图数据可分为定量数据和定性 数据。 1. 定量数据 定量数据是一种连续量,可分为间隔尺度数据和比率尺度数据。 1间隔尺度数据 间隔尺度数据是有实际单位的度量,如米表示长度, 千克表示质量等。间隔尺度数据是 地图制图中常见的一种数据类型,一般数学方法和数理统计都以这类数据为基础。 2比率尺度数据 比率尺度数据是以一个基准量作为衡量标准的数据, 如百分比、 百分含量、 某种比值。 比率尺度数据也是地图制图中常见的一种数据类型,可用于一般数学方法和数理统计处理。 2. 定性数据 定性数据是一种不连续量,可分为有序尺度数据、 二元数据和名义尺度数据。 1有序尺度数据 有序尺度数据只表示制图物体的次序和等级关系, 不表示具体的数量。如居民地的行 政等级有首都、 省会、 地级市、 县、 乡镇、 村, 虽然没有表示出具体的数据, 但却可以分出行 政等级的高低和次序。 2二元数据 二元数据是表示地图上的图斑是否具有某种特性。如研究地图上的某个图斑所代表的 区域在相应实地上是否具有某种树木, 可以用数据 “0” 表示没有, “1” 表示有。通过二元数 据,可以把地图制图的定性数据和定量数据联系起来进行数量分析。 3名义尺度数据 4地图数据处理模型的原理与方法 名义尺度数据是表示制图物体的性质差异的数据, 例如土壤分类、 土地利用分类、 植被 分类等。 二、 地图制图数据的数字特征 1. 频数与频率 频数与频率表示制图要素分布基本特征。设有一组数据为 x1, x2, ⋯, xn, 按一定的间 距分组。在各组出现的次数称为频数, 用 fi表示; 各组频数与总频数之比叫频率, 用 pi表 示。计算公式如下 pifi ∑ n i 1 fi2 -1 2. 平均数、 数学期望、 中位数和众数 这些数据是表示地图制图数据分布的集中趋势。 1平均数 平均数是表示地图制图数据分布的集中位置, 用 x 表示。设有一组数据为 x1, x2, ⋯, xn, 则 x 为 x 1 n∑ n i 1 xi2 -2 2数学期望 数学期望 Mx是以概率 pi为权的加权平均数, 表示为 Mx ∑ n i 1 pixi2 -3 3中位数 中位数是按数值大小排列的中间数,偶数列则为中间两个数的平均值。 4众数 众数是出现次数最多的某一数值。 3. 极差、 离差、 方差和变异系数 这些数值是反映数据的离散程度。 1极差 极差是最大值与最小值的差值。 2离差 离差是各数值与平均值之差,用公式表示为 di xi- x2 -4 离差绝对值的平均值称为平均离差,用公式表示为 Md ∑ n i 1 xi- xn2 -5 离差平方和为 d 2 ∑ n i 1 xi- x 2 2 -6 3方差 5第二章 地图制图数据处理模型的数学基础 方差是用离差平方和除以样本容量得出的, 它是反映各数值与平均值的离散程度的重 要指标,用公式表示为 σ 2 ∑ n i 1 xi- x 2 n2 -7 标准差是方差的平方根, 当用样本标准差对总体标准差进行估计时, 则采用无偏估计 值,即 S ∑ n i 1 xi- x 2 n - 12 -8 4变异系数 变异系数是衡量要素的相对变化波动的程度。即 Cv S x 1002 -9 三、 地图制图数据的分布特征参数 地图制图数据处理中常用偏态系数和峰态系数来衡量制图数据的分布特征。 1. 偏态系数 偏态系数表示要素分布的不对称性。偏态系数的计算公式为 Cv μ3 S 3 2 -10 图 2 -1 偏态 式中,μ3是三阶中心矩, 即 μ3 ∑ n i 1 xi- x 3 n S 为标准差。当 Cv 0 时, 众数 在平均 值的 左边, 称为 正偏; Cv 3 时, 称为高峰态; Ce Rα 该回归方程有意义。所以该地区河流长度分布特征模型为 y 1 921 x - 1 .43 3 -6 62地图数据处理模型的原理与方法 根据3 -6式可计算该地区河流按长度的分布值, 为了检验3 -6式模型的模拟精度,将 实际分布值与计算分布值进行比较分析见表 3 -6。 表 3 -6 组号1M2345‘6b738 计算值40d125643‘2b231 实际值26d145852‘3b131 误差14d- 2M- 2- 11‘- 1‘- 1b0 从表 3 -6 中可以看出3 -6式模型基本能反映河流按长度分布的规律,但比用递减指数 分布函数建立的数学模型精度低得多。 3 -3 居民地规模大小分布特征模型 在地图制图综合中,通常是舍弃规模较小的居民地, 而居民地规模的大小一般都是以人 口数来区分。研究居民地规模大小分布规律,建立居民地规模大小分布特征模型, 可为居民 地综合提供科学依据。 根据统计分析,大规模的居民地一般都比较少, 居民地规模越小,数量越多。因此, 居民 地按规模大小分布的规律,可用数理统计中的递减指数分布函数拟合。根据递减指数分布 函数定义得居民地规模大小分布特征模型为 y ne - 1 x x i - e - 1 x x i1 3 -7 式中, y 是居民地按规模大小分布的频数, n 是居民地的总个数, x 是居民地的平均人口数, xi是居民地按大小分组的区间临界值。 为了研究某省的居民地大小分布规律,统计得到该省城镇居民地总数 n 135 个; 总人 口数∑x 2 033 499 人指城镇人口数, 不包括郊区人口。 因为 x 1 n∑ x 1 135 2 033 499 15 063 ≈ 1. 5万人 所以 1 x 1 1 .5 0 .667 得该省城镇居民地规模大小分布特征模型为 y 135e - 0 .667 xi - e - 0 .66 7 xi1 3 -8 根据3 -8式可计算该省居民地按规模大小的分布值。为了检验3 -8式模型的正确性, 将 实际分布值与计算分布值进行比较分析见表 3 -7。 72第三章 地图要素分布特征模型 表 3-7 组号分组/ 万人模型计算值实际值误差 1 2 3 4 5 6 0~2 2~4 4~6 6~8 8~10 ≥10d 98 26 7 2 1 1c 94 28 5 1 3 6 4 - 2 2 1 - 2 - 5} 从表 3 -7 可以看出3 -8式模型基本能反映该省的城镇居民地规模大小分布规律,但由于居 民地是社会经济要素,大型居民地实际个数与模型计算值误差较大, 好在制图综合中大型居 民地一般都选取,不在选择范围之内。 该省农村居民地的总数 n 187 513, 农村总人口数 ∑ x 30 256 279 人。 因为 x 1 n∑ x 1 187 513 30 256 279 163 人 所以 1 x 1 163 0 .006 1 得该省农村居民地规模大小分布特征模型为 y 187 513e - 0 .0 06 1 xi - e - 0 .006 1 xi1 3 -9 用该模型可计算出任意区间的农村居民地分布值。 3 -4 地面高程分布特征模型 在地图制图中,地貌高度表的设计和选择、 研究地貌分层设色的色层和颜色时, 都需要 了解地面高程的分布情况;在制定城市规划、 土地利用规划、 农业规划和林业规划时, 常常会 用到某个高程差范围内的地表面积。因此,研究地面高程分布规律, 建立地面高程分布特征 模型有一定的现实意义。 地球上地形起伏,形式多样, 一般来说地面高程有接近于正态分布、 皮尔逊Ⅲ型分布、 递 减指数函数分布、 幂函数分布和高次多项式分布等类型。某地区地面高程符合哪种分布就 用相应函数建立该地区的地面高程分布特征模型。 一、 符合正态分布的地面高程分布特征模型 有些地形的地面高程分布接近于正态分布, 如某地区的地面高程 的量测数据 见表 3 -8。根据表 3 -8 的数据可绘出直方图如图 3 -2 , 从图 3 -2 中可明显地看出它接近于一 条正态分布曲线。 82地图数据处理模型的原理与方法 表 3 -8 分组/ m500~600600~700-700~800800~900O900~100051 000~1 10051 100~1 2001 200~1 300 组中值/ m550{650L7508509501 0501 150ˆ1 250f 频数3M28162035y48J36 频率0.0120.0080“.0310d.06305.0780.1370.1880.141 分组 / m1 300~1 400 1 400~1 5001 500~1 6001 600~1 700“1 700~1 800d1 800~1 90051 900~2 000 ∑ 组中值/ m1 3501 450s1 550D1 6501 7501 8501 950ˆ 频数32d3051274‘1b23256 频率0.1250.1170“.0470d.02705.0160.0040.0081 图 3 -2 正态分布曲线与试验分布直方图 1. 地面高程分布特征模型 根据正态分布函数的定义,有地面高程分布特征模型 y Δh σ2π e - hi- h2 2σ 2 3 -10 式中, y 是地面高程分布频率, hi是组中值, h 是平均高程,σ是高程分布的标准差,Δh 是组 距。 令 t hi- h σ 3 -11 有 Zt 1 2π e - t2 2 上式为正态分布的标准化形式,计算时用 t 为引数,可在标准正态分布的概率表中查出。 92第三章 地图要素分布特征模型 故有 y Δh σ Zt 由于 h 1 n∑ n i 1 hi 1 256∑ 2 56 i 1 hi 1 204 m σ ∑ n i 1 hi- h 2 n ∑ 2 56 i 1 hi- h 2 256 15 936 896 256 250 Δh 100 所以该地区地面高程分布特征的数学模型为 y 100 250 Zt 0 .4Zt3 -12 根据3 -11式计算 t 值, 再用 t 值查标准正态分布的概率表可得到 Zt,然后将 Zt乘 0 .4 得到地面高程分布频率。为了进行3 -12式模型的精度分析, 把计算值和相应的观测值全 部列在表 3 -9 中。 表 3 -9 编号tZty计算值 n观测值 ni误 差 1|- 2.570.014 700.005 92c3- 17 2|- 2.220.033 900.013 63c217 3|- 1.820.076 100.030 48c807 4|- 1.420.145 600.058 215c16- 17 5|- 1.020.237 100.094 824c2047 6|- 0.620.329 200.131 734c35- 17 7|- 0.220.389 400.155 840c48- 87 8|0.180.392 500.157 040c3647 9|0.580.337 200.134 934c3227 10“0.980.246 800.098 725c30- 57 11“1.380.153 900.061 616c1247 12“1.780.081 800.032 78c717 13“2.180.037 100.014 84c407 14“2.580.014 300.005 72c117 15“2.980.004 700.001 91c2- 17 03地图数据处理模型的原理与方法 从表 3 -9 中可以看出3 -12式模型基本能反映该地区地面高程分布规律。 2. 数学模型配合判断 为了检验模型用正态分布配合是否正确,还可用分布特征参数来判断。 由于三阶中心矩 μ3 ∑ n i 1 hi- h 3/ n ∑ 256 i 1 hi- h 3 256 1 179 995 根据2 -10式有偏态系数 Cv μ3 S 3 μ3 σ 3 1 179 995 250 3 0 .08 Cv 0,众数在平均值的左边, 高程分布向前偏一些,图形有点正偏态。 由于四阶中心矩 μ4 ∑ n i 1 hi- h 4/ n ∑ 25 6 i 1 hi- h 4 256 12 574 518 942 根据2 -11式有峰态系数 Ce μ4 S 4 μ4 σ 4 12 574 518 942 250 4 3 .2 Ce 3,图形有点呈高峰态分布。 通过分布特征参数的判断,证明用3 -12式来反映该地区地面高程分布规律偏差不大。 二、 符合皮尔逊Ⅲ型分布的地面高程分布特征模型 不少地貌的高程分布是向前偏一些, 如果偏离较大, 应用皮尔逊Ⅲ型分布建立数学模 型。皮尔逊Ⅲ型分布的概率密度函数为 y β α Γα x - δ α- 1 e -β x-δ 3 -13 式中,Γα 可以在Γ分布表中查出,α ,β ,δ为待定参数。 α 4 C 2 v β 2μ2 μ3 δ x1 - 2 CS Cv 3 -14 为了研究某地区的地面高程分布规律, 用点网覆盖该地区等高线图形, 量测结果见表 3 -10。 根据3 -13式得地面高程分布特征模型 y Δh β α Γα h - δ α- 1 e -β x -δ 3 -15 式中, y 是地面高程分布频率, h 是组中值,Δh是组距。 13第三章 地图要素分布特征模型 表 3-10 编 号126345’67z89b10 分组/ m 50~100 Rα 相关显著,回归方程有意义。 因此,得 1∶ 20 万地形图居民地选取程度数学模型为 y 7. 47 x - 0. 6 5 4 -2 有了居民地选取程度模型,只要知道资料图居民地密度, 就可计算出新编 1∶ 20 万地形 图上居民地的选取程度或选取数量。 按同样的方法,对全国范围内的已成 1∶ 10 万地形图作了大量的实际观测, 建立了确定 居民地选取程度模型 y 2. 627 7x - 0. 264 0 4 -3 式中, y 是居民地选取程度, x 是居民地实地密度个/ 100 km 2 。 53第四章 地图要素选取指标模型 同理,对全国范围内已成的各种比例尺地形图作了大量的实际观测, 建立了如表 4-2 所 示的选取程度模型。 表 4-2 中小型居民地大中型居民地 比例尺ab比例尺ab 1∶ 25 万2 . 332 8- 0 . 618 11∶ 25 万2 . 396 5- 03 . 615 0 1∶ 50 万0 . 941 9- 0 . 648 71∶ 50 万0 . 946 1- 03 . 637 3 1∶ 100 万0 . 339 7- 0 . 668 81∶ 100 万0 . 354 6- 03 . 665 9 表 4-2 中考虑到人口密度对居民地选取指标的影响。为了提高模型的精度, 在小于或 等于 1∶ 25 万地形图中分大中型和中小型两种居民地类型来建立模型。 在实际地图制图数据处理中,常常是以与之比例尺相差不远的地形图作为资料图。考 虑到实际需要,通过数据分析处理可得到相应的数学模型见表 4-3。 表 4-3 中小型居民地大中型居民地 模型类型ab模型类型ab 1∶ 10 万编 1∶ 25 万1’ ‡. 426 1- 0‘ †. 483 11∶ 10 万编 1∶ 25 万1 . 465 8- 0 . 480 8 1∶ 25 万编 1∶ 50 万0’ ‡. 432 4- 0‘ †. 080 41∶ 25 万编 1∶ 50 万0 . 415 6- 0 . 058 2 1∶ 50 万编 1∶ 100 万0’ ‡. 357 9- 0‘ †. 132 91∶ 50 万编 1∶ 100 万0 . 373 3- 0 . 079 1 以上模型中,居民地密度 x 的单位为个/ 100 cm 2 ,即资料图上每 100 cm 2 范围内居民地 的个数。这样,在实施地图制图综合时, 可根据具体情况使用相应的数学模型。 二、 多元回归模型 在地图制图综合中,影响居民地选取指标的因素很多, 诸如居民地实地或资料图上密 度、 人口密度、 地形、 水系、 交通等。分析上述一些因素可知,地形、 水系及其他因素对居民地 选取指标的影响,或多或少地都可以在居民地密度和人口密度这两个标志上得到反映。因 此,确定居民地选取指标的多元回归模型采用居民地密度、 人口密度和居民地选取程度或 选取数量三个变量之间的相关, 进行多元回归分析,建立选取模型。 1. 建立确定居民地选取指标的多元回归模型的基本原理 据上分析,确定居民地选取指标的多元回归模型为 y b0 x1 b1 x2 b2 4 -4 式中, y 为居民地选取程度, x1为居民地密度实地密度单位是个/ 100 km 2 , 资料图上密度 单位是个/ 100 cm 2 , x2为人口密度人/ km 2 , b0, b1, b2为待定参数。 设 y1为单位面积内居民地选取个数,则有 63地图数据处理模型的原理与方法 y y1 x1 4 -5 把4-5式代入4-4式有 y1 b0 x1 1 b1 x2 b2 4 -6 下面对参数 b0, b1, b2的性质进行讨论。 1参数 b0 在4-4式中,当 b1, b2, x1, x2为常数时, 选取程度 y 随 b0增大而增加, 这时, b0决定着 选取的总程度水平。当 b0 0 时, y 0,居民地全部舍去, 因此 b0≥ 0 2参数 b1 在4-4式中,当 b0, b2, x2为常数时, b1一定,由不同的 x1能得到不同的 y。这时, b1决 定不同居民地密度的居民地选取程度。 显然, b1不能为正值。如果 b1 0, 选取程度 y 将随着 x1增加而增大, 也就是说居民地 密度越大,选取程度越大, 这是违背地图制图综合原理的。 当然, b1也不能小于 - 1。若 b1 - 1, 从4-6式可以