地质勘测数据综合分析方法及其计算程序包.pdf
地质勘测数据综合分析方法及其计算程序包 地质勘测数据综合分析方法及其计算程序包 张焕智 张焕智 随着地质科学的发展和探测手段现代化,必须对大量地质数 据进行分析,从中提取有效信息;微型计算机的推广使用,则提供 了有力的工具。 为适应地质工作的飞快发展,使广大从事野外勘察 的地质工作者能够对获取的大量勘测数据通过多种方法的数学分 析,更深入地探求地质规律,尽可能定量化地做出更合理、可靠的 地质评价, 地质勘测数据的分析与处理是当前地学领域研究的热点课题 之一,它是将地学研究由定性向定量推进的重要环节。 数学地质是在大量地质资料积累的基础上产生的,是地质学 中一门新兴的边缘学科, 它通过数学模型模拟地质现象,并应用 数字计算机快速、有效和正确地处理大量复杂的地质数据,把传 统地质学从定性描述阶段推向定量研究的新阶段。在各类地质工 作中,通过数学地质方法的应用,可以对取得的大量地质勘测数 据及时进行系统的处理和分析,从而定量了解地质现象的规律和 发展过程,以作出较合理的推断、解释与评价。随着计算机技术 的推广和应用,为使广大从事地质勘察工作的技术人员能够较好 的掌握有关的数学地质方法,有效地解决地质问题,有必要并有 可能在微型计算机上建立一个功能比较强、更加方便实用的地质 勘测数据分析计算程序包。 1 地质勘测数据综合分析方法简介 1 地质勘测数据综合分析方法简介 当前在地质勘测数据处理中,常用到的是多元统计、 模糊数学 和灰色理论三种数学方法。 下面仅对最常用的 18 种具体计算方法 进行简要的阐述。 1.1 回归分析 回归分析是研究变量相关关系的一种统计方法,即定量地建 第 1 页 立一个变量与另一个一元回归分析或几个变量多元回归分析 之间关系的数学表达式。在许多实际问题中,由于事物的内、外在 因素间关系的复杂性,使我们很难找到十分精确的数学表达式;同 时也因各变量间还受到其它偶然因素随机误差的影响,使它们 之间的关系具有不确定性。回归分析则是通过大量试验、观测数 据的统计、分析,寻找诸变量之间的内在规律,并以一种数学表达 式将其表示出来。 通过对抽水试验数据的回归分析计算,可以完成确定井孔涌 水量曲线方程、辅助计算水文地质参数、群孔试验数据的分析、 确定管井出水量与降深及井径(井间距离)等关系的数学模型、 确定管井滤水管实用长度等用常规水文地质计算所难以解决的问 题。在地下水资源评价中可以完成预报开采量、泉群流量预测、 地下水开采量预测、建立地下水均衡回归方程等工作。在工程地 质勘察中,可以确定有关设计参数(如地基容许承载力)与试验 数据(如比贯入阻力ρS)的经验方程等。 确定了管井出水量与降深、井径、等关系; 1.2 趋势面分析 趋势面分析是拟合数学面的一种统计方法。勘测试验中取得 的各项数据一般包括反映区域规律性变化, 反映局部范围特点变 化及随机因素所造成偏差的随机性变化等三部分。通过趋势面分 析,可以排除随机性干扰,掌握区域性变化规律,突出局部异常,以 便更有效的解决有关的地质、水文地质问题。在实际应用中,最常 用的是采用多项式函数做为计算趋势面的数学表达式。当以不同 观测点的纵、 横坐标相对于该点的观测值,构成不同幂次的多项式 后,根据最小二乘法原理,确定该趋势面方程;因此,其实质上是一 种多维二维或三维高次非线性回归分析。 在各类工程勘察工作中,可以建立勘测区内各种水文地质、 工程地质要素的趋势面方程,进行变化趋势分析及预测。 1.3 判别分析 第 2 页 判别分析是判别样品所属类型的一种统计方法,是在已知要 判别的类型和数目并已取得各种类型的一批已知样品的情况下, 根据一个未知样品的多种性质而判定它究竟属于哪一类。如果判 别的类型只有两个,称为二组判别,即当已知 A、B 两种类型的 一批已知样品时,可找出一个包括样品中各个指标的综合指标, 使得 A、B 两类之间的区别更加明显。从而根据一个未知样品所测 得的各个指标,算出这个综合指标,然后判定它属于哪一种类型; 这个综合指标也称做线性判别函数。如果判别的类型有多个,称 为多组判别;对于分别属于 m 个组的m≥3N 个样品,每个样品 具有 P 项指标变量,要从这 P 个变量中挑选出对于区分 m 个组 是最优的那些因子变量,进行逐步判别计算。 应用判别分析可以进行矿井涌水水源判定、井孔出水量类别 的正确划分、盐泉含钾性的判别等 1.4 聚类分析 聚类分析又称群分析,它是研究对样品或指标分类问题的 一种多元统计方法。首先认为我们所研究的样品或指标变量之 间是存在着程度不同的相似性亲疏关系。于是根据一批样品的 多个观测指标具体找出一些能够度量样品或指标之间相似程度的 统计量,以这些统计量为划分类型的依据,把一些相似程度较大的 样品或指标聚合为一类,把另一些彼此之间相似程度 较大的样 品或指标又聚合为另一类;关系密切的聚合到一个小的分类单 位,关系疏远的聚合到一个大的分类单位,把不同类型一一划分出 来,形成一个由小到大的分类系统。根据分类对象不同,可分为 Q型对样品分类聚类分析和 R型对指标分类聚类分析两 种。 同时可以采用最优分割法计算对一批有序样品进行划分分段。 地质工作中,涉及到分类的问题很多,如岩石分类、 地层分类、 地下水水质类型划分与评价、含水层富水性带划分等等。聚类 分析的方法可以突破传统地质学所建立的一些定性分类系统,形 成一些定量的分类关系,用于对事先并不都知道划分的类型和数 第 3 页 目的一批样品或指标进行分类与评价,能够较有效地解决有关 的地质问题。在水文地质工程地质工作中,应用聚类分析(最优 分割)的方法可以完成岩溶含水层的富水性分析、包气带水份变 化阶段分析、水质分类与评价以及岩土体类型划分等工作。 1.5 主成分分析 在许多情况下,我们所研究的对象中,必须进行多因子的综合 分析,多数情况下因子之间存在着一定的相关性,因此从原来因子 的相关矩阵出发,通过研究它的内部结构,可以找出若干个对这些 因子起着支配作用的独立新因子即综合因子,它们实际上是原来 因子的线性组合来表达所有观测数据,从而简化观测系统,突出 主要矛盾,有助于对大量的观测数据进行更合理的分析和解释,揭 示研究对象在成因上或者空间上的联系;这种分析方法,称为因子 分析。因子分析也分为 R型和 Q型两种类型。R型因子分析 亦称为主成分分析,是通过变量或指标的相关系数矩阵内部结 构的研究,找出控制着所有变量的几个主成分。 在地质工作中,运用因子分析方法对大量观测数据进行分析 和解释,可以从一些具有错综复杂关系的地质现象中找出少数几 个主要因子,其中每一个主因子代表反映地质变量间结合关系的 一种地质作用,从而加深对地质现象的认识,找出地质规律。 例如, 在一定的水文地质单元内, 地下迳流具有连续性;同时受到当年 以至以前若干年降水量的影响,因而具有多年调节的特点;地下 水调节年份与调节周期确定得是否合适,是合理进行地下水资源 评价、进行水资源供需平衡预测的关键,进行主成分分析,可以 确定降水对地下迳流的滞后影响年份。 1.6 对应分析 对应分析是在因子分析的基础上发展起来的一种多元分析方 法,该方法由 R型分析的结果,可以很容易地得到 Q型分析的 结果,这就克服了由于样品容量大而对进行 Q型因子分析所带 来计算上的困难。 同时,把 R型与 Q型因子分析统一起来,把变 第 4 页 量和样品同时反映到相同坐标轴因子轴的一张图形上,更直观 地揭示出研究对象在成因上或者空间上的联系,便于直接进行解 释与推断。 应用对应分析方法对大量地质勘测数据进行处理分析,可以 对变量和样品一起进行分类、 作图和成因解释,从而有助于对样品 类型的解释,同时了解地质过程的空间关系。 有文献对 20 个盐泉、 7 项指标进行了对应分析,以便了解样品和变量之间的关系,更合 理地评价各盐泉及它们的成因联系。 1.7 典型相关分析 1.7.1 典型相关分析计算 典型相关分析是研究两组变量之间相关关系的一种统计方 法。假定考虑两组具有联合分布的变量 x1 、x2 、、xp 1 及 xp 11 、xp 12 、、xp 1 p 2 ,要研究其一组变量与另一组 变量之间的相关,可类似主成分分析,在每一组变量中,都选择若 干个有代表性的综合指标变量的线性组合,通过研究两组综合 指标间的关系来反映两组变量间的相关。 1.7.2 典型趋势面分析计算 典型趋势面是用典型相关分析的原理建立起来的一个多项式 趋势面。假定有两组变量,第一组变量由一些地质量所组成,第二 组变量则由样品的地理座标X,Y及其二元多项式的各高次项所 组成。通过典型相关分析,可以找出第一组变量的综合变量 U1 第一组变量的线性函数及第二组变量的综合变量 V1 第二组 变量的线性函数,使这两个综合变量具有最大的相关系数 r1 第 一个典型相关系数。若 r1 ≈1,说明两组变量密切相关,可以建 立典型相关变量 U1 与 V1 的线性回归方程 U1 b10 b11 V1 此既为典型趋势面。依此,由自变量地理座标 x、y可以预测出 因变量多个地质变量的综合趋势在一个区域上的变化趋势,并 第 5 页 圈出趋势等值线图。 应用“典型相关分析”和“典型趋势面分析”可以进行“井 孔出水量与井径及水文地质因素” 、 “地域含水层富水性”等综合 分析研究。 1.8 模糊数学分析法 模 糊 数 学 自1965年 美 国 加 利 福 尼 亚 大 学 控 制 论 教 授 L.A.Zaden 发表第一篇论文Fuzzy Sets以来,引起了众多数 学爱好者的关注。1976 年,我国开始了对模糊数学的讨论和研究, 至今已得到了迅速的发展和在各学科的推广应用。 自然界中,许多 事物都具有广泛而普遍的模糊性,经典数学对于这些具模糊性的 事物只能先给出一个特征性的标准,然后采用符合则是,不符合则 不是的逻辑来判断,因而造成许多具模糊性的事物经严格的标尺 去度量时,致使许多有用的信息丢失,甚至在结论上导致失真。模 糊数学的应用,则弥补了经典数学在这方面的不足。 1.8.1 模糊聚类分析计算 聚类分析是研究“物以类聚”的一种多元分析方法,它是用数 学定量地确定样品间的亲疏关系,从而客观地分型划类。 在确定样 品分类的众多影响因素中,很难确切地说明哪种因素所起作用的 大小,这是一种模糊关系;将这种模糊概念引入聚类分析中,就成 为模糊聚类分析。 1.8.2 模糊综合评判 在生产、科研和日常生活中,人们总要对某一事物进行评价, 然后决定是否取用或确定其级别。而同一事物又具有多种属性, 要做出正确合理的评价,必须对多个相关因素进行综合考虑。 模糊 综合评判就是根据一个样品的若干因子对该样品进行恰当的评 价。 如果用一种模式表示,可以把模糊关系 R看成 “模糊变换器” ,A 为输入,B为输出;若已知输入和变换器,求输出,就称为模糊综合 评判。 1.8.3 多对象多因素的模糊综合评判 第 6 页 该方法是对多种因素所影响的事物或现象作出总的评价,即 对评判对象的全体,根据所给的条件,给每个对象赋予一个非负实 数评判函数,在此基础上排序择优。 模糊数学方法在水质评价中已经得到了较好的应用,有文献 应用于井孔出水量类别划分。 工程地质工作中,涉及到许多评价问 题,如边坡稳定性、岩体质量、场区稳定性、基础强度、土体类别 划分等等, 这些工程地质条件都受到多种因素的长期作用的影响, 利用模糊数学方法进行评价,都能够取得比较合理的结果。 1.9 灰色分析与模拟 灰色系统是指即含有已知信息、又含有未知信息的系统。灰 色系统理论是华中理工大学邓聚龙教授 1982 年在国际上创立的 一种新型系统工程理论,它是一门横断面大、渗透性强、新兴的边 缘科学,已在社会科学、自然科学的许多领域中得到广泛的应用。 1.9.1 灰色关联度分析计算 关联度分析,是根据灰色系统内因素数据列的几何形状、 发展 态势接近的程度,来衡量因素间关联程度的一种方法。 1.9.2 灰色 GM 建模计算 灰色系统中,所能够获得的系统信息或资料往往不很完善,系 统的结构和参数也不完全确知。在建模时, 首先承认这些现实, 并把它看作一组有不确定特征的“灰色”参数和“灰色”结构; 然后,可以通过“灰色过程”和“生成变换”的方式,建立一般性 灰色系统理论微分模型,简记为 GM 模型。 水文地质工作中,由于人力、物力和财力所限,对地下水系统 的信息或资料不可能全部获得,已获得的水文地质资料仅是地下 水系统总体信息的一部分,因此地下水系统也是一种灰色系统。 地 下水系统的灰色模拟和预测,主要是通过建立 GM1,M模型,进行 的数列模拟和预测。地下水系统的灰色建模,用灰色变量、灰色 结构和灰色参数来描述系统中即重要但又缺乏可直接观测的那些 非确知部分;它克服了确定模型仅描述系统的确知行为、随机模 第 7 页 型仅分析系统的偶然行为的不足,更客观、实际地反映了地下水 系统的本质,因而具有更广阔的应用前景。 灰色系统理论在工程地质工作中的应用也是多方面的,如地 基变形的灰色模拟、滑坡体稳定性的灰色模拟预测等。 2 程序包组成与功能2 程序包组成与功能 2.1 程序包组成 程序包汇集了在地质分析工作中最常用的多元统计、模糊数 学、灰色系统理论的十八种分析计算方法,在主控菜单下,组成 了有机的整体。程序包主控菜单(本次有修改)(本次有修改)如下 “****************************************************************“ “* 地质勘测数据分析计算程序包 *“ “* *“ “* 1. 一元回归分析 2. 多元回归分析 *“ “* 3. 逐步回归分析 4. 趋势面分析 *“ “* 5. 判别分析 6. 多级逐步判别分析 *“ “* 7. R - 型聚类分析 8. Q - 型聚类分析 *“ “* 9. 最优分割计算 10. 主成分分析 *“ “* 11. 对应分析 12. 典型相关分析 *“ “* 13. 典型趋势面分析 14. 模糊聚类分析 *“ “* 15. 模糊综合评判 16. 多对象多因素的模糊综合评判 *“ “* 17. 灰色关联度分析 18. 灰色 GM1,M 模型 *“ “* 19. 退 出 *“ “* *“ “* 注计算所用数据文件请参照数据文件模版(DT1 - DT18) *“ “* 采用“记事本”或“写字板”建立后,以 .DAT文件保存 *“ “* 在子文件夹 /DAT中即可。 *“ “****************************************************************“ “请选择 1 --- 19 “; xz 2.2 计算方法功能块 包括 3 种计算方法的 18 个计算模块如下 1 多元统计分析方法, 13 个计算模块 1 一元回归分析 该程序可进行直线及对数等 8 种曲线化直线的一元回归分 析计算, 输出确定的回归方程及相关系数、剩余标准差等计算结 果。 2 多元回归分析 该程序可进行直线及幂曲线的多元回归计算, 输出确定的多 第 8 页 元回归方程及相关系数、回归显著性检验值等。 3 逐步回归分析 该程序可进行直线与幂曲线的逐步回归计算, 输出确定的偏 回归方程、方差分析、偏相关系数、回归显著性检验值等计算结 果。 4 趋势面分析 该程序可按照给定的多项式趋势面的趋势面方程最高幂次, 进行各次趋势面计算,输出各次趋势面方程系数包括常数项,及 其分析结果、拟合度、检验统计量、剩余标准差等。 5 判别分析 该程序可进行两组判别分析计算, 还可进行待判样品的判别 计算, 输出确定的判别函数,A、B 类样品的综合指标、判别限、F 统计量, 各样品的判别值等。 6 多级逐步判别分析 该程序可进行多级逐步判别分析计算, 还可对待判样品进行 计算分类, 输出各组的判别函数系数、对已知样品的回判结果、 判别矩阵及判别效果检验等。 7 R - 型聚类分析 该程序可对指标进行聚类分析, 在指标间的距离系数或相关 系数矩阵的基础上采用一次形成法进行指标的分类聚合; 或者依 据相关系数矩阵采用逐步形成法进行指标的分类聚合。输出初始 相关距离系数矩阵、 分类聚合的指标及其最大相关距离系数, 同时可输出逐步聚类过程中的分类矩阵。 8 Q - 型聚类分析 该程序可对样品进行聚类分析。采用距离系数法或相似系数 法夹角余弦法计算样品间的相似距离系数矩阵, 并利用一次 形成法进行各样品的分类聚合; 另外可在相似矩阵的基础上, 利 用逐步形成法进行各样品的分类聚合; 输出各项计算结果。 9 最优分割计算 第 9 页 该程序可对一批有序样品进行最优分割计算,输出变差矩阵 及各次分割结果。 10 主成分分析 该程序可进行主成分分析计算, 输出相关矩阵、相关矩阵特 征值、主因子数、初始因子载荷矩阵、经方差极大正交旋转变换 后的因子载荷矩阵及其方差、样品各主因子得分等结果。 11 对应分析 该程序可进行对应分析计算, 输出协方差矩阵、特征值与特 征向量、主因子数、R -型及 Q - 型因子载荷矩阵等计算结果。 12 典型相关分析 该程序可进行典型相关分析计算, 输出第一组与第二组变量 的典型变量的组合系数、各对典型变量的典型相关系数及其显著 性检验统计量、自由度等计算结果。 13 典型趋势面分析 该程序可进行 1 - 6 次典型趋势面分析计算,输出各次典型趋势 面分析结果及拟合度、相关系数、回归系数、二组变量的线性组 合系数等。 2 模糊数学分析方法, 3 个计算模块 1 模糊聚类分析 该程序可以对给定的模糊集合进行构造模糊相似关系矩阵及 合成模糊等价关系矩阵的计算,并可以分别在模糊相似关系矩阵 或模糊等价关系矩阵的基础上,对样品进行不同水平的分类。 输出 模糊相似关系矩阵、模糊等价关系矩阵及其不同水平的分类集合 等项计算结果。 2 模糊综合评判 该程序可同时对若干个样品进行模糊综合评判计算, 并可进 行二级模糊综合评判计算。输出评语集、因子集、权重、评价矩 阵、二级评价矩阵及综合评判结果。 3 多对象多因素的模糊综合评判 第 10 页 根据实际问题确定多对象、多因素的模糊评判矩阵后, 该程 序可进行模糊综合评判与二级评判计算。输出评判矩阵、二级评 判矩阵及二级评判指标等计算结果。 3 灰色关系分析方法, 2 个计算模块 1 灰色关联度分析 该程序可进行灰色关联度分析计算,输出各因素序列与母序 列的关联度及其关联序。 2 灰色 GM1,M 模型 该程序用于 GM1,M及不等时距的 GM1,1模型建模计算, 并 可对预测模型精度进行检验计算。输出模型参数、预测数据列以 及检验计算结果。 2.3 数据文件建立 本次建立了 18 种计算方法的数据文件模版(DT1 - DT18), 使用中可采用“记事本”或“写字板”参照数据文件模版建立计算 所用数据文件,建立后以 .DAT 文件保存在子文件夹 /DAT 中即 可,使用起来更加方便。 3 系统环境与安装 3 系统环境与安装 该程序包的开发环境主要是 硬件 联想 11 天蝎Ⅱ型微机, OKI-8340C 型 24 针打印机。 软件 MS DOS6.22 操作系统,UCDOS5.0 汉字系统。 该程序包的支撑环境主要是 硬件 386 以上微机, 打印机, 鼠标器等。 软件 DOS3.30 以上操作系统, UCDOS3.0 以上汉字系统。 本程序包计算程序使用 QBASIC 算法语言编制,编译为. 可执行文件(原程序包使用 FOXPRO 2.5 编制菜单系统,主控程序 包运行) 。 本程序包可在 Windows 98 的 DOS 系统中运行,在 D盘中需 要有 UCDOS 汉字系统(或使用 Win98 中 DOS 自带的汉字系统, 第 11 页 但没有试过) 。 在 D盘建立目录\DTFX,存放计算程序及数据文件模板;并 子目录\DTFX\DAT 中存放计算所用的数据文件。 计算所用的数据文件可按照数据文件模板使用“记事本”或 “写字板”建立并编辑。 各程序包的批命令直接放在 D盘根目录下,在 D盘下直接 点击(或在 Windows 98 桌面上建立快捷方式)即可进入 DOS 系统 的 UCDOS 汉化环境运行(或使用 Win98 中 DOS 自带的汉字系统, 但没有试过) 。 运行中,按照提示直接输入“数据文件名”即可,文件路径 程序中自行认定。 程序运行时应打开“打印机” ,否则程序出错退出。 注本成果最初作为个人工作的总结完成于 1992 年前,其中许多内容已经 编写论文发表。1998 年,对程序包部分又进行了调整、补充和完善,并作 为一项成果,由水利厅科技处组织专家评审,获得好评。本次程序包形式 有修改,为了方便使用,仍用 QBASIC 算法语言重新编制主控菜单,编译 为. 可执行文件,控制程序包运行。完整成果及程序包源程序等正在重 新整理、编辑,完成后将一并奉献给同仁。 第 12 页