化探数据处理原理及方法_csy.pdf
1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. 第卷第期年月 一 物化探计算技术 二。 人 灿 人 化探数据中特高值的确定及其处理方法 廉龙沫 黑龙江省地质三队 一 、 二项系数加权游动平均值的计算方法及原则 本文将提出 , 在化探数据处理中运用二项系数加权游动平均法确定特高值及其处理的新 方法 , 仅供讨论 对于等间距分布的一维数列 , 每取相邻的三个点值为基本游动区间 , 以 ,, 的系数把下式作为基本公式 , 计算对应于中间点值的加权游动平均值 一 、, 一 须把端点值 ,分别赋给公 式 当计算对应于数列首尾两个端点值的加权游动平均值时 , 中 一 或 十 计算 当游动区间的中间点为空 白时 , 把区间内三个值全部赋给零 , 使其 , 并仍给 予空 白代码如果区间内 一 或十点为空白 , 则把中间的值分别赋给 一 或 十 计算 。 如此计算的加权游动平均值 , 须与原始数据一一对应且二者均值要 相等 先按列计算一维加权游动平均值 , 一 一一 一 对于成方格网分布的二维数阵 , 仍用公式 在其基础上再按行计算一维加权游动平均值 , 就得相当于每取正方形九个网点为游动区间的 二维加权游动平均值 二 、 特高值的确定及处理方法 下面将通过实例说明化探数据的统计特征及特高值的确定及处理方法 、 步骤 原始教据的统计特征 以某地土壤中砷元素的观测值为例子观测点成网点布列 , 点距米 , 其 中有效观测值个 , 空 白点个 。 含量变化、 任何化探数据都是包含规律性基本变化和随机性变化的复杂的复合变量 。 它的概率曲线 不一定就符合什么型式的分布函数 。 一 一 收稿日期 啤 月 。 ‘ 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. 期康龙沫 化探数据 中特高位的确 定及其处理方法 图表示 , 上述个原始数据的对数 频率统计及其直方图从图可知 , 并不符合 通常所认为的对数正态分布 , 不能用正态分 布函数来处理 对于这类复合变量的变化大小 , 用其总 方差表示 , 观测值 , 对样本 均值了的离差 △ 、二 一 , 叫总离差 。 总离差的平方的平 均值叫总方差 , 用 、表示 公 ,一 劝 了 , 尹傀护 飞瑟 , 唯护 ‘ ,‘”, 一组中值真数 , 〕频数一频率 圈冲无素衬数频率直方 图 一 通皿 一 一 , 用式计算总方差 一二 总方差的平方根就是标准差 。 这个标准差达均值的倍 , 足以说明原始数据变化很 有可能存在特高值和异常值 二项系数加权游动平均值的统计特征 对于原始数据 , 按上述方法进行二项系数加权游动平均 , 可得新的与原始数据一一对应 的加权游动平均值这个游动平均值 , 代表以九个网点的区间为单位滤去随机性变化而显 现 出来的规律性变化 。 这种规律性变化 , 用其基本方差表示 ⋯ 一 加权游动平均值义对其均值父的离差一父一父 , 叫基本离差基本离差的平方的平均 值 , 称为基本方差 , 用表示 八 一 名一 竺一一‘石二扁 到 今 一 二一 根据式算得基本方差 ‘ 二一二 这个基本方差与总方差的比值 , 表明原始数据总变化 中呱作为规律性 变 化呈现出 来 , 其余呱的变化为随机性变化被滤掉 。 被滤掉的随机性变化如此之大 , 正是原始数据中 特高值或异常值存在的反映 。 随机离差的统计特征 向、 原始观测值与二项系数加权游动平均值之差各 一 叫随机离差 。 图表示 , 个随机离差值的频率分布情况 , 从图可知 , 随机离差的绝大部分基本 上服从正态分布 , 且少数高值呈现异常 随机离差 的变化大小 , 用其简单随机方差表示 , 随扒离差的平方的平均值 , 叫简单随机 方差 , 用 乙表示 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. 物化探计葬技术卷 又 盈 一笼 各 八 根据式算得简单随机方差 各 因 二 』, 随机离差的均值必定是 乙 对于原始数据中特高值或异常值的存在 与否 , 最敏感的是这个随机离差 ’ 因此 , 其 简单随机方差可作为确定特高值 的主要 指 标 。 ‘今 狡 , 一 一 。 特离值的确定 上述随机离差乙 , 是均值为零且服从正 态分布的变量 。 因此用正态分布函数可确定 随机离差的异常值 。 对于正态分布变量中的 异常 , 通常用 “ 均值加三倍标准差 ” 确定 。 为 了和 一般异常相区别 、 笔者认为用六倍标 准差确定特高异常为宜 一 、 一 。佣 即 拓 石 一归 尸 一胎 一胎 户习 ‘们 黔 、 邓 么 ﹃ ︸︸﹄︸︸︸ 缺叭头 队 月刃 一 矿严 瓶沪 气 尹银雷 丙 一组中值一频数一频率 圈砷元素随机离差频率直方图 简单随机方差 乙的平方根 、 就是髓机离差的标准差 二 二 一 ‘一 一斌丽 ‘ 因 乙 , 所以 二 六倍标准差 二 整个个随机离差中 , 大于“ 者只有和两个 , 也就是图的最后两组 。 这 是 随机离差的特高异常 。 与这个随机离差的特高异常值相对应的原始数据是和爪这就是所要确定的原始化 探数据的特高值 , 一特商值的处理 特高值的处理 , 应尊重它比相邻样品值具有略高的信息 。 为此笔者主张用代表该点的规 律性变化的二项系数加权游动平均值 , 代替特高值的办法处理为合理 。 对应于特高值和的加权游动平均值分别为和 , 这就是特高值的校正值 。 特高值的确定和处理 , 可用如下模型表示 随机离差二观测值一游动平均值 ‘ 加 各”一 一 ‘ 落工 大于 亿石 畜则特高值,校正值 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. 期廉龙沫化探数据 中特 高位 的确定 及其处理方法 三 、 计算程序框图 四 、 结论 用本方法确定的特高值 , 不仅在整 个样本中相对的较高 , 更重要的是以其随机 离差最大为特征 特高值的校正值 , 代表以该点为 中 心的小区间的规律性变化 , 且高于相邻样品 值 , 被减少的仅仅是随机性变化 , 这样处理 是合情合理的 。 样品中最高者不一定都是特高值 。 如本例中最高含量是 , 其随机离差 达标准差的五倍 , 但该点的游动平均值却低 于相邻样品值 。 对相邻样品值来说并不 很高 , 所以不属特高值 。 本例中所确定两个特高值 经校正 后 , 使整个样本的均值 降肠 , 总 方差 降 输输人峙 汝盆数阵行数 , 列数 输输人原始数据矩阵 , , , 并计算统计特征值值 计计算脚离差 , 一 计计算枷离差的方差 ‘ , 标准差 二 茄 , ”” 校校正特高值 , 二 , 、、 图程序框 图 呱 。 可见特高值对样本统计特征的影响之大 运用二项系数加权游动平均法 , 是以相邻样品之间具有较密切的相关性为前提本 例 中原始数据与加权游动平均值的相关系数为 , 它间接的反映相邻样品之间钓相关程度 。 对于点距较大的 中小比例尺观测值来说 , 因观测点之间地质条件有可能不 同 , 相关性不 明显 , 所以不宜处理特高值 , 应直接圈定异常 二项系数加权游动平均法 , 对下一步确定异常值也是比较理 想的数学工具只是把 确定特高值的指标 “ 六倍标准差 ” 改为 “ 均值倍标准差 ” , 校正特高值的过程改作剔出 异常值 如此反复进行到再没有异常值为止 。 ‘ 」 、 、 万 参考文献 〔〕杨善慈 , 矿床地质变量统计理论和扬赤中滤波与推估 , 中南矿冶学院采矿系 、 矿床地质变量统计学科研组编 , 年月 。 一 勺、 卜 坛拄 月 几 。一。 二 。 溉 、 。,。。