纳林河二号煤矿涌水水源判别的PCA-Logistic方法_纪卓辰.pdf
第 48 卷 第 5 期 煤田地质与勘探 Vol. 48 No.5 2020 年 10 月 COAL GEOLOGY 2. China Coal Rock Burst and Water Hazard Control Center, Ordos 017200, China; 3. School of Geology and Environment, Xi’an University of Science and Technology, Xi’an 710054, China Abstract Nalinhe No.2 coal mine is the first pair of large-scale mines in the Nalinhe mining area. The water inrush events occur from time to time due to its own complex hydrogeological conditions and strong disturbance of exca- vation in the initial stage of production, which has caused serious threat to the mining activity safety. Finding the source of gushing water quickly and effectively is the key to control the mine water disaster. Based on the water quality analysis of main aquifers and goaf water samples in Nalinhe No.2 coal mine, and drawing the piper trilinear nomograph water samples, the hydrogeochemical characteristics of the groundwater in each aquifer and goaf water were revealed. Then eight inds, snch as Ca2, Mg2, NaK, HCO – 3, Cl–, SO 2– 4, pH and salinity, were counted as the original data of water source discrimination. After the principal component analysis, four principal compo- nents F1, F2, F3 and F4 were obtained. Taking the values of these four principal components as the discriminant of the Logistic regression model, a discriminant model for gushing water sources in the Nalinhe mining area was es- tablished. Using 36 groups of standard water samples as training samples, the resubstitution accuracy was 97.22. The established model was used to discriminate 4 groups of water samples. The research results showed that the of principal component analysis and disordered multi-class logistic regression could eliminated redundant ination effectively between the original data of the samples, and made the results of water source discrimina- tion more rapid and accurate. It could meet the needs of mine production, and provide decision-making and basis 98 煤田地质与勘探 第48卷 for prevention and controlling of water inrush. Keywords hydrogeochemistry; principal component analysis; logistic regression ; water source judgment; Nalinhe No.2 coal mine 鄂尔多斯盆地是我国最大的聚煤盆地[1],其中 纳林河矿区位于该盆地的中北部。纳林河矿区由于 煤质优良、储量巨大和构造简单等特点,成为煤炭 生产的主产区。近年来,随着煤炭采掘强度增加和 复杂的水文地质条件导致涌水事件时有发生,加之 可采煤层与充水含水层间无有效隔水层,使侏罗纪 煤炭资源在开采过程中面临较严重的顶板水害问 题。矿井水害问题严重威胁着煤矿安全生产,解决 其水害问题的有效前提是对涌水来源进行判别,提 前做好防治水工作,从而降低、预防水害事故的发 生[2-3]。目前,矿井涌水水源判别方法主要有水化学 特征分析法、 多元统计学方法聚类分析、 判别分析 和非线性分析方法模糊数学、灰色系统理论、GIS、 SVM、人工神经网络、可拓实别法等多种方法[4-9], 形成较为成熟的水源判别理论体系。 但水化学特征 分析法在针对水化学特征相近的水样和混合水样 时不能进行有效判别, 多元统计学方法和非线性分 析方法在进行涌水水源判别时需满足相应的初始 条件,且往往为某个方法单独使用,具有一定局限 性[10-11]。无序多分类Logistic回归方法在3类及以 上分类变量且类别间无次序关系时适用,最终判别 结果以概率的形式呈现出来,更加直观也更符合实 际。因此,笔者将以纳林河二号煤矿为例,分析各 含水层及采空区水水文地球化学资料,并选取 Ca2X1、Mg2X2、KNaX3、 3 HCO-X4、Cl –X 5、 2 4 SO - X6、pHX7和矿化度X8共8个指标,运用主 成分分析法Principal Component Analysis,PCA和 无序多分类Logistic回归方法对样本数据进行判别, 最终建立PCA和无序多分类Logistic回归方法相结 合的涌水水源判别模型,从而精确判别矿井涌水来 源,以期为矿井水害防治提供参考。 1 研究区地质和水文地质概况 纳林河二号煤矿位于内蒙古自治区鄂尔多斯市 乌审旗境内,纳林河矿区的最南端图1,井田面积 约为130.23 km2。该矿区属典型的高原沙漠地貌特 征,地表均被第四系风积沙覆盖,无基岩出露,井 田中南部和东北部有常年性河流无定河、纳林河。 研究区属华北板块鄂尔多斯地台伊陕斜坡中部,为 一向西倾斜的单斜构造。据钻孔及井巷揭露地层由 老至新有三叠系上统延长组T3y,侏罗系中统延 安组J2y、直罗组J2z、安定组J2a,白垩系下统志 丹群K1zh, 第四系中更新统离石组Q2l, 上更新统 萨拉乌苏组Q3s及全新统Q4eol。 图 1 纳林河二号煤矿地理位置 Fig.1 Location of the Nalinhe No.2 coal mine 地下水的形成受地层岩性、地质构造、古地理 环境及水文气象等因素控制。区内含水层可划分为 第四系全新统风积沙层潜水含水层,第四系全新统 冲洪积砂砾石层孔隙潜水含水层,第四系上更新统 萨拉乌苏组孔隙潜水含水层,白垩系下统志丹群洛 河组孔隙裂隙承压含水层,侏罗系安定–直罗组孔 隙裂隙承压含水层和侏罗系延安组孔隙裂隙承压含 水层图2。目前,纳林河二号煤矿主采煤层为3–1 煤,3–1 上煤为待采煤层。根据主采煤层采后导水裂隙 带发育情况可知,3–1煤层开采后导水裂隙带进入延 安组地层, 部分区域导水裂隙带发育至直罗组地层, 因此, 延安组地层孔隙裂隙承压含水层和安定–直罗 组孔隙裂隙承压含水层是矿井的直接充水含水层。 延安组孔隙裂隙承压含水层在井田内全区发育,单 位涌水量为0.000 4370.025 96 L/sm,富水性弱; 安定–直罗组孔隙裂隙承压含水层在井田内广泛分 布,单位涌水量为0.006 230.120 5 L/sm,富水性 弱到中等。因此,直罗组孔隙裂隙承压含水层水是 矿井主要充水来源,对矿井安全生产威胁最大。 2 地下水水化学特征分析 地下水的水化学成分十分复杂,导致相同含水 层的水化学特征也会存在差异性,这些差异性往往 第5期 纪卓辰等 纳林河二号煤矿涌水水源判别的PCA-Logistic方法 99 图 2 研究区地层柱状图 Fig.2 The comprehensive histogram of stratum in study area 体现在常规离子、气体成分、胶体、微量元素和少 量有机物等的不同[12]。地层中岩性特征和补给来源 对含水层的化学组成起控制作用,不同岩性特征和 来自不同的补给条件导致含水层水化学特征存在较 大差异,利用这些差异可对不同涌水水源进行快速 和准确的判断。 利用以往不同勘探时期的水样水质分析报告收 集得到48组水样数据, 第四系含水层水样8组、 白垩 系志丹群含水层水样4组、安定–直罗组含水层水样 12组、延安组含水层水样16组、采空区水水样8组, 同时,本次采集了4组待判别水样,其中2组待判水 样分别取自3–1 上102 工作面探放水孔和3–1 上102 工作 面,另外2组分别取自井底煤仓上口锚索孔和31116 工作面采空区。 根据水质化学分析报告可知52组水样 中Ca2、Mg2、Na、K、 3 HCO-、Cl–和 2 4 SO - 含量高。 根据MT/T 6721997煤矿水害防治水化学分析方法 规定 ,主要离子浓度比例大于25时作为主要离子 参与水质类型的评价;2025的离子成分作为参 考,并用括号区别[13-14]。统计这些水样的阴阳离子浓 度表1,并在Aquachem软件中绘制地下水Piper三 线图图3,进行各含水层和采空区水水化学特征分 析、总结,并进行待判水样涌水来源的初步判别。 表 1 纳林河二号煤矿各水样主要水化学成分 Table 1 Main water chemical composition of water samples in Nalinhe No.2 coal mine 离子浓度/mmolL–1 水样编号 采样地点 Ca2 Mg2 KNa 3 HCO- Cl– 2 4 SO - pH 矿化度/mgL–1 1 Q 1.64 1.21 0.44 2.91 0.14 0.21 7.96 254.84 2 Q 4.05 1.70 1.52 2.90 0.48 3.70 7.50 558.50 3 Q 2.90 1.15 1.04 2.43 0.41 2.20 7.70 380.20 4 Q 3.03 0.71 0.04 3.91 0.21 0.07 7.00 242.00 5 Q 2.21 0.66 0.04 2.96 0.08 0.10 7.30 192.00 6 Q 2.43 0.73 0.05 3.25 0.10 0.10 7.20 205.00 7 Q 2.40 0.63 0.05 3.16 0.07 0.16 7.10 202.00 8 Q 2.17 0.64 0.04 2.91 0.07 0.05 7.30 194.00 100 煤田地质与勘探 第48卷 续表 离子浓度/mmolL–1 水样编号 采样地点 Ca2 Mg2 KNa 3 HCO- Cl– 4 SO2- pH 矿化度/mgL–1 9 K1zh 1.78 1.40 2.74 2.44 0.31 3.20 8.10 429.55 10 K1zh 1.85 1.15 3.90 2.15 0.50 4.15 7.60 497.60 11 K1zh 0.93 0.32 3.38 2.23 0.70 1.70 7.70 350.10 12 K1zh 1.49 0.10 2.98 1.81 1.05 1.88 8.20 359.00 13 J2z 22.50 5.00 83.10 2.01 3.10 122.50 7.30 8 637.30 14 J2z 20.70 6.81 92.29 1.94 5.37 112.50 7.79 8 348.00 15 J2z 19.92 3.93 94.94 2.29 4.41 113.05 7.55 8 375.00 16 J2z 23.27 0.88 84.68 2.01 3.17 106.94 7.36 7 813.00 17 J2z 16.63 11.10 100.732.24 6.97 120.65 7.55 8 117.00 18 J2z 21.70 3.37 94.51 2.51 4.04 110.80 7.72 8 281.00 19 J2z 19.92 3.93 94.94 2.29 4.41 113.05 7.65 8 375.00 25 J2y 17.45 0.70 84.09 0 7.05 94.50 8.60 7 280.00 26 J2y 20.95 4.55 97.80 2.20 4.45 116.75 7.60 8 957.10 27 J2y 20.65 5.10 101.971.95 5.03 120.75 8.15 9 043.50 28 J2y 19.70 5.05 98.39 1.85 4.05 117.25 7.50 8 912.50 29 J2y 19.20 9.89 91.01 2.05 4.12 111.00 7.72 8 919.00 30 J2y 27.32 7.14 105.977.75 6.99 131.50 7.50 9 013.00 31 J2y 17.82 9.52 99.04 7.97 7.04 108.73 7.74 8 748.00 32 J2y 15.86 5.74 113.382.93 7.26 125.62 7.98 9 464.77 33 J2y 21.00 4.50 95.53 1.61 5.17 114.25 7.50 8 649.10 41 采空区水 23.01 10.63 100.3314.25 6.03 116.45 6.83 9 589.00 42 采空区水 16.47 10.73 106.8013.41 4.94 117.63 7.30 9 528.00 43 采空区水 17.74 5.31 110.719.48 5.87 120.78 7.68 9 176.00 44 采空区水 19.32 9.38 123.0210.46 8.15 136.64 7.31 10 842.00 45 采空区水 16.17 3.65 106.539.65 5.39 118.42 7.53 9 613.00 46 采空区水 22.25 9.15 112.4114.11 6.01 122.63 7.03 9 456.00 47 采空区水 21.29 7.75 115.1110.08 13.65 119.52 7.07 9 890.00 48 采空区水 21.88 5.54 119.558.96 15.14 124.22 7.15 9 748.00 49 3–1 上102工作面探放水孔 21.46 4.68 93.74 2.01 5.47 115.10 7.23 8 498.00 50 3–1 上102工作面 16.95 5.08 117.302.78 8.26 128.90 7.58 9 764.00 51 井底煤仓上口锚索孔 19.40 9.91 90.95 2.07 4.13 111.11 7.76 8 927.00 52 31116工作面采空区 20.96 6.66 130.4412.32 14.80 131.57 7.01 9 922.00 2.1 第四系孔隙潜水 研究区第四系孔隙潜水具有相对较低的矿化 度,为192.00558.50 mg/L。阳离子以Ca2为主, 浓度为1.644.05 mmol/L;阴离子主要为 3 HCO-,浓 度为2.433.91 mmol/L,这是由于第四系孔隙潜水 含水层接受大气降水和地表河流水体的补给,水体 中溶解部分CO2,导致 3 HCO-含量增大。潜水相较 于承压水有径流路径短、水循环快的特点,使容易 迁移的Na和Cl–大量流失[15]。由图3可知,18 组水样主要位于菱形区域的中部偏左,直观显示为 HCO3-CaMg和SO4HCO3-CaMg型水,由于潜水 流经石灰岩、砂岩中钙质胶结物和钙质土壤或含石 第5期 纪卓辰等 纳林河二号煤矿涌水水源判别的PCA-Logistic方法 101 膏的沉积物,在溶滤作用下形成低矿化度溶滤水的 水质特点。 2.2 白垩系下统志丹群孔隙裂隙承压水 志丹群孔隙裂隙承压含水层水矿化度为350.10 497.60 mg/L,属低矿化度水。阳离子以Na为主, 浓度为2.743.90 mmol/L;阴离子以 3 HCO-和 2 4 SO - 为 主, 浓度分别为1.812.44 mmol/L和1.704.15 mmol/L。 相较于上覆第四系孔隙潜水,Na浓度明显增大,究 其原因是第四系孔隙潜水为白垩系下统志丹群孔隙 裂隙承压含水层水的主要补给来源,且以垂向补给 为主,含水层中存在各种长石砂岩,由于风化水解 和离子交换作用,使得在这些砂岩含水层中径流的 地下水溶解更多的Na[16]。 由图3可知,该含水层912组水样点主要 分 布 在 菱 形 中 部 偏 右 的 区 域 , 属SO4HCO3- NaCa型水。 图 3 纳林河二号矿井水样水质对比 Piper 三线图 Fig.3 Piper trilinear nomograph of the water quality com- parison of all water samples 2.3 侏罗系安定–直罗组孔隙裂隙承压水 区内侏罗系安定–直罗组孔隙裂隙承压含水层 水矿化度为7 813.009 461.00 mg/L, 属高矿化度水。 阳离子主要为Na,浓度为84.68109.40 mmol/L; 阴离子主要为 2 4 SO - , 浓度为106.94126.62 mmol/L。 由于安定组下部存在岩性为暗紫红色、灰绿色砂质 泥岩和薄层灰绿色、杂色粉砂岩,厚度较大且分布 连续,隔水性能良好。隔水层的存在较大程度减弱 了该含水层接受上覆含水层的垂向补给,仅能以侧 向补给为主,且径流缓慢,形成了补给条件差和矿 化度高的深部滞流水。 由图3可知, 安定–直罗组孔隙裂隙承压含水 层1324组水样点集中分布在菱形右边区域, 表现出SO4-Na型水的特点,表明安定–直罗组孔 隙裂隙承压含水层水溶解石膏导致 2 4 SO - 含量较 大,Na由于解吸作用也含量增加,Ca2则大量吸 附于矿物表面且发生方解石沉淀,其含量远低于 Na。 2.4 侏罗系延安组孔隙裂隙承压水 煤系砂岩水矿化度为7 280.0010 130.00 mg/L, 属高矿化度水。阳离子主要为Na,浓度为84.09 122.34 mmol/L;阴离子主要为 2 4 SO - ,浓度为94.50 131.50 mmol/L。由于石膏的溶解作用,延安组孔隙 裂隙水中 2 4 SO - 含量较大,Na的解析作用使其含量 远高于Ca2和Mg2,Cl–含量低,说明延安组砂岩 中岩盐含量很小。 由图3可知,煤系砂岩水水样点集中分布在菱 形区域的右端,显现出SO4-Na型水的特点。 2.5 采空区水 采空区水矿化度为8 890.0010 842.00 mg/L, 属高矿化度水。阳离子主要为Na,浓度为100.33 123.02 mmol/L; 阴离子主要为 2 4 SO -, 浓度为116.45 136.64 mmol/L。阳离子交换反应是造成Na过量的 主要原因,而由于采空区中黄铁矿的氧化作用, 2 4 SO - 含量增加。 由图3可知,采空区水水样点集中分布在菱形 区域的右端,显现出SO4–Na型水的特点。 3 含水层标准水样和待判水样水质比较 由图3可知,各含水层在垂向上从上到下由淡 水向咸水逐渐发生变化,且幅度很大;侏罗系含水 层水相较于第四系和白垩系含水层水在地层中滞流 时间相对较长,水岩作用也更强烈,水中溶解的离 子含量较高;侏罗系含水层水主要为静储量,当采 掘活动打破原有的封闭状态时,黄铁矿将氧化产生 较多的 2 4 SO - 。4组待判水样均落在菱形区域右侧, 矿化度为8 498.009 922.00 mg/L,属高矿化度水。 阳离子主要为Na,浓度为90.95130.44 mmol/L; 阴离子主要为 2 4 SO -, 浓度为115.10131.57 mmol/L; 水化学特征和侏罗系安定–直罗组孔隙裂隙承压 水、侏罗系延安组孔隙裂隙承压水、采空区水均 接近,说明水化学成分存在交叉,难以准确判别 涌水水源。 鉴于此,笔者运用PCA-Logistic方法建立涌水 水源识别模型,对水化学成分存在交叉的水样进行 水源判别。 102 煤田地质与勘探 第48卷 4 水化学数据处理方法 4.1 PCA 法 PCA法是一种统计方法,通过正交变换将一组 可能存在相关性的变量转换为一组线性不相关变 量。利用该方法进行数据处理,能有效降低高维数 据组之间的相关性,使其在获得主成分的同时尽量多 的包含原参数信息。假设待处理数据 X 有 n 个样本, 每个样本有 p 个指标,即 p 个变量,数据结构为 11121 21222 12 p p nnnp aaa aaa X aaa 1 当 p 较大即初始变量维度较高时,数据分析会 比较繁琐,过程复杂。因此,需对初始数据进行降 维处理,以较少的变量表示原变量,且降维后的变 量信息间没有相关性。 新变量为 F1,F2,, Fmmp, 新变量和初始变量间的关系为 111 11221 221 12222 1 122 pp pp mmmmpp Fl Zl Zl Z Fl Zl ZlZ FlZlZlZ 2 其中,确定载荷系数lmp的原则为 ① F1,F2,,Fm相互无关; ② F1是原始变量 Z1,Z2,,Zp的所有线性组合中 方差最大的一个,即 F1为第1主成分;F2是与 F1 不相关的 Z1,Z2,,Zp所有线性组合中方差最大的, 即 F2为第2主成分;以此类推至 Fm。m 的取值依 据是主成分 F1,F2,,Fm的方差累计贡献率达到85 以上[17]。 主 成 分 分 析 的 实 质 就 是 确 定 原 始 变 量 Zuu1,2,,p在其主成分 Fkk1,2,,m上的载 荷系数lmp,这些载荷分别是相关矩阵的 p 个较大 特征值对应的特征向量。 4.2 无序多分类 Logistic 回归方法 无序多分类的Logistic回归方法是分析具有3 个及以上取值水平的因变量与其他自变量之间关系 的多元回归方法,其实质可以认为是多个2分类 Logistic回归方法相互比较形成的[18]。 对于无序多分类问题,假定因变量 Y 有 j 个取 值,即有 jj1,2,,J个类别,且设定最后一个类别 为相应的参照组,自变量为 xkk1,2,,m,则对应 的第 J–1个Logistic可表达为 1 ln m jjkk k P yj x x P yJ x 3 式中P yj x为第 j 类主成分的概率; j 为常 数项; jk 为第 k 类主成分系数; xk为第 k 类主成分。 鉴于各类别的概率之和等于1,即1P yx 21P yxP yJ x,则可以推导出 1 11 12 1exp1 Jm jj k jk P yxP yxP yj x P yJ xP yJ xax 4 接下来可以求出各类别的概率,各类别的概率 公式如下 1 11 1 -1 1 1 11 11 1 1 11 1 1exp exp 1 1exp exp 1 1exp Jm jjkk jk m Jjkk k Jm jjkk jk m kk k Jm jjkk jk P yJ x ax ax P yJx ax ax P yx ax 5 因此,可将 J 个分类因变量问题,统一用下 面的概率公式归纳 1 1 11 exp 1exp m jjkk k Jm jjkk jk ax P yj x ax 6 5 涌水水源判别的 PCA-Logistic 分析模型 5.1 样本数据的 PCA 处理 根据表1中148组水样水化学成分原始数据, 利用PCA进行预处理,通过计算得到各判别指标相 关系数矩阵表2, 发现各指标间存在一定相关性[19], 如KNa和 2 4 SO - 相关系数为0.810,KNa和矿 化度相关系数为0.792, 2 4 SO - 和矿化度相关系数 为0.727。如果直接利用水样的原始数据进行涌 水水源判别,会造成信息冗余,计算量增大的同 时有可能对模型精度产生影响,甚至导致判别结 果错误。因此,有必要对样本原始数据进行PCA 处理。 利用SPSS软件进行水样各指标的PCA分析, 得到表3的结果。根据表3可知,主成分 F1和 F2 的特征根大于1, F1F4方差贡献率分别为48.97、 第5期 纪卓辰等 纳林河二号煤矿涌水水源判别的PCA-Logistic方法 103 19.56、11.45和9.02,累计贡献率为89.00, 大于85.00。因此,主成分 F1、F2、F3和 F4包含 了原始数据的绝大多数信息,可对原样本数据进行 有效的降维处理[20]。 表 2 各水化学成分指标 Pearson 相关系数矩阵 Table 2 Person correction coefficient matrix of the water chemical components 指标 Ca2 Mg2 KNa 3 HCO- Cl– 2 4 SO - pH 矿化度 Ca2 1.000 –0.158 –0.345 –0.010 –0.122 –0.084 –0.355 –0.255 Mg2 –0.158 1.000 0.360 0.579 0.237 0.354 –0.470 0.512 KNa –0.345 0.360 1.000 0.495 0.658 0.810 –0.211 0.792 3 HCO- –0.010 0.579 0.495 1.000 0.403 0.289 –0.670 0.607 Cl– –0.122 0.237 0.658 0.403 1.000 0.365 –0.216 0.453 2 4 SO - –0.084 0.354 0.810 0.289 0.365 1.000 –0.269 0.727 pH –0.355 –0.470 –0.211 –0.670 –0.216 –0.269 1.000 –0.410 矿化度 –0.255 0.512 0.792 0.607 0.453 0.727 –0.410 1.000 表 3 各主成分解释方差率 Table 3 Explained variance rates of the principal components 主成分 特征根 方差贡献率/ 方差累计贡献率/ F1 3.918 48.97 48.97 F2 1.565 19.56 68.53 F3 0.916 11.45 79.98 F4 0.721 9.02 89.00 F5 0.417 5.22 94.22 F6 0.235 2.93 97.15 F7 0.176 2.20 99.35 F8 0.052 0.66 100.00 在确定主成分个数的基础上,结合成分得分系 数矩阵,得到各主成分与原始变量的数学表达式 11234 5678 21234 5678 31234 5678 0.1030.0550.3110.218 0.2070.6630.0480.318 0.1050.4990.1240.418 0.1170.2000.3510.088 0.7810.2640.0520.029 0.0440.1910.3420.057 FXXXX XXXX FXXXX XXXX FXXXX XXXX 41234 5678 0.0200.2970.2070.209 0.9370.2930.0220.112 FXXXX XXXX 7 5.2 PCA-Logistic 判别模型验证 利用提出的无序多分类Logistic回归方法,建 立涌水水源判别的Logistic判别函数 11234 21234 3 266.755 1.94410.2470.10313.049 96.1890.4182.5231.4332.327 ln10 YFFFF YFFFF Y 8 式中Y1、Y2和Y3分别为Ⅰ、Ⅱ和Ⅲ类水样的概率对 数;F1、F2、F3和F4分别为第1、2、3和4主成分。 将式7中的F1、F2、F3、F4和原始变量的表达 式代入式8,得到无序多分类Logistic回归模型和 各原始变量的表达式如下 11 2345 678 21 2345 678 Logitln266.7550.695 1.1582.0406.59010.621 4.6043.1810.064 Logitln96.1890.944 0.1670.0361.4081.862 0.6361.3040.013 P Y PX P Y XXXX XXX P Y P X X X P Y XX X X XX XX X Ⅰ Ⅲ Ⅱ Ⅲ 3 Logitlnln10 P Y P P Y X X Ⅲ Ⅲ 9 式中P1、P2和P3分别为Ⅰ、Ⅱ和Ⅲ类水样概率; X1,X2,,X8为原始变量的含量。 对水样原始数据经PCA处理后的Logistic回归 模型能否有效完成涌水水源判别进行检验,具体操 作步骤如下 首先,依据式7确定的4个主成分表达式,分 别计算36组样本的主成分得分表4,并将其作为 判别指标;其次,利用式9无序多分类Logistic回 归模型, 将1348组各含水层的标准水样作为PCA- Logistic判别模型的训练样本,即侏罗系安定–直罗 组孔隙裂隙承压水类别为Ⅰ类,侏罗系延安组孔隙 裂隙承压水为Ⅱ类,采空区水为Ⅲ类;最后,利用 回代的预测类别和实际类别进行对比分析,确定判 别模型的可靠性表4。 最终表明水样的水化学原始 数据在PCA处理后, 通过无序多分类Logistic回归模 型进行判别,训练样本的回代准确率为97.22,建立 的PCA-Logistic判别模型具有较高识别准确率。 104 煤田地质与勘探 第48卷 表 4 纳林河二号煤矿水源判别及验证结果 Table 4 Results of water source discrimination and verification in Nalinhe No.2 coal mine 判别指标 判别指标 样本 编号 F1 F2 F3 F4 实际 类别 预测 类别 样本 编号 F1 F2 F3 F4 实际 类别 预测 类别 13 2 855.04 723.33 459.42–983.62 Ⅰ Ⅰ 31 2 883.24738.47474.18 –985.18 Ⅱ Ⅱ 14 2 758.55 699.35 447.26–944.84 Ⅰ Ⅰ 32 3 127.90792.49513.02 –1 067.20 Ⅱ Ⅱ 15 2 768.51 700.28 448.65–947.47 Ⅰ Ⅰ 33 2 856.75723.71463.50 –977.96 Ⅱ Ⅱ 16 2 583.38 651.54 413.81–885.11 Ⅰ Ⅰ 34 3 262.93827.25537.41 –1 110.78 Ⅱ Ⅱ 17 2 692.06 678.94 437.15–919.41 Ⅰ Ⅰ 35 3 238.72819.92529.77 –1 106.32 Ⅱ Ⅱ 18 2 737.25 692.12 442.25–936.46 Ⅰ Ⅰ 36 3 173.13803.62517.18 –1 085.04 Ⅱ Ⅱ 19 2 768.52 700.24 448.69–947.47 Ⅰ Ⅰ 37 3 108.79786.64507.43 –1 063.08 Ⅱ Ⅱ 20 2 769.91 693.04 444.32–942.33 Ⅰ Ⅰ 38 2 872.78731.05467.64 –985.07 Ⅱ Ⅱ 21 2 710.05 685.49 438.31–928.00 Ⅰ Ⅰ 39 2 946.35748.02477.86 –1 010.78 Ⅱ Ⅱ 22 2 731.90 691.42 440.08–936.09 Ⅰ Ⅰ 40 2 923.59747.28476