岩爆等级预测的PCA-OPF模型.pdf
岩爆等级预测的 PCA-OPF 模型 ① 赵国彦1, 刘雷磊1, 王剑波2, 刘焕新2, 赵 杰2, 范 壮3 (1.中南大学 资源与安全工程学院,湖南 长沙 410083; 2.山东黄金矿业科技有限公司深井开采实验室分公司,山东 莱州 261400; 3.锡林郭勒盟山金 白音呼布矿业有限公司,内蒙古 锡林浩特 026000) 摘 要 为了高效准确预测岩爆烈度,将主成分分析(PCA)和最优路径森林(OPF)算法相结合,选取岩石单轴抗压强度、应力系数、 脆性系数、弹性能量指数以及完整性系数这5 个指标建立了岩爆预测的 PCA⁃OPF 分析模型。 通过 SPSS 软件对国内外50 组岩爆工 程实例数据做主成分分析,依据方差累计贡献率得出 3 个主要影响因素,作为输入因子对 OPF 模型进行训练、评估、测试。 试验结 果的平均预测准确率可以达到 91.25%,对比于其它数学模型,PCA⁃OPF 模型预测准确率更高且更稳定,表明 PCA⁃OPF 模型在岩爆 等级预测中有较好的实用性,可作为一种新的岩爆等级预测方法。 关键词 岩爆; 岩爆预测; 岩爆分级; 主成分分析; 最优路径森林 中图分类号 P642文献标识码 Adoi10.3969/ j.issn.0253-6099.2019.04.001 文章编号 0253-6099(2019)04-0001-05 PCA-OPF Model for Rock Burst Prediction ZHAO Guo⁃yan1, LIU Lei⁃lei1, WANG Jian⁃bo2, LIU Huan⁃xin2, ZHAO Jie2, FAN Zhuang3 (1.School of Resources and Safety Engineering, Central South University, Changsha 410083, Hunan, China; 2.Deep Mining Laboratory Subsidiary of Shandong Gold Mining Technology Co Ltd, Laizhou 261400, Shandong, China; 3.Xilingol Shanjin Baiyinhubu Mining Co Ltd, Xilinhot 026000, Inner Mongolia, China) Abstract For effectively predicting rock burst magnitude, a PCA⁃OPF model, a combination of principal component analysis(PCA) and optimum⁃path forest(OPF) algorithm, was established for rock burst prediction with uniaxial compressive strength, the stress coefficient, the brittleness coefficient, the elastic energy index and integrality coefficient of rock as the predictors. 50 groups of rockburst practical data at home and abroad were taken for the principal component analysis by using SPSS. Based on the cumulative variance contribution rate, three principal influencing factors were determined, which were taken as the input factors for training, evaluating and testing of OPF model. It is shown that the average prediction accuracy can reach 91.25%, which is higher and more stable than the prediction results of other models. It is concluded that the PCA⁃OPF model is more practicable for predicting rock burst classification and can be used as a new method in underground engineering. Key words rock burst; rock burst prediction; rock burst classification; principal component analysis ( PCA); optimum⁃path forest(OPF) 岩爆是指在高地应力区进行岩体工程开挖时,由 于开挖卸荷使得围岩中的应力场进行重新分布,导致 岩体中的弹性应变能瞬间得到释放,而发生使岩石脱 落、爆裂、飞掷的现象[1-3]。 随着矿山、隧道等地下工 程开挖不断往深部发展,岩爆发生的概率和烈度也随 之增大。 为了对岩爆等级进行有效预测,目前国内外研究 人员提出了多种方法,主要分为 4 类① 理论判据预 测;② 现场仪器监测,如微震监测法、AE 法等;③ 数 值模拟;④ 数学方法和 AI 理论结合的多因素综合预 测,如模糊数学、BP 人工神经网络、随机森林法、SVM 以及云模型等。 上述各种方法均从不同方面对岩爆现 象的等级进行预测,各有显著的效果,但是由于岩爆机 制的复杂性以及发生的不确定性,目前国内外在岩爆 ①收稿日期 2019-02-23 基金项目 国家重点研发计划(2018YFC0604606) 作者简介 赵国彦(1963-),男,湖南沅江人,教授,博士研究生导师,主要从事采矿与岩石力学方面的研究工作。 通讯作者 刘雷磊(1995-),男,陕西渭南人,硕士研究生,主要研究方向为智能岩石力学与大数据分析。 第 39 卷第 4 期 2019 年 08 月 矿矿 冶冶 工工 程程 MINING AND METALLURGICAL ENGINEERING Vol.39 №4 August 2019 万方数据 等级预测方面还没有统一的方法,所以很有必要去研 究一些更准确的方法来进行岩爆等级预测。 最优路径森林算法(OPF)是一种不依赖于任何参 数、训练阶段也不用进行参数优化的分类预测算法,能 处理多类及有一定程度类别重叠的问题,广泛应用于 医学、生物、图像、石油勘探等领域[4],但未应用于岩 爆预测研究。 岩爆问题是多因素共同作用的结果,在 进行岩爆等级预测时,往往忽略了输入参数之间的相 关性,使得预测结果存在误差[5]。 因此,本文综合考虑 多个评价指标,尝试采用主成分分析法(PCA)与最优路 径森林算法(OPF)结合的方式建立岩爆的预测模型。 1 PCA⁃OPF 预测模型 1.1 主成分分析法 在数据处理过程中,因为一些数据的维数高、指标 多,且指标间往往会有着一定的相关性,使得在分析这 类数据的过程中计算步骤过多而把问题变得更加复 杂。 主成分分析法(PCA) [6] 是一种多指标数据的特 征信息提取技术,它利用投影的方式,把维数高的数据 投影到低维层面,把原始数据中的多个指标缩减为少 数几个没有相关性但是却能表达原始数据大部分特征 的主成分指标,简化数据结构。 主成分指标的数据既 能反映原始数据的大部分信息,又可以避免信息重叠, 使问题简单化,具体步骤如下 1) 原始数据标准化。 假设样本总数为 n,指标总 数为 p,则样本的数据矩阵为 X = x11x1p ︙ xn1xnp (1) 各个指标之间会因为量纲差异过大而对预测结果产生 影响。 首先将原始数据标准化,使得每一个指标的平均 值为 0,方差为 1。 标准化公式以及标准化后的矩阵为 x∗ ij = xij - x j var(xj) (2) X∗= x∗ 11 x∗ 1p ︙ x∗ n1 x∗ np (3) 式中xj和var(xj) 分别为第 j 个变量的平均值和标准 差;i=1,2,,n;j=1,2,,p。 2) 根据标准化数据矩阵建立协方差矩阵 R,并计 算其特征值及特征向量。 协方差矩阵 R 的值越大,说 明数据之间相关性越大,则越有必要利用主成分分析 法对数据进行处理,计算公式为 R = X∗TX∗ n - 1 (4) 然后计算 R 的特征值 λ1≥λ2≥≥λp以及相应的特 征向量 μ1, μ2,, μp。 3) 计算方差贡献率 ηi及累计方差贡献率 η��(m), 确定主成分的个数 m ηi= 100λi ∑ p i λi (5) η��(m) =∑ m i ηi(6) 通常情况下取前 m 个主成分使得方差的累积贡献率 达到 80%以上,m 即为主成分指标的个数。 4) 计算主成分对应的荷载矩阵 Upm以及 n 个样 本的主成分矩阵 Znm Upm=u1,u2,,um[](7) Znm = X ∗ npUpm (8) 1.2 最优路径森林算法 最优路径森林算法(OPF)是由 Papa 等人提出来 的一种基于最优路径树的监督分类算法,该方法主要 分为训练和分类两个阶段。 首先根据训练样本之间的 距离构建由所有样本构成的完全图的最小生成树,再 根据训练样本的类别生成最优路径森林分类器,然后 利用该分类器对测试集的所有样本进行测试分类,具 体的分类原理见图 1。 Rs Z1 πt t S 图 1 最优路径森林算法分类原理 分类步骤为[7-8] 1) 数据集 Z=Z1∪Z2,其中 Z1和 Z2分别代表训 练集和测试集。 2) 设置一个原型集 S∈Z1,S 里面是一些能够代 表不同种类的关键样本 s1,s2,,sk。 π 表示路径,是 由不同样本所构成的序列 π=〈s1,s2,,sk〉。 3) 每条路径 π 都有一个代价 f〈π〉,以路径代价 函数 fmax计量,各样本的代价 fmax初始值及路径代价为 fmax=〈s〉 = 0当 s 为根节点时 +∞当 s 为其他节点时 { (9) 2矿 冶 工 程第 39 卷 万方数据 fmax=π〈s,t〉 = max{fmax(π),d(s,t)}(10) 最优路径,顾名思义即为从同一个起点出发到同 一个终点的多条路径中最短的一条,也就是路径代价 要为最小。 OPF 算法的本质就是把 S 到 Z1中每一个 样本 t 的最优路径集合起来,形成一个最优路径集合, 称之为最优路径森林。 4) 在构建最优路径森林的同时,计算过程中会 得到 Z1中每个样本 t 的最优路径代价 f(π(t))以及 t 的类别,就是该条路径所对应的 S 中样本的类别 L(R(s))。 5) 同理,根据训练集 Z1构建的最优路径森林来 计算测试集 Z2中每个样本的类别 L,实现对待测样本 的分类。 1.3 PCA-OPF 组合模型 针对岩爆的等级预测问题,把主成分分析法和最 优路径森林算法两种数学方法的思想整合在一起来构 造新的岩爆等级预测模型。 基本思路是收集国内外 50 组岩爆实例数据,然后用 SPSS 软件中的 PCA 分析 模块进行处理,根据主成分的累计贡献率来选取主成 分,这样既消除了原始数据的相关性,提高分类结果准 确性,又可以减少 OPF 模型的输入参数,使模型训练 和计算的时间大大降低。 最后采用 OPF 对输入因子 进行分类与预测。 其计算流程如图 2 所示。 14.;2C 9CD0C4 B;;2 D,9 40 8.0 40 /*0 ;0 B ;*1. 图 2 岩爆预测的 PCA-OPF 模型计算过程 2 岩爆评判指标选取 影响岩爆发生的指标比较多,不同学者在研究岩 爆问题时所选取的指标有所不同,而且各个指标之间 往往存在非线性关系,所以评判指标的选取决定预测 的结果。 岩石单轴抗压强度 σc(X1)、应力系数 σθ/ σc (X2)、脆性系数 σc/ σt(X3)、弹性变形指数 Wet(X4)和 完整性系数 Kv(X5)等 5 个参数能够比较完整地反映 岩爆的特征,一般作为岩爆等级预测常用的 5 个指标。 查阅相关文献,许多研究学者根据这 5 个指标将岩爆 烈度可分为 4 个等级Ⅰ级(无岩爆)、Ⅱ级(弱岩爆)、 Ⅲ级(中岩爆)、Ⅳ级(强岩爆),岩爆等级分类标准见 表 1[9]。 表 1 岩爆等级分级标准 岩爆等级X1X2X3X4X5 无岩爆( Ⅰ 级)<80<0.3>40.0<2<0.55 弱岩爆(Ⅱ 级)80~1200.3~0.526.7~402~40.55~0.65 中等岩爆(Ⅲ级)120~1800.5~0.714.5~26.74~60.65~0.75 强烈岩爆(Ⅳ级)>180>0.7<14.5>6>0.75 3 模型验证 为验证所建立的 PCA⁃OPF 岩爆等级预测模型的 实用性,选取文献[10-12]的国内外 50 组岩爆工程实 例作为样本输入模型进行试验,样本参数见表 2。 表 2 国内外 50 组岩爆实例样本参数 编号 X1X2X3X4X5 岩爆等级 1157.600.5813.206.300.794 2148.400.4517.505.100.683 3132.100.3920.904.600.653 ︙ 49156.000.2011.203.600.441 50192.000.4129.707.300.852 注岩爆等级中的1、2、3、4 分别代表岩爆4 个等级中的Ⅰ级、Ⅱ级、Ⅲ 级、Ⅳ级。 3.1 相关性分析 为了避免各个指标间由于共线性而使得预测结果 误差较大,需要对表 2 中的数据进行相关性分析[5]。 采 用 Pearson 简单相关系数,采用 Two⁃tailed 进行显著性 检验,得到各指标的 Pearson 相关系数矩阵见表 3。 结 果表明,5 个指标之间相关性较大,所以需要对表 2 中 的数据进行主成分分析。 表 3 各因素 Pearson 相关系数矩阵 影响因素X1X2X3X4X5 X11.000 X2-0.2521.000 X30.257-0.4581.000 X40.500-0.0940.0681.000 X50.1410.185-0.0560.3671.000 3.2 主成分分析 由于表 2 中原始数据量纲不同,使得数据参差不 3第 4 期赵国彦等 岩爆等级预测的 PCA⁃OPF 模型 万方数据 齐,差异较大。 因此对表 2 中数据进行了标准化处理, 结果见表 4。 然后再对表 4 中标准化后的数据进行分 析,得到主成分分析碎石图(见图 3)以及主成分特征 向量表(见表 5)。 可以看出,前 3 个主成分的累计贡 献率为 81.026%,满足主成分方差的累积贡献率占总 方差 80%以上的条件,能充分反映样本的主要特征, 因此选前 3 项主成分代替原始变量进行分析。 3 个主 成分与初步定的指标之间的相关系数矩阵见表 6,即 式(7)对应的荷载矩阵 Upm。 表 4 标准化处理后的岩爆样本参数 编号X1X2X3X4X5 1-0.119 11.216 7-1.537 90.413 00.751 9 2-0.313 40.459 9-0.819 1-0.260 4-0.223 4 3-0.657 60.110 6-0.250 7-0.541 0-0.489 5 ︙ 49-0.152 9-0.995 5-1.872 2-1.102 2-2.351 5 500.607 40.227 01.220 30.974 21.283 9 ,; 2.0 1.6 1.2 0.8 0.4 0.0 12345 CD 图 3 主成分分析碎石图 表 5 主成分特征向量表 成分 初始特征值 合计方差占比/ %累计/ % 11.85137.02937.029 21.47929.58166.610 30.72114.41681.026 40.53010.60291.627 50.4198.373100.000 表 6 主成分因子荷载矩阵 影响因素 成分 F1F2F3 X10.7970.138-0.373 X2-0.5680.618-0.030 X30.583-0.5310.460 X40.6940.510-0.205 X50.270-0.7330.572 根据表 6 可得到各主成分的因子表达式,即主成 分 F1、F2、F3与 X1、X2、X3、X4、X5之间的关系式为 F1=0.797X1-0.568X2+0.583X3+0.694X4+0.270X5 F2=0.138X1+0.618X2-0.531X3+0.510X4+0.733X5 F3=-0.373X1-0.030X2+0.460X3-0.205X4+0.572X5 对表 4 中的数据进行主成分分析得出主成分矩阵 见表 7。 表 7 主成分计算后的数据 编号 F1F2F3 1-1.193 01.211 6-0.354 1 2-1.229 60.706 9-0.348 1 3-1.240 70.193 6-0.042 4 ︙ 49-2.047 71.519 3-1.893 4 502.089 3-0.868 10.862 6 3.3 基于 PCA-OPF 模型的岩爆预测 把表 7 中的 F1、F2、F3作为输入参数,岩爆等级作 为输出参数,然后将 50 组样本按照 6 ∶2 ∶2的比例划分 为训练集、评估集和测试集来进行试验。 为使预测结 果更加真实可靠,消除样本数据的潜在特性对分类器 结构的影响,进行多次试验来检验模型的准确率,并采 用回代检验法对训练集中的学习样本进行回检。 所有的试验均在 C++语言编写的 LibOPF 程序下 进行,配置在 Linux 系统终端下运行,计算不同试验次 数的回代检验准确率和预测准确率的标准差并绘制标 注差趋势变化图,见图 4。 由图 4 可知,试验次数为 100 时,回检准确率和预测准确率的标准差波动均趋 于平稳,因此设计 100 次试验即可,试验结果见表 8。 ,-;*; 0.06 0.05 0.04 0.03 0.02 0.01 0.000 4080120160200 D BD95 /*0D95 图 4 回检准确率和预测准确率标准差变化趋势 表 8 100 次试验结果 序号回检准确率/ %预测准确率/ % 190.288 2100 292.731 890 392.731 890 ︙ 9992.731 890 10092.731 8100 4矿 冶 工 程第 39 卷 万方数据 100 次试验中,学习样本的回代检验平均准确率 为 94.900 2%,其中累计有9 次试验的回代检验准确率 达 100%;测试样本的预测平均准确率为 91.25%,其中 累计有46 次试验的预测准确率达100%。 由此可见该 预测模型正确率比较高,可以在工程实际中应用。 3.4 不同预测模型比较 为了进一步检验 PCA⁃OPF 模型的实用性和准确 性,同时将 PSO⁃SVM(基于组合赋权支持向量机)、 GA⁃SVM(遗传算法优化支持向量机)以及 Grid⁃SVM (基于网格计算优化支持向量机)3 种模型的岩爆预测 模型的预测平均准确率和总体标准差进行对比分析, 结果见表 9。 结果发现 PCA⁃OPF 模型的岩爆预测准 确率更高,预测效果更稳定。 表 9 岩爆等级预测平均准确率对比 预测模型预测平均准确率/ %总体标准差 PCA⁃OPF91.250.053 2 PSO⁃SVM77.40.129 3 GA⁃SVM77.60.110 6 Grid⁃SVM77.70.111 8 4 结 论 1) 将主成分分析法和最优路径森林算法相结合, 建立岩爆预测的 PCA⁃OPF 模型,通过对国内外 50 组 岩爆实例进行学习、评估与测试,平均预测准确率可达 91.25%,说明将该模型用在岩爆等级的预测方面有较 强的工程实用性。 2) 采用主成分分析法对样本数据进行分析,将影 响岩爆的 5 个指标缩减为 3 个包含原始数据大部分特 征的综合性指标,使最优路径森林模型的输入参数变 少,也减小了各指标之间的相关性,简化了模型训练过 程,提高了预测的精度与速度。 3) 采用回代检验法对学习样本进行评估来消除 样本数据的潜在特性对 PCA⁃OPF 模型结构的影响,将 PCA⁃OPF 模型与 PSO⁃SVM、GA⁃SVM 以及 Grid⁃SVM 模型的预测平均准确率和总体标准差进行对比,结果显 示,PCA⁃OPF 预测模型具有更高的准确性和稳定性。 参考文献 [1] 赵国彦,李振阳,梁伟章,等. 岩爆预测的 Vague 集模型[J]. 矿冶 工程, 2018,38(1)1-4. [2] 杨悦增,邓红卫,虞松涛. 基于随机森林模型的岩爆等级预测研究[J]. 矿冶工程, 2017,37(4)23-27. [3] 王迎超,靖洪文,张 强,等. 基于正态云模型的深埋地下工程岩 爆烈度分级预测研究[J]. 岩土力学, 2015,36(4)1189-1194. [4] 沈龙凤,宋万干,葛方振,等. 最优路径森林分类算法综述[J]. 计 算机应用研究, 2018,35(1)7-12. [5] 张钦礼,刘伟军,杨 伟,等. 基于 PCA 和改进 BP 组合预测模型 的矿岩可爆性研究[J]. 爆破, 2016,33(1)19-25. [6] 范金城,梅长林. 数据分析[M]. 北京科学出版社, 2002. [7] Papa J P, Falc A X, Suzuki C T N, et al. A discrete approach for supervised pattern recognitio[C]∥Proc of International Workshop on Combinatorial Image Analysis. Berlin Springer, 2008136-147. [8] 陈斯雅. 基于距离的遥感图像分类方法研究[D]. 长春东北师范 大学地理科学学院, 2017. [9] 宫凤强,李夕兵,张 伟. 基于 Bayes 判别分析方法的地下工程岩 爆发生及烈度分级预测[J]. 岩土力学, 2010,31(s1)370-387. [10] 周科平,雷 涛,胡建华. 深部金属矿山 RS⁃TOPSIS 岩爆预测模 型及其应用[J]. 岩石力学与工程学报, 2013,32(s2)3705- 3711. [11] 温廷新,陈晓宇. 基于组合赋权的混合粒子群优化支持向量机的 岩爆倾向性预测[J]. 安全与环境学报, 2018,18(2)440-445. [12] 王 羽,许 强,柴贺军,等. 工程岩爆灾害判别的 RBF⁃AR 耦合 模型[J]. 吉林大学学报(地球科学版), 2013,43(6)1943- 1949. 引用本文 赵国彦,刘雷磊,王剑波,等. 岩爆等级预测的 PCA⁃OPF 模 型[J]. 矿冶工程, 2019,39(4)1-5. �������������������������������������������������������������������������������������������������� 中国知网版权声明 本刊已许可中国学术期刊(光盘版)电子杂志社在中国知网及其系列数据库产品中以数字化方式复制、汇 编、发行、信息网络传播本刊全文。 该社著作权使用费与本刊稿酬一并支付。 作者向本刊提交文章发表的行为即 视为同意本刊上述声明。 矿冶工程编辑部 2019 年 8 月 5第 4 期赵国彦等 岩爆等级预测的 PCA⁃OPF 模型 万方数据