基于主成分分析法的山东省煤矿事故原因分析.pdf
基于主成分分析法的山东省煤矿 事故原因分析* 王二鹏1, 姚 璐1, 孙学芳1, 马汉鹏2 ( 1. 华北科技学院 安全工程学院, 北京 101601; 2. 华北科技学院 安全培训部, 北京 101601) 摘 要 为了研究山东省煤矿事故的主要类型及各类事故之间的相互影响关系, 并依据 2008 2019 年山东省境内煤矿发生的事故数据进行了事故原因分析。基于 SPSS 24. 0 软件中的主成分分 析法, 计算得到了导致煤矿事故发生的 3 个主成分, 从而分析得到造成山东省煤矿事故的主要类型 为瓦斯事故、 顶板事故、 运输事故和水害事故, 并确定山东省煤矿各类事故之间的相互影响关系。 相关研究方法和结果可以为今后山东省煤矿行业更准确地制定防范对策, 为减少此类 型事故的发生提供参考依据。 关键词 煤矿事故; 主成分分析法; 事故类型; 事故原因; 统计分析 中图分类号 TD77 + 1 文献标志码 A 文章编号 1671- 749X( 2021) 01- 0057- 04 Cause analysis of coal mine accidents in Shandong Province Based on principal component analysis WANG Erpeng1, YAO Lu1, SUN Xuefang1, M A Hanpeng2 ( 1. School ofSaf ety Engineering, North China Institute ofScience and Technology, Beij ing 101601, China; 2. Saf ety Training Department, North China Institute ofScience and Technology, Beij ing 101601, China) Abstract In order to study the main types of coal mine accidents and interaction of coal mine accidents in Shandong Prov- ince, based on the accident data of coal mines in Shandong Province from 2008 to 2019, the accident causes are analyzed. Based on the principal component analysis of SPSS 24. 0 software, the three principal components causing coal mine accidents are calculated, the main types of coal mine accidents in Shandong Province are determined as gas accidents, roof accidents, transportation accidents and water accidents, and the mutual influence among various accidents is discussed. The research s and results can provide reference for the coal mines in Shandong Province to ulate more accurate pre- ventive countermeasures and reduce the occurrence of similar accidents in the future. Key words coal mine accident; principal component analysis; accident type; accident cause; statistical analysis 0 引言 煤炭工业作为我国的基础产业, 在现在及未来 的国民经济发展中都起着举足轻重的作用, 从目前 我国能源现状、 经济发展水平和世界能源格局来看, 相当长的时期内以煤为主的能源消费结构难以改 变[ 1- 3]。总体来看, 近年来我国煤矿安全生产形势 趋于好转, 以山东省煤矿安全生产形式为例, 截止 2020 年 3 月, 全省境内煤矿共发生事故 2 起、 死亡 6 人, 与 2019 年同期相比, 事故起数增加 1 起, 死亡人 数增 加 5 人, 同 比 生 产 安 全 事 故 增 长 率 达 到 100%[ 4], 山东省煤矿安全形势依然面临着严峻挑 战。煤矿安全事故, 不仅给煤矿企业造成了严重的 经济损失, 更对煤矿职工造成严重的心理压力, 导致 煤矿企业全都面临着招工难的困扰。为此, 对山东 省煤矿安全形势进行分析, 以期提高山东省煤矿企 业安全生产形势, 减少事故的发生, 保障职工的生命 财产安全。 李慧敏[ 2]、 李艺昕[ 3]和王扬[ 5]等人基于主成分 75第 1 期王二鹏 姚 璐 孙学芳 等 基于主成分分析法的山东省煤矿事故原因分析* 收稿日期 2020- 07- 16 *基金项目 中央高校基本科研业务费资助( 3142020037) ; 中央高 校基本科研业务费资助( 3142020059) 作者简介 王二鹏( 1994) , 男, 山东聊城人, 华北科技学院安全工 程专业在职研究生, 现从事安全生产监管与应急管理方面的研究。 万方数据 分析法分别对 19902014 年时间段内的全国煤矿 死亡人数、 事故起数进行分析, 得到造成煤矿事故的 主要类型; 潘怀兵[ 6]将影响沥青路面使用性能的因 素作为评价指标, 基于主成分分析法得出各因素对 沥青路面使用性能的影响程度。付光辉等[ 7]通过 采集城市发展过程中的数据, 将主成分分析法运用 到评价城市发展速度方面, 并得出影响城市发展速 度的主要因素。 综上, 我国专家学者对主成分分析法的研究及 应用也不少, 其中也不乏对煤矿安全领域的研究, 但 是将主成分分析法应用到部分省份煤矿安全形势的 研究比较少, 因此通过收集山东省境内煤矿安全生 产事故数据资料, 基于 SPSS 24. 0 软件中的主成分 分析法, 得出近年来山东省境内煤矿安全生产事故 的主要类型, 并研究各类型事故之间的相互影响关 系, 以期为今后山东省煤矿行业更准确的制定防范 对策, 为减少此类型事故的发生提供参考依据。 1 主成分分析法 1. 1 主成分分析的基本思想 主成分分析法是采用降维的思想, 在力保数据 信息损失最少的原则下, 把多个指标转化为少数几 个综合指标的一种对多变量数据进行最佳综合简化 的多元统计方法[ 8]。即将高维空间杂乱无章的问 题转化为低维空间的线性组合问题, 显然问题的难 度就降低了很多。通过转化而得到的线性组合指标 称为“ 主成分” 。主成分在变差信息量中的比例越 大, 则在综合评价中的作用就越大, 该法不仅可消除 评价指标之间的相关影响, 并减少指标选择的工作 量, 而且计算过程可用数学软件进行简化, 计算过程 快捷、 结果精确。其数学模型如下 F1= μ 11X1 + μ 12X2+ + μ1mXm F2= μ 21X1 + μ 22X2+ + μ2mXm Fp= μ p1X1 + μ p2X2+ + μpmX l \ \ \ \ m ( 1) 简写为 F = μ j1X1 + μ j 2X2 + +μ j mXm, 其中 j=1, 2, , m; m≤p。 1. 2 主成分分析的基本步骤 数据的采集与标准化 首先将采集到的数据样 本构建一个数据矩阵 X= ( xij) n m, 其中 n 为观测样 本数量, m 为单个样本观测的指标变量数目。为了 统一数量级, 对收集到的样本数据运用 SPSS 24. 0 软件 进 行 标 准 化, 令 标 准 化 数 据 矩 阵 为 Z = ( zij) n m。 建立相关系数矩阵 由标准化数据矩阵 Z = ( zij) n m, 计算其相关系数矩阵 R = ( rij)n m。 计算特征值、 特征向量, 确定主成分 由特征方 程| λ p- R| = 0, 得到 m 个特征值 λP( p =1, 2, , m) 、 特征向量 Lp= Lp1, Lp2, Lpm。则主成分表达式 为 Fp= Lp1Z1+ Lp2Z2+ + LpmZm( 2) 式中, p= 1, 2, , m; F1为第 1 个主成分; F2为第 2 个主成分; ; Fm为第 m 个主成分。 主成分的累计贡献率 选取特征值 λ p >1 的 k 个指标( k < m) 作为指标变量的主成分, 主成分的累 计贡献率即为选定的主成分包含全部信息的百分 比, 累计贡献率越高越接近真实情况, 主成分的累计 贡献率可接受范围为 70% ~ 90%, 一般选取 k 个主 成分的累计贡献率下限为 85%。 对 k 个主成分进行综合评价 对选取的 k 个主 成分进行线性加权求和, 得到主成分的评价得分 F =∑ k p= 1 λ p ∑ m p= 1 λ \\ \ \ \\ p Fp( 3) 2 应用实例 2. 1 数据收集 依据国家煤矿安全监察局和山东省煤矿安全监 察局网站公示数据, 对 20082019 年山东省煤矿事 故起数进行数据收集[ 9- 10], 见表 1。 表 1 20082019 年山东省煤矿事故起数统计 Table 1 Statistics of coal mine accidents in Shandong Province from 2008 to 2019 年份 顶板 事故 瓦斯 事故 机电 事故 运输 事故 放炮 事故 水害 事故 火灾 事故 其他 事故 200820186151803 200934020002 201036134001 201167120111 2012951131000 201338402932 201432310100 201540020000 201640100001 201710010001 201820010101 201900120001 通过以上收集的资料, 选取山东省煤矿事故中 发生次数最多的 8 类事故作为评价指标变量, 即 顶 85陕 西 煤 炭 2021 年 万方数据 板事故 X1、 瓦斯事故 X2、 机电事故 X3、 运输事故 X4、 放炮事故 X5、 水害事故 X6、 火灾事故 X7及其他事故 X8, 并运用 SPSS 24. 0 软件对原始数据进行标准化 处理, 得到标准化评价指标变量 顶板事故 Z1、 瓦斯 事故 Z2、 机电事故 Z3、 运输事故 Z4、 放炮事故 Z5、 水 害事故 Z6、 火灾事故 Z7及其他事故 Z8, 见表 2。 表 2 标准化数据 Table 2 Standardized data 年份顶板事故 Z1瓦斯事故 Z2机电事故 Z3运输事故 Z4放炮事故 Z5水害事故 Z6火灾事故 Z7其他事故 Z8 20082. 858 512. 607 211. 107 073. 077 510. 270 801. 961 60- 0. 375 532. 128 83 2009- 0. 345 53- 0. 031 41- 0. 704 50- 0. 166 35- 0. 541 60- 0. 516 21- 0. 375 531. 018 14 2010- 0. 345 530. 345 53- 0. 402 570. 083 182. 708 01- 0. 516 21- 0. 375 53- 0. 092 56 20110. 219 890. 534 01- 0. 402 57- 0. 166 35- 0. 541 60- 0. 206 480. 751 07- 0. 092 56 20120. 785 300. 157 062. 616 710. 083 180. 270 80- 0. 516 21- 0. 375 53- 1. 203 25 2013- 0. 345 530. 722 480. 503 21- 0. 665 411. 083 212. 271 323. 004 271. 018 14 2014- 0. 345 53- 0. 408 360. 201 29- 0. 415 88- 0. 541 60- 0. 206 48- 0. 375 53- 1. 203 25 2015- 0. 157 06- 0. 785 30- 0. 704 50- 0. 166 35- 0. 541 60- 0. 516 21- 0. 375 53- 1. 203 25 2016- 0. 157 06- 0. 785 30- 0. 402 57- 0. 665 41- 0. 541 60- 0. 516 21- 0. 375 53- 0. 092 56 2017- 0. 722 48- 0. 785 30- 0. 704 50- 0. 415 88- 0. 541 60- 0. 516 21- 0. 375 53- 0. 092 56 2018- 0. 534 01- 0. 785 30- 0. 704 50- 0. 415 88- 0. 541 60- 0. 206 48- 0. 375 53- 0. 092 56 2019- 0. 910 95- 0. 785 30- 0. 402 57- 0. 166 35- 0. 541 60- 0. 516 21- 0. 375 53- 0. 092 56 表 3 相关系数矩阵 Table 3 Correlation coefficient matrix 顶板事故 X1瓦斯事故 X2机电事故 X3运输事故 X4放炮事故 X5水害事故 X6火灾事故 X7其他事故 X8 顶板事故 X11. 0000. 8570. 6090. 9120. 1160. 538- 0. 0840. 479 瓦斯事故 X20. 8571. 0000. 5040. 8280. 4130. 7520. 2770. 701 机电事故 X30. 6090. 5041. 0000. 4000. 2300. 3510. 113- 0. 010 运输事故 X40. 9120. 8280. 4001. 0000. 1600. 496- 0. 2210. 588 放炮事故 X5 0. 1160. 4130. 2300. 1601. 0000. 2900. 2770. 191 水害事故 X60. 5380. 7520. 3510. 4960. 2901. 0000. 6770. 698 火灾事故 X7- 0. 0840. 2770. 113- 0. 2210. 2770. 6771. 0000. 303 其他事故 X8 0. 4790. 701- 0. 0100. 5880. 1910. 6980. 3031. 000 表 4 主成分分析表 Table 4 Principal component analysis 主成分变量特征值贡献率 累计贡献率 X1X2X3X4X5X6X7X8 1 顶板 X1 4. 17752. 21352. 2130. 207- 0. 2710. 034- 0. 144- 0. 6410. 7203. 9211. 282 2 瓦斯 X2 1. 64320. 53272. 7450. 233- 0. 0140. 0010. 093- 0. 3861. 599- 2. 076- 4. 710 3 机电 X3 1. 06613. 31986. 0650. 133- 0. 1320. 657- 0. 4161. 270- 0. 270- 0. 6360. 247 4 运输 X4 0. 7849. 80095. 8640. 200- 0. 293- 0. 1540. 148- 0. 525- 0. 793- 2. 6564. 529 5 放炮 X5 0. 1732. 16898. 0320. 0930. 2160. 4370. 907- 0. 034- 0. 3090. 8240. 617 6 水害 X6 0. 1091. 36099. 3920. 1990. 269- 0. 092- 0. 271- 0. 513- 2. 0670. 585- 3. 008 7火灾 X70. 0350. 43299. 8240. 0730. 5440. 089- 0. 357- 0. 4390. 999- 0. 4784. 069 8 其他 X8 0. 0140. 176100. 0000. 1760. 129- 0. 5240. 1691. 6910. 2210. 7360. 787 2. 2 运用 SPSS 软件进行分析、 计算 基于 SPSS 24. 0 软件中的主成分分析法, 对标 准化处理后的数据进行主成分分析, 得到评价指标 的相关系数矩阵( 表 3) 以及特征值, 确定评价的主 因子数, 见表 4、 表 5。由表 4 可知, 前 3 个主成分的 特征值大于 1, 且累计贡献率为 86. 065% > 85%, 故 可以提取前 3 个主成分来表示所有指标所具有的全 部信息。 根据公式( 2) ( 3) , 可以得出相对应的主成分的 线性组合为 95第 1 期王二鹏 姚 璐 孙学芳 等 基于主成分分析法的山东省煤矿事故原因分析* 万方数据 F1= 0. 207X1+ 0. 233X2+ 0. 133X3+ 0. 200X4 + 0. 093X5+ 0. 199X6+ 0. 073X7+ 0. 176X8 F2=- 0. 271X1- 0. 014X2- 0. 132X3- 0. 293X4 + 0. 216X5+ 0. 269X6+ 0. 544X7+ 0. 129X8 F3= 0. 034X1+ 0. 001X2+ 0. 657X3- 0. 154X4 + 0. 437X5- 0. 092X6+ 0. 089X7- 0. 524X l \ \ \ \ \ \ 8 则山东省煤矿各类事故起数综合评价函数为 F = λ 1 λ 1 + λ 2+ λ3 F1+ λ 2 λ 1 + λ 2+ λ3 F2+ λ 3 λ 1 + λ 2+ λ3 F3 = 0. 61F1+ 0. 24F2+ 0. 15F3 表 5 总方差解释 Table 5 Total variance interpretation 成分 初始特征值 总计 方差 百分比 累计/ % 提取载荷平方和 总计 方差 百分比 累计/ % 14. 17752. 21352. 2134. 17752. 21352. 213 21. 64320. 53272. 7451. 64320. 53272. 745 31. 06613. 31986. 0651. 06613. 31986. 065 40. 7849. 80095. 864 50. 1732. 16898. 032 60. 1091. 36099. 392 70. 0350. 43299. 824 80. 0140. 176100. 000 根据表 4 和主成分的线性组合公式 F1、 F2、 F3 可以看出 第 1 个主成分中瓦斯事故、 顶板事故、 运 输事故和水害事故的成分得分系数的绝对值分别为 0. 233、 0. 207、 0. 200 和 0. 199, 故此 4 类事故是在第 1 个主成分中起到决定性的成分, 并且此 4 类指标 的得分系数均为正数, 呈正相关; 同理, 第 2 个主成 分中火灾事故、 运输事故和水害事故的成分得分系 数的绝对值分别为0. 544、 0. 293 和0. 269, 故此3 类 事故是在第 2 个主成分中起到决定性的成分; 在第 3 个主成分中机电事故和其他事故的成分得分系数 的绝对值分别为0. 657 和0. 524, 故此2 类事故是在 第 3 个主成分中起到决定性的成分。因 此 在 20082019 年山东省煤矿事故中瓦斯事故、 顶板事 故、 运输事故、 水害事故、 火灾事故、 机电事故和运输 事故是发生次数较多的事故类型。由于第 1 主成分 的累计贡献率为 52. 213%, 远大于第 2 主成分的贡 献率 20. 532%, 故认为第 1 主成分代表了所有统计 指标变量的全部信息, 即 20082019 年山东省煤矿 事故中发生次数较多的事故类型为瓦斯事故、 顶板 事故、 运输事故和水害事故。 3 结论 ( 1) 主成分分析法采用降维的方式, 将多种因 素之间复杂的作用关系简化为主成分之间的线性关 系, 减少各个因素之间的相互影响关系, 大大方便了 对数据进行系统处理。 ( 2) 主成分分析法仍有一定的局限性, 采用主 成分分析法对实际问题进行分析处理时, 需要大量 的数据予以支撑。采集数据时, 难免会由于采集的 难度过大等问题对分析结果造成一定的干扰。 ( 3) 通过对 20082019 年山东省煤矿事故统 计数据进行主成分分析, 可以得出近年来山东省煤 矿事故中造成发生次数较多的类型为瓦斯事故、 顶 板事故、 运输事故和水害事故, 并且 4 种事故类型之 间存在着较强的关联性, 说明引起这 4 种事故的原 因和机理相互之间具有较大的联系, 某种因素引发 一种事故的同时, 在该情形下也有可能会导致另一 种事故的发生, 因此在今后制定防范措施时, 必须要 关注并综合考虑各事故之间的联系, 尽可能减少事 故的发生。 参考文献 [ 1] 丁宝成. 煤矿安全预警模型及应用研究[ D] . 阜 新 辽宁工程技术大学, 2010. [ 2] 李慧敏, 庞奇志, 邹伟霞. 主成分分析法在煤矿事 故统计分析中的应用[ J] . 安全与环境工程, 2012, 19( 3) 77- 79, 87. [ 3] 李艺昕, 曹卫星. 基于主成分分析法的我国煤矿 事故原因统计[ J] . 山东煤炭科技, 2016, 44( 2) 168- 169, 171. [ 4] 山东煤矿安全监察局. 煤矿安全监察特刊[ EB/ OL] . [ 2020- 03- 31] http / / www. sdcoal. gov. cn/ channels/ ch00055 / . [ 5] 王扬. 基于主成分分析法的煤矿安全事故原因统 计[ J] . 工矿自动化, 2013, 39( 5) 94- 96. [ 6] 潘怀兵. 基于主成分分析法的沥青路面使用性能 评价[ J] . 重庆交通大学学报( 自然科学版) , 2010, 29( 6) 888- 890. [ 7] 付光辉, 郭宗逵. 全局主成分分析模型在城市综 合经济实力评价中的应用 以江苏省 13 个主要 城市为例[ J] . 企业科技与发展, 2008, 24( 10) 211- 213. [ 8] 汪冬华. 多元统计分析与 SPSS 应用( 第 2 版) [ M] . 上海 华东理工大学出版社, 2018. [ 9] 田兵. 主成分分析的数学模型及实际应用[ J] . 阴 山学刊( 自然科学版) , 2010, 24( 2) 18- 21. [ 10]国家煤矿安全监察局. 国家煤矿安全监察局 年 度统计分析[ EB/ OL] . http / / www. chinacoal- safe- ty. gov. cn/ mkaj/ fxtb/ mkaj_ fxytb. htm. 06陕 西 煤 炭 2021 年 万方数据