基于数据挖掘的尾矿库风险预测预警方法研究.pdf
8 8 有色金属 选矿部分2 0 1 6 年第5 期 d o i 1 0 .3 9 6 9 /j .i s s n .1 6 7 1 - 9 4 9 2 .2 0 1 6 .0 5 .0 1 9 基于数据挖掘的尾矿库风险预测预警方法研究 陈友良,李全明 中国安全生产科学研究院国家安全生产监督管理总局安全生产 重点实验室一矿山采空区灾害防冶实验室,北京1 0 0 0 1 2 摘要尾矿库作为企业安全生产过程中的一项重大危险源,其安全稳定的运行一直受到政府、企业和社会的密切关注。 总结目前尾矿库监测的现状,分析其存在不足,结合当前互联网技术和大数据发展的趋势,提出单独监测、集中管理的模式, 在收集到的大数据的基础上进行尾矿库风险预测预警分析,并以数据分类和回归分析的方法具体演示部分安全指标的分析 过程。结果表明,该方法对尾矿库安全运行风险有一定的预测预警功能,为政府部门和企业对尾矿库安全运行的监管和处置 提供重要参考数据。 关键词数据挖掘;尾矿库风险;预测预警 中图分类号T D 6 7 2 ;T D 9 2 8 .9 ;T D 9 2 8 .8文献标志码A文章编号1 6 7 l - 9 4 9 2 2 0 1 6 0 5 J D 0 8 8 J D 4 R e s e a r c ho n 砌s kP r e d i c t i o na n dE a r l yW a r n i n gM e t h o do f T a i l i n gD a m b a s e do nD a t aM i n i n g C H E NY o u l 诡n g ,I 。IQ u t n r 仇i n g ‰ ,k 6 0 m £o r yQ 厂G o 矿D 如o s £e r sP 删e m 泌n ,S £n £eA d m i n 如n o 如nQ 厂%r 南S 咖£,.,C h i n aA c 。d e w 妒S 咖沙 .s c i e ,t c e 口,以死c n o f o g y ,B e 玎打曙J O D D J 2 ,C i n o A b s t r a c t A so n eo ft h em a j o rh a z a r d o u ss o u r c e si nt h ep r o c e s so fe n t e 印r i s es 如t yp r o d u c t i o n ,t a i l i n gd a mi s aw i d e s p r e a dc o n c e mo ft h eg o v e m m e n t , e n t e 叩r i s e sa n ds o c i e t y . T h i sp a p e rs u m m a “z e st h ec u H e n ts i t u a t i o no f t a i l i n g sd a mm o n i t o r i n g ,a n a l y s e si t se x i s t i n gp r o b l e m s ,c o m b i n e dw i t ht h ec u I T e n tt r e n do fI n t e m e tt e c h n o l o g ya n d b i gd a t ad e v e l o p m e n t ,p u tf o r w a r das e p a r a t em o n i t o r i n g ,c e n t r a l i z e dm a n a g e m e n tm o d e l ,p r e d i c t sa n de a d yw a m i n g a n a l y s i s e st h er i s k o ft a i l i n gd a mb a s e do nt h ec o l l e c t e dd a t a ,t h e nt h ea n a l y s i s p r o c e s so ft h es a f b t yi n d e xi s d e m o n s t m t e db yt h em e t h o do fd a t ac l a s s i 6 c a t i o na n dr e g r e s s i o na n a l y s i s .T h er e s u l t ss h o wt h a tt h i sm e t h o dh a sa c e r t a i nf o r e c a s ta n de a r l yw a m i n gf u n c t i o nf o rt h es a f eo p e r a t i o no ft a i l i n g sd a m ,a n dp r o v i d e si m p o r t a n tr e f e r e n c e d a t af o rg o v e m m e n td e p a n m e n t sa n de n t e 印r i s e st os u p e r v i s ea n dd i s p o s eo ft h es a f eo p e r a t i o no ft a i l i n g sd a m . K e y w o r d s d a t am i n i n g ;t a i l i n gd a mr i s k ;f o r e c a s ta n de a r l yw a m i n g 尾矿库是金属矿采选项目的重要工程建设内容 之一,是一个具有高势能的泥石流危险源‘1 。2 I 。我国 目前有大小尾矿上万座,具有分布广,数量多,稳定 性差等特点旧j 。目前,很多企业已经配备在线尾矿 库安全监测系统。41 ,主要是采用自动式全站仪结合 光纤光栅传感网络,对尾矿库主要部位进行可视化 监测,监测指标包括尾矿库浸润线、坝体位移、库水 位、干滩长度、降雨量等关键安全指标,这些为企业 提供尾矿库生产运行状况的真实数据,通过报表的 形式提供尾矿库安全隐患数据,并发送预警信息给 管理人员,对企业安全管理有一定的辅助作用。但 是,随着互联网技术和大数据的发展,目前的尾矿库 在线安全监测系统存在以下不足 1 监测系统大多都是安装在本地的应用且针对 单个尾矿库,此模式不利于各级安全监督机构访问, 且企业的投资大,每个企业需要重复计算机软硬件 投资,收集数据不利于汇总以便产生用来作数据挖 掘和预测分析的行业大数据。 2 目前监测系统的预测预警主要依赖传感器收 集的动态数据并局限于数据统计分析、报表查看等 基本功能。国内有相关研究使用数据样本的方式作 数据挖掘和预测分析。数据样本对比大数据,其预 测的精度和稳健性还有较大差距。 因此,有必要针对尾矿库风险监测的数据进行 收集整理,形成统一的大数据集合,然后进行预测预 警分析,为政府监管部门提供宏观决策支持,为企业 基金项目国家自然科学基金资助 7 1 3 7 3 2 4 5 收稿日期2 0 1 5 .1 2 旬2修回日期2 0 1 6 加7 2 0 作者简介陈友良 1 9 7 7 一 ,男,湖南临湘人,硕士,高级工程师,主要从事安全生产信息化方面的工作。 万方数据 2 0 1 6 年第5 期陈友良等基于数据挖掘的尾矿库风险预测预警方法研究 8 9 提供风险预警服务。 1 数据采集方式 数据采集过程由传感器、数据采集仪、传输系统 等组成,最终汇集到软件平台。传感器用于采集尾 矿库浸润线、坝体位移、库水位、干滩长度、降雨量等 监测数据,监测设备可通过太阳能、蓄电池供电,也 可通过市电进行供电。传输系统主要通过G P R S 、北 斗卫星、交换机进行数据的传输,收集来自全国各地 的尾矿库监测数据∞J 。系统软件平台主要用于对采 集的大数据进行实时查看和接收,对监测数据进行 存储、管理、查询、统计、分析和预警,并能输出查询、 统计和分析的结果。具体的系统结构图如图l 所示。 一型一一一兰粤【- 一蔓} 竺竺‘二一 I I l 东省 i j 型竺一一兰竺兰一一 型一 福建省 一蔓旦兰一一婴竺L 一 竺竺一一 河北省 图1 尾矿库风险监测系统 F i g .1T a i l i n gd a mr i s km o n i t o r i n gs y s t e m 2 数据预处理 系统采集来自全国各地的尾矿库监测数据之 后,由于监测设备的厂家不同、数据格式不同等诸多 原因,可能产生一些不完整数据、错误数据、重复数 据,在进行大数据风险预测预警之前,需要对数据进 行预处理,形成统一、规范的数据格式M 1J 。具体的 数据预处理方式如下 1 数据清洗 数据清洗主要是除去数据中的由于传感器故 障、数据传输问题等原因出现的“噪声”,妥善解决 遗失数据问题,帮助有效减少分析过程可能出现前 后数据不一致、相互冲突的情况。 2 样本数据相关性比较 尾矿库风险监测收集数据中,许多属性与挖掘 分析的目标本身可能无关,有些属性可能冗余,这些 数据可能减缓甚至误导整个分析预测过程,因此有 必要对数据进行相关性分析,也称属性选择。 3 数据转换 数据转换是将数据表达方式转换或归并成适合 数据分析挖掘的形式。目前,通用的方式是利用概 念层次树,把数据转换成更高的层次。举例来说样 本数据属性“尾矿库等级”的值就可以转换成多个离 散的区间,诸如一级、二级、三级、四级和五级。由 于数据转换过程压缩原来数据集,因此可以很好地 降低学习过程中数据的输入、输出操作。 万方数据 9 0 有色金属 选矿部分2 0 1 6 年第5 期 3 数据分类分析 数据分类分析方法用于提取描述尾矿库基础数 据和监测数据种类的模型,或者对尾矿库风险等级 进行鉴定,具体操作过程是,在现有数据的基础上构 造一个分类模型或构建一个分类函数,该模型或函 数把数据库中相应的数据信息映射到指定类别中的 某一项记录中,从而应用于数据预测分析⋯。常用 的数据分类分析方法有神经网络分类、决策树分类、 关联规则分类、贝叶斯分类等。本文以决策树为代 表,阐述数据分类的过程。 决策树分类方法是建立在信息论的基础上,对 样本数据进行分类分析的一种方法。第一步,如图2 所示,通过对数据库中各数据行内容分析,建立一个 描述现有数据集类别或概念的模型,模型可以通过 提取数据库中各数据项的内容获得,通过分类算法, 得出分类规则。 第二步,生成决策树,决策树的建立过程也是数 据规则的生成过程,其中,树的每个内部节点表示对 一个属性或者取值的测试,其分支就是每个具体的 测试结果,树的每个叶节点代表一个具体的类别。 根据该原理,生成的决策树如图3 所示。 尾矿库名称库龄安全许可证尾矿库安全等级 河北省一A 库 5 有正常库 山东省一B 廊 1 0七病库 福建省一C 库 5 一I O 有诈常摩 ,河北省叫 麾 l O 有限常库 I 福建省E 痒 5允难常摩 | l l l 西省一F 本 5 一1 0 允痫库 卜 岔 训练数据 l ,i f 库龄 1 0 卸d 安全许可证 无。则鹾矿I 笨安全等级 绢库; 3 ⋯。 图2 学习建模 F i g .2L e a m i n gm o d e l i n g 圈 图3 决策树示意描述 F i g .3 S c h e m a t i cd e s c r i p t i o no fd e c i s i o nt r e e 第三步,根据决策树,可以生成具体的分类规 则。根据这些规则,数据分类方法把全国收集过来 的尾矿库数据处理后,得出不同安全等级的尾矿库, 然后针对不同安全等级的尾矿库,采取相应的预测 预警方法。 4 预测预警方法 数据分类方法已经把尾矿库信息按照安全等级 进行分类,预测是根据其具体的浸润线、坝体位移、 库水位等监测数据,对尾矿库的具体风险进行更加 万方数据 2 0 1 6 年第5 期陈友良等基于数据挖掘的尾矿库风险预测预警方法研究 9 1 ‘ 深入、具体的分析。对于一个连续数值的预测可以本,公式 2 计算出相应的回归系数。 利用统计回归方法所建模型来实现,主要包括线性、 ,, i 嚣。 戈i 一万 ,i 一歹 , 、 多变量和非线性回归等建模方法一J 。本文以线性回 ’ 嚣, x i 万 2 、7 归方法为例,阐述预测方法的具体过程。其中,i 为石,z ,⋯,戈。的均值;歹为y ,, ,,⋯,儿 线性回归理论上是用一条直线描述具体的数据的均值。 模型,利用自变量x 为因变量y 建立模型,具体回归监测尾矿库坝体位移、浸润线、库水位、干滩长 模型是度、降雨量等监测数据是衡量尾矿库安全运行的主 y 仅 肘 1 要技术参数,本文以尾矿库坝体位移为代表进行描 d 和口为回归模型的回归系数,分别表示因变量述。尾矿库坝体位移有侧向位移、下游向位移、垂直 y 的截距和直线的斜率。利用最小二乘法可以方便沉降三种0 I ,从历史的监测数据看,前二者监测数 获得此二回归系数的值,同时也能保证实际数据与据值极为微小,下面以山东省某尾矿库2 0 1 4 年8 月 线性回归的预测结果差距最小。指定n 个数据样起1 0 个月的平均垂直沉降的数据进行分析。 表1垂直沉降样本数据表 T a b l e1T a b l eo fv e r t i c a ls e t t l e m e n td a t a y 毫米 2 .5 22 .4 52 .4 62 .4 42 .5 02 .4 82 .4 62 .4 72 .4 92 .4 9 根据表所示数据,计算出万 5 .5 ;歹 2 .4 7 6 ,然后再利用这些值及公式得出以下结果 8 坠血二掣丝堑篓羔坐譬至型l /1 6 5 p 一 嚣。 戈。一i 2 一 姥, x 。一5 .5 2 一“~ a 2 .4 7 6 5 .5 /1 6 5 2 .4 4 3 因此,基于最小而成的回归模型就是y 2 .4 4 3 x /1 6 5 。利用这一模型,预测1 年后垂直 沉降为2 .5 2m m ,对照前面的数据,可以得知该尾矿 库坝体位移数据中,垂直沉降值小且非常稳定。同 样,根据类似的算法,可以预测浸润线、库水位、干滩 长度、降雨量的变化情况,综合这些数据,分析得出 尾矿库运行的安全状况。对于异常数据,采用手机 短信提醒、系统信息推送、邮件通知等方式进行通 知,达到预测预警的目的。 5结论 1 利用感知技术和智能装置对尾矿库运行状况 进行感知识别,通过互联网、移动通信网等网络进行 传输,这种单独监测、集中管理的思路一方面可以减 少企业对部分软硬件的投入,又方便监管部门从宏观 上了解管辖范围内尾矿库各项指标的安全运行状况。 2 数据分类方法对尾矿库的基本数据进行处 理,得出不同安全等级的尾矿库,从而对采取相应的 预测预警方法和监管措施提出建议。 3 预测预警方法能针对尾矿库安全运行的具体 指标,根据现有积累的监测数据,进行发展趋势的预 测,及时预警有风险趋势的尾矿库管理企业,并以多 种形式通知到监管部门和责任企业监管、处置相关 风险。 参考文献 [ 1 ] 柴建设,王姝,门永生.尾矿库事故案例分析与事故预 测[ M ] .北京化学工业出版社,2 0 1 0 8 0 - 9 0 . [ 2 ] 于广明,宋传旺,吴艳霞,等.国外尾矿坝安全研究新进展 及我国尾矿坝安全研究发展态势[ J ] .岩石力学与工程 学报,2 0 1 4 ,3 3 1 5 - 9 . [ 3 ] 李道明,余国平,沈楼燕,等.尾矿库于滩自动化监测预警 系统应用研究[ J ] .现代矿业,2 0 1 4 4 4 2 掣. [ 4 ] 罗志雄.安全在线监测系统在官地铁矿尾矿库的应用 [ J ] .矿业工程,2 0 1 4 ,1 2 2 5 0 5 3 . [ 5 ] 于继武,邢远秀.基于物联网技术的矿山井筒安全监测 系统设计[ J ] .金属矿山,2 0 1 5 ,4 4 7 1 0 7 1 1 0 . [ 6 ] 孙集平.我国尾矿库环境问题及对策建议[ J ] .环境科学 导刊,2 0 1 4 ,3 3 3 3 0 3 2 . [ 7 ] M A R T I NTE ,D A v I E SMP ,R I C ES .S t e w a r d s h i po f T a i l i n g sF a c i l i t i e s [ J ] .M i n i n g , M i n e r a l sa n ds u s t a i n a b l e D e v e l 叩m e n t ,2 0 0 2 ,2 0 1 - 3 7 . [ 8 ] 陈友良.城市公共安全监管对象风险调查系统研究[ J ] . 中国安全生产技术,2 0 l l 7 7 9 8 2 . [ 9 ] 卓青峰,袁文君,林建,等.福建省某尾矿库溃坝分析 [ J ] ,矿冶工程,2 0 1 1 ,3 l 2 1 6 1 9 . [ 1 0 ] 李全明,田文旗,王云海.尾矿库在线监测系统中位移数 据分析方法探讨[ J ] .中国安全生产技术,2 0 1 1 8 4 7 5 2 . 万方数据