基于粗糙集的石油开采故障诊断方法.pdf
务l lI5 化 基于粗糙集的石油开采故障诊断方法 Faul t di agnos i s m e t h od b ased on r ough set oi l expl or at i on 钟峥 Z HONG Zh e n g 中海油能源发展股份有限公司 采油技术服务分公司,天津 3 0 0 4 5 2 摘要 故障诊断是保证石油开采正常运作的关键。利用计算机准确的监控与故障诊断,能够让生产 管理者可以及时发现油井或泵的故障,并且立即采取正确的措施。本文以有杆泵抽油过程为 例 ,给出了基于粗糙集理论的抽油故障诊断方案,将反映系统状态的数据建构决策表,对五 种典型的故障类别进行识别,结果显示了方法的有效性。 关键词 石油开采;故障诊断;模式识别;粗糙集 中图分类号T P 2 7 7 文献标识码A 文章编号 1 0 0 9 -0 1 3 4 2 0 1 2 4 下 一0 0 5 6 0 3 Doi 1 0. 3 9 6 9 / J . i s s n. 1 0 0 9 -0 1 3 4 . 2 0 1 2. 4 下 . 1 6 0 引言 石油开 采是一个包括 了石油勘探 、钻井、采 油和原油加工 等诸 多环节的复杂过程。任何一个 环节中设备 的故障都可能引发严重 的事故 ,如果 发生事故将会带来严重的经济损失。如何将石油 开采过程 中设 备的故障降到最低,让整个运作系 统能够顺利的进行,是一个相当重要 的课题。石 油开采中设备故障的原因有可能是因为设备所处 的工作环境 恶劣或机器本身的特性 以及性能状况 出现 不 良的情 形。例 如,在 有杆泵抽 油过程 中, 设备可能会在运作的过程 中,产生许多复杂问题 , 如油管漏失、泵磨损和卡泵等故障。这些复杂的 故障原因需要借助 于一些专业的经验知识进行诊 断 ,但是这种人工判别的方式具有一定的局限性。 如果能应用一 些新 的模式识别技术来帮助人们判 断故障的种类,以实现更加快速与精确 的故障诊 断 ,这将是探索石油开采过程 中故障诊断的一大 突破 ⋯ 。 1 有杆泵抽油故障分析 有杆泵抽油是世界上 石油开采 中一种主要的 采油方法 ,在 整个石油开采的过程中,有杆泵抽 油 的费用就 占到 了生产总成本的 8 0 % 以上 ,因此 有杆 泵抽油 的安全生产是非 常重要的一个 环节。 图 1 给 出了有杆泵抽油装置 的示意 图,其 中 1为 只能向上打开的吸入凡尔 固定凡尔 , 2为深井泵 的泵筒,3为活塞 ,4为只能向上打开的排出凡尔 游动凡尔 ,5 为掏油杆柱。 有杆泵抽油的过程中, 用油管 6把 2下 到井 内液面以下 ,利用抽油杆柱 来带动深井泵 的活塞实现抽油。存有杆泵 抽油过 程 中,设 备可能会在运作的过程 中,产生许 多复 杂问题 ,如油管漏失、泵磨损和卡泵 等故障。本 文将故障的类型分为如下 5种 卡泵 、固定凡尔 卡死、泵 筒弯曲、泵严重磨损、抽油杆断脱。为 了监测有杆泵抽油的这些故障类型,需要能够反 映状态的如下数据 1 有杆泵抽油监测周期性载荷一位移变化数 据 示功 图 ; 2 有 杆 泵 抽 油 机 的 电压 、电流 、功 率和功率因数等; 3 有 杆 泵 抽 油 监测冲程 、冲次、电 流平衡度 、采油时 间 和采油时率等; 4 有 杆 泵 抽 油 监测最小载荷与最大 载荷。 在近几年里 ,人 们为了提高各种系统 中 故 障 诊 断 的准 确 率,已经用各种人工 智能的方法着手实现 故障 诊断 ,例 如 有专 家 系统、可拓理 论 、 人工神经网络、支持 向 量 机 、遗 传 算 法 图1 有杆泵抽油装置 收稿 日期 2 0 1 2 0 3 0 l 作者简介钟峥 1 9 7 0 一,男,广东汕头人,高级 l 程师,本科 ,研究方向为企业管理、人力资源管理和工程管理。 [ 5 6 1 第3 4 卷第4 期2 0 1 2 4 下 学兔兔 w w w .x u e t u t u .c o m 、 l lI5 似 等 。粗糙集理论是一种 可以用来处理不 完备性 、 不确定性 、有模糊性 以及不准确性 问题的数学工 具 ,它可 以实现对不准确和不完整数据的有效分 析 】 。本文以有杆泵抽油过程为例,给 出了基于 粗糙集理 论的故障诊 断方 法。 论文介绍 了粗糙集 理论 的基本概念 与原理 ,首先将各个传感器所收 集到 的数据建构成一个决 策表,并对决策表 中的 属性 和故障类别进行 分析 ,接着采用约简算法将 决策表 中的属性进行约 简。因为粗糙集理论主要 是用来处理不确定性 的数据 ,所以必须将隐藏于 经验数 据中且对决策 有关 的规则列 表,以求 出最 小 决策规则 ,这些决策规则是主要是 由数据数据 库 中经过 消除 多余或无用 的数据后所获取 的。在 此基础上 ,引入粗糙集理论以便能从完备讯息中 找 出正确 的诊断结果 ,从不完备的讯息 中得出满 意 的诊 断结果 ,提高故障识别率 ,以达 到 良好的 准确率 。 2 粗糙集 由波 兰学 者 Z . P a wl a k于 1 9 8 2年 初所 发 表 的 报告为粗糙集理论 r o u g h s e t t h e o r y , R S T ,是一种 可 以用来处理不 完备性 、不确定性、有模 糊性 以 及不准确性 问题 的数学工具 ,它可以在一个拥有 不完整 、有缺陷数 据的知识库里,得知数据 与数 据彼此之 间所有的关联性 ,并从 中取 出有用的知 识 ,通过知识约简找 出问题的所在 ,并且加 以分 类产生规则。用粗 糙集理论 和其 它能处理 不确 定 性问题的方法 比较,最大差别在于粗糙 集理论可 以不需要依靠数据之外的任何附加讯息 ,也能 有 效地分析和处理不准确以及不完整等有缺陷的数 据 1 3 5 1 o以粗糙 集理论为基础 ,可以针对所要研究 的对象集与属性集定义一个知识表示系统 KS 。 定义 1 让 KS U, Q, V , f 为 一 个 知 识 表 示 系 统 k n o wl e d g e e x p r e s s i o n s y s t e m ,亦可称为讯息系统 i n f o r ma t i o n s y s t e m ,其 中 U为研究对象的非空有 限 集合,可表示为 U { r , r 2 , r 3 , ⋯, r n ,也可称之 为论 域 u n i v e r s e ; Q { t l , t 2 , t 3 , ⋯, t m 为属性 的非 空 有限 集合 ,Q C UD; C为 条件 属性,D为 决策 属性 ; V是属性值 的集合,V UV ,t ∈Q,V 是属 性 t 的值域 ; .厂 为 讯 息 函数 ,.厂 UQ V,V , EQ, V, ∈U, .厂 r , t EV ,是对象集合 中的每个属性值所 给的讯息函数。 定 义 2 在属性 ZCQ的每个集合 ,难以辨识的 I n d Z 可以 由下列方式定义 设 z是 U上 的一个等价关 系,l n d Z 的等 价 类 e q u i v a l e n c e c l a s s 为 z中 的 基本集合 e l e me n t a r y s e t ,若 z r 。 Z r j ,则两个 对象 和 r i 都是属于属性 z的集合是难以辨识的, 关于 I n d Z 之 r i 的等价类 。在 U上的难以辨识的 关系 i n d i s c e r n i b l e r e l a t i o n 定义为 I { r , ∈Y YI f r , f h , f , V ∈ z} 1 定义 3 若 要将 资 料进 行 分析 以及 判断 ,可 以藉 由 以下三种 基 本概 念 来探讨 ,第一 种为 上界 近似 集 u p p e r a p p r o x i ma t i o n ,亦 可 表 示 为 R 中 的正 域 ,可记作 P O S s ;第二种为下界近似集 1 o w e r a p p r o x i ma t i o n ,亦 可表示为 R中的负域 ,可记作 E N G z R ;第三种为边界 b o u n d a r y 域 ,以上三种 可以如图 2所示 。 正域 图2 粗糙 集理论概念 图 让 KS U, Q, V’ .厂 ,K U,k EU,集合 R的 上界近似集表示为 ,是与 R有非空交集 a n o n e mp t y i n t e r s e c t i o n wi t h R 之基本 集合 的联集 ,其 一 般表示方式为 Z R { ∈ u It ] z 、 I ≠ } 2 在 z Q, Z≠ 内R的下界近似集表示为z R , 其定义表示是所 有包含于 Z中的基本集合的联集 u n i o n ,集合 R的下 界近似 集 是对象 r i 的集 合, 其属于包含于 R内的基本集合,其一般的表示方 式 为 ZR r∈ [ ] z } 3 在 u的范 围里除 了包含上界近似集与下界近 似集 ,还包含 了边界域 ,其一般表示方式为 Z N R 一 4 第3 4 卷第4 期2 0 1 2 - 4 下 1 5 7 1 学兔兔 w w w .x u e t u t u .c o m I 生 匐 似 如 果 Z RZ R, 则 集 合 R是 可 以 定 义 d e fi n a b l e 的 ,否则集合 R在 u中是无法 定义的 u n d e fi n a b l e ,下列有 四种无 法定义 的集合 类型, 表示方法如下 1 若 ≠ 且Z R≠U 则 称 z在 u中 是 粗 糙 模 糊 定 义 的 r o u g h l y d e fi n a b l e 2 若 ≠ 且Z RU 则称 Z在 U中是表面上无法定义的 e x t e r n a l l y u n d e fi n a b l e 3 若 且Z R≠U 则称 Z在 u中是 内部 无法 定义 的 i n t e r n a l l y u n d e fi n a b l e 4 若垫 且Z RU 则 称 z在 U 中 是 完 全 无 法 定 义 的 t o t a l l y u n d e fi n a b l e 定义 4 要使用粗糙集理论必须要有核心 c o r e 与约简 r e d u c t 的基本概念,所有不可或缺的属性集合可 以称之为核心,是属于约简的部分 ,可表示为 c o r eZn Z 5 约简的定义则是能辨识一个知识表 示系统 的 所有对象 ,并透过约简集去辨识讯 息的最小 属性 集并将 属性化简。在粗糙集理论 中,决策表是通 过特定对象的基本属性和属性值来叙述的 ,可 以 用条件属性 C 来表示规则的条件 ,决策属性 D 表示规则 的结论。然而,并非每个条件属性都是 被 需要的,有可能会出现 多余 的现象 ,所以可以 去除 多余 的属性 ,让原本 是非常复 杂的决策 表, 通 过数 据约简,得到最小条件的属性决策表 ,以 达到最高的准确率。其主要约简的步骤如下 1 首先要将数据预处理,根据原始数据结合 属性做整合。 2 求取条件属性相 对于决策属性 的属性核, 并将条件属性进行最小约简。 3 根据属性核删除多余以及重复的条件属性。 4 最后将删除完多余属性的决策表 中,总结 出分类规则。 3 基于粗糙集的有杆泵抽油故障分析 本论文 以实际测量出来的故障案例样本数据 , 来进行 故障结果的诊 断。首先我们建立 一组 3 0 0 I 5 8 1 第3 4 卷第4 期2 0 1 2 4 下 笔的训 练数据进行故障诊断决策规则的推论,其 中每个数 据含有如下的几组属性 监测周期性载 荷一位移变化数据 示功图 、监测电压、监测电 流、监测功率和功率 因数 、监测冲程 、冲次、电 流平衡度、采油时 间、采油时率、最小载荷 与最 大载荷。有六种故障诊断的决策属性 ,决策属性 分别以 D { D1 , D2 , D3 , D 4 , D5 }来表示。将每一笔 数据含有的输入属性 ,将各个输入属性利用粗糙 集理论来进行离散化,分别表示属性 的断点。可 由离散段点产生数据离散化后的决策表,2 0 0组测 试数据的诊断准确率如图 3所示。由图中结果可 以看出五类故障的诊断结果均非常精确 ,有的 故障类型甚至达到了 1 0 0 % 的正确率。 l 0 0% 9 0 % 8 0 % 7 O % 姗6 0 % 舞 5 0 % 罄 4 0 % 3 0 % 2 0 % 1 0 % 0 % 故障类型 图3 五种故障的诊断准确率 4 结束语 本文 以有杆泵抽油过程为例,给 出了基于粗 糙集理论的抽油故障诊 断方案 ,将 反映 系统状态 的数据建构决策表 ,对五种典型的故 障类别进行 识别,结果显示了方法的有效性。 参考文献 I 1 1韩国庆, 吴晓东, 张庆生. 泵示功图识别技术在有杆泵王 况诊 断中的应用【 J 】 . 石油钻采工艺, 2 0 0 3 , 2 5 5 7 0 7 4 . [ 2 】赵树 阳, 刘道信 . 有秆抽油泵使 翔与研究现状 以及发震 展望 . 设计 与制造 , 2 0 0 3 ,6 1 4 9 5 0 . 【 3 ]吴云. 基于粗糙集的不完备信息系统知识约简的研究 【 D】 . 中山大 学, 2 0 1 0 . 【 4 】苗夺谦, 李道国. 粗糙集理论、算法与应用 第一版 【 M J . 北京 清华大学 出版社, 2 0 0 8 . [ 5 】王国胤, 于洪, 杨大春. 基于条件信息熵的决策表约简 【 J ] . 计算机学报, 2 0 0 2 , 2 5 7 7 5 9 7 6 6 . 学兔兔 w w w .x u e t u t u .c o m