长输天然气管道的海量音波数据挖掘方法研究.pdf
石 油机械 C H I N A P E T R O L E U M M A C H I N E R Y 2 0 1 2年第 4 o卷第 1 期 ●专题研究 长输天然气管道的海量音波数据挖掘方法研究 梁 伟 张来斌 郭存杰 I .中国石油大学 北京机械与储运工程学院2 .中石油北京天然气管道有限公司 摘要长输天然气管道的音波检测技术受高采样频率影响,多通道音波时间序列为海量数据, 如何快速有效进行数据挖掘是面临的一大难题。为此 ,对 系统产生的海量音波数据进行 了数据挖 掘方法研 究。介绍 了基于 自底 向上法的分段线性表 示的原理 ,利用该方法对音波序列进行数据分 割,突出信号拐点信息,同源聚类,减小 了由自定义长度分 割带来 的统计误差,实现 了不同信号 源数据的有效分割。同时,运用 分裂基算 法取 代基 2 F F T对 音波序 列进行 快速频率 抽取,与基 2 F F T相比,分裂基算法在保持频谱 图信息完整性的同时,减少 了约3 3 % 的实数乘法计算量,提高 了系统分析速度。试验结果证 明了这 2种方法的有效性和实用性。 关键词 天然气管道 音波 数据挖掘 分段线性表示 分裂基 中图分类号T E 9 7 3 . 6 文献标识码 A 文章编号 1 0 0 1 4 5 7 8 2 0 1 2 0 l一 0 0 0 4 0 5 0 引 言 大 口径天然气管道在长期运行中,受 自然老化 以及第三方 破坏 机 械损 伤、地震 等 的影 响 , 可能会发生破裂 、穿孔和泄漏等事故 ,导致高压天 然气在短时间内大量外泄并迅速扩散 ,造成爆炸和 大范围火灾 ,特别是 当事故发生在人 口稠密、经济 发达地 区时,后果更为严重 _ 】 。因此 ,需 要开展 大口径天然气管道泄漏检测技术。泄漏发生时将产 生连续音波信号,通过实时获取该信号,进行分析 处理即可进行泄漏检测与定位 。受高采样频率影 响 ,多通道音波时间序列为海量数据 ,如何快速有 效地进行数据挖掘是面临的一大难题。滤波降噪作 为有效方式能够去除大量噪声 ,但数据长度的自定 义分割不利于相似特征的聚类统一。在 自定义数据 长度过程 中,容易造成 “ 多数” 吃 “ 少数”,使得 突变拐点 遗 失 以及少 数不 同类数 据 “ 淹 没 ” 的 问题。 因此,需要对音波数据进行自适应分割方法研 究,将相似数据部分进行聚类分析。此外,在对序 列特征信号进行频谱分析时,常用基 2 F P F 算法, 为了进一步提高数据分析速度 ,笔者选用基于分裂 基的 F F T算法对音波数 据进行快速分 析,以减少 F F T计算量 ,提高分析速度 。 1 音波检测技术原理 大 口径天然气管道发生开裂时 ,管道内外的巨 大压差使天然气快速喷出而形成泄漏 ,并造成系统 流体弹性能量的释放,引起瞬间音波振荡,产生音 波信号。该信号属于连续声发射信号,并以管内介 质为载体向上下游传播 ,最终被安装在上下游的音 波传感器检测到 ,然后通过一系列数字信号处理装 置进行数据分析。根据上下游传感器接收到音波信 号 的时间差以及音波在管内介质中的传播速度就可 以计算出泄漏位置 J 。其原理示意图如图 1所示。 图 1中,A、B为音波传感器 ,冗余安装 ,保 证在其中一个损坏的情况下 不影响数据 的监测 。, J 为上 、下游站点间距离 ,k m; 为泄漏点到上游站 点的距离,k m;t 和 £ 为上下游传感器各自检测 到音波信号的时刻,则 t . 一 t 为两者之间的时间 差,记为 A t ,S ; 为音波在管内天然气中的传播 速度 ,m/ s 。漏点定位公式为 基金项目国家 自 然科学基金项目 “ 油气储运 ‘ 设备链’瞬态过程的耦变规律及其故障的自组织诊断方法” 5 1 0 0 5 2 4 7 ;国家 8 6 3 计划项目 t t 基于双扭环机制的输油管线泄漏诊断的新装置与方法研究” 2 0 0 8 A A 0 6 Z 2 0 9 ;北京市科技新星计划项 目 “ 油气生命线关键设 备耦变故障的自组织诊断方法” 2 0 1 0 B 0 6 8 和北京市教委共建项目 “ 天然气主管线泄漏检测系统研究” 。 石 油机械 2 0 1 2年第4 0卷第 1 期 或混合 基算 法 ,是 1 9 8 4年 由 D u h a me l P以及 H o l t - m a n n H等人 提出的。分裂基算法同时使用基 2 F F T和基4 F F T算法,其理论思想为对偶序号数据 输出使用基 2 F F T算法,对奇序号数据输出使用基 4 F F T算法。在 目前 已知 的所有针对 N2 M 为 正整数 的算法 中,分裂基算法具有最少 的实数 乘法次数和实数加法次数 ,同时还具有和 C o o l e y T u k e y 提出的F F T 算法一样的结构,算法合理,速 度快 ,因此被认 为是 目前对 .7v等于 2的整数次幂 各类算法中最为理想的一种 。同时,后续的研 究结果也证明了分裂基算法最接近理论上所需乘法 次数的最小值 。 对 N 2 点 的时间序列 n ,其 D F T变换 对为 r |j} ∑ n e - 12 / N l n O 1. n te a .j} 。 ,1 , ⋯ ,』、r 一 1 4 式 4 的 D I F偶序号输出项利用基 2 F F T为 x 2 0 n ] % r ∑ I n n 譬 I% n l 、 厶 l rO, 1 , ⋯ , N 1 5 奇序号输出项利用基4 F F F 为 4r 1 N /4- { 【 c n , 一 n 】 一 十 孚 一 n ] } r0 , 1 , ⋯, N / 41 6 c4 r 3 N /4- { [ c n , 一 n 譬 ] 孚 一 n 】 } r0 , 1 , ⋯, N / 41 7 基2 F F T 、基 4 F F T以及分裂基算法的实数乘法 计算量 R m c 实数加法计算量 R 分别如下。 基 2 F F Y f R M c Ⅳ 2 l o g z Ⅳ一 7 2 8 【 们 3 Ⅳ 1 o g 2 N一1 4 基 4 F ’ F r 『 R 。 g 2 N一 5 N 8 J ‘ 9 %Ⅳ 一 分裂基 o g 2 Ⅳ 一 小1 l g 2 N 2 6 g Ⅳ一 1 l g 2 N 2 2 1 0 若 N1 0 2 4,则分裂基算法 所需 实数乘法 运 算次数 为 9 3 3 6次,较基 2 F F T的 1 3 3 2 4次 和基 4 F F F的 1 0 2 4 8次分别 减少 了 3 9 8 8次和 9 1 2次, 降幅分别为 2 9 . 9 %和 8 . 9 %。 表 1 为不 同 Ⅳ值情况下 ,基 2 、基 4和分裂基 基 2 / 4 算法所需的实数乘法与实数加法的次数。 从表可以看出,当 N6 4时,分裂基算法所需的实 数乘次数约为基 2算法的%。除此之外 ,分裂基所 需实数加法运算量较基 2算法的比例,从 1 6点的 9 7 . 3 %到 4 0 9 6点 的 9 2 . 2 % ,呈现逐渐减少趋势, 因此说明了分裂基算法从实数乘法和实数加法 2方 面运算量都具有明显的优势 ,速度快、耗时少 ,而 且 当 Ⅳ取值越大时 ,分裂基算法效果越明显。 表 1 基 2 、基 4及分裂基算法所需运算次数 3 数据测试 3 . 1 数据分割 利用 Ma t l a b模拟一段长为 2 0 0 0点数据 , r a n d 1 , 2 0 0 0 ,通过适当分块平移,形成如图3 所示分段明显的模拟信号,用于测试 P L R 。 采用 自 底向上分割算法进行数据分割,分割数 分别取为 6和 l 1 。分割后的图形分别如图 4和 图 5 中直线所示。从图中可以看出,自底 向上分割法能 有效检测信号突变点,使得分割后各段数据具有同 源属性。同时还能看出,分割段数越大 本例为 1 1 时,划分越精确, 越能刻画信号的突变信息。 2 0 1 2年 第4 0卷第 1期 梁伟等长输天然气管道的海量音波数据挖掘方法研究 图 4和图 5说 明了 自底 向上分割法的有效性。 利用 P L R对现场音波序列进行分割计算 ,图 6为 音波原始序列,图7为自定义等长分割与自底向上 法分割的效果对比。 [ 点数 图 4 自底 向上线性分割 分割段数 6 6 [ z} 0l i 一 , } I lIiI I ; 一 1 . . . 图 5 自底 向上 线性 分割 分割段 数 1 1 0 . 1 0 0 . 0 5 g 0 。 。 。 馨 一 0 . 0 5 0 . 1 O 0 5 0 0 1 0 0 0 1 5 0 0 20 0 0 2 5 0 0 3 0 0 0 3 5 0 0 4 0 0 0 点数 图 6音 波 原 始 信 号 图 从 图 7可 以看 出,自定义等长分割虽然简单 , 但容易造成不同源信号归并为一段,使得计算特征 值时存 在较 大误 差。而 自底 向上线 性分 割法 P L R 能按照实际音波信号源特点进行分割、合 并归类,从整体上能将同源音波信号分为一段,从 表现形式上看是将信号进行不等长分割,每段信号 属于同类,因此特征计算时能够有效控制误差, 有 利于聚类、识别等数据分析。 0 . 1 0 乏O . 0 5 一 0 . 1 0 g j 磐 馨 一 1 0 0 5 O O 0 5 10 点数 a . 自定 义 数据 长 度 血 .JlIL L 。 I lI I 』 ll J J I 』 I I1I. 。 11『 ” 笫 1段 l 0 5 0 0 1 0 0 0 1 5 0 0 20 0 0 2 5 0 0 30 0 0 3 5 0 0 40 0 0 点 数 b . PLR 图 7 自定义等长分割和 自底 向上分割对 比 分割段数 4 3 . 2 快速频率抽取 试验过程中,采样时间为 1 0 m i n ,信号采集后 进行降噪处理,并且利用 自 底向上分割法对其进行 线性分割。由于数据众多 ,分 别选取其 中的 5 1 2 、 1 0 2 4、 2 0 48、 4 0 9 6、 8 1 9 2、 1 6 3 8 4、 3 2 76 8、 6 5 5 3 6 、1 3 1 0 7 2和 5 2 4 2 8 8点 各段点数均为 2的 M 次方共计 1 0组数据进行频谱分析测试 ,测试 目的包括计算时间和计算次数,测试结果见表2 。 表 2 基 2 F F T与分裂基算法耗时比较 从表 可见 ,当分析 数据量较小 时,耗 时都很 少 ,从感觉上难以察觉 ,但随着数据量的增加 ,分 裂基算法较基 2 F F T算法的耗时差逐渐增大,感觉 明显 。尤其是当多通道海量数据 同时处理时,系统 反应速度将能直观表现出来。同时,从实乘次数和 耗时可以看出, 分裂基算法较基2 F 订算法能减少 大约3 3 %的实乘计算量,并相应缩短了运行时间。 图 8为基 于分裂基算法 的频谱 图以及与基 2 F F r 的频谱图对比。从图可见,两者的频谱图一 样,即利用分裂基进行快速频率抽取,在提高分析 速度的同时,并没有使信息丢失,效果较好。 一 8一 石 油机械 2 0 1 2年第4 0卷第 1 期 2 0 1 6 1 2 墨s 4 0 2 O 1 6 .E E l 2 墨s 4 O 频 率/ Hz a . 基2 FF T 频率 / Hz b . 分裂基 图 8 分裂基 与基 2 F F T效果比较 4 结束语 海量音波数据 的快速准确分析是反映系统灵敏 度的一个重要依据 ,因此 ,合理的数据挖掘技术 的 应用显得尤为重要。通常情况下 ,人为 自定义数据 分割将会带来加大的统计误差,同时普通的频率抽 取方法也不利于频谱分析速度的提高。笔者利用基 于 自底向上分割法的分段线性表示对音波序列进行 同源属I生 数据分割,有利于特征计算、聚类分析以 及识别研究等深层次分析研究。同时,利用分裂基 算法取代常规的基 2 F F T也能大幅提高数据频谱分 析速度。 [ 2 ] 参考文献 邢志祥 .天然气 长输 管道 的定量风 险评价方法 [ J ]. 石油机械,2 0 0 8 ,3 6 4 1 51 7 ,5 4 . L o t h J , Mo r r i s G J .P a l me r G M. Te c h n o l o g y a s s e s s 一 [ 3 ] [ 4 ] [ 5 ] [ 6 ] [ 7 ] [ 8 ] [ 9 ] me n t o f o n~l i n e a c o u s t i c mo n i t o ri n g f o r l e a k s / i n f ri n g e r - me n t s i n u n d e r g r o u n d n a t u r al g a s t r a n s mi s s i o n l i n e s [ D]. U S AWe s t V i r g i n i a U n i v e r s i t y 。2 0 0 3 . Ke o g h E, C h a k r a b a r t i k , P a z z a n i M. L o c a ll y a d a p t i v e d i me n s i o n a l i t y r e d u c t i o n for i n d e x i n g l a r g e t i me s e ri e s d a t a b a s e s[ J J. A C M T r a n s a c t i o n s o n D a t a b a s e S y s t e ms . 2 0 0 2 2 7 2 1 8 8 2 2 8 . Ke o g h E, C h u S , Ha r t D, e t a 1 . An o n l i n e a l g o r i t h m for s e g m e n t i n g t i m e s e ri e s[ C ]ff P r o c e e d i n g s o f I E E E I n t e r n a t i o n a l C o nfe r e n c e o n Da t a Mi n i n g . L o s Al a mi t o s I E EE C o mp u t e r S o c i e t y P r e s s ,2 0 0 12 8 9 2 9 6 . K e o g h E, P a z z a n i M. R e l e v a n c e f e e d b a c k r e t r i e v a l o f t i me s e ri e s d a t a[ C]∥P r o c e e d i n g s o f t h e 2 2 t h A n n u al I n t e rna t i o n a l ACM S I G I R Co nfe r e n c e o n Re s e a r c h a n d De v e l o p me n t i n I nfo r ma t i o n Re t rie v a 1 . Ne w Yo r k AC M P r e s s , 1 9 9 9 1 8 31 9 0 . 胡广书.数字信号处理 一理论、算法与实现[ M]. 2 版 .北京清华大学出版社 ,2 0 0 3 . D u h a me l P. Ho l t ma n n H. S p l i t r a d i x F F T a l g o r i t h m [ J ]. E l e c t r o n i c s L e t t e r s ,1 9 8 4 ,2 0 1 1 4一l 6 . Du h a me l P . Al g o ri t h ms me e t i n g t h e l o w e r b o u n d s o n t h e mu h i p l i c a t i v e c o mp l e x i t y o f l e n g t h 一2 “D F T s a n d t h e i r c o n n e c t i o n w i t h p r a c t i c a l alg o r i t h m [J] . I E E E T r a n s . o n A S s P ,1 9 9 0 ,3 8 9 1 5 0 41 5 1 1 . He i d e ma n M T . Mu l t i p l i c a t i v e c o mp l e x i t y, c o n v o l u t i o n, a n d t h e D F T [ M]. N e w Y o r k S p ri n g e r V e r l a g N e w Yo r k l n e , 1 9 8 8 . 第一作者简介梁伟,副教授,生于 1 9 7 8年,2 0 0 5 年毕业于中国石油大学 北京 ,主要研究方向为设备安 全监测与故障诊断。地址 1 0 2 2 4 9 北京市 昌平区。E ma i l 1 w e i mm y a h o o . c o m. c n 。 收稿 日期 2 0 1 1 0 51 1 本文编辑刘峰 . . 信息广角 我国首次出国的海洋平台钻井系统发运出厂 2 0 1 1年 1 1 月 2 6日,宝鸡石油机械有限责任公司 以下简称宝石机械公司出口韩国的海洋平台钻井系统最后一批产 品发运出厂。这标志着我国首次出口的海洋平台钻井系统项目基本实施完毕。 此次发运出厂的海洋平台钻井系统是宝石机械公司为韩国大字造船海工株式会社设计生产的。这套海洋平台钻井系统 是包括提升系统、 循环系统和动力系统等在 内的甲板以上全套海洋平台钻井系统装备。该项 目合同签订于 2 0 1 0年 8月 5 日,是宝石机械公司的重点项 目。为确保项 目 有效执行 , 宝石机械公司专门成立大宇造船钻机项 目 部 , 并加强项 目组织和 沟通协调。面对交货期紧、 设计图纸频繁升版以及客户需求不断变化等压力,公司各相关单位和部门打破常规 , 采用分系 统异地调试和分阶段调试等有效措施,创造性地开展工作,保证了这套海洋装备系统的如期产出。从 2 0 1 1 年 7月2 6日 起, 这批海洋钻井系统陆续开始发货 , 公司分批派出服务人员出国进行平台安装试验。 该项目是我国第 1 次将海洋钻井系统打入国际市场。它的成功运作 ,为宝石机械公司积累了大项 目管理经验,对增强 该公司的国际市场竞争力,加快向世界海洋石油装备主流市场进军步伐具有重要意义。 孕晓斌