油气识别的模糊聚类与遗传神经网络技术.pdf
2 0 1 4年 4月 第 3 3卷第 2期 大庆石油地质与开发 Pe t r o l e u m Ge o l o g y a n d Oi l f i e l d De v e l o p me nt i n Da qi n g Ap r ., 2 01 4 V0 】 . 3 3 No . 2 DOI 1 0 . 3 9 6 9 / J . I S S N. 1 0 0 0 . 3 7 5 4 . 2 0 1 4 . 0 2 . 0 0 7 油气识别的模糊聚类与遗传神经 网络技术 李铁军 贺 建 凌立苏 王国斌 李雪彬 1 .西南石油 大学理学 院,四川 成都6 1 0 5 0 0 ;2 .新疆油 田公司勘探公 司 ,新疆 克拉玛依8 3 4 0 0 0 摘要为了解决遗传 B P神经网络在储层油气识别中存在的问题,采用改进的遗传算法优化了 R B F网络的连接 权值及结构 ,不仅解决了神经网络易陷入局部最优的问题,而且提高了网络的泛化性能。针对储层性质差别大 会影响油气识别精度的问题,给出基于马氏距离的模糊聚类方法,对原样本空间按储层性质聚类得到了新 的样 本空间,并以常规测井和录井资料作为网络的输入参数进行了油气识别。通过样本的聚类处理,提高了遗传神 经网络映射的精度。 关键词 模糊聚类;遗传算法 ;R B F神经网络;目标函数;油气识别 中图分类号T E l 2 1 文献标识码A 文章编号1 0 0 0 3 7 5 4 2 0 1 4 0 2 0 0 3 1 0 4 I DENTI F I CATI oN oF T HE oI L AND GAS BAS ED oN FUZZY CLUS TER. I NG A ND GE NE T I C- NE URAL NE T WORK T EC HNI QUES L I T i e j u n ,H E J i a n ,L I N G L i s u ,WA N G G u o b i n ,L I X u e b i n 。 1 . C o l l e g e o ft h e S c i e n c e s ,S o u t h w e s t P e t r o l e u m U n i v e r s i t y ,C h e n g d u 6 1 0 5 0 0, C h i n a ;2 . E x p l o r a t i o n C o m p a n y ofX i n j i a n g O i lfie l d C o m p a n y , K a r a m a y 8 3 4 0 0, C h i n a Ab s t r a c t I n o r d e r t o s o l v e t h e p r o b l e m i n t h e i d e n t i fi c a t i o n o f t h e o i l a n d g a s r e s e r v o i r s ,t h e i mp r o v e d g e n e t i c a l g o r i t h m i s a d o pt e d t o o p t i mi z e t h e c o n n e c t i o n p o we r a n d s t r uc t u r e,t h u s t he pr o b l e m o f t h e p a r t i a l l y o p t i mi z e d n e u - t r a l n e t wo r k c a n b e r e s l o v e d,a n d mo r e o v e r t h e g e n e r a l i z e d c a p a b i l i t y o f t h e n e t wo r k h a s b e e n e n h a n c e d. I n t h e l i g h t o f t h e p r o b l e m o f i n fl u e n c i n g t h e i d e n t i fi c a t i o n r e s u l t e d f r o m t h e s h a r p c o n t r a s t a mo n g t h e r e s e r v o i r p r o p e r t i e s , o n t h e b a s i s o f Ma r k o v Di s t a n c e ,t h e f u z z y c l u s t e ri n g me t h o d i s p r e s e n t e d,a n d t h e n t h e n e w s a mp l e s p a c e i s o b - t a i n e d b y t h e c l u s t e rin g o f t h e o r i g i n a l s a mp l e s p a c e b y me a n s o f t h e r e s e rvo i r p r o p e r t i e s .At t h e s a me t i me, t a k i n g t h e c o n v e n t i o n a l we l l l o g g i n g a n d mu d l o g g i n g d a t a a s t h e i n p u t p a r a me t e r s o f t he n e t wo r k,t h e o i l a n d g a s i d e n t i f i c a t i o n i s c o n d u c t e d .Wi t h t h e h e l p o f t h e s a mp l e c l u s t e rin g p r o c e s s ,t h e r e fl e c t i n g p r e c i s i o n o f t h e g e n e t i c - n e u t r a l ne t wo r k i S e n ha nc e d . K e y w o r d s F u z z y c l u s t e ri n g ; g e n e t i c a l g o ri t h m;R B F n e u r a l n e t w o r k ; o b j e c t i v e f u n c t i o n; o i l a n d g a s i d e n t i f i c a t i o n 近年来 ,采用多参数判别油水层的方法有灰色 理论分析法 、数理统计法、模糊聚类法、神经 网络 法 、微差分析法及多组 、逐步判别法等 ,尤其是基 于人工神经 网络预测 、评 价储层 的研究 较多 。 收稿 日期 2 0 1 3 0 7 . 2 2 改回 日期 2 0 1 3 1 0 . 3 1 作者简介李铁军 ,男 ,1 9 6 4年生 ,教授 ,从事油气层增产技术研究与教学工作。 E m a i l l f j s w p u . e d u . c n 3 2 大庆石油地质与开发 2 0 1 4盎 虽然人工神经网络及遗传神经网络技术已在石油勘 探开发领域得到应用 ,但仍有局限性 ,而且在 应用遗传神经网络技术预测储层物性时会 因储层之 间差别大而降低 预测精度 J ,因此将模糊 聚类 与 遗传神经 网络技术引入储层含油气性评价 中。模糊 聚类是将数据进行分类处理 ,保证 了样本空间储层 性质 的相似度 ;遗传神经网络技术既具有神经网络 的非线性映射能力和预测功能,也具有遗传算法的 全局优化特征 ,在处理变量和 目标 函数之间无明显 映射关系等复杂问题时优势明显,表明模糊聚类与 遗传神经网络相结合的方法是行之有效的。 1模糊聚类与遗传神经 网络技术的油 气识别方法 1 . 1基于马氏距离的模糊聚类 半监督聚类是利用 已标识样本的分类信息和未 标识样本的数据结构进行聚类 ,是一种重要 的知识 学习和数据挖掘方法。该方法是经典的模糊均值聚 类方法的推广,给出的优化 目标为[ 1 c Ⅳ Q , ∑ ∑ 2 口 2 i 1 1 c Ⅳ ∑ ∑ 一 g ik b 1 式中Q 模糊聚类的 目标 函数 ; c 聚类 中心个数 ; 样本个数 ; £ 使 目标函数达到最小 时的判别矩阵 , 满 足∑ 1 ; 一 聚类 中心矩阵。 令标号矩阵为 G [ g ] ,g 表示 的先 验知识 ;若 被标号 ,则 b 1 ,反之 b 0 ;权 重 ∈ [ 0 , ∞] 。 由于式 1 的优化 目标是基于欧式距离的半 监督模糊聚类 ,其迭代公式复杂且计算时间长 ,对 储层样本空间进行聚类处理所得 的聚类 效果不佳。 因此 ,利用马氏距离代替欧式距离 ,通过大量的试 算及效果分析改进的聚类 目标函数为 c Ⅳ m i n Q ∑ ∑ “ 一 g 6 D i 1 kl c Ⅳ 1 一 ∑ ∑ ⋯ D 2 2 式 中, D 一V i s 一 口 表示 至 0 i 1 , 2 ,⋯ ,c 的马氏距离 ;S 为第 i 类的协方差矩阵。 1 . 2遗传 R B F神经网络 1 . 2 . 1改进 的遗传算法 遗传算法是一种基于 自然选择和基因遗传学原 理的优化搜索算法,其显著特点为隐含层的并行性 和解空间的全局搜索性_ 1 j 。在应用 过程 中,尽 管遗传算法具有很多优点,但平衡及协调算法的快 速收敛、保持个体多样性是其具有代表性 的问题 , 因此引入局部搜索算法并对传统遗传算法的算子进 行了改进 。其 中,算子的改进主要包括 1 选择最差个体直接进行变异。 2 采用分段取点交叉算子。 3 采用加速算子。 改进的遗传算法尽量避免了传统遗传算法局部 搜索能力差和易早熟的问题。 1 . 2 . 2 R B F神 经 网络 模 型 人工神经网络是模仿人脑神经冲动传导原理而 建立 的数学模型 ,是由许多相互联系的相似处理单 元 神经元 有机连接构成的一个非线性复杂 网 络 。 B P神经 网络在油气勘 探开发 领域应用较 多 , 而且其学习过程的收敛与初值密切相关 ,训练速度 慢、效率低,学习过程中会出现局部最优问题。 R B F径向基 函数神经 网络是一种性 能 良好 的前馈 型人工神经 网络 ,在一 定程度上能够 克服这些 问 题 。R B F神经 网络是基 于人脑 的神 经元 细胞对外 界反应的局部性提出的 ,具有较高的运算速度和较 强的非线性映射能力 ,能以任意精度全局逼近一个 非线性 函数 ,因此得到了广泛应用 J 。 选用具有单 隐层 的 3层前馈 R B F神经 网络作 为储层油气识别模型。在 R B F网络 中,从输入层 到隐含层的变换是非线性变换 ,从隐含层到输 出层 是线性变换。R B F网络 中最常用 的基 函数是高斯 函数 ,选其作为隐含层的基函数。对于任意的输人 向量 X∈R R为输入样本集 ,高斯 函数 的定义 为 R j 。 p f 一 _』L 1 3 \ z o - ; / 式中, 为隐含层第 个单元 的输 出, 1 , 2 ,⋯,m; X { 。l X p∈R,P 1 ,2,⋯, Ⅳ} ;c 为隐含层第 个单元高斯函数的中心点; 为第. 个隐节点的归一化参数,即该隐层节点 的宽度。 隐含层到输 出层的映射是线性 的,即 R B F网 络 的实际输出是各单元响应的线性组合。输出层第 第 3 3卷第 2期 李铁军等 油气识别的模糊聚类与遗传神经网络技术 3 3 k 个神经元网络输出方程为 y ∑w j R j x , k 1 , 2 , ⋯, n 4 式 中m 隐含层节点的个数 ; 输出层节点数 ; 隐含层第 个神经元与输出层第 k个 神经元的连接权值。 1 . 3模糊聚类与遗传神经网络 模糊聚类的结果是让所有的样本既要尽可能地 体现出整体数据集的数据结构 ,又要尽可能与 已标 号样本 的隶属度吻合 ,即在储层的油气识别过程中 通过基于马氏距离的半监督模糊聚类将储层性质相 似程度高的个体聚集在同一样本空间中,对聚类产 生的新的样本空间分别进行储层油气识别 ,尽量避 免 因储层性质差异大而影响识别的符合率 。 在研究现有遗传算法的基础上改进了遗传算法 的搜索方式, 使搜索方式不依赖梯度信息,只需求 解函数在约束条件下有解即可进行运算 ,而且避免 了局部搜索能力差的问题 。 神经网络的连接权值 的整体分布包含着神经网 络系 统 的全 部 知识 。利用 改 进 的遗 传 算 法优 化 R B F网络 的连接权值 和 网络结 构 ,既能 克服神经 网络易陷入局部最优的问题 ,又可以有效提高神经 网络的泛化性能。因此 ,遗传算法优化神经网络的 问题可以描述为 1 n r n n nf W , Z , 0 , 1 ∑ ∑[ £ 一 ] 1 i 1 5 式 中Y t 实际输出; Y t 期望输出; 一 隐含层的连接权值 ; z 隐含层到输 出层 的连接权值 ; 隐含层各单元的阀值 ; r输出层各单元的阀值。 W∈R ,Z∈R ,0 ∈R P , ∈R 。运用改进 的遗传算法求解式 5 得到 、z 、0 、 后即可 求得实际输 出与期望输 出的误差 函数 厂 。若厂满足 精度要求 ,则说明网络模型训练成功 ,可以进行相 关的储层油气识别。 2应用 实例 利用准噶尔盆地西北缘地 区2 0 5口井 的 2 2 0个 层常规测井及录井资料 的 3 5种参数 去掉参数不 全及数据异常的层 ,将其 中的 1 8 0个层作为训练 样本进行了数据拟合。 由于单一 的测井 资料在油气识别时符合率低 , 将常规测井与录井资料 中的 1 0个参数 测井参数 包括地层 电阻率、 自然 电位、 自然伽 马、声 波时 差 ,录井参 数包括含油级 别、干照 强度、全烃 增 幅 、全烃 最小量 、C , 增 幅、湿 照颜 色 6个 参数 作为油气层识别 的输人参数 ,并基于准噶尔盆地储 层的油气特征将油层 、含油层 油层 、含 油层可 根据准噶尔盆地工业油流标准 区分 、水层及干层 作为网络模型的输出。 选取准噶尔盆地西北缘地 区的 1 6口井作为模 型的检验样本 日 , ,⋯,H 。 进行了油气识 别 ,具体步骤如下 1 利用 V B 6 . 0软件对式 2 进行编程处 理 ,将已确定的 1 0个参数及其 中的测井参数分别 作为算法的输入参数 ,对用于拟合 的训练样本进行 模糊聚类处理 ,分 别得到聚类 中心 , , , , 和 , , , , 。 2 利 用 步 骤 1 得 到 的 5个 聚类 中 心 / 1 , , , , 对检验样本进行 聚类处理 并划分到 5个 聚类结果 中。同样 ,利用 聚类 中心 , , , , 将检 验样 本划分 到另外 5 个聚类结果中。 3 首先将确定的1 0 个参数作为网络的输人 参数,按步骤 1 产生的样本空间进行映射拟 合 ,利用映射拟合得到的隐含层连接权值为 Wi [ W 1 ,W ,⋯,W n 0 ] 6 隐含层到输 出层的连接权值为 Z i 1 , ,⋯, 1 o ] 7 在式 6 、 7 中,i 1 ,2 ,⋯,5 。利用式 6 、 7对检验样本 的聚类结果进行油气识别 。 同样 ,将单一常规测井参数作为网络的输入参数对 检验样本进行油气识别 。 4 用遗传 R B F神经 网络技术对训练样本直 接映射拟合,分别以确定的 1 0 个参数和 8 个单一 常规测井参数作为 网络的输人参数 ,进行映射拟合 得到的连接权值为 W [ W 1 ,W 2 ,⋯,W 1 0 ] 8 Z [ z , z , ⋯, z 。 ] 9 [ W i , W ,⋯, W ; ] 1 0 Z [ , ,⋯, ; ] 1 1 利用式 8 一式 1 1 对检验样本进行储层 的油气识别。从表 1 看出,利用所确定的 1 0个参 数作为输入得到的解释结果 比用常规的单一测井参 3 4 大庆石油地质 与开发 2 0 1 4年 数解释的符合率高。相对于遗传 R B F网络的油气 识别而言,该方法 比以单一的常规测井参数为基础 或以常规测井与录井结合的参数为基础时的油气识 别符合率都有提高 ,油气识别的可信度也更高。 表 1 油气识别结果对 比 T a b l e 1 Co n t r a s t o f t h e o i l a n d g a s i d e n t i fic at i o n r e s u l t s 3结 论 1 利用遗传 R B F神经 网络实现连接权值和 网络结构的优化 ,能够解决神经 网络容易陷入局部 最优的问题 ,提高了网络的泛化能力 ,为储层的油 气识别提供了新途径。 2 经模糊聚类处理后 ,遗传神经网络技术 的预测精度有一定提高 。因此 ,在储层油气识别之 前需对预测样本进行聚类处理。 3 将常规测井 与录井 资料 结合作为 网络的 输入参数 ,可以提高储层油气识别的精度。 参考文献 [ 1 ]张文宾 ,林景晔 ,刘概琴 ,等 .对应分析油气水层识 别方法及 应用 [ J ] .大庆石油地质与开发 ,2 0 0 2,2 1 6 8 - 9 . [ 2 ]贾焕军 .油气 层神经 网络识 别方 法研究 [ D] .大 庆 大庆石 油学院 ,2 0 0 3 . [ 3]段新 国,王允诚 ,李忠权 ,等 .应用多组逐步判别分析优选 油 气层 [ J ] .大庆石 油地质 与开发 ,2 0 0 7,2 6 1 6 8 . 7 1 . [ 4 ] 杨宇,郭春华,袁显华 . 改进遗传神经网络在洛带气田测井解 释 中的应用 [ J ] .天然气工业 ,2 0 0 5,2 5 8 4 7 4 9 . [ 5]王路 ,吴国平 .基 于遗传 B P神经网络的油气识别 [ J ] .工程 地球物理学报 ,2 0 0 8 ,5 2 1 6 9 . 1 7 2 . [ 6 ] 杨思通,孙建盂,马建海 ,等. 低孔低渗储层测录井资料油气 识别方法 [ J ] .石油与天然气地质 ,2 0 0 7,2 8 3 4 0 7 . 4 1 1 . [ 7 ]陈清华 ,王正 .苏北盆地低 电阻率油气层成 因与识别 [ J ] .特 种油气藏 ,2 0 0 8 ,1 5 2 1 1 1 3 . [ 8 ]赵军 ,邓婷 ,刘兴礼 ,等 .吉拉克油 田三叠系低阻油层识别方 法 [ J ] .特种 油气藏 ,2 0 1 1 ,1 8 1 2 5 . 2 7 . [ 9 ]董兴朋 .相似度- 遗传神经 网络在储层物性预测中的应用 [ J ] . 测井技术 ,2 0 1 2 ,3 6 3 2 6 7 . 271 . [ 1 0 ]于福生 .基于知识的聚类 从数据到信息粒 [ M] .北京 北 京师范大学出版社 ,2 0 0 8 7 9 8 7 . [ 1 1 ]周 明,孙树栋 .遗传算 法原理及应用 [ M] .北京 国防工业 出版社 ,1 9 9 9 . [ 1 2 ]李晔 .基于一种改进遗传算法 的神经 网络 [ D] .太原 太原 理工大学 ,2 0 0 7 . [ 1 3 ]阎平凡,张长永. 人工神经网络与模拟计算 [ M] .北京清 华大学 出版社 ,2 0 0 0 . [ 1 4 I刘进军 . R B F神经 网络 的改进 及其应用研究 [ D] .兰 州兰 州大学 ,2 0 0 8 , [ 1 5 ]田景文,高美娟 . 人工神经网络算法研究及其应用 [ M] .北 京 北京理工大学出版社 ,2 0 0 6 . 编辑宋玉梅