用灰色支持向量机进行储层油气、水模式识别.pdf
石油天然气学报 江汉石油学院学报 2 0 0 9 年8 月第3 1 卷第4 期 J o u r n a l o f O i l a n d G a s T e c h n o l o g y J . J P I A u g . 2 0 0 9 V o 1 . 3 1 N o . 4 用灰色支持向量机进行储层油气 、水模式识别 刘冬娥,黄婧芝 ,吴国平 中国 地质大学 武汉机械与电子 信息学院, 湖北武汉4 3 0 0 7 4 [ 摘要]在石油天然气开发中,储层油气、水y - 0 别属于典型的模式识别问题。为了克服传统的学习方法存 在 的过于简单 、对经验较强的依赖 、涉及人 为 因素多、易陷入局 部最 小值 、存在 过学 习问题 等缺 陷 ,同 时也为了适应油气储层样本属性特征差异小,属性特征信号信噪比不够高的特点,在研究灰色关联和支 持 向量机原理的基础上 提 出灰色支持 向量机模 型,用 于储 层油 气、水模 式识别 。与单纯 的支持 向量机 识 别方法相 比较该模 型判别 油气、水属性 的正确率 高。研 究结论 可用于 油气 勘探储层 精细评价和 油气勘 探 二次开发。 [ 关键词]灰色关联;支持向量机 ;油气;水;模式识别 [ 中图分类号]P 6 3 1 . 8 4 [ 文献标识码]A [ 文章编号]1 0 0 0 9 7 5 2 2 0 0 9 0 4 0 2 6 1 0 4 在石油天然气开发中,油气、水判别属于典型的模式识别问题 。传统的学习方法如线性分类器、贝 叶斯分类器 、模糊模式识别方法、B P神经网络因各 自存在的缺陷、和油气层识别的特殊性 ,使其在油 气层识别应用 中的效果不尽人意。灰色支持 向量机气模式识别方法 ,是将灰色关联和支持向量机相结合 提出来的一种新的方法。灰色关联是一 种可研究小样本情 况下 ,突 出储层属性特征 ,压制 干扰 的方 法[ ;支持 向量机是 Va p n i k等人在统计学习理论基础上提出来 的一种机器学 习方法 ,这种统计学 习理 论是一种专 门研究小样本情况下机器学习规律 的理论[ 2 ] ,在统计学习理论基础上提出的支持向量机 的方 法,虽然适用于小样本分析和学习,但不具备压制干扰和突显样本储层属性特征的能力 。为适应油气储 层样本属性特征差异小 ,属性特征信号信噪比不够高的特点 ,笔者提出灰色支持向量机储层油气模式识 别方法 ,以达到提高储层油气模式识别效率和识别精度的目的。 1 理论方法 1 . 1 灰 色矢量 关联 度模型 根据灰色系统理论 ,测井方法提取的反映地层的信号是灰色信号 ,利用测井信号进行油气储层识别 与油气性分析是一个灰色系统过程[ 3 ] 。提取一已知油气层的 自然电位、电阻率 、自然伽马、声波时差信 号构成参考矢量序列,选取该储层上下范围深度相应信号为比较矢量序列 ,构建油气性储层矢量关联度 模型,设计以储层油气、水模式识别为 目的的灰色模式识别系统 ,对储层油气、水模式进行识别 。 设 X 。 为参考矢量序列 , 五 为 比较矢量序列 一 1 , 2 , ⋯, z o o 1 , z o 2 , ⋯ , z o m zf z 1 , zf2 , ⋯ , z 式 中, z z 均为矢量 是一 1 , 2 , ⋯, m ; m为参考矢量序列元素的个数 ; 为比较序列的个数 。 记 △ 0 一 I I X o 一z l l 1 为矢量 z 。 与 z 之间的距离测度 ; 并且记 Am 一 ma x m a x △o △m ; 一 m i n mi I 1 △o i i 可定义关联系数 [ 收稿日期]2 0 0 9 0 1 1 0 [ 基金项目]圜家自然科学基金项目 4 0 6 7 4 0 6 9 。 [ 作者简介]刘冬娥 1 9 8 4 一 ,女 ,2 0 0 7年大学毕业 ,硕士生 ,现主要从事信 息处理与油气开发方面的研究工作。 学兔兔 w w w .x u e t u t u .c o m 石油天然气学报 江汉石油学院学报 2 0 0 9 年 8月 一 2 △ ⋯ 式中 , p∈ O , 1 为分辨系数 。 矢量关联度为 , z 。 , z m k l 。 1 . 2 支持 向量机及其算法 支持向量机方法是从线性可分情况下 的最优分类超平面提出的。 对于训练集 z , d , ⋯, z , d , z ∈ R , d P ∈ 1 , 一1 } d p 为与向量X相对应 的判决结果 , 为输入维数 , 如果训练数据可以无误差地分 开 , 并且每一类数据距超平面距离最近 的向量与超平面之间的距离最大 , 则称这个超平面为最 优超平 面[ 。 设最优超平面方程为 叫 b一 0 。 分类判决如下 d E w z b - I ≥ 1 ,P一 1 , 2 , ⋯, P 4 式中, 使等号成立的向量 X称为支持 向量。 最优超平面的问题可以表示成如下的约束优化问题 , 即在条件的约束下 , 使得权值代价函数 训最 小 mi n w一 0 . 5 l I W l I 。 5 引入拉格朗 日乘子口 ’ ≥ 0 , p一1 , 2 , ⋯, P。 根据 Ka r u s h Kii h n - T u c k e r 条件 , 问题可转化为在约束条件 下 叫 n ∑a p 一 告∑a P a d d X j 由以上条件求出最优的 n 一即可求 出最优超平面方程 厂 z 厂 z 一s g n ∑ d p a * z 一6 o 而对于非线性情况 , 则引入松弛变量 £ , 式 5 变为 P m i n q w 一0 . 5 ll W II 。 C ∑e 式中, C为某个指定的常数 , 称为惩罚系数 。 式 6 的约束条件变为 a ≥ 0 0≤ 口 ≤ C 7 8 9 支持向量机的实现基于如下思想 通过某种事先选择 的非线性 映射 , 将输入 向量 X 映射到一个高维 特征空间, 在这个高维空间中构造最优分类超平面, 这个高维空间的构造与内积核函数有关 。 设 x为N 维输入空间的向量 , 令 x一 [ x , 。 x , ⋯, { & M x ] 表示从输入空间到 M维空间 的非线性变换 , 称为输入向量 X在特征空间诱导出的“ 像” , 参照前面的思路 , 可以在该特征空间定义构造 一 个分类超平面 W X一 0 1 0 则式 8 变换成式 1 1 的形式 厂 一s g n d P a p * x ’ x 一b o 1 1 支丽 量 X X表示第 P个输入模式 x一 在特征空间的像 X 与输入向量 X在特征空间的像 x的内 积 , 因此在特征空间构造最优超平面时 , 仅使用特征空间中的内积 , 若能找到一个 函数 K X, X , 使得 M K X, X 一 x x 一∑ ≠ J x f5 x P1 , 2 , ⋯, P 1 2 J 1 则在特征空间建立超平面时无需考虑变换 的形式 。 K X, X一 称为内积核函数。 ≥ 一 歇 , ∑ ㈤ 函 泛 令 学兔兔 w w w .x u e t u t u .c o m 第 3 1 卷第 4期 刘冬娥等 用灰色支持向量机进行储层油气、 水模式识别 统计学 习理论指出, 根据 Hi l b e r t S c h mi d原理 , 只要核函数 K X, X 要满足 Me r c e r 条件 , 它就可以 代替这种映射变换, 不用考虑映射过程[ 4 ] 。 常用的核函数有多项式核函数 K X, Xp 一 [ X, X 1 ] , R B F核函数 K X, XP 一 e - g l , S i g mo i d核函数 K X, Xp t a n h 志 X, X c L 6 J 。 1 . 3 灰 色支 持 向量机原 理 灰色支持向量机气模式识别方法,是为了适应油气储层样本属性特征差异小,属性特征信号信噪比 不够高的特点而提出的将灰色关联和支持 向量机[ 5 ] 相结合 的一种新的方法 ,该方法的主要思想是,首先 利用关联度分析方法计算测井属性的关联度值 ,突出油气样本序列的属性特征 ,提高信噪 比,并将数据 进行归一化处理 ,然后利用支持向量机对储层样本进行学习和识别,以达到提高储层油气模式识别效率 和识别精度的 目的。 2 应用实例 实际应用中,取西北地区某油 田具有钻探结论 的 S T井测井数据 4 2 7 9 . 1 m 到 5 3 8 3 . 4 m 深度段 自然电位 5 P 、 八侧向电阻率 R F O C 、 自然伽马 G R 、 声波时差信号 AC 构成 1 9 8 4样本空间,以判别 油气和水为目的。其 中,将对应已知油气 、水段的 1 5 7 4个样本空间作为训练样本空 间,采用灰色支持 向量机模式识别方法对油气层判别。 灰色支持向量机方法主要包括以下几个步骤 1 采用式 1 、式 2 和式 3 确定 的关联度模 型将油气样本属性进行灰关联处理 。 式 1 中 X 。 为参考序列 , X 为比较序列 , 式 2 中 为关联系数 , I。 为分辨系数 , 取 0 . 5 。 式 3 中 y 为矢量关联度, m3 , 为参考序列的长度 。 选取 S T井实际油气储层 5 3 7 2 . 7 m到 5 3 7 2 . 9 m一段作为参考序列矩阵X o , 由式 1 3 表示, 其 中 z 0 f ∈ o , 例如 X 0 l一 一4 0 . 1 4 8 , 6 . 6 6 3 , 6 6 . 7 6 3 , 7 2 . 6 6 3 X o -_ 4 0 .1 84 6 .6 6 3 6 6 . 7 63 7 2 . 6 63 3 9 .9 3 6 .6 7 9 6 8 . 55 2 7 2 . 75 6 39 . 73 6 6 . 83 72 . 89 6 72 . 92 6 1 3 比较序列 X , i 1 时, 分别取测井信号声波时差、 自然伽马 、 自然 电位和电阻率的 1 ~ 个采样点的 采样值 , i 一 2时, 取 2~ 1 个采样点 的采样值。 依此类推 , 以 0 . 1 m为间隔逐点滑动取值构成 比较序列 矩阵 z f 1 , z f 2 , X 诏, z f 4 , i 1 , 2 , ⋯, 1 5 5 。 根据公式 2 计算关联系数 , 最后根据公式 3 得到每个 比较序列的关联度, 每个比较序列求出的关 联度值记在该序列中点对应的采样点上 。 用构建的关联度模型对油气勘探训练样本 和预测样本进行灰关联处理,此处理不仅压制干扰和突显 样本储层属性特征,而且将样本属性值归一化到 [ O ,1 ]之间,归一化处理可以避免出现因属性值差异 过大带来的额外的误差。 2 考虑选用支持向量机算法 中的核函数 。因为考虑到线性核函数是 R B F核 函数的一种特殊情况 , S i g mo i d核函数的精度不如 R B F核函数 ,而多项式核 函数需要确定 的参数相对于其他 3种核 函数来说 要多一个,而且在阶数很高的情况下会产生数值 问题 ,故在此选 R B F核函数 。 3 采用交叉验证选择式 6 中的最佳惩罚系数 C与式 2 中的参数 g 。 用原样本 中的一部分来建模型用来预测识别另一部分未知数据,并计算准确率,这整个过程 叫交叉 验证 。根据以上选取的 1 5 7个油田训练样本结合交叉验证方法寻找最佳参数 C一 1 , g 0 . 2 5 。 4 采用选取的参数 C与 g对整个训练集进行训练获取支持向量机模型。 5 利用获取的模型进行测试与预测 。 利 用 得到 的训 练模 型 ,以判 别油 气 和水 为 目的 ,用 同井 S T 井 4 1 4测 试 样本 空 间 进 行 识别 预 测结果示于表 1 。 C 一 ~ 学兔兔 w w w .x u e t u t u .c o m 石油天然气学报 江汉石油学院学报 2 0 0 9 年 8 月 表 1 S T井灰色支持 向量机识别结果 深度 实际 灰色支持 向量 支持 向量机 S P R RF OC R GR R AC R / m 目标 桃预测 结果 预测结果 5 3 5 5 . 7 1 2 . 0 8 9 0 . 6 9 6 3 . 1 4 7 0 . 7 3 1 1 1 9 . 1 0 . 5 2 5 6 8 . 4 2 3 0 . 4 5 7 水层 油气层 油气层 5 3 5 5 . 8 1 2 . 4 7 1 0 . 5 5 2 3 . 3 5 3 0 . 6 O 7 9 2 . 9 8 0 . 4 9 7 6 6 . 6 0 5 0 . 4 4 0 水层 水层 油气 层 5 3 5 5 . 9 1 3 . 7 2 5 0 . 5 5 8 3 . 4 7 6 0 . 6 2 1 8 1 . O 5 3 0 . 6 3 O 6 6 . 1 5 2 0 . 3 8 2 水层 水层 油气层 5 3 5 6 . 0 1 5 . 1 7 8 0 . 5 7 0 3 . 4 4 8 0 . 6 3 1 6 8 . 0 7 9 0 . 7 5 7 6 6 . 7 7 9 0 . 3 5 5 水层 水层 油气层 5 3 5 6 . 1 1 5 . 9 4 6 0 . 5 8 4 3 . 1 6 4 0 . 6 2 5 5 8 . 7 9 6 0 . 8 2 7 6 8 . 3 5 4 0 . 3 8 1 水层 水层 油气层 5 3 5 6 . 2 1 6 . O 5 9 0 . 5 9 3 2 . 7 2 9 0 . 6 0 2 5 4 . 6 4 8 0 . 8 2 5 7 0 . 1 2 7 0 . 4 5 4 水层 水层 油气层 5 3 5 6 . 3 1 5 . 4 9 1 0 . 5 9 4 2 . 4 5 9 0 . 5 7 1 5 3 . 7 9 1 0 . 7 5 5 7 0 . 7 3 1 0 . 5 4 2 水层 水层 水层 5 3 5 7 . 5 7 . 3 3 1 0 . 4 0 8 2 . 8 4 2 0 . 5 5 3 1 5 1 . 5 0 . 4 7 7 7 4 . 2 8 6 0 . 8 5 9 水层 水层 水层 5 3 8 1 . 6 3 1 . 6 9 6 0 . 8 9 3 3 . 9 2 8 0 . 6 8 0 6 0 . 9 7 0 . 8 7 7 7 1 . 0 1 8 0 . 6 4 4 油气层 油气屡 油气层 5 3 8 3 . 4 3 4 . 5 9 0 . 8 3 9 5 . 0 0 9 0 . 8 1 8 6 4 . 0 5 3 0 . 6 9 9 6 8 . 7 3 1 0 . 4 6 2 油气层 油气层 油气层 5 3 7 2 . 7 4 0 . 1 8 4 0 . 9 9 7 6 . 6 6 3 0 . 9 7 9 6 6 . 7 6 3 0 . 9 1 3 7 2 . 6 6 3 0 . 9 8 6 油气层 油气层 油气层 5 3 7 2 . 8 3 9 . 9 3 O I . 0 0 0 6 . 6 7 9 1 . 0 0 0 6 8 . 5 5 2 1 . 0 0 0 7 2 . 7 5 6 1 . 0 0 0 油气层 油气层 油气层 5 3 7 2 . 9 3 9 . 7 3 6 0 . 9 9 7 6 . 8 3 0 0 . 9 7 5 7 2 . 8 9 6 0 . 8 9 1 7 2 . 9 2 6 0 . 9 8 2 油气层 油气层 油气层 表 1中R为对应测井信号依式 2 和式 3 滑动计算 的关联度值 , 可以看出其油气属性相对测井信号 增强、特征差异变大 。这显然有利于支持 向量机的学 习与识别 。从深度 5 3 5 5 . 7 m 到 5 3 5 7 . 5 m 实际类别 为水层 , 灰色支持向量机方法仅仅将第 1个样本识别 为油气层 ,而支持 向量机方法却 将 5 3 5 5 . 7 m 到 5 3 5 6 . 2 m的 6 个水层样本误识别为油气层 ,由灰色支持 向量机模型判别油气水层 与实际开发 的结论 比 较,正确率为 9 7 . 5 6 ,而单纯 S VM 对应识别率为 8 5 . 3 7 。对待测样本的识别准确率没有前种方法 高。 3 结 语 储层油气 、水识别 问题往往获取的信息是有限的 ,而对油气 、水模式识别问题是复杂的,针对利用 有限油气勘探信息进行油气 、水模式识别的特殊性问题 ,提 出了灰色支持向量机方法,该方法具有所需 训练样本空间小、压制干扰能力强、突显样本储层属性特征的能力 ,并且具有学习效率高 、抖动小 、识 别率高的特点 。研究在油气勘探储层精细评价和油气勘探二次开发中具有应用前景。 [ 参考文献] E 1 ]邓聚龙 .灰理论基 础 [ M3.武汉 华 中科技 大学 出版社 ,2 0 0 2 . E 2 3 C r i s t i a n n i n i N,S h a we - Ta y l o r J .支持向量机导论 [ M].李国正 译 .北京 电子工业出版社,2 0 0 4 . [ 3 ]金龙 ,陈小宏 ,王守东 .基于支持 向量机与信息融合的地震油气预测方法 口].石油地球物理勘探 , 2 0 0 6 ,4 1 1 ;7 6 8 0 . [ 4 3张学工 .关于统计学习理论与支持向量机 [ 刀 .自动化学报 ,2 0 0 0 ,2 6 1 3 6 4 6 . [ 5 3 V N. T h e n a t u r e o f s t a t i s t i c a l l e a r n i n g E M]. B e r l i n S p r i n g e r ,1 9 9 5 [ 6 3 B e n n e t t Kr i s t i n . S u p p o r t v e c t o r ma c h i n e s a n d o t h e r k e r n e l me t h o d s[ c ]. I E E E I n t e r n a t i o n a l C o n f e r e n c e o n F u z z y S y s t e ms , P r o c e e d i n g s o f t h e I EEE I n t e r n a t i o n a l Co n f e r e n c e o n Fu z z y S ys t e ms,FUZZ - I EEE 2 0 0 5 . [ 编辑] 弘文 学兔兔 w w w .x u e t u t u .c o m