基于最小二乘支持向量机的油气水层识别方法.pdf
第 3 2 卷第 3 期 天 然 气 勘 探 与 开 发 基于最小二乘支持向量机的油气水层识别方法木 李榕钟仪华 西南石油大学 摘要测井解释过程中的油气水层识别实质是一个模式识别问题。基于统计学习理论发展起来的新一代 小样本学习算法一支持向量机, 是至今模式识别问题强有力的解决方法之一。依据测井所得到的小样本、 不适定 性等数据信息进行网格搜索及交叉验证对 目标函数寻优, 找到最佳参数建立了最小二乘支持向量机分类器模型; 针对现有方法在解决油气水层识别问题中的不足, 提出了基于最小二乘支持向量机的油气水层识别方法, 并将此 方法应用于大庆油田某油藏的油气水层识别。结果表明, 此方法较人工神经网络和标准支持向量机方法具有更快 的运算速度和准确率, 是一种值得进一步研究及推广使用。表3参7 关键词油气水层识别测井解释最小二乘支持向量机网格搜索交叉验证 O 引言 油气水层识别是依据测井中所测得的数据判 断油气藏类型、 测试井类型和井底完善程度的一个 重要环节。准确识别油气水层提高解释符合率可 对井筒储层的流体性质进行准确的识别评价, 为制 定合理的试油压裂设计方案提供依据 , 而且对减少 勘探风险、 提高勘探效益有着重要 的意义。 勘探实践、 理论和实验 的研究越来越多地证实 了储层的非均质性及储层 的测井响应特征属非线 性。因此, 使用非线性信息处理技术来揭示储层非 均质性特征, 表征出其分布规律, 才能更好地适应 油气藏勘探开发的需求, 而常规线性、 经验性测井 解释技术表现能力不足⋯。尽管近年来 已有研究 者将人工神经网络、 支持向量机等方法应用于油气 水层的判别 中, 并取得了较好 的效果 ] , 但它们 仍然有不足之处 人工神经网络方法在局部最优、 维数灾难、 数据样本小时, 较难以给出满意结果; 支 持向量机虽能克服神经网络方法的不足, 可运算速 度较低 。 最小二乘支持向量机是支持向量机的一种改 进方法。它除具有解决小样本模式识别 问题的支 持向量机的特点一泛化能力强, 能够较好地解决小 样本、 非线性、 高维数、 局部极小点等难题外, 还能 将优化问题转化为等式约束的线性系统求解问题, 在保证收敛精度的情况下, 运算快速、 简便。因此, 本文依据测井所得到的小样本、 不适定性等条件, 针对现有方法在解决油气水层识别问题中的不足, 提出了基于最小二乘支持向量机 L S S V M 的油气 水层识别方法 。 1 标准支持向量机 S V M 和最小二 乘支持向量机 L S S V M 分类器 1 . 1 标准支持向量机和标准最小二乘支持向量机 支持向量机 S u p p o r t V e c t 0 r M a c h in e , S V M 是在统计学理论基础上发展起来的新的机器学习 方法 。它的基本思想是 选择一非线性映射 g , 把 2 维样本向量 , , , ⋯, 戈 , , , E R “ 从原空间 尺 映射到高维特征空间, 在此空间中利用结构风 险原 则构 造 最优 分离 超 平 面, 通 过 引入核 函数 , 的概念, 得到最优线性决策函数 [ ∑ iK i , 6 ] 。 最小二乘支持 向量机[ ’ L e a s t S q u 盯e s S u p p 0 r t V e c c o r Ma c h i n e , L S S V M 是 S V M的一种变形算法。 由于s v M的训练是一个有约束的二次规划问题, 基金项目 四川省教育厅重点项目 o 7 z A 1 4 3 资助 作者简介李榕, 女, 1 9 8 3年出生, 陕西韩城人; 2 o o 6年毕业于渭南师范大学信息与计算科学专业, 现为西南石油大学在读硕士, 主要从事 石油工程计算和优化决策研究。地址 6 1 O 5 o o 四川省成都市新都 区西南石油大学研究生院硕 0 r 7 级 9班。电话 1 5 8 8 2 4 o 2 6 6 5 。E Il l a i l l r r o n g s h u l 6 3 . c o m l 5 学兔兔 w w w .x u e t u t u .c o m 天 然 气 勘 探 与 开 发 2 o o 9年7月出版 且约束数目 等于样本容量, 导致训练时间较长, 尤其 当样本 容量较 大 时训 练时 间有 时 会过 长。于是 s u y k e n 将上述优化目标函数中误差 量变为误差 蠡 的二范数, 且 亭 可以是负数, i ≥1 , 则 被错分; ≤1 , 被正确分类。与 Js 聊 求解方法类似最终可 得 聊 的分类函数 i y 昭 孔 [ , f 6 ] 。 1 . 2 最小二乘支持向量机多分类器 构建多元分类 的 L S s V M方法是将多元分类器 看成若干二元分类器的集成。考虑多类的训练样本 形式 { , , ,。 “ } , 其中z 为训练样本数; m为内 置二元分类器个数, 即 m类分类问题; ,。 “ 是指第 |l} 个样本属于第 个类别。多分类的最小二乘支持向 量机可描述为 1 m 一 1 ‘ , , I . m . , ’ f , 6 i , , 寺暑 ∞ i c 。 互 ,‘ , ’ [ ∞ 1 I 6 1 ] l 一 . 1 , , ∞ 6 ] 卜 l, 2, ⋯ , z i , [ ∞ g 6 ] l 一 . 1 根据式 1 定义拉格朗日函数为 ’ c c , f , 6 ‘ , .‘, 。 ‘J ‘ m ’ ∞ , 6 i , ,f一∑I 。 i d ‘ , { , , ‘ [ ∞ I 6 i ] 一 1 .i } 2 对 2 式优化, 分别对变量 ∞ , 6 , 求 偏导令其等于零并消除 ∞ 和 转换为求解分 块矩阵 ” c , ] ’ ,2 ,⋯ ,m 3 , 式中, “ ’ 由元素 2 y iJ , , 巧 , 组成; “ 为对应 , , 的 , 乘子向量; 6 为对应 y i 的 常数项。求解 “ ’ 与 6 之后, 即求得多元分类最小 二乘支持向量机的决策函数为 昭 7 ‘ [ J J , ] 』 1 . 2 . ⋯, m 4 2 最小二乘支持 向量机 L s S V M 在 油气水层识别的应用 2 . 1 L S S V M油气水层识别方法 依据测井参数来进行油气层的识别、 油气藏评 价等方面的实际问题 , 本质上就是一个非线性的连 续函数映射问题。由于测井响应与实际地层各组成 部分之间的复杂关系, 这种映射通常是高度非线性 的, 最小二乘支持向量机正是解决此类复杂非线性 映射问题的有效方法 , 它既能够具有较快收敛速度 又能够取得较高的分类精度。 由于油藏中油气水的分布规律有多种, 因此属 于一个多分类问题 , 可以采用 L S S V M多分类器方法 对其进行识别。最小二乘支持向量机的油气水层分 类器模型的操作步骤为 1 选取样本集并对数据预处理 选择对储层油气水层各类型反映敏感 的测井属 性变量 , 提取可靠 的、 有代表性的数据样本并分成两 部分 ①用于学习建模的训练样本; ②用于检验预测 的测试样本 。并 对所选取 的数据样本集进行标准 化、 归一化预处理等工作。 2 选择 L S s V M分类器的模型参数和核函数 L S S V M分类器的优劣, 取决于除当地选取模型 参数 C 、 核函数类型和核参数。 3 获得油气水层类型识别 的 L S S V M分类识 别预测模型 从前两个步骤获得 的最佳 L S S V M分类器训练 参数可在训练样本上进行训 练, 并利用学习训练后 的模型检验测试样本。如果达到预测识别精度, 则 获得油气水层类型识别的 L s s V M模型; 否则需调整 参数 , 重新进行训练和检验。 4 识别预测分类 将新的、 待识别预测井段上的层段测井特征值 归一化后输入到 L S s V M分类器中, 得到支持向量机 识别出的油气水层类型结果 J 。 2 . 2实例 研 究 以大庆油田某地区的油藏为例, 依照上述的操 作步骤, 依次选取输入参数、 核函数, 建立适当的最 小二乘支持向量机 分类器 , 对该地区的油藏进行油 气水层分布规律的识别研究。 1 选取训练样本集 选取 2 9 组数据作为总样本进行油气水分布规 律的研究。其中 1 9组数据作为训练样本, 1 0组数 据作为测试样本。由于该地区油层的分布规律极为 复杂, 没有统一 的油水界 面, 且井 间油层连通性较 差, 所涉及的参数很多。因此选取具有代表性的参 数 砂岩厚度、 泥质含量、 有效孔隙度、 含水饱和度、 含油气饱和度、 含油气孔隙度等这 6个参数作为 L S s V M的输人数据, 将试油结果的4种不同的油气 类别干层 A 、 水层 B 、 油层 c 、 差层 D 作为 L S s v M 的输出 表 1 。 学兔兔 w w w .x u e t u t u .c o m 第3 2卷第3期 天 然 气 勘 探 与 开 发 表 1 训练样本数据表 为了消除各输入参数量纲不同对计算造成的影 响, 对输入属性参数进行预处理 ,采用归一化的方 法将其统一[ 0 , 1 ] 到之间。设样本 的总数量为 , 样 本的属性个数为 m, 则有 R 。 , l , 2 , ⋯ , m l I 其中, R 表示第 个样本的第 n个属性值, 尺 ’ 是 映射到[ O , 1 ] 区间的值。 2 L S s V M核函数和参数的选择 为了获得最佳模型经常需要选择不同的核函 数, 需要进行一些试验研究才能选好核函数。通过 比较, 本文选用了径向基核函数 。 , e { 一l I 。 一 , l l / } 其中, 为高斯分布的宽度。 选择径 向基核函数 , 是 因为从模型选择上该 函 数影响复杂度的超平面参数少。 本文采用网格搜索法来选择 L S s V M训练参数 C和 , 用交叉验证法对 目标 函数进行寻优, 直到 找到最佳的参数, 使交叉验证的精度最高。即将 c 和 盯 分别取 Ⅳ 7和 7个值, 对 Ⅳ 4 9个 C, 的组合 , 通过 2 O重 2 0一 f 0 l d 交叉验证法搜 索选取, 选择正确识别率最高的一个 c , 。 作为最 优 上 .s Is 肼 训练参数, 其中c 1 0 0 o , 0 . 5 5 。 3 结果分析 使用得到的参数对共有 1 9 组训练样本的数据 集进行学习, 使得 L S s V M训练正确率 l 0 0 %。最 后对测试样本 的 1 0组数据进行检验, 测试正确率 8 6 . O % 表 2 。 表 2 测试样本数据表 1 7 学兔兔 w w w .x u e t u t u .c o m 天 然 气 勘 探 与 开 发 2 0 0 9年 7月出版 最后, 将人工神经网络和标准 S v M的识别结果 与本文 L S S v M所得结果进行了对比分析 表 3 。 表3 分类算法对比表 从表3可以看出, 在保持样本准确识别的基础 上, L S S V M分类器取得了较快收敛速度和分类精 度。因此 , 将 L S S V M分类器用于油气层分布的识别 很有效。 3 结论 1 用 L S S V M方法构建的油气水层识别模型, 准确率达8 6 . O %。相对其它非 s V M分类方法, 它很 好地避免了陷入局部极小而得不到全局最优或训练 效率低的缺陷, 在实际应用中简化了通常的分类和 回归等问题 , 具有很好 的分类 、 学习和容错能力 , 显 示出具有较好的应用价值。 2 由于 L S s V M通过非线性映射将原始空间 不等式约束二次优化问题转化成特征空间等式约束 的线性系统, 使传统的 s V M变为等式约束, 进而极 大地简化了寻优过程, 加快了运算速度。 3 L S S v M丧失 了标准 S v M 的内在稀疏性和 鲁棒性 , 在数据样本很 大的情况下 , L S S V M 的分类 效率和正确识别率可能较标准 S V M有所下降。目 前, 已有人 提 出加权 L S S V M 和 L S S V M 稀 疏化 方 法 来解决这两个问题 , 但得到很好应用效果 的学 习算法, 仍然是一个值得研究的重要课题。 参考文献 1 杨斌 , 匡立春, 孙中春 , 等 .一种用于测井油气层综合识 别的支持向量机方法[ J ] .测井技术, 2 o o 5 , 2 9 6 5 l l 一 5 1 4 . 2 孙开琼, 周云才 .改进的神经网络算法及其在油层识别 中的应用[ J ] . 石油机械, 2 0 o 4 , 3 2 3 2 8 2 9 . 3 邹玮, 李瑞, 汪兴旺. B P神经网络在致密砂岩储层测井识 别中的应用[ J ] .勘探地球物理进展 , 2 0 0 6 . 1 2 , 2 9 6 4 2 84 3 2 . 4 刘斌, 岳会宇, 李卓 , 等 .支持向量机在油层含油识别中 的应用[ J ] .控制工程, 2 o o 6 , 1 3 4 3 5 63 5 7 . 5 连承波, 赵永军, 钟建华 , 等 .基于支持向量机的低阻油 层识别方法及应 用 [ J ] .石油 天然气 学报 , 2 0 0 8 . 2 , 3 O 1 8 O一 8 2 . 6 方瑞明.支持向量机理论及其应用分析[ M] .中国电力 出版社 , 2 0 c r 7 l 6 ol 8 3 . 7 刘江华, 程君实, 陈佳品.支持向量机训练算法综述[ J ] . 信息与控制 , 2 o 0 2, 2 1 4 5 4 7 . 收稿 日期2 0 o 9一 o 3 一 o 9 编辑周国英 【 上接第 1 4页 井复查及新钻井中见到了好的地质效果。 喜 、 一 嚣 叵 囊 D l 1 . 1 O 4 低 阻气层 一 乘幂 气水分界线 中高 阻气 妻 。\ 、 、 l ; 。 ‘ . . . 低阻 、 _ 水层 0 2 4 6 8 l 0 l 2 l 4 1 6 l 8 2 0 孔隙度 % 图5 D 11 1 o 4井声波时差 一电阻率交会图 1 8 参考文献 l 樊政军 , 金意志, 贺铎华. 低阻储层参数的测井解释[ J ] . 新疆 石油地质 1 9 9 6 , 1 7 2 1 2 3一l 2 6 . 2 郭振华 , 赵彦超. 大牛地气 田致密砂岩气藏低阻气层成因 分析[ J ] . 石油天然气学报 , 2 O o 7 , 2 9 3 6 1 6 4 . 3 刘红歧, 彭仕宓, 唐红. 苏里格气田低阻气层分布特征及 识别方法研究[ J ] . 天然气工业 , 2 o o 4 , 2 4 1 0 4 1 4 3 . 4 邓雷清. 综合识别方法在低阻油气层勘探中的应用[ J ] . 岩性油气藏, 2 o o 7 , 1 9 2 7 1 7 6 . 5 侯洪斌. 鄂尔多斯盆地北部上古生界天然气成藏条件与 勘探方向[ M] . 北京 石油工业出版社 , 2 o o 4 . 收稿 日 期2 o o 9一 o 4 1 5 编辑景岷雪 学兔兔 w w w .x u e t u t u .c o m