支持向量机回归在油气钻井成本预测中的应用.pdf
2 0 1 0年5月 第 2 5卷第 3期 西安石油大学学报 自然科学版 J o u r n al o f X i a n S h i y o u U n i v e r s i t y N a t u r a l S c i e n c e E d i t i o n Ma v 2 0 1 O V _0 I . 2 5 No . 3 文章编号 1 6 7 3 -06 4 X 2 0 1 0 0 3 - 0 0 9 6 - 0 4 支持向量机 回归在油气钻井成本预测中的应用 马加传, 刘天时 西安石油大学 计算机学院, 陕西 西安 7 1 0 0 6 5 摘要 钻井成本是钻井公司成本的重要组成部分, 对钻井成本进行准确预测 , 有利于提 高钻 井成本 的控制和计划管理水平. 应用作业成本法分析影响钻井成本的主要因素, 结合某钻井公司钻井成本 数据 , 运用支持 向量机回归建立预测模型 , 同多元回归与 B P神 经网络回归进行对比, 验证 了支持 向量机模型具有较高的预测精度. 关键词 向量机 ; 钻井成本 ; 预测模型 ; B P神经网络 中图分类号 T E 2 2 ; F 4 0 7 . 2 2 文献标识码 A ’ 油气 钻井 生产 规模大、 投资多、 风险 高, 需要 花 1 成本影响因素分析 费大量的人力、 物力和财力. 同时油气钻井过程存在 很多未知因素和不确定因素. 钻井生产风险性也很 大 】 . 钻井作业会 因为地 下情 况复杂等 因素 的影 响, 导致钻井投资加大. 控制钻井成本对降低钻井工 程投资, 提高钻井企业和油气生产企业的经济效益 至关重要. 目前钻井成本的预测方法多是基于传统 的统计预测 , 它的理论前提是样本数 目趋于无穷大 时的渐进 理论 J . 因此 只有 当采样数据 趋 于无 穷 时 , 参数方法的训练结果才趋于真实的模型. 近些年 发展起来的人工神经网络属于经验非线性预测方 法 , 虽然克服了参数预测方法的部分弱点 , 能够依照 需要 、 假设数据 内在相关性而构造非线性模 型. 然 而 , 这些非线性方法缺乏统一的数学理论基础 , 神经 网络中的结构选择和权重的初值设定, 仍需要借助 于经验, 得到的模型通常是局部最优解 , 而非全局最 优. 支持向量机是基于统计学 习理论 的新一代机器 学习技术. 由于使用结构风险最小化原则代替经验 风险最小化原则 , 泛化能力强, 这样能较好地解决小 样本情况下的学习问题, 同时再把非线性问题转化 为线性问题的方面采用了核函数的思想, 降低了输 入空间的维数和算法的复杂度. 油气钻井成本从成本形态上可以分为固定成本 与变动成本 , 固定成本包括 直接人工费、 折旧费、 井 控费 、 固控及野营房摊销费、 资产 占用费 , 安全费用 及制造费用. 变动成本包括 直接材料费、 其他直接 支出费, 其中直接材料又主要包括 钻头、 钻井液、 润 滑油 、 钻具 、 套管、 套管附件 、 水泥 、 添加剂 、 仓储保管 费 、 燃料. 影响油气钻井成本 的因素主要包括地质环 境 、 井型 、 钻井技术 、 井深 、 作业时间、 钻井速度 、 原材 料价格等因素 , 国内外学者认为影响钻井成本的主 要因素是井深和作业时间 J . 通过对中石油某钻井 公司 2 0 0 8年 2 0 0 0多 口 井的样本数据进行作业 动因分析 , 可 以发现钻井成 本与影响因素有如下关系 1 地质环境 对钻井成本影 响较大 , 不同地质 条件下的钻井深度差异很大 , 钻井深度越深 , 钻井成 本越高; 2 井型结构一般分为气开发井、 油开发井、 气 探井和油探井. 而 由于地质取心的需要和对地质情 况的不熟悉等因素使得探井成本高于开发井成本 , 气井成本高于油井成本 ; 3 钻井技术的不 同对钻井成本影响较大, 钻 收稿 日期 2 0 0 9 1 2 - 0 5 作者简介马加传 1 9 7 9 一 , 男, 硕士研究生, 主要从事管理信息系统与计算机网路研究. E ma i l m j 5 1 3 1 6 3 . c o rn 马加传等 支持向量机回归在油气钻井成本预测中的应用 一9 7一 井技术主要分为直井 、 定向井 、 水平井. 技术难度越 大 , 钻井成本越高 , 不同钻井技术使用的钻井设备和 采用地下作业方法不同, 从而钻井成本亦不同 ; 4 钻井井深直接影 响钻井成 本 , 相 同的地 质 环境 、 井型结构和开发技 术 , 井深越深成本越 大, 与 钻头 、 钻井液套 管 、 水 泥 、 添加 剂、 燃 料等有直接关 乏 [ 41 . 、 5 作业 时间是影响钻井成本 的重要 因素 , 作 业时间与燃料消耗 、 仓储保管费等成线性关系; 6 钻机类型分为 3 0钻机 、 4 0钻机等 , 钻机速 度越快燃料消耗越 多而作业 时间越少 , 从 而影 响钻 井成本 ; 7 井下斜率不 同影 响钻井作业 的难度 , 相 同 的条件下, 井下斜率越大 , 井下作业难度就越大 , 随 之钻井成本越大. 从以上关系中可以得 出成本影响 因素关系图 , 如图 1 所示 , 可以看 出在相 同的地质环境 、 井型和钻 井技术条件下, 井深 、 作业时间、 钻机类型 、 井下斜率 是影响钻井成本的主要因素. 圃圆匹 I 井 深 l l作 业 时 间 l l钻 机 类 型 I l井 下 斜 率 l U 圈医 图 1 成本 影响因素关 系 2 油气钻井成本预测模型的建立 近年来在机器学习 中, 用于非线性 回归估计 的 支持向量机 回归 T h e S u p p o r t V e c t o r Ma c h i n e s f o r R e g r e s s i o n , S V R 是一种得 到广泛应用 的最优化技 术 , 它从 V a p n i k统计学习理论发展 而来 , 是一种 特 别适用于小样本学习的算法. 支持 向量机 回归通 过 选择一些训练点最终能够产生一个稀疏估计 函数 , 而这些训练点即为支持 向量 , 能够根据输入数据来 估计输 出. 虽然在这一点上支持 向量机 回归和神 经 网络相类似 , 但神经 网络 的方法是基于经验风 险最 小原则的. 相比较而言 , 支持向量机回归通过在经验 误差 风险 与模型复杂性之 间的折中 , 近似地实现 V a p n i k的结构风险最小原则 , 因此 , 支持 向量 机 回 归实现全局最优化 , 而神经网络只是实现 了一个局 部最优化 . 设 回归样本集为 T{ x 。 , Y , ⋯, x , Y }E , y , 其中 X ∈R , Y ∈R , i1 , ⋯, f 假定存在一超平面 J , i w x 易可以将样 本集线性分开 , 基于 s不敏感损失 函数建立最优化 问题 f 最/ J 、 值 ., ’ . , 』 条 件 t ≤ 占 , 1 I Y 一 W X b ≤ , 【 v 1 ,2, ⋯ , 1 . 在式 1 中引入松 弛变量 , , ⋯ , , 和惩罚参数 C, 便得到 CS V R的原始问题 f最 小 值 c 毫 , { 条 件 w。 6 一 Y ≤占 , 2 l Y 。 一 W X b ≤占 , , , 0,V i 1 , 2, ⋯ , 1 . 转化为对偶问题 l 最 大 值 口 一 寺∑[ 口 一 口 a i a j l ‘ -i , , 1 I f l x p] _∑ 口 一 口 ∑ 口 口 , { l 条 件∑ 口 一 口 。 0 , l 【 孚 ≥ a i , a i ≥ 0 ,V 1 , 2 , ⋯ f . 3 引人核函数 K 。 , x j 咖 咖 到式 3 , 将线性不可分问题转化到高维空间得 最 大 值 口 一 壹 -- a i a j 一‘ J 1 f K x x i ] _∑ 口 i 一 口 ∑ 口 口 i , l 条件∑ 口 。 一 口 0 , 旱≥ a i , a i ≥ 0 , v 1 ,2 , ⋯ ,z. 4 求解该优化问题 , 建立超平面 l Z ∑ 口 一 a i K 一∑ 口 一 I 1 ‘l a K x , , s , 5 其中a , a ≠0的向量为支持向量. 根据上述 S VM 回归算 法 , 结 合钻井成本 预测 西安石油大学学报 自然科学版 步骤 S t e p l 选择钻井成本作为因变量 J , , 选择钻井成 本影响因素作为 自变量构造 向量 ; S t e p 2 选择一定数量的单井数据, 构造训练样 本集, T{ 。 , Y 。 , ⋯, ,J ,f } ∈ , y , 其中X ∈R , ∈ R, V i1 , 2, ⋯ , Z ; S t e p 3 选择适当的精度参数C , 和核函数r 0 , 计算 b l ∑ 口 一 a i i , ; £l l S t e p 7 构造超平面 ∑ 口 i 一 a i K l l ; S t e p 8 根据钻井工程设计书构造 向量, 代人 解得钻井成本 Y . 3 支持向量机在钻井成本 中的应用 3 . 1 建模步骤 1 样本归一化处理. 归一化处理有利于避免 各个因子之间的量级差别 , 消除各个因子由于量纲 不同而产生的影响. 对样本的输入 、 输出数据进行规 格化处理 , 使规格化后的值在[ 一1 , 1 ] . 2 确定 核 函数 为 径 向基 函数 K , e x p 一 JIx , 其中 0 是核函数的参数. 3 参数的选择. 采用 c r o s s v a l i d a t i o n方法 , 选 择较好的核参数 、 惩罚参数 C和损失参数 , 建立的 S V M预测模型利用 L i b s v m- 2 . 8 9软件. 3 . 2 预测结果及分析 选取中石油某钻井公 司 2 0 0 8年 2 2 4 7口井数 据进行分析 , 按照相同的地质环境 、 井型和钻井技术 分为 1 4个 区块 , 并选取井深 、 作业 时间 、 钻机类型 、 井下斜率作为影响钻井成本 的主要 因素. 每个 区块 中随机选取 8 0 %的样本数据作 为训练样本 , 2 0 %作 为预测样本 , 样本数据见表 1 . 对 1 4个 区块训练数 据用 L i b s v m软件建立支持向量机模型, 并建立 B P 神经网络模型和多元回归模型 J , 对预测样本进 行预测 , 部分结果见表 2 . 对 1 4个 区块预测结果 的 相 同指标进行对比, 结果见表 3 . 表 1 中国石油某钻井公司2 0 0 8年钻进成本数据 序 号 赢 模型分析一般包括相对指标分析和绝对指标分 析 , 本文选择平均绝对百分误差 MA P E 和准确率 作为相对指标分析, 均方误差 MS E 作为绝对误差 指标分析, 利用这 3 种指标对支持向量机模型在钻 井成本预测中的优劣进行评价 ] . 1 平均绝对百分误差 , n I I M A P E 寺∑1 1 0 0 I. ” I 1 I i l 式中, , Y 分别为预测成本和实际成本. 一般认为 MA P E越小 , 则预测精度越高. 从表 3可以看出除第 5和第 l 3区块外 , 其他区块都小于其他模型. 2 准确率 预测成本与实际成本误差在[ 一 0 . 1 , 0 . 1 ] 之间的测试样本数 占总测试样本数. 从表 3 可 以看 出第 5区块外 , 其他区块都高于其他模型 , 说 明支持向量机模型优于其他模型. n 3 均 方 误差 1 ∑ 多 。 一 Y i , 均方 误差越 Il 小说明模型预测泛化性能越好 , 从表 3可以看 出除 了第 5区块 , 支持 向量机模型都小于其他模型. 马加传等 支持向量机回归在油气钻井成本预测中的应用 一 9 9一 表 3 S V M 模型与 其他模型对 比 4 结论 妓评价 方法 研 川 北 通过对钻井成本影响因素的分析 , 选择径 向基 作为核函数 , 建立支持 向量机模型 , 预测钻井成本 , 并利用相对指标与绝对指标与其他模型进行对 比分 析 , 支持 向量机模型明显优于其他模型, 在钻井成本 预测中取得 了较好 的结果 , 如何 利用先验经验选择 核函数和对应的参数需要进一步的研究. 参 考 文 献 [ 1 ] 马时雨, 杨民育. 国外钻井现场 H S E管理的实践与认 识[ J ] . 天然气工业, 2 0 0 5 4 1 8 5 1 8 7 [ 2 ] V a p n i k V . T h e N a t u r e o f S t a t i s t i c a l L e a r n i n g T h e o r y [ M] . Ne w Yo r kS p r i n g e r 。 1 9 9 5 . [ 4 ] 董世明, 程汝才. 定向钻井周期与成本预测初探[ J ] . 断块油气 田 , 1 9 9 4 , 1 3 4 5 - 4 9 . [ 5 ] S m o l a A J , S c h o l k o p f B . A t u t o r i al o n s u p p o r t v e c t o r r e g r e s s i o n[ J ] . S t a t i s t i c s a n d C o m p u t i n g , 2 0 0 4, 1 4 1 9 9 2 2 2. [ 6 ] 葛哲学 , 孙志强. 神经网络理论与 MA T L A B R 2 0 0 7实 现[ M] . 北京 电子工业出版社, 2 0 0 8 . [ 7 ] 韩力群 , 人工神经网络理论设计及应用 [ M] . 北京化 学工业 出版社 , 2 0 0 2 . [ 8 ] 程伟 , 张燕平 , 赵 姝. 支持 向量机 在粮食 产量 预测 中的 应用[ J ] . 安徽农业科学, 2 0 0 9 , 3 7 8 3 3 4 7 - 3 3 4 8 . 责任编辑 张新 宝 海 油工程两 自升式钻 井平 台同时下水 中国石油新闻中心 [ 2 0 1 0 - 0 5 1 7 0 9 4 7 ] 5月 1 1 13, 海洋石油工程股份有 限公司 下称海油工程 总承包的 2 0 0英尺 自升式钻井平台海洋石 油 9 2 1 、 9 2 2下水 庆典在海油工程青 岛场地举行 , 这标志着海油工程在特种船舶建造领域已形成 自己的核心竞 争力. 海油工程总承包的 2 0 0英尺 自升式钻井平台共有 4座 , 除两平台已下水 , 另两座正在加紧建造 中. 这批 钻井平 台均为三角形结构 , 最大作业水深 6 0 . 9米 , 最大钻井深度可达 6 0 0 0米. 项 目于 2 0 0 8年 1 0月在青 岛 场地开工建造, 预计今年 8 月全部建造完工并交付使用. 总包 4 条该类钻井平台项 目对海油工程是一次全新 的挑战, 4 座钻井平台在一家场地几乎同时开工建造, 目前在国内也没有先例. 海油工程 自主创新, 探索出了 适合自身特色的运作模式, 克服了平台内部布局紧凑 、 作业空问狭小、 设计施工精度要求高等困难, 保障了项 目安全 、 优质运行. h t t p / /n e ws . c n pc . C O B. e r r / s y s t e m/ 2 01 0 /0 5 /1 7 / 0 01 2 8 9 0 9 5.s h t ml