基于BP神经网络的石油运聚系数预测模型.pdf
第 3 2 卷第 6期 2 0 1 1 年 1 2月 新疆石油地质 XI NJ I ANG P E T R0L EU M GE0 L OGY Vo 1 . 3 2 . N o 6 De c . 2 0l l 基于 B P神经网络的石油运聚系数预测模型 吕 一 兵 , 张 涛- , 吕 修祥 1 .长江大学 信息与数学学院, 湖北 荆州 4 3 4 0 2 3 ; 2 . 中国石油大学 盆地与油藏研究中心, 北京 1 0 2 2 4 9 摘要 根据一系列石油运聚单元的解剖结果, 筛选 出影响石油运聚系数的主控地质因素。 建立了以主控地质因素为 输入 向量, 运聚系数为输出向量的 B P神经网络石油运聚系数预测模型。应用结果表明, 所建立的 B P神经网络模型 具有较好的预测效果, 平均相对误差为 1 0 . 8 9 %, 有效性指数达到9 2 . 5 1 %, 且运聚系数预测精度高于多元非线性回归 模型的预测。 关键词 运聚系数; B P神经网络; 模型; 预测 文章编号 1 0 0 1 3 8 7 3 2 0 1 1 0 6 0 6 5 3 0 3 中图分类号 T E l 6 ; T E l 9 文献标识码 A 1 石油运聚系数研究 回顾 石油运聚系数是计算资源量的关键参数, 影响因 素复杂, 如何取值一直是困扰石油地质工作者的棘手 问题 。 文献[ 1 ] 在国内外资料调研的基础上, 从东营凹陷 实际地质情况出发, 提出了采用多因素综合选取石油 运聚系数的方法。 该方法既考虑了研究区目前的勘探 程度 福克一 沃德法、 网格统计法 , 又考虑了成藏条件 及其匹配关系等影响石油运聚系数的地质因素 地质 综合分析法 。 但在实际应用中, 由于不同方法考虑的 因素不同, 导致不同方法求取的运聚系数存在较大的 差异闭 。 文献[ 2 , 3 ] 首先利用层次分析法建立油气运聚 单元 油气成藏体系 定量评价结构模型 , 然后根据 “ 三高” 勘探程度高、 地质认识程度高、 资源探明程度 高 原则选取刻度区, 利用生烃潜力法和油藏规模序 列法求取刻度区的油气聚集系数, 将各油气成藏体系 与刻度区进行类比, 进而求取相应油气成藏体系油气 聚集系数。值得指出的是, 在目前有关求取石油运聚 系数的方法中, 统计法已逐步引起研究者的兴趣。文 献[ 4 ] 在对松辽、 渤海湾、 鄂尔多斯、 塔里木、 准噶尔和 吐哈等盆地多个运聚单元解剖的基础上 , 研究 了运聚 单元石油聚集系数与主要地质参数之间的关系, 认为 石油运聚系数与有效烃源岩的年龄和成熟度、 圈闭的 发育程度以及上覆的区域不整合个数有关, 并采用多 元回归和逐步回归的统计方法, 建立了运聚单元石油 运聚系数与主要地质因素之间关系的统计模型。另 外 , 文献[ 5 ] 根据中国东部断陷盆地 1 5 个标准区的 石油运聚系数及其相关地质参数的统计数据, 通过对 运聚系数诸地质因素的相关性分析, 确定其主控地质 因素, 然后采用多元回归法建立了中国东部断陷盆地 石油运聚系数与其主控地质因素之间关系的统计模 型,从而减少了油气资源评价中人为因素的影响, 使 资源评价结果更为可靠。 然而, 在利用统计方法建立石油运聚系数与主控 因素之间关系的数学模型时, 不可避免地只能利用简 单函数 如幂函数、 指数函数等 来描述二者之间的关 系。由于石油的运聚过程是复杂和高度非线性的, 因 此仅仅利用简单函数来描述石油运聚系数与主控因 素之间的关系是不准确的。 由于神经网络具有处理复 杂非线性映射的能力, 因此本文考虑将神经网络引入 石油运聚系数预测问题中, 以期建立更加准确的石油 运聚系数预测模型。值得指出的是, 目前利用神经网 络研究石油运聚系数的报道并不多见。 2 石油运聚系数的主控地质因素 根据“ 三高” 原则, 在解剖运聚单元的基础上, 文 献[ 4 ] 选取分布在松辽盆地、 渤海湾盆地、 鄂尔多斯盆 地、 塔里木盆地、 准噶尔盆地和吐哈盆地的一系列油 气运聚单元,通过对选取的运聚单元的解剖认为, 石 油运聚系数与烃源岩年龄、 烃源岩的成熟度、 圈闭面 积系数以及区域不整合个数存在较为明显的相关关 系 表 1 。 因此在本文中选取上述 4 个因素为石油运 聚系数的主控地质因素。 3 B P神经网络模型建立 3 . 1 网络的学 习算法 B P B a c k P r o p a g a t io n 网络属于多层状型的人工 神经网络, 可视为一个从输入到输出的高度非线性映 射, 由输入层、 输出层和一个或若干个隐含层构成, 每 收稿 日期 2 0 1 l - 0 l o 4 修订日期 2 0 1 1 _ 0 3 2 4 基金项 目 国家自然科学基金项目 1 0 9 2 6 1 6 8 , 4 1 0 7 2 1 0 2 ; 国家专项 2 0 0 9 G Y x 0 2 _ 0 3 作者简介 吕一兵 1 9 7 9 一 , 男, 湖北钟祥人, 博士, 人工智能、 系统决策, T e 1 1 5 8 7 2 1 “3 8 9 6 9 E - m a i l L v y i b i n g __2 0 0 1 s o h u . c n m。 新疆石油地质 表 1 运聚单元解剖主要成果 援引自文献【 4 ] 虚 烃 源 岩 烃 源 岩 区 域 圈 闭 面 石 油 运 良 烃 源 岩 烃 源 岩 区 域 圈 闭 面 石 油 运 良 烃 源 岩 烃 源 岩 区 域 圈 闭 面石 油 运 焦 距 今 年 龄成 熟 度 不 整 合 积 系 数 聚 系 数 警距 今 年 龄成 熟 度 不 整 合 积 系 数 聚 系 数 距 今 年 龄 成 熟 度 不 整 合 积 系 数 聚 系 数 1 0 6 a % 个 % % 1 o 6 a % 个 % % 1 0 6 a % 个 % % 1 1 2 7 O.5 3 5 9 8 . 9 8 8 3 0 0 . 6 4 1 2 6 5 .9 3 1 5 2 2 0 0 . 9 2 4 0 5.7l 2 5 0 O . 8 l 2 7 7 . 3 4 9 5 2 O.6 8 1 5 7 l 2 . 2 6 l 6 l 8 0 0 . 9 3 5 0 8 . n 3 5 O 1 . 1 l 3 O 5 . 7 1 1 0 6 O 1 . 3 l 4 7 l 1 . 8 6 1 7 6 o 0 . 9 1 4 9 1 4. 9 0 4 5 0 1 .O 1 1 0 1 5 . 2 0 1 1 9 0 1 . 1 2 5 6 8 .o9 1 8 2 7 0 2 . 5 4 4 2 5 . 1 O 5 5 O 0. 8 l 3 O 5 . 1 O 1 2 9 0 0 . 9 2 7 7 8 . 8 8 l 9 2 6 0 0 . 9 7 3 2 7 2 .98 6 5 0 1 .0 1 3 O 1 0 . 1 2 1 3 9 0 0.9 3 2 4 6 .O2 2 0 5 5 0 2 . 5 6 1 5 1 .4 0 7 5 O n5 l 3 O 5 . 2 5 1 4 9 O 1 . 1 3 3 O 6 . o 3 21 5 5 0 2 . 5 6 1 5 0 . 8 7 一 层包含若干个神经元, 层与层之间的神经元通过连 接权重及阈值互连, 每层神经元的状态只影响下一层 的神经元状态, 同层的神经元之间没有联系 图 1 。 隐含层 图 1 B P网络拓 扑结构示意 B P 算法是基于信息正向传播和误差反向传播的 算法。对于输入信号, 先向前传播到隐含层, 经过作用 函数后, 再把隐含层的输出信息传播到输出层; 若输出 层得不到期望的输出, 则转入反向传播, 将误差沿原路 返回, 通过修正权值, 使误差达到最小。 3 . 2 网络设计 用于预测的B P神经网络模型的结构根据实际情 况而定。 本文 B P 神经网络的输入层神经元数目等于主 控地质因素的数目, 即4 个; 输出层对应于石油运聚系 数, 因此其神经元个数为 1 ; 关于隐层的设计 , 由于缺 乏理论指导, 根据经验将隐含层的神经元个数取 7 个。 据此, B P 神经网络的拓扑结构为4 x 7 x 1 . 另外, B P 神经 网络的学习率 A取为 0 . 2 , 系统误差 8 定为 0 .0 0 0 1 . 笔者选择表 1 的总共 2 1 个运聚单元中的 1 9 个作 为神经网络的训练样本, 对 B P神经网络进行训练。为 了检验 B P神经网络的预测效果, 选取 2 1 个运聚单元 中剩余的2 个运聚单元作为检验样本, 这两个运聚单元 的序号分别为 7 号和 1 2 号。为了判断训练后的 B P神 经网络的预测能力, 将用于训练的 1 9 个样本的参数输 入 B P 神经网络得到它们相应的石油运聚系数 表2 。 表 2 不同模型石油运聚系数预测结果与实际值的比较 % 椰 差 椰 搓 相 吴 差 实测值统计神经网统计神经网 粤f j - 实测值统计神经网统计神经网 实测值统计神经网统计神经网 。 模型络模型模型 络模型 模型络模型模型络模型 模型络模型模型 络模型 l 8 . 9 8 8 . 0 8 9 . 4 4 1 0.02 5 . 1 2 9 1 2 . 2 6 1 2 . 7 2 1 2.2 9 3 . 7 5 0 . 2 4 1 7 1 4.9 O l 0.91 1 3 .65 2 6 . 7 8 8_ 3 9 2 7 . 3 4 6.9 4 7 . 6 6 5 .45 4 . 3 6 1 0 1 1 . 8 6 l 1 .2 6 1 2. 8 6 5 . 0 6 8 . 4 3 1 8 5. 1 O 4 . 6 4 4. 7 7 9.0 2 6.4 7 3 5 . 7l 7 . 8l 6 .6 9 3 6 .78 1 7 . 1 6 1 1 8 . 0 9 1 0 . 6 7 7.O 5 31 . 8 9 1 2 . 8 6 l 9 2.9 8 2 .93 3 .95 1 . 6 8 3 2 . 5 5 4 1 5 . 2 0 5.0 2 1 5 . 1 O 6 6 . 9 7 0 . 6 6 1 3 6 . O 2 4.6 7 6.2 3 2 2 . 4 3 3 . 4 9 2 O 1 .4 0 0 . 8 6 1 . 2 3 3 8.6 0 1 2. 1 4 5 5 . 1 O 7.3 9 6 . 5 6 4 4. 9 O 2 8 . 6 3 1 4 6 . 0 3 5 . 5 O 5. 8 O 41 . 9 3 3 。 81 21 O.8 7 O . 8 6 1 .23 1 . 1 5 l 2. 1 4 6 1 0 . 1 2 7.67 6 . 6 4 2 4 . 2 l 3 4 . 3 9 1 5 5 . 7l 4.8 5 5 .0l l 5 . O 6 1 2 . 2 6 7 5.2 5 6 . 9 9 6 .42 3 3. 1 4 2 2. 2 9 8 5 . 9 3 7 .02 5 . 9 5 1 8 . 3 8 0 . 3 4 l 6 8 . 1 1 6 .0 8 8 . 1 O 2 5 . O 3 O . 1 2 1 2 8 I 8 8 1 6 . 0 4 9 . 1 4 8 0.6 3 2 .93 4 与统计预测模型的比较 为了进一步说明 B P神经网络预测模型的优越 性,作为比较,笔者将 B P 神经网络预测模型与文献 [ 4 ] 中的统计模型作比较。 事实上, 利用表 1 中的数据, 文献[ 4 ] 建立了石油运聚系数预测的统计模型, 其具体 的数学公式为 l n y 1 . 4 8 7 0 . 0 0 3 1 8 x l O . 1 8 6 x 2 - - 0 . 1 1 2 3 0 . 0 2 1 1 8 x 4 , 1 式中 一运聚单元石油运聚系数, %; 1 烃源岩年龄, 1 0 6 a ; 烃源岩成熟度, %; ,区域不整合个数; 圈闭面积系数, %. 利用 1 式 , 结合表 1 中的数据计算相关的石油 运聚系数, 具体的预测结果见表 2 . 由表 2 可知, 对于总共 2 1 个样本点, 利用 B P 神