钻井工程信息化的数据透视技术.pdf
石 油机械 C I t I N A P E T R O L E U M M A C H I N E R Y 2 0 1 0年第 3 8卷第 1 2期 钻 井新技术 钻 井工程信息化 的数 据透视技术 纪荣艺 。 樊洪海 周英操 刘 鹏 1 .中国石油大学 北京 2 .中国石油集 团钻井工程技 术研 究院 摘要 在钻井工程信息化中,还没有出现直观的、便 于现场使用 的数据挖掘或深层数据分析 软件 ,而数据透视技术能够实现快速 的交叉 汇总,通过 一系列简单操作来表达用户的统计需要, 形成在各种条件下的数据分析表格。介绍了钻井工程数据的结构特点、多层面的统计需求及数据 透视技术的概念。阐述 了多维数据透视技术的实现过程。在钻井工程数据处理过程 中的应用表明, 数据透视技术可为钻井设计和施工提供数据参考,为油 田区块 的特征分析提供数据支持,为集 团 公司的决策提供数据依据。 关键词 钻井工程 信息化 数据透视技术 钻井数据库 数据挖掘 随着钻井- _[ 程信息化的推广 ,越来越多的生产 管理数据 、现场实时数据和工具规格数据等被采集 到钻井数据库 中,以便对数据进一步挖掘,最终形 成能为下一步决策提供支持的成果。但 目前还没有 出现直观的、便于现场使用的数据挖掘或深层数据 分析软件 ,而数据透视技术能实现快速的交叉汇总, 通过一系列简单操作来表达用户的统计需要 ,形成 在各种条件下的数据分析表格 ,满足钻井工程 中钻 前设计 、钻时监测和钻后分析的数据处理需求。 1 钻 井工程数据 1 . 1 结构 特点 钻井数据库巾多为层次表 ,即以井信息表为根 , 通过建立外键逐级关联,不断细化所描述 的对象。 例如 ,对于钻头喷嘴的描述,从逻辑上看 ,某一 口 井可能包含若干个井眼,在对某个井眼的施工 中, 可能使用若干个钻头 ,而每个钻头又可能具备若干 个喷嘴,因此有如图 1 所示的关联关系数据结构。 类似的结构也同样出现在钻具组合、固井注水 泥和钻井液 1 .性能等数据表 中,这些层次递进 的 井数据描述表在钻井数据库中占大多数 ,只是层次 的深度不 同而 已。整 个钻井数据库大致 为广度较 大 、深度不多于 6层的树形结构 。 井 信息表 ID Z 井 眼 信 息 表 钻 头 使 用 情 况 喷 嘴 井 号 ID ID ‘Z ID 油 田名称 井信息表 1 D 井眼信息表 I D 钻头使用情况I D 所 在国 家 井眼名 称 钻头序 号 喷 嘴序号 区块 主井 眼 名称 钻头尺 寸 流道 的长度 井 型 设计 起始井 深 钻头型 号 喷嘴直径 钻头 类别 井别 喷 嘴个数 图 1 井一 井眼一 钻 头一 喷嘴数据表层 次关 系 1 . 2多层面统计需求 在钻井丁程 中,对数据的统计分析是 多层次 、 多 目标的 ,主要表现为不同的管理层面在统计分析 需求上的差异性。如果暂时忽略甲乙方体制造成的 差异 ,这些层面有钻井现场层面 、油 田区块层面和 集团公司层面。如果是海外区块 ,还可能存在事业 部 层面 。 1 . 2 . 1 钻 井现 场层 面 在现场层面上 ,班报 日报一类时效分析统计是 必须 的,此外还有钻进参数 、钻具组合等技术性统 计分析。这些统计分析常有较强的实时性 ,使用 的 数据粒度一般也 比较细,但 主要对本井进行统计, 偶尔会涉及到邻井数据的对比 j 。表 1 所示的钻井 月志就是这类现场统计分析的典型 。 基金项 目国家科技重大 专项 “ 大 型油气 田及煤层气开发 ”之课题 2 1 6 “ 钻井丁程设计和丁艺软件 ” 2 0 0 8 Z X 0 5 0 2 1 0 0 6 。 2 0 1 0年 第 3 8卷 第 1 2期 纪荣艺等 钻 井工程信 息化 的数据透视技 术 表 1 钻井月志 ⋯ 学 鬻 ⋯ r } 1 . 2 . 2 油田区块层面 仅从统观的角度来做数据分析。当然 ,对一些重点 从各油田区块的层面上看 ,数据的统计主要是 井也会有较详细的单井汇总。表 2是油田区块层面 针对本油 田的多角度汇总,反映一段时期内本油田 汇总的一个例子 。 的钻井工作进展 。目的除了掌握油 田开发的动态情 1 . 2 . 3 集 团公司层面 况外 ,还肩负着 向集 团公司汇报 的职责 。因此 , 在集 团公司层 面,统计分析更多是为了对全局 在这个层面上的汇总统计多数会忽略数据明细 ,而 的把握 ,以期为今后的部署或调整提供参考。这类 表 2 油 田区块生产数据汇总 序 号井 号 营 筠音 籍音 荔葬 m篡 篙 d荔 , 蔷 喜 蛊 攀 襄 皋 , 统计包括全年探井完成情况 、多年开发井纯钻时效 井数和各个油 田总进尺 等多种 比较。如表 3所示 对 比、深井平均井深指数对 比、年度各油 田水平井 摘 自勘探与生产年度钻井报告 。 表 3 集团公司 2 0 0 8 --2 0 0 9年度 生产数据 汇总对比 2 数据透视技术 以上所述的钻井工程数据结构已具备多维数据 集的特点 ,即按 明细数据级别组织数据 ,且与用户 分析数据时使用 的分类相 同。这种组织方法使得数 据透视技术 的应用成为可能 ,而且更容易显示较高 级别的汇总数据及不同重点井的明细数据 。 首先需要 了解联 机分析处理 O L A P ,它是 一 种组织大型企业数据库的方法 ,也是数据挖掘中 不可或缺的一环。O L A P数据可设置为适应用户分 析和管理数据的方式 ,这样只要花较少的时间和精 力就可找到所需信息。 维是将一类数据组织到具有明细数据级别的分 层结构中的字段。包含 O L A P数据的数据结构 ,按 维和数据字段进行组织 ,则称为多维数据集 。多维 数据集是一个数据集合 ,通常从数据仓库的子集构 造 ,并组织和汇总成一个 由一组维度和度量值定义 的多维结构。例如钻头喷嘴数据结构,它可以逐级 提供越来越详细的数据,形成井 、井眼 、钻头和喷 嘴 4个级别 ,既可以高层汇总又可 以关注明细。 在对多维数据的统计分析中,传统的 S Q L查询 语言具有很大的局限性。一般的 S Q L语句查询方式 虽然也可以通过 G r o u p B y 来进行分组统计 J ,但如 果要对多维数据进行处理 ,形成一个既有小计又有 总计的交叉汇总报表 ,就显得有些力不从心 了。这 时采用数据透视技术是非常恰当的解决方案。 数据透视技术能够动态地生成交互性很强的汇 总表格。生成 的数据透视表 P i v o t T a b l e 可 以随 意变化其版面布局 ,通过拖动方式重排行区域 、列 区域和数据区域上的字段 ,可以方便地按照不同的 方式来分析数据 ,且在每次版 面布局发生变化时 , 数据透视表将即时按照新布局重新计算数据。在原 始数据变动时 ,数据透视表也能够 自动更新 ,以反 映新 的汇总或 明细数据 - o 。 3 多维数据透视技术的实现 Mi c r o s o f t O ffic e We b C o mp o n e n t s是 一 套 伴 随 Mi c r o s o ft O f f i c e 提供的包 含电子表格 、数据透视 表 石 油机械 2 0 1 0年第 3 8卷第 1 2期 和数据透视 功能的工具集。它 以 C O M组件的方 式存存 ,l【 J I 以脱 离 Mi e r o s o ft O f f i c e单独 安装 并运 行 。其中数据透视表可以查看和组织数据清单或数 据库中的数据 、查找信息或明细数据 以及创建个人 汇总并生成报表。 3 . 1 建立 数据 连接 与数据 源 在软件巾实现数据透视技术 ,首先需要引用控 件 Mi c r o s o f t O f f i c e We b C o mp o n e n t s ,建立数据连接 和数据源。如果采用 Mi c r o s o ft S Q L S e r v e r 作为数据 库服务器 ,则数据连接可以模仿如下格式建立 P i v o t Ta b l e 1 . C l 1 n e c t i 0 nS t r i n g “ Pr o v i d e r S Q L O L E D B . 1 ;U s m ’ I Ds a ;P a s s w o r dp w d ;P e r s i s t S e c u r i t y I n fi Tr u e; Da t a S o u r c e.; I n i t i a l Ca t a l o gDr i l l DB’ ’ 数据源的构建可以直接引用数据表或者建立视 图来实现 ,后者具有更大的灵活性。通过建立以下 视图可以将从井到喷嘴的各级数据表关联起来。 S E L E C T d r 喷嘴 . ,d r 钻头使 用情况 . , 井 眼 . ,井 . F R O M d r 喷 嘴 I N N E R J O I N d r钻 头 使 用 情 况 O N d r喷 嘴 .d r B i t U s e S i t u a t i o n I Dd r 钻头使用情况 . I D I N N E R J O I N井眼 O N d r 钻头使用情况 . H o l e I D 井 眼 . I D I N N E R J O I N井 O N井眼 . We l l I D井 . I D 采用类似方法可以建立视图或多维数据透视表 所需要的数据源。当数据源绑定 到 P i v o t T a b l e控件 后就基本可以进行查询或汇总操作了。 3 . 2 自定义显示布局 完成上述工作后 ,就可以定义数据透视表的基 本显示版式 ,预定义的版式能够帮助用户迅速实现 目标分析。例如很 多数据 表都和“ 井眼名称”关 联 ,通过 “ 井眼名称” 筛选来指定需要 统计 分析 的范同,那么就可 以预先将 “ 井 眼名称” 置于筛 选字段 域 。通过以下语句可以实现 Pi v o t Ta b l e 1 .Ac t i v e Vi e w.F i he r Ax i s . I n s e r t Fi e l d S e t P i v o t T a b l e 1 . A c t i v e V i e w . F i e l d S e t s“ 井眼名称” 为了更直观地说明数据透视技术的应用 ,可在 以上列举 的钻头喷嘴数据上虚构一种统计需求 数 据库中所有井使用 的钻 头情况 下人井深 、起 出 井深 、进尺 、钻头生产厂家 、入井新度 、出井新度 和层位 ,并汇总出每个钻头上的喷嘴平均直径。 尽管这样的统计需求并不常见,但仍可 以通过 拖动字段的方式很快地完成汇总。大致操作为 ① 选择需要汇总的喷嘴数据表 ;②从 出现的字段列表 中依次将各个 字段拖放 到列 区域 行 区域亦可 , 关闭不必要的分类汇总 ,设置好显示格式,必要时 转换数据单位 ;③将钻头直径拖放到数据区域,并 选择 自动计算平均值 ;④ 隐藏明细数据 ,保存最后 的汇总结果。图 2为生成 的数据透视表。 图 2 类似地,可以将多个字段置于行 区域 、 和数据区域上 ,形成基本数据透视表结构。 3 . 3 保存布局为模板 生成的数据 透视表 局部 列区域 比例。 当数据透视 图版面布局完毕 ,生成所需 的统计 分析表后 ,保存为统计模板 ,以后的报表生成就无 需再重新拖动 ,只需要刷新 即可,或者可以在原模 板 的基础 衍生 。 数据透视冈的生成与数据透视表具有类似的操 作 ,只是展现的方式不 同而 已。图 3为利用数据透 视 来统汁钻若干 L I 井所使用 的钻头生产 厂家的 图3 生成的数据透视图 局部 2 0 1 0年 第 3 8卷第 1 2期 纪荣艺等 钻井工程信息化的数据透视技术 4 应用 实例 针对前面所述的钻井工程多层面统计需求 ,下 面将采用数据透视技术逐一说明如何满足这些需求 。 黝 l 黪 甜{ 确 ; 蘩 i 表 1的钻井月志是钻井井史的必要组成部分 , 它一般在钻井 日志的基础上统计得到。通过引用最 基本的班报 明细数 据表,加 以必要 的 S Q L查询形 成 日志视图,就可以在 日志视 图的基础上生成 图4 的钻井月志汇总。 图 4 钻 井月志汇总 局部 ,数据非真 实,只表达功 能的实现 表 2是从各油 田区块 的角度来分析数 据 的例 子 ,为了实现这一层面的需求 ,一般在井或井眼的 基础上做分析统计。依据 目前数据库中大庆油田的 井数据进行汇总后的结果见图 5 。 图 5油 田 区块 生产 数 据 汇 总 局 部 ,数 据 非 真 实 , 只 表 达 功 能 的 实 现 表 3是站在集团公司层面上的、对各个油 田区 块一定时期内的对 比图。它并未显示来 自井队现场 的明细数 据 ,但所有 的统计 又是基于这些 明细数 据 ,只是隐藏了细节。图 6演示了这一数据透视表 的生成 ,图 7则采用数据透视图的方式演示了各油 田在某段时间平均井深的对比。 舅 _ 一 ● 磊 \ 蛐轴 弹 榭 珊 十 十 睦 船 一十 ∞ 瞄脚d 端 赫 艚 ⋯ 十 嘲 m ml { 黼 2 . 一 1 n l 6 州 Ⅷ 4 1 2 1 2 , 1 { 1 ~.1 2 3 9 1 日 ⋯ L 1 7 2} l 一 ⋯ E 1 m ㈣l 】 5 I 图 6集 团公司 2 0 0 5 --2 0 0 7年度生产数据汇 总 对 比 数据 非真 实, 只表 达功 能的 实现 图 7 各油 田2 0 0 5 --2 0 0 7年度平均 井深对 比透 视 图 数据非真实, 只表达功能的实现 5 结束语 数据透视技术 以其直观方便为基本特征 ,将在 未来 的数据统计分析中占有重要的一席之地 ,它能 为钻井设计 、钻井施工提供强有力的数据参考 ,为 油 田区块 的特征分析提供数据支持,为集团公司的 决策提供数据依据。在今后的钻井知识库基础上 , 数据透视技术将是不可或缺的统计分析手段。 [ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ] 参考文献 S Y / T 5 3 l 3 2 0 0 6 钻井T程术语[ S ]. 2 0 0 6 . 钻井 手册 甲方 编写组. 钻井手册 甲方 [ M].北京 石油工业出版礼 ,1 9 9 0 . S Y / T 5 7 0 5 --1 9 9 5 石油T程数据库文件格式[ s ]. 1 9 95 . 王 同 良,王 汉 良,邹 衡 岳 .石 油 信 息 技 术 进 展 [ M]. 北京 石油工业 出版社 ,2 0 0 61 2 81 3 5 . S i l b e r s c h a t z A,K o a h H F,S u d a r s h a n S . 数据 库系统 概念[ M]. 2版 .杨冬青 ,译 .北京 机械T 业 出 版社 ,2 0 0 0 . 于守健 ,杨超 ,乐嘉 锦 .基 于数据透 视表 的多维 数据查询技术研究 [ J ].计算机应用与软件,2 0 0 5 42 32 5 . 第一作者简介 纪 荣艺 ,油气 井工程 博士 ,生于 1 9 7 4 年,现从事地层压力预测 、钻井信息工程研究工作。地址 1 0 0 1 9 5 北 京 市海 淀 区。 电话 0 1 0 5 2 7 8 1 7 4 6 。E m a i l j i r o n g y i d r i c n p c . c o i n . c n 。 收稿 日期 2 0 1 0 0 92 9 本文编辑丁莉萍