基于形式概念分析的煤矿事故本体构建.pdf
第 44 卷 第 5 期 2018年 5 月 工矿自动化 Industry and Mine Automation Vol. 44 No. 5 May 2018 文章编号671-251X 201805-0026-05 DOI 10. 13272/j. issn. 1671-251x. 2017120026 基于形式概念分析的煤矿事故本构建 朱佳S 王向前12 张宝隆S 刘敏1 1.安黴理工大学经济与管理学院, 安 黴 淮 南 232001 2. Post-doctoral Station of Management Science and Engineering’ Fudan University’ Shanghai 200433, China Abstract In order to solve problems of management confusion and linkage lack of coal mine accident knowledge’ a coal mine accident ontology based on al concept analysis was constructed. Firstly’ al contexts are separately constructed based on thesaurus and text set of coal mine’ and al context of heterogeneous resources is obtained through apposition-overlap operation. Then the al context is converted to concept lattice by use of concept lattice construction tool. Finally’ concept’ attribute and instance are extracted from the concept lattice to coal mine accident ontology. The coal mine accident ontology can organize and ally express coal mine accident knowledge, and realize sharing and reuse of coal mine accident knowledge’ so as to provide help for coal mine safety warning. Key words coal mine safety warning; coal mine accident; coal mine accident knowledge; ontology; al concept analysis n 产 。但煤矿企业没有统一的标准来规范监控系统中 0 引 的煤矿事故知识, 导致监控系统得到的海量数据共 中国大多数煤矿企业已经对瓦斯、 水灾、 火灾等 享不足、 利用率低[1], 煤矿事故知识管理混乱、 联动 煤矿事故进行自动化监控, 有效保障了煤矿安全生 不足。本体是共享概念模型明确的形式化规范说 收稿日期 2017-12-11;修回日期 2018-04-15;责任编辑 盛男。 基金项目 国家自然科学基金资助项目( 51474007。 作者筒介 朱佳( 1M 94 女 , 安徽六安人, 硕士研究生, 主要研究方向为领域本体构建、 数据挖掘, E-mail91746203qq com。 引用格式 朱 佳 , 王向前, 张宝隆, 等.基于形式概念分析的煤矿事故本体构建[J].工矿自动化, 2018, 4456-30. ZHU JiaWANG Xiangqian,ZHANG Baolonget al. Construction of coal mine accident ontology based on al concept analysis [J]. Industry and Mine Automation,2018,445 ; 26-30. 2 0 1 8 年 第 5 期 朱 佳 等 基 于 形 式 概 念 分 析 的 煤 矿 事 故 本 体 构 建 27 明[2], 可对知识进行规范化、 系统化的组织和表示, 实现知识的共享和重用。孟现飞[3]利用本体构建了 煤矿事故预警知识库, 可提高安全预警的准确率; 马 莉) ]构建了煤矿事故应急预案本体, 可辅助应急救 援人员快速、 准确地做出应急决策; 支向阳等) ]构建 了瓦斯灾害预警本体, 可利用本体的语义推理实现 瓦斯预警, 提高了瓦斯预警的准确率;药慧婷等) ]通 过研究掘进工作面的生产方式, 构建了掘进工作面 本体, 可为智能决策系统提供帮助。但上述本体大 多是利用人工构建, 工作量大且易受开发者主观影 响。鉴此, 本文采用形式概念分析( alConcept Analysis, FCA方法构建煤矿事故本体, 可半自动 挖掘出隐含的概念及概念之间隐含的层次关系, 大 大降低工作量和开发者的主观影响, 为煤矿安全生 产信息化发展提供支持和帮助。 1 FCA F C A 由 Wille]在 1982年提出, 其作用是运用 数学模式进行概念的挖掘、 排 序 和表示。在 FCA 中, 所有属于某个概念的对象集合叫做概念的外延, 所有属于这个概念的对象的公共属性集合叫做概念 的内涵。根据内涵和外延的确定, 可利用二元关系 表达出所有的概念及概念间关系, 并从中提取出概 念层次关系概念格) ]。关于形式背景的主要定 义如下 定 义 1形式背景 K 是由对象集合G 、 属性集 合 M 及对象集合G 与属性集合M 之间的二元关系 7 组成的, K G , M ,) 。( 尽, ™ 了 或 表 示 对 象 尽 具 有 属 性 ™。 定 义 2假 设 集 合 X 是对象集合G 的一个子 集 , 则 X 中所有对象公共属性的集合为 f X {m M| g X,glm } 相应地, 设集合y 是属性集合m的一个子集, 则具有y 中所有属性的对象的集合为 gY {g G \ m y,glm} 定 义 3若 X i, y , (x2, y 是任意形式背景 的 2 个概念, 且 Xi X , 则可认为( X i, y 是 (x2, y 2的 子 概 念 , 并 记 为 ( 兄 , 1 , , 关系 表示概念的序层次, 简称为序。形式背景中所 有用 层 组 的 集合 为 。 2基 于 FC A 的本体构建流程 本文提取煤矿领域两大主要数据资源主题 词表和文本集中的基本知识构建本体, 相比于利用 单一数据源构建本体, 这样可获取更多的概念和关 系。由于主题词表和文本集存在根本上的差异, 在 煤矿事故本体构建中需要融合这2 种资源。基于 F C A 的煤矿事故本体构建流程 1 搜集煤矿领域经典且完备的主题词表, 参 照煤矿主题词表中独特的属( S、参 ( C、分 ( F 、代 D、族Z等 , 从中全面地提取有关煤矿事故的概 念与概念间关系等, 然后对其进行形式化处理, 生成 基于主题 的形 。 2 选取一些关于煤矿领域的文本集,然后对 文本集中的文献进行自然语言处理, 再根据主题词 中的 从中 可作为 象 属 的基 本概念, 最后形式化构建基于文本集的形式背景。 3 将构建的2 种煤矿事故知识的形式背景进 行并叠置处理, 再运用概念格工具构造基于异构资 的。 基于异 资 的 本 映射, 生成基于异构资源的煤矿事故本体) 12]。 3煤矿事故本体构建 3.1 异构资源的形式背景处理 本文选择 煤炭科技文献检索词典 和 中国分 类主题词表 作为基础数据来源, 选取的部分煤矿事 故主题词表见表1。 表表1部分煤矿事故主题词表部分煤矿事故主题词表 Table 1 Part thesaurus of coal mine accident 参照项煤矿事故[0701] D 矿井事故 矿山事故 爆破事故 机电事故 冒顶事故 F煤尘爆炸事故 煤岩突出事故 瓦斯爆炸事故 煤与瓦斯突出事故 从主题词表中选取有关煤矿事故的核心概念及 主题 有的 间关系 形 化 作为以具体煤矿事故为形式对象, 以该煤矿事故所 属类别为形式属性, 即可得到基于主题词表的形式 见 2。 根据 煤炭科技文献检索词典 中的相关概念, 选取一些有关煤矿事故的文献, 从文献中抽取摘要 28 工 矿 自 动 化2 0 1 8 年 第 4 4 卷 表表2基于主题词表的形式背景基于主题词表的形式背景 Table 2 al context based on thesaurus 属性属性 矿山水灾矿山水灾矿山矿山 灾灾矿事故矿事故 瓦斯爆炸事故瓦斯爆炸事故 * 煤尘爆炸事故煤尘爆炸事故 * 透水透水* 突水突水* 内因火灾内因火灾* 和题目形成文本集。由于纯文本属于非结构化数 据 , 在进行形式背景提取时, 首先需要对文本集数据 进行自然语言处理。本文使用汉语词法分析系统 ICTCLAS对煤矿事故文本集进行切词处理, 得到 一些带有词性的数据集, 经过切词处理后的数据集 还需要过滤停用词, 如“ 的” 、 “ 了” 等[10]。然 后 , 根据 汉语的语法特性从数据集中提取核心名词、 动词和 宾语等。最后, 将提取的核心名词作为形式对象, 将 所有语句中与该核心名词对应的宾语作为形容该对 象的形式属性, 这样就可得到基于文本集的形式背 景 , 见 表 3。 表表3基于文本集的形式背景基于文本集的形式背景 Table 3 al context based on text set 属性属性 矿事故矿事故破坏生产环境破坏生产环境产生有害气体产生有害气体突发性强突发性强火源明显火源明显事故事故 发发 瓦斯爆炸事故瓦斯爆炸事故****** 爆炸事故爆炸事故***** 岩尘危害岩尘危害* 煤与瓦斯突出事故煤与瓦斯突出事故***** 透水透水** 突突*** 内灾内灾*** 煤矿事故复杂多样, 涉及内容较多, 因此需要集 合多种数据源的信息。煤矿事故主题词表与文本集 在结构与属性等方面区别极大, 利 用 这 2 种不同结 构的数据资源构建的本体各有优缺点 主题词表容 易确定概念之间结构关系, 但主题词表中语义与属 性都不够丰富; 文本集中具有大量的概念和概念关 系 , 但不容易提取。若单独以其中一种结构的数据 资源为基础去构建本体, 得到的本体都是不完善的, 因此, 需要在煤矿事故本体构建过程中融合异构资 源) 3]。利用并叠置运算融合异构资源的主要步骤 1依照 煤炭科技文献检索词典 和 中国分 类主题词表 , 得到基于主题词表的形式背景Ki 〇1, ]1,1, 其 中 61, ]1, 71分别为基于主题词表 的对象集合、 属 性 集 合 及 G i 与 M 之间的二元 关系。 “ 对文本集中的内容进行自然语言处理, 针 核心 象 属 基于文 本集 的 形 式背景K 2 G2, M2,2, 其 中 G2, M2,2 分别为基 于文本集的对象集合、 属性集合及G2 与 M2 之间的 二 关系 。 “ 因为 K 1 G1, M1, J1 和 K 2 G2, M2, 满足 G1 G , G2 G , M1 M , M2 M , 即 和 K 2 属于同域形式背景, 可对其进行并叠置运算, 获 得合并后的形式背景G UG2, M UM2,1 U 2。 利用并叠置运算获得异构资源的形式背景, 见 4。 3. 2 概念格构造 形式背景过多会使概念格的结构过于复杂, 可 对其进行适当约简, 从而实现有效信息的提取和完 整概念格的简单构建。根据文献[14]的方法进行约 简 , 利用概念格构造工具Concept Explorer 1. 3,输 人约简后的形式背景, 即可得到基于形式背景的概 念格。Hasse图是一种概念格描述工具, 可实现概 念 及 其 层 次 关 系 的 可 视 化 。根 据 表 4 得到基于 Hasse图的概念格, 如 图 1 所示, 其中每个节点代表 一个概念, 且每个概念节点的属性为与其连接的所 有上级概念节点属性的集合, 每个概念节点的对象 为与其连接的所有下级概念节点对象的集合。利用 形式背景构建概念格的过程就是将各种概念聚类的 。 3.3 本体生成 先对概念格进行处理命名顶端概念节点、 标注 2 0 1 8 年 第 5 期 朱 佳 等 基 于 形 式 概 念 分 析 的 煤 矿 事 故 本 体 构 建 29 表表4并叠置后的形式背景并叠置后的形式背景 Table 4 al context after apposition-overlap operation 对象对象 属性属性 矿山水灾矿山水灾 矿山火灾矿山火灾 煤矿事故煤矿事故破坏生破坏生 生有害生有害 突发突发明显明显事故事故 发发 瓦斯爆炸事故瓦斯爆炸事故** **** 煤尘爆炸事故煤尘爆炸事故***** 岩尘危害岩尘危害* 煤与瓦斯突出事故煤与瓦斯突出事故***** 透水透水* ** 突水突水**** 内因火灾内因火灾*** * 中间概念节点、 删除底端概念节点。再对处理过的 概念格进行转换 将概念节点关系转换为概念与概 念间的关系; 概念节点的属性转换成本体的数据属 性;对象转换成本体概念的实例。 利用概念格构建本体的具体步骤首先, 将概念 格中顶端概念节点抽取出来作为煤矿事故本体的一 级概念;然后点击顶端概念节点, 从概念格中找到与 其连接的所有概念节点, 根据这些概念节点的位置 及与顶端节点的连线情况, 挖掘出概念节点与顶端 节点之间的结构关系, 再根据对应的结构关系将这 些概念节点作为顶端节点的子类或相关类, 这样从 上往下依次挖掘完最后一个概念节点后即可得到所 有概念的基本结构关系[8*最后利用本体编辑工具 Pr〇 qgq 3 及 OWLWebOntologyLanguage, 网 络本 ) 对 由 FC A 得到的 、 属 实例等 进行构建[15*, 得到煤矿事故本体, 如 图 2 所示。 图图2煤矿事故本体煤矿事故本体 Fig. 2 Coal mine accident ontology 4结语 首先, 从主题词表和文本集中抽取了煤矿事故 的一些基本对象和属性, 通过并叠置运算构成异构 资 源 的 形 式 背 景 ; 然 后 , 利 用 概 念 格 构 造 工 具 ConceptExplorer将形式背景构建为概念格; 最后, 利用本体编辑工具Proqgq对概念、 属性和实例进 行形式化的表达, 得 到 基 于 F C A 的煤矿事故本体。 该本体对煤矿事故知识进行了规范化、 系统化的组 织和表示, 方便煤矿安全管理人员集成、 共享和重用 煤矿事故知识, 且可为煤矿安全预警提供帮助。然 而 , 在煤矿事故本体构建过程中仍存在一些不足 由 于收集到的煤矿事故概念的数 少 , 隐藏的 关系 不 全 , 建的本 有 定的局限性, 影响本体的实用性; F C A 虽然可降低 本体构建的工作量, 但这种半自动化本体构建方法 仍比较费时费力。因此, 搜集更多的文本资料、 挖掘 30 工 矿 自 动 化2 0 1 8 年 第 4 4 卷 更多的有效信息, 以完善本体的概念、 属性和实例 等 , 以及本体的自动化构建将是下一步研究的重点。 参 考 文 献 ((References 1 *郭华郭华.煤矿瓦斯监控系统的本体模型研究煤矿瓦斯监控系统的本体模型研究[D ].太 原 太 原 太原科技大学,太原科技大学,2014. [ 2 ] STUDERR,BENJAMINS 6 R ,FENSEL D. Knowledge engineering principles and m ethods]. Data and Knowledge Engineering,,1998, 25 1 /2 161-197. [3 ]孟现飞孟现飞.基于本体的煤矿事故预警知识库模型及其应基于本体的煤矿事故预警知识库模型及其应 用用[D ].徐州 中国矿业大学,徐州 中国矿业大学,2014. [ 4]马莉马莉.本体的煤矿数字化应急预案系统研究本体的煤矿数字化应急预案系统研究[J ].西安西安 科技大学学报,科技大学学报,2014,342 216-223. MA Li. Digitalized system of coalmine emergency plan based on ontology[J]. J ournal of Xian University of Science and Technology, 2014,342 216-223. [5 ]支向阳, 吕岳东, 陈立潮, 等支向阳, 吕岳东, 陈立潮, 等.基于本体的瓦斯灾害预基于本体的瓦斯灾害预 警 模 型 研 究警 模 型 研 究[ J ] .太 原 理 工 大 学 学 报 ,太 原 理 工 大 学 学 报 ,2010,41 4 388-391 ZHI Xiangyang, LYU Yuedong,CHEN Lichao,et al. Gas safety warning model based on ontology [ J]. Journal of Taiyuan University of Technology, 2010,, 414388-391. [6 ]药慧婷, 陈 立 潮 , 潘理虎.掘进工作面本体模型研究药慧婷, 陈 立 潮 , 潘理虎.掘进工作面本体模型研究 [J ].工矿自动化,工矿自动化,2015,,419 93-96. YAO Huiting,CHEN LichaoPAN Lihu. Research of ontology model of heading face[J]. Industry and Mine Automation,2015,419 93-96. [7 ] GANTER B, WILLE R. al concept analysis mathematical foundations [ M ] Berlin Springer- Verlag,1999. [ 8]刘萍 , 胡月红.基于刘萍 , 胡月红.基于F C A和关联规则的情报学本体构和关联规则的情报学本体构 建建[J ].现代图书情报技术,现代图书情报技术,2012234-40. LIU Ping HU Yuehong Development of domain ontology in ination science based on FCA and association rules[J]. New Technology of Library and Ination Service,20122 34-40. [ 9]张云中张云中.基于形式概念分析的领域本体构建方法研究基于形式概念分析的领域本体构建方法研究 [D ].长 春长 春吉林大学,吉林大学,2009. [ 0]滕广青, 毕强滕广青, 毕强.基于概念格的异构资源领域本体构建基于概念格的异构资源领域本体构建 研究研究[J ].现代图书情报技术,现代图书情报技术,201157-12. TENG Guangqing, BI Qiang. A study on domain ontology construction from heterogeneous resources based on concept lattice [J ]. New Technology of Library and Ination Service , 20115 7-12. [11] BENDAOUD R NAPOLI A TOUSSAINT Y 8 al concept analysis a unified framework for building and refining ontologies[M]. BerlinSpringer- Ver lag, 2008. [ 2] 孙利孙利.基 于 主 题 词 表 和基 于 主 题 词 表 和F C A的海事本体构建研究的海事本体构建研究 [D ].大 连 大连海事大学,大 连 大连海事大学,2010. [ 3] 韩道军, 甘 甜 , 叶曼曼, 等韩道军, 甘 甜 , 叶曼曼, 等.基于形式概念分析的本体基于形式概念分析的本体 构 建 方 法 研 究构 建 方 法 研 究[ J ] .计 算 机 工 程 ,计 算 机 工 程 ,2016, 42 2 300-3068 HAN Daojun,, GAN Tian,, YE Manman,, et al. Research of ontology construction based on al concept analysis [J ]. Computer Engineering,, 2016,422300-306. [ 4] 杨 丽 , 徐 扬 .基 于 形式 背 景 的 概念 格 约 简 及其 修 复杨 丽 , 徐 扬 .基 于 形式 背 景 的 概念 格 约 简 及其 修 复 [J ].计算机工程,计算机工程,2008,34922-24. YANG Li XU Yang. Concept lattice reduction and reparation based on al context [J ]. Computer Engineering , 2008,349 22-24. [ 5] 邱 璇 , 李端明, 张智慧邱 璇 , 李端明, 张智慧.基 于基 于F C A和异构资源融合的和异构资源融合的 本 体 构 建 研 究本 体 构 建 研 究[ J ] .图 书 情 报 工 作 ,图 书 情 报 工 作 ,2015,,5 9 2 112-1178 QIU Xuan, LI Duanming, ZHANG Zhihui. Research on ontology construction based on FCA and heterogeneous resources integration [J]. Library and Ination Service , 2015,592112-117.