DD2006-07地质数据质量检查与评价.pdf
中国地质调查局地质调查技术标准 中国地质调查局地质调查技术标准 DD2006-07 DD2006-07 地质数据质量检查与评价 地质数据质量检查与评价 中国地质调查局 2006 年 12 月2006 年 12 月 目 次 前言 ................................................................................. Ⅰ 引言 ................................................................................. Ⅱ 1 范围 ................................................................................ 1 2 规范性引用文件....................................................................... 1 3 术语和定义 .......................................................................... 1 4 总则 ................................................................................ 2 5 地质数据质量描述框架................................................................. 3 5.1 定量数据质量元素................................................................... 3 5.2 定性数据质量元素................................................................... 3 6 地质数据缺陷分级..................................................................... 4 7 地质数据质量检查..................................................................... 4 7.1 检查内容 .......................................................................... 4 7.2 检查方式与手段..................................................................... 4 7.3 检查方法 .......................................................................... 4 7.4 数据质量检查结果的记录............................................................. 5 7.5 数据质量检查结果的处理............................................................. 5 8 地质数据抽样......................................................................... 6 8.1 多图幅抽样......................................................................... 6 8.2 幅内抽样 .......................................................................... 7 8.3 基于属性的抽样..................................................................... 7 9 地质数据质量评价..................................................................... 7 9.1 质量评价规则....................................................................... 7 9.2 质量评分方法....................................................................... 8 10 数据质量报告....................................................................... 10 11 地质数据质量检查与评价流程和标准的应用............................................. 10 11.1 地质数据质量检查与评价流程....................................................... 10 11.2 地质数据质量检查与评价过程中标准的应用........................................... 10 附录 A(资料性附录)地质数据的缺陷分级 ................................................ 13 附录 B(资料性附录)地质数据抽样检查的相关概念 ........................................ 16 附录 C(规范性附录)地质数据抽样方案查找表 ............................................ 17 附录 D(资料性附录)地质数据抽样方法示例 .............................................. 23 附录 E(资料性附录)地质数据质量报告格式 .............................................. 24 附录 F(资料性附录)地质数据质量检查评价流程 .......................................... 27 参考文献 ............................................................................. 28 I 前 言 本标准在ISO 19113 地理信息 质量原理、ISO 19114 地理信息 质量检查评价规程、GB/T2828.1- 2003 计数抽样检验程序 第1部分 按接收质量限(AQL)检索的逐批检验计划、GB/T 18316 数字测 绘产品检查验收规定和质量评定 等有关标准的基础上,根据有关数据规范类文件编制的需要,结合地 质数据生产实际编制而成。 本标准附录C为规范性附录,附录A、附录B、附录D、附录E和附录F为资料性附录。 本标准由中国地质调查局提出。 本标准由中国地质调查局归口。 本标准起草单位中国地质调查局发展研究中心、山东省国土资源信息中心、吉林省地质调查院、 南京地质矿产研究所、同济大学、中国地质环境监测院。 本标准主要起草人姜作勤、李军、童小华、李景朝、肖志坚、刘冶兵、谢欢、陈辉、张振芳、向 运川。 II 引 言 作为一种战略资源与生产要素的信息 (数据) 资源, 其质量直接影响相关决策的正确性和使用价值。 调查结果表明,数据质量的问题是普遍的,造成的损失是巨大的。地质数据的生产、管理和服务是地质 工作的重要任务。 作为国家进行资源决策重要基础的地质数据同样面临着数据质量问题。 制定地质数据 质量检查与评价的通用标准, 使数据质量的检查与评价有章可循, 对于提高地质数据质量具有实际意义。 本标准根据ISO 19113和地质数据的特点,对现存地质数据质量元素进行了规范,增加了“图面整饰 的规范性”; 借鉴国际上广义数据质量的概念和描述框架, 在定性质量元素中增加了“适用性”, 并以GB/T 2828.1-2003计数调整型抽样方案为基础,结合ISO 19114提出了适合地质数据的抽样检查方法。 本标准为通用标准, 应用时应根据选择、 细化、 扩展或调整的原则解决具体数据集的检查评价问题。 1 地质数据质量检查与评价 1 范围 本标准规定了地质数据质量检查与评价所涉及的数据质量描述框架、缺陷分级、检查的方式、手段 和方法、质量评价规则、质量报告的内容与格式、地质数据质量检查与评价流程以及标准的应用原则。 本标准适用于地质数据产品规范编写、数据生产过程质量检查、数据产品质量检查、评价与验收等 不同阶段,其他数据的质量检查评价可参照执行。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。 凡是注日期的引用文件, 其随后所有的 修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 2828.1-2003 计数抽样检验程序 第1部分 按接收质量限(AQL)检索的逐批检验计划 GB/T 18316-2001 数字测绘产品检查验收规定和质量评定 ISO 19113 地理信息 质量原理(Geographic ination Quality principles) 3 术语和定义 下列术语和定义适用于本标准。 3.1 数据质量元素数据质量元素 data quality element 数据质量定量描述元素与定性描述元素的集合,可分为不同的级别。 3.2 定量数据质量元素定量数据质量元素 data quality quantitative element 定量描述数据集质量的部分。 按[ISO 19113 4.5]改写。 3.3 定性数据质量元素定性数据质量元素 data quality overview element 定性描述数据集质量的部分。 按[ISO 19113 4.8]改写。 3.4 个体个体 item 质量检查的基本单位。可以是图幅、实体或数据项。 3.5 总体总体 population 检查的全部个体。 3.6 检查批检查批 lot 由个体汇集起来进行抽样与检查的数据集,简称为批。 3.7 样本样本 sample 2 从检查批中抽取的用于检查的个体的全体。 3.8 缺陷缺陷 defect 质量特性不满足规定的要求。 3.9 不合格品不合格品 nonconing item 质量不满足规定要求的个体。 3.10 致命缺陷致命缺陷 the most serious defect 个体的极重要质量特性不符合规定, 或个体的质量特性极严重不符合规定, 以致不经返工处理不能 提供用户使用。 3.11 严重缺陷严重缺陷 the more serious defect 个体的重要质量特性不符合规定,或个体的质量特性严重不符合规定,对用户有重大影响。 3.12 重缺陷重缺陷 serious defect 个体的较重要质量特性不符合规定,或个体的质量特性较严重不符合规定,对用户有较大影响。 3.13 轻缺陷轻缺陷 light defect 个体的一般质量特性不符合规定,或个体的质量特性轻微不符合规定,对用户使用有轻微影响。 3.14 缺陷率缺陷率/不合格品率不合格品率 rate of defect/nonconing item 每百个个体包含的缺陷数/不合格品数。 3.15 接收质量限(接收质量限(AQL)) Acceptable Quality Level 可接受的批数据的最大缺陷率或不合格品率。 注AQL 是确定地质数据质量检查抽样方案的重要参数。 4 总则 4.1 地质数据质量检查与评价的标准 本标准中地质数据指以图形空间数据为主的数据、以属性数据为主的数据(包括点空间数据)、符 号化制图数据和格网数据(包括图像和扫描的栅格数据)等。 地质格网数据质量检查与评价按GB/T 18316的规定执行,其它地质数据质量检查与评价执行本标 准。 4.2 地质数据质量检查与验收的基本要求 4.2.1 地质数据检查的基本要求 按三级检查要求进行。 一级检查作业组自查、互检。要求 100 %的全面检查。 二级检查是在作业组自查、互检的基础上,由项目负责人或项目质检人员对作业组生产的数据进 行 100 %的全面检查。 三级检查是在二级检查的基础上,对作业组生产的数据进行的再一次检查。三级检查由生产单位 的质量管理部门或质检员负责,按抽样比例进行检查。 对每级检查或验收发现的问题应进行全面修改,并经复检通过后方可提交下一级检查或验收。 4.2.2 地质数据验收的基本要求 3 按二级验收要求进行。 一级验收指由数据的生产单位组织的验收。在抽样检查与评价的基础上给出验收结论和质量报告。 二级验收指由数据生产任务下达部门委托有关机构按照相关要求进行的验收。 二级验收一般采用概 查方式,只检查重点内容。在抽样检查与评价的基础上给出验收结论与质量报告。 5 地质数据质量描述框架 地质数据质量描述框架包括定量数据质量元素和定性数据质量元素。 数据质量元素是数据质量检查 与评价的基础,定量数据质量元素与定性数据质量元素决定描述数据质量的元数据元素。 5.1 定量数据质量元素 定量数据质量元素包括数据完整性、逻辑一致性、空间定位准确性、专题数据准确性和图形整饰规 范性等一级质量元素及相应的二级质量元素,其组成与描述见表 1。 表1 地质数据定量数据质量元素 一级质量元素一级质量元素 描描 述述 二级质量元素二级质量元素 描描 述述 多余 数据集中多余数据的程度,如多余图层、空间实体等 数据完整性 实体、实体属性 和实体关系的存 在或缺失 缺失 数据集中缺失数据的程度,如缺失图层、空间实体等 概念一致性 与结构设计的符合程度,如与数据库结构设计的符合程度 值域一致性 值对值域的符合程度,如与其他值域关系的一致性等 格式一致性 数据存储同数据集的物理结构匹配程度,如数据文件命名或 数据格式等 逻辑一致性 数据结构、属性 及关系的逻辑规 则的一致性程度 拓扑一致性 拓扑特征的准确度,如多边形封闭、结点关系正确等 数学基础精度 图廓点、坐标网交点、控制点坐标等的准确程度,平面坐标 系和高程基准选择,及其参数设置和地图投影的正确性 校正精度 校正控制点数目与分布的合理性,校正后数据符合精度要求 空间定位 准确度 空间实体位置 的准确度 采集精度 空间实体位置与可以接受的值或真值的符合程度,如扫描和 矢量化精度,以及点空间数据位置的准确度等 分类的正确性 实体及其属性分类与真值或参考数据集的符合程度 定性属性 正确性 如岩性描述的正确性 专题数据 准确性 定量属性的准确 度、定性属性以 及实体及其属性 分类的正确性 定量属性 准确度 如数据值的正确性 符号规范性 符号正确、定位准确、表示合理,符号与符号以及符号与其 它图元压盖关系合理 线划规范性 线型设置正确、线划光滑、符合要求 用色规范性 符合相关专业的色系标准或规范 网纹与花纹 规范性 网纹类型、颜色、高度、宽度和透明系数等是否正确 图面结构合理性图廓内容整饰符合有关标准或规定,图面结构合理,美观 图面整饰 规范性 图面颜色、花纹、 符号、线型的设 置,以及图名、 图号、图例、附 图、镶图等配置 的规范性 注记规范性 注记正确、可读,参数和界限关系应合理 5.2 定性数据质量元素 定性数据质量元素是对数据质量的间接描述,包括数据生产的目的、适应性、用途和数据志等。地 4 质数据的定性数据质量元素的组成及其描述见表 2。 数据的使用者可通过定性数据质量元素间接评价所需数据的质量。 表2 地质数据定性数据质量元素 一级质量元素一级质量元素 描描 述述 二级质量元素二级质量元素 描描 述述 目的 生成数据集的原因及其预期 用途 可提供数据格式的种类 适用性 满足用户要求的能力 易操作性 用途 说明数据集已经实现的应用 数据源的状态 生成数据集的原始资料完 成的时间、介质、质量 数据志 数据集的历史。描述数据源 以及从数据源到数据集当前 状态的过程 处理步骤或历史信息 描述在数据集演变过程中 的事件或变化 6 地质数据缺陷分级 缺陷指个体的任何一个质量特性不符合规定的要求。地质数据的缺陷分为六级,即致命缺陷、严重 缺陷、 重缺陷、 次重缺陷、 轻缺陷和次轻缺陷。 以空间数据为主的地质数据、 以属性为主的地质数据 (包 括点空间数据)和地质制图数据的缺陷分级及不同级别缺陷的转换比例参见附录 A。 7 地质数据质量检查 7.1 检查内容 根据地质数据的定量数据质量元素及数据质量的特点确定的检查项,见表3。 7.2 检查方式与手段 地质数据质量的检查方式分为全检和抽检。 全检对批数据中的所有个体进行逐一检查。数据质量的一级、二级检查要求进行全检,某些重要 的数据在三级检查或验收阶段也可能要求全检。 抽检按照规定的抽样方案,采用适用的抽样方法从批数据中抽取部分个体作为样本进行检查。抽 检是用样本的质量判断批数据质量的一种方法,适用于质量比较稳定、数据量大、检查费用与时间有限 的情况。抽样检查的具体内容见第8章。 地质数据质量的检查手段包括软件自动检查、人机交互的计算机辅助检查和人工判别检查。 7.3 检查方法 数据质量的检查方法是对检查项实施检查的具体技术方法。 地质数据的检查通常以原始数据、 理论 数据和标准规范为依据。常用的检查方法有 a 屏幕显示检查通过计算机屏幕显示对数据进行检查。如图层的套合、数据和控制点采集、空 间实体的多余和缺失、误差校正等检查。它是数据质量检查中普遍采用的方法之一。 b 图、表打印输出检查图形打印输出主要用于检查图幅接边、形状再现、图层套合、地质实体 压盖、整饰效果等;表格输出用于检查属性数据。 c 关联检查将数据之间的逻辑关系可视化并判别其正确性的检查。主要用于空间数据与属性数 据、属性数据与属性数据或空间数据与空间数据之间的逻辑关系检查。 d 统计分析检查利用统计分析方法判断数据正确性的检查。主要用于属性数据的检查,如特异 数据检查(如地球化学、地球物理等)、数据取值范围和数据完整性检查。 e 理论计算检查检查内容主要包括数学基础精度、校正精度和通过计算获得的属性数据。如图 廓点、坐标网交点、控制点坐标、扫描或矢量化数据的校正精度等。 f 双机录入校对检查由两台计算机分别录入同一组数据,然后用计算机对录入数据进行比较, 对不同之处进行复查核实,确定错误数据。主要用于数值型数据的检查。 5 g 人工判别检查主要用于无法用计算机检查的内容,如数值或描述性属性的正确性。如果被检 查的数据在室内无法判断其正确性,可采用实地检查的方法。 地质数据的检查项及可能采用的检查手段和方法见表 3。 表3 地质数据质量的检查项和常用的检查手段与方法 一级质量元素一级质量元素 二级质量二级质量 元素元素 检查项检查项 检查 手段 检查 手段 检查方法检查方法 多余 数据文件、图层、实体、数据表、记录、注记 数据完整性 缺失 数据文件、图层、实体、数据表、记录、注记, 文档、说明文件,要求数据集的工作量 人工 自动 机助 屏幕显示检查、关 联检查、图、表打 印输出检查、人工 判别检查 概念一致性 数据库结构、数据表结构 值域一致性 数据项 格式一致性 数据格式(空间数据格式、属性数据格式等) , 文件名(图层名、数据文件名、文档文件名、字 段名等) 机助 自动 逻辑一致性 拓扑一致性 不同图层间共用界线一致性,多边形封闭性、结 点关系,线状实体交叉结点关系、有向线状实体 的方向 机助 自动 人工判别检查 关联检查 统计分析检查 数学基础 精度 图廓点、坐标网交点、控制点坐标,投影参数, 坐标系统,数据精度和采用的单位 自动 人工 理论计算检查 人工判别检查 校正精度 校正方法,校正控制点数目与分布 机助 自动 人工判别检查 理论计算检查 空间定位准确度 数据采集 精度 图形扫描精度分辨率、变形情况 矢量化精度采集点坐标、线坐标的空间位置误 差,线圆滑程度 自动 机助 人工 理论计算检查 人工判别检查 图、表打印输出检 查 分类的 正确性 实体及其属性分类与真值或参考数据集的符合 程度 定性属性 正确性 定性属性,如岩性描述 专题数据准确度 定量属性 准确度 定量属性,如数据值 人工 机助 统计分析检查 人工判别检查 双机录入校对检查 符号规范性 符号完整、定位准确、表示合理,符号与符号以 及符号与其它地物压盖关系 线划规范性 线型设置、线划圆滑、符合要求 用色规范性 符合相关专业的色系标准或规范 网纹与花纹 规范性 网纹类型、颜色、高度、宽度和透明系数等是否正 确 图面结构合理性 图廓内容整饰符合有关标准或规定, 图面结 构合理,美观 图面整饰规范性 注记规范性 注记正确、可读、参数和界线关系的合理性 人工 机助 人工判别检查 图、表打印输出检 查 7.4 数据质量检查结果的记录 数据质量检查的记录是地质数据质量检查过程中形成的原始记录凭证, 是评价产品质量和编写质量 报告的依据。检查记录表的格式参见表4。 7.5 数据质量检查结果的处理 a 致命缺陷的处理检查过程中,一旦发现致命缺陷,停止进一步检查,直接要求返工。 b 复核与复检 1)对合格数据中发现的所有问题,要求生产单位进行处理并对处理结果进行复核。 6 表4 数据质量检查记录表 数据产品名称 提交单位 数据集名称 一级质量 元素 检查项 检查方法 检查个体数 或抽样方案 缺陷描述 数据 完整性 需要特殊说明的问题如表示缺陷实际状态的屏幕截取图。 检查人 审核人 检查日期 注注 1数据产品可能由多个数据集组成,如 120 万地质图空间数据库产品由空间数据集、制图数据集和文档数据集组成; 注注 2常用检查方法列表01-屏幕显示检查;02-图表打印输出检查;03-关联检查;04-统计分析检查;05-理论计算检 查;06-双机录入校对检查;07-人工判别检查;08-其它。 2)对不合格的数据, 要求生产单位返工或重作并进行复检。 复检时应根据检查与评价结果调 整复检的内容及抽样方案。 3)确定复检抽样方案的规则质量优秀者放宽抽样,质量合格者正常抽样,不合格者加严抽 样。具体抽样方案见附录 C 的表 C.1。 4)复检后进行重新评价。 8 地质数据的抽样 地质数据常用的抽样分为三种多图幅抽样、幅内抽样和基于属性的抽样。地质数据抽样的相关概 念参见附录 B。 8.1 多图幅抽样 在批图幅数据中以图幅为个体的抽样,也称幅间抽样。 8.1.1 确定抽样方案 确定抽取的图幅数 n 和该批图幅数据的合格判定数 c 的步骤 a 1-8 幅采用专家判断法抽样。根据图幅以往检查结果和对图幅质量的要求,确定抽取的样本数 及合格判定数。 b 多于 8 幅的数据则按下述步骤确定抽样方案。 1) 确定 AQL,即该批数据可接受的最大不合格品率。 2) 从附录 C 的表 C.1 中查找与总图幅数 N 对应的样本图幅数 n。 3) 从附录 C 的表 C.2 中查找与 n、AQL 对应的合格判定数 c(图幅数) 。 8.1.2 确定抽样方法 多图幅抽样通常采用分层随机抽样方法抽取样本。分层的具体原则如下 7 a 当批数据由不同单位生产时,将每个单位生产的数据作为层(子总体) ,应保证每个单位的数据 都必须抽到,且各单位数据之间样本量分配比例基本上等同于子总体的比例。 b 当个体的复杂和重要程度不同时,可按以下三个原则进行分层抽样 1)内容简单的图幅基本不抽。 2)抽取单幅时,选择复杂程度或重要程度最高的图幅。 3)抽取两幅以上时,复杂(重要)与中等复杂(重要)程度抽取概率相同。 多图幅抽样方法的示例参见附录 D。 8.2 幅内抽样 以图幅为总体,以图元为个体的抽样。 8.2.1 确定抽样方案 确定抽取的图元数n和该图幅的合格判定数c的步骤 a 确定 AQL,即该图幅可接受的最大缺陷率。 b 从附录 C 的表 C.1 中查找与该图幅内的总图元数 N 对应的样本量 n。 c 从附录 C 的表 C.2 中查找与 n、AQL 对应的合格判定数 c(缺陷数) 。 8.2.2 确定抽样方法 考虑空间分布按专家判断法抽样。 实施过程确定样本量(图元数)n后,采用专家判断法,选择一个或多个空间区域抽取样本,直 到区域内的总图元数不小于n为止。 注当由软件来统计区域内的图元数时,应特别注意与边框相交的图元,不能遗漏和重复。 8.3 基于属性的抽样 以数据项为个体的抽样。为了保证抽样的合理性并降低复杂程度,采用整群抽样,即以实体(包括 点)为群抽取样本。 8.3.1 确定抽样方案 确定抽取的数据项群数 n 和该群的合格判定数 c 的步骤 a 确定 AQL,即该批数据可接受的最大缺陷率。 b 计算该批的总的数据项个数 N c 总项数 N=该批的总实体数 N1每个实体包含的数据项数 m。 d 根据总项数 N,从附录 C 的表 C.1 中查出对应的要检查的数据项数 n。 e 计算抽取的实体数(群数)n1 n1=nm,若 n 不为整数,则取整加 1。 f 在附录 C 的表 C.2 中查找与 n、AQL 对应的判定数 c(缺陷数) 。 8.3.2 确定抽样方法 采用简单随机或系统抽样的方法抽取群,即 n1 个实体的记录。系统抽样特别适合于依次编号的数 据。系统抽样的示例参见附录 D。 9 地质数据的质量评价 地质数据质量评价分为直接质量评价和间接质量评价。 直接质量评价是按照一定的规则与方法对质 量检查的结果进行评价并得出结论的过程。 间接质量评价主要依据外部知识, 通过定性数据质量元素的 内容判断数据质量。 9.1 质量评价规则 a 质量等级的划分规则采用优秀、良好、合格、不合格等四个级别表征地质数据质量水平。按 百分制的得分划分质量等级。S 为得分,数据质量等级的划分标准为 1)优秀 S≥90 分 2 良好 90>S≥75 分 8 3 合格 75>S≥60 分 4 不合格 S<60 分 b 数据集和数据产品合格的判定规则 1)多图幅地质制图数据集合格的判定规则在确定单图幅是否合格的基础上,根据抽样方案中 的合格判定数确定数据集是否合格。 2 以空间数据为主和以属性数据为主的地质数据集合格的判定规则在确定数据集全检和抽检 部分是否合格的基础上,按下列规则判定只有当全检和抽检部分的数据都合格时,数据集 合格。 3 数据产品综合质量合格的判定规则当组成产品的所有数据集的质量合格时,产品的综合质 量为合格。 9.2 质量评分方法 在相关部分合格的基础上,根据 9.2.2 给出的质量评分方法计算。 9.2.1 统计所有检查项各级别缺陷数 根据数据质量检查记录表(表4)记录的检查结果和缺陷分级的规定,确定缺陷级别,统计各级别 缺陷的数量,并按照表5的格式汇总。 表5 数据集质量评价表 数据产品名称数据产品名称 生产单位生产单位 数据集名称数据集名称 缺陷数缺陷数 一级质量 元素 一级质量 元素 检查项检查项 检查方检查方 式式 个体数或个体数或 ((N,n,c)) 严重缺陷 ( 严重缺陷 (16) 重缺陷 () 重缺陷 (9) 次重缺陷 () 次重缺陷 (5)) 轻缺陷 ( 轻缺陷 (2) 次轻缺陷 () 次轻缺陷 (1)) 缺陷率缺陷率 数据 完整性 逻辑 一致性 注注常用检查方式列表①全检;②抽检。 9 续上表 主 要 缺 陷 描 述 此页不够可续页 专家组长 专家组 检查日期 注 (16)~(1)为各级别缺陷与最低级别缺陷即次轻缺陷的比例,用于缺陷换算。 9.2.2 数据集的质量评分方法 将数据集所有不同级别的缺陷转换为最低级别缺陷,并计算数据集的实际缺陷率/不合格品率。将 AQL作为全检数据的质量合格限,将数据集所有抽检项抽样方案中的c/n的平均值作为抽检数据的质量 合格限。根据质量合格限和实际缺陷率/不合格品率的关系计算数据集的得分。 9.2.2.1 以空间数据为主和以属性数据为主的数据集的评分方法 a 分别计算全检和抽检部分的平均实际缺陷率 1 计算全检部分所有检查项的平均实际缺陷率 统计每个全检项的各级别缺陷数。 根据各级别缺陷的换算比例, 将所有缺陷换算为最低级别缺陷数, 除以检查的个 体数得到每个全检项的实际缺陷率。 对所有全检项的实际缺陷率进行算术平均,得到全检部分数据的平均实际缺陷 率。 2 计算抽检部分所有检查项的平均实际缺陷率 统计每个抽检项各级别缺陷数。 根据各级别缺陷的换算比例, 将所有缺陷换算为最低级别缺陷数, 除以样本量得 出每个抽检项的实际缺陷率。 对所有抽检项的实际缺陷率进行算术平均,得到抽检部分数据的平均实际缺陷 率,用 U 表示。 b 计算数据集的得分 将AQL作为全检部分数据的质量合格限,将抽样方案中的c/n或多个c/n的平均值作为抽检部分数据 的质量合格限,用V代表质量合格限。 预置分数为100分,数据集的质量合格限对应扣40分。按下式计算数据集得分 S全=100-U全(40/ V全) S抽=100-U抽(40/ V抽) S =[S全K S抽(1-K)] 其中S为数据集得分;U为平均实际缺陷率;V为质量合格限,下标全和抽分别代表全检和抽检; K为全检部分检查项数占全部检查项数的比例。 9.2.2.2 多图幅制图数据集的评分方法 a 计算单图幅数据的平均实际缺陷率方法同9.2.2.1中的 1)。 b 计算单图幅的得分将AQL作为质量合格限,根据9.2.2.1中的 2)计算单图幅数据的得分。 c 计算多图幅数据集的得分对所有单图幅的得分进行算术平均。 9.2.2.3 文档数据的评分方法 由用户自定。 10 9.2.3 数据产品的评分方法 按照表6的格式填写数据产品所包括的数据集的得分与权重,根据各数据集的权重进行加权平均确 定产品的最终得分。 表6 数据产品综合质量评价表 数据产品名称数据产品名称 生产单位生产单位 产品得分产品得分 质量等级质量等级 组织检查部门组织检查部门 数据集名称数据集名称 得分得分 权重权重 数据集 1 数据集 2 数据集 n 专家组长 专家组 检查日期 10 数据质量报告 数据质量报告是数据质量检查与评价过程、 方法及结果的综合描述和评述, 是数据集质量特性的综 合反映。数据质量报告由正文和数据质量评价附表构成。 正文应是质量评价过程、 方法和结果的全面记录和描述, 包括质量检查与评价的组织、 数据集概况、 检查方法、评价依据、评价过程、评价规则、质量评述、存在问题及结论等。 数据质量报告的格式可采用文本或表格两种格式,参见附录 E。 数据质量评价附表是数据质量综合特性统计表,是对数据产品及其组成部分质量特性的描述和反 映,其格式参见表5和表6。 11 地质数据质量检查与评价流程和标准的应用 11.1 地质数据质量检查与评价流程 地质数据质量检查与评价一般需要经过下列步骤确定检查评价的依据、数据范围、质量元素、质 量指标、检查方式和方法,实施检查并记录检查结果,必要时对检查结果进行评价以及编写评价报告。 地质数据检查评价的流程参见资料性附录F。 11.2 地质数据质量检查与评价过程中标准的应用 本标准为通用标准,选择、细化、扩展或调整是应用本标准的基本原则。本节结合地质数据质量检 查与评价流程阐述该标准的应用。其他应用可根据需要选择部分内容,如在编写产品规范时,主要应用 定量数据质量元素确定对数据的质量要求;编写产品元数据或说明时,可使用定性数据质量元素;文档 数据的质量元素主要涉及文档的完整性和规范性,其质量元素、检查项与评分标准等由用户自行确定。 a 收集数据产品规范或用户要求等相关文档,作为数据质量检查与评价的直接依据。 b 当数据产品由多个数据集组成时,确定各个数据集的权重。 c 确定定量数据质量元素 按照下列原则从第5章的表1中选取或增加适用的定量数据质量元素。 1 不同类型地质数据的质量元素不同。 根据数据的类型与特点、 质量要求及用于数据质量检 查与评价的资源(人力、物力、时间等)状况选取。 2 完整性、逻辑一致性以及专题数据准确度适用于任何类型数据。 3 空间位置准确度适用于空间数据; 在确定非空间数据的质量元素时, 不选取空间定位准确 度以及制图数据的定量数据质量元素。 4 确定制图数据的质量元素时,不选取专题数据准确性。 11 5 当本标准的定量数据质量元素不满足应用要求时,可增加一级或二级质量元素。 d 确定检查的内容与范围 按照下列原则从第 7 章的表 3 中选取或扩展检查项,并确定相应的范围(即检查的个体数)。 1 根据数据特点、 质量检查的要求和确定的定量数据质量元素选取或扩展。 当扩展检查项时, 需要规定相应的缺陷级别。 2 某些地质数据, 如矿产地、 重砂和地质灾害等数据, 难以确定整个数据集应包括的实体数, 因此在确定检查项时,主表记录个数检查项可不予选取。 e 确定缺陷分级及 AQL 1 根据附录 A 中表 A.1 的内容确定或调整缺陷分级, 权重为 1 的缺陷称为最低级别缺陷。 当调整现存缺陷级别或确定新增检查项的缺陷级别时,应保证不同质量元素的同一缺 陷级别对数据质量的影响程度基本一致。 2 AQL的确定 AQL 应由数据产品质量规范或用户要求给出。 如果没有规定可将相关的质量要求转 换为 AQL 或根据历年数据质量情况或预检结果确定。 确定 AQL 应考虑的因素质量要求、产品的复杂程度、检查项的数量和经济性等。 多图幅制图数据的 AQL 需要确定两个值,一是数据集的接收质量限,即该数据集 可接收的最大不合格品率。二是单图幅数据的接收质量限,即该图幅可接收的最大缺陷 率。 以空间数据为主和以属性数据为主的地质数据的 AQL 是该批数据可接收的最大缺 陷率。 f 确定检查方式 地质数据质量检查方式分为全检和抽检。 1 原则只要能够使用计算机进行检查的内容一律全检。对检查量大,需要人工检查的内容 一般采用抽样检查。对于产品生产过程中的一级质量检查,必须保证全检。 2 一般说来,多图幅制图数据的检查