城市地质环境质量信息权综合评价方法研究.pdf
广西大学学报990 2 18 广西大学学报 JO U RNA L O F G U A NG XI U NI VERSI T Y 1999年 第2 4卷 第2 期 Vo l . 2 4 No . 2 1999 城市地质环境质量信息权综合评价方法研究* 谭卓英 吴恒 王思敬 摘 要 利用现代信息理论,提出了信息权的概念并建立了信息权模型. 采用分级 计权方法,反映了要素及要素与因子间的作用程度及层次关系,并采用数理逻辑推 理,避免了人为因素干扰. 适合于地质环境系统环境变量数据的不确定性和不完备性以 及多数工程只需广义危险性评判的需要. 关键词 地质环境质量;信息权;信息权模型 分类号 X 8 2 2 Study of an Ination Weight Approach of Systhetic uation on Urban Geoenvironment T a n Zh u o y i n g Co l l e g e o f Re s o u r c e s a n d En v i r o n m e n t , G u a n g x i U n i v e r s i t y , Na n n i n g , 530 0 0 4 W u H e n g Co l l e g e o f Ci v i l a n d A r c h i t e c t u r a l En g i n e e r i n g , G u a n g x i U n i v e r s i t y , Na n n i n g , 530 0 0 4 W a n g Si j i n g In s t i t u t e o f G e o l o g y , Ch i n e s e A c a d e m y o f Sc i e n c e s , Be i j i n g ,10 0 0 2 9 A b s t r a c t A n e w c o n c e p t o f i n f o r m a t i o n w e i g h t a n d i t s m o d e l a r e e s t a b l i s h e d b y a p p l i c a t i o n o f m o d e r n i n f o r m a t i o n t h e o r y i n t h i s p a p e r . Be s i d e s , w e i g h t c a l c u l a t e d b y g r a d i n g r e f l e c t s t h e i n f l u e n c e s a n d g r a d e r e l a t i o n s h i p o f t h e e s s e n t i a l e l e m e n t s a n d i t s f a c t o r s , a n d m a t h e m a t i c a l a n d l o g i c a l d e d u c t i o n i s a d o p t e d t o a v o i d i n t e r f e r e n c e w i t h h u m a n f a c t o r s h e r e a l s o . T h e m e t h o d i s f i t t o t h e u n d e t e r m i n i b i l i t y a n d u n p e r f e c t i b i l i t y o f g e o e n v i r o n m e n t a l v a r i a b l e s a s w e l l a s t o t h e r e q u i r e m e n t o f d a n g e r j u d g e m e n t i n t h e b r o a d s e n s e i n m a n y p r o j e c t s . K e y w o r d s g e o e n v i r o n m e n t a l q u a l i t y ;i n f o r m a t i o n w e i g h t ;m o d e l o f i n f o r m a t i o n w e i g h t 1 信息量评价模型及其存在的问题 信息论是由C. E. Sh a n n o n 创立的. 他首先提出了信息概念及信息熵的数学表达[1]. 晏国珍教授[2 ]将信息论首先引入到滑坡预测,继而应用到地质环境质量评估中. 在现 代信息论中,设X是取有限个实现的随机变量,X取x j 的概率为p x j j 1, 2 , ⋯, n ,则X 的信息定义为 f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 1/7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据 广西大学学报990 2 18 1 式中c 为与信息单位有关的常数. 信息模型基于信息论的思想. 在信息模型中,若计算因素 状态指标 变量X因子j 状 态,提供给事件A 的信息记为I x j , A ,则 2 式中p x j , A 为A 状态下x j 因素发生的概率;p x j 为x j 因素发生的总概率. 显然,式 2 的概率变换为样本统计提供了条件. 在具体运算时,总体概率又用样本 频率来估计,即 3 在进行环境质量评价时, 3 式中S为评价域内总的单元数;Sj为评价域内有状态指标 x j 的单元数;N为评价域内已知环境质量好的单元总数;Nj为评价域内有状态指标x j 的 质量好的单元数. 某一评价单元i 中m 种因素综合情况下,提供给事件A 的信息为 4 4 式就是环境质量评价的信息量模型. 并据I 值的大小给各评价单元划分质量等级和进 行分区. 不难看出,在以上信息量模型中,评价因子各状态指标值 或变量值 是以事件出 现的概率来表征的,未考虑评价因子及其状态指标在地质环境质量评价中所起作用大 小的程度,显然这是不客观的. 事实上,地质环境质量评价包括了多个评价因子 或要 素 ,各评价因子对地质环境质量的贡献是不同的,而且,各评价因子有多种状态或有 多个变量指标,它们对环境质量的贡献也是不同的,应该区别对待. 可见,在传统的信 息量模型中,将变量提供的信息量作为信息权看待,实际上不是权而是一种概率. 概率 只反映了数的方面;作为作用程度的权重是隐含的量,未被考虑. 因此,信息量模型是 一种未考虑因子权重的评价方法,不能很好地反映重要因子在城市地质环境质量中的 影响. 应该指出,重要因子是一个动态的概念,城市的地理位置不同,评价的目标不 同,城市地质环境质量评价的侧重点可以不同. 如滨海城市、流域城市常以港口建设、 岸带开发、海水入侵、堤岸滑塌及内涝等为重点;山区城市主要以山体崩滑、泥石流 等地质灾害为主;对于干旱、半干旱地区及北方一些平原地区主要以水资源、土壤沙 f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 2 /7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据 广西大学学报990 2 18 漠化为重点;位于东西、南北等大断裂带附近的城市地震活动强烈,应以地壳稳定性 评价为主要内容. 之所以要突出重点,对奇异性因子进行加权评价是因为质量坚持以点 概全的原则,即只要影响质量的因子中某个或某些因子对质量的影响很大,那麽,总 体的质量必然受这些因子控制. 因此,对地质环境质量评价必须坚持突出重要因子的原 则,考虑因子权重的影响. 2 信息权及信息权模型 2 . 1 原理与方法 1 单变量的信息权. 信息及信息权模型的基础是现代信息论. 按照以上的分析,可定 义信息权如下设地质环境质量总体为Q ,第i 因素状态指标 或单要素评价因子 x j i 1, 2 , ⋯, m ; j 1, 2 , ⋯, k 提供给地质环境质量Q 的信息为I x i j , Q , 且符合Sh a n n o n 信息的定 义,则同样总体概率可用样本概率估计,即 5 式中符号的意义与 3 式相同. x i j 提供给地质环境质量的信息权记为H x i j , Q ,则 6 式中W i j 为单因素状态指标x i j 对地质环境质量Q 的权重. 在实际应用中, 5 式还可以采用面积密度、体积密度、线密度及点密度来计算. 主 要视评价对象、评价目标及数据提取的方便性而定. 例如,在某城市区内对水资源、水 质及地质灾害等进行评价时,数据的取样可分别采用不同的方法. 地下水资源及水质的 评价,可采用单元中满足要求的取样点来进行;地表水体的评价可用面积密度进行计 算;而地质灾害可用单元内各种等级的地质灾害次数或直接用体积 如崩滑、泥石流 密度进行评价. 总之,采用何种方法,应根据实际来确定,以实际采集数据方便、保真 度高为原则. 2 单因素的信息量. 某一评价因素i 状态指标x i j 有k 种指标状态 状态标志变量 ,则因 素i 提供给地质环境质量好的信息权H i , 7 3 评价单元的信息量. 若某个评价单元有m 个因子,各因子的权重为W i ,则该评价 单元m 个因子提供给地质环境质量好Q 的总信息量Id d 为评价单元数,d 1,2 ,⋯, f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 3/7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据 广西大学学报990 2 18 N ,则 8 据此,可计算评价单元信息量的大小,并根据一定的判据对评价单元划分质量等级和 进行分区. 2 . 2 权重的确定 2 . 2 . 1 单因素状态 变量 指标权重W i j 单因素状态变量指标分2 种类型状态分级指标和变量数值指标. 1 状态分级指标 a 状态分级指标数值化. 在地质环境质量评价中,常将某种要素分成几种等级状态. 如区域地壳稳定性常以地震烈度进行分级. 一般分成3~4级. 如按地震烈度≤Ⅵ,Ⅶ~ Ⅷ,≥Ⅸ分为稳定性好、稳定性较好及稳定性差3级. 又如泥石流灾害程度常以过境痕 迹 泥位 来计算泥石流的方量并据此表示危险度和分级. 如将一次泥石流量按≥10 0 万 m 3,10 ~10 0 万m3,1~10 万m3,<1万m3分别划分为特大型、大型、中型及小型4级. 其 他诸如地下水、地面沉降、地面岩溶塌陷等影响或表示环境质量的因素都可以用分级 状态指标 文字或数字 来表示. 此时,每一种状态相当于一种变量,且同一因素的各种 状态数据类型和量纲相同. 对于文字数据描述的状态指标,则应先给出评分标准,再给 各级状态打分. 打分时应客观、避免人为因素的影响. 最后根据得分值进行归一化处理. b 确定权重W i j . 因各状态均包含于同一因素,其物理意义相同. 因此,其数值的大 小即反映因素贡献的大小,因而权重的确定可直接用该因素下各状态因子组成的1k 维向量矩阵进行初值化、均值化或极值化等归一化处理. 各种状态的归一化处理值即为 该状态分级指标的权重值. 若因素X包含有k 种状态指标 已转化为数值指标 ,X∈ [x i 1,xi 2,xi k ],各状态指标 变量 的权重为W i j ,则 初值化权重W i j x i j / x i 1 j 1, 2 , ⋯, k ; 均值化权重 极值化权重W i j x i j -x i m i n / x i m a x -x i m i n 或W i j x i j / x i m i n ,W i j x i j / x i m a x . 式中 i 为状态/ 变量指标中的x i j 变量评价指标的平均值;x i m i n 为状态/ 变量指标中的下限 指标值. x i m i n M i n {x i 1,xi 2,⋯, xi k };x i m a x 为状态/ 变量指标中的上限指标值. x i m a x M a x {x i 1,xi 2,⋯, xi k }. 2 变量数值指标 评价要素可能含有多个因子变量,因子变量的物理意义不同,数值不同,量纲不 同,因而数据大小悬殊. 如对水、土壤、岩石三大环境进行评价,选取的评价因子和评 价标准都不相同,显然,意义也不同. 此时,该因素下各变量组成的1k 维向量矩阵的 每一向量表征的意义不同. 此时,不能在同一矩阵内进行归一化处理. 解决的办法是借用 评价标准向量矩阵. 利用各变量相应评价标准的初始向量、均值向量、极值向量进行初 f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 4/7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据 广西大学学报990 2 18 值化、均值化及极值化处理. 这样处理后的结果也就反映了该变量贡献的大小. 因此,也 就表征权重. 若第i 个要素包括x i j 个因子/ 变量 j 1, 2 , ⋯, k ,则变量组成的1k 维向量矩阵{ x i 1, x i 2,⋯,xi k } ,其中,x i j 变量对应的评价标准组成的向量矩阵为{ b i 1,bi 2,⋯,bi k } k 为 该变量因子评价标准的分级数 ,则 初值化权重W i j x i j / b i 1 j 1, 2 , ⋯, k ; 均值化权重 极值化权重W i j x i j -b i m i n / b i m a x -b i m i n 或W i j x i j / b i m i n ,W i j x i j / b i m a x . 式中 i 为评价标准中的x i j 变量评价指标的平均值;b i m i n 为评价标准中的下限指标值, b i m i n M i n {b i 1,bi 2,⋯, bi k };b i m a x 为评价标准中的上限指标值,b i m a x M a x {b i 1, b i 2,⋯, bi k }. 2 . 2 . 2 单因素权重W i 在地质环境质量评价中,评价要素是多方面、多层次、敏感且相互独立的. 因素的 含量主要在状态变量指标中表征,但其重要程度 权重 还与其他因素在地质环境质量 评价 事件 中的作用大小有关. 因此,它包括2 个部分,用公式表示为 9 式中Ci为第i 要素在地质环境质量总体中所占的比重 i 1,2 ,⋯,m . 令,则各要素在地质环境总体中,内部含量表征y i 所构成的1m 维向量 矩阵为{ y 1,y2,⋯,ym} ,则在向量矩阵中经标准化处理即可得各要素在总体Q 中的含 量 权重 ,即 10 2 . 3 分级标准 通过前面分析,第i 评价单元提供的信息总量Ii由 8 式确定. Ii落在何种区间属于哪 种质量级别有赖于质量分级标准. 质量分级标准的范围可大可小,视要求而定. 就某个具 体的城市区域来说,可借助国家或各级地方环境标准建立自己的环境标准体系,这种 体系和国家或地方标准是一致的. 但突出的重点、评价的内容可能不同. 基本思路是根 f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 5/7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据 广西大学学报990 2 18 据该区域理想与最劣地质环境质量指标提供的数据作为变量,计算信息量并按照一定 要求进行分级 区间 ,建立分级标准. 然后,根据单元提供的信息总量所属区间划分相 应的等级. 最后,根据相近相关的原则进行聚类分区. 具体做法是利用相应环境标准中最 佳和最差变量 参数 按照以上步骤分别计算环境质量理想和最劣两种状态下的信息总 量,得到信息量最大与最小值的区间,然后根据评价要求将此区间细划为多级区间 分 级 . 也就是说,根据环境标准确定的信息量建立分级标准. 标准信息量的确定完全按照 以上步骤进行,这里不再重复. 3 评价程序 城市地质环境质量综合评价是为一定的目标服务的,包括回顾评价、现状评价和 预断评价. 一般应遵循以下程序 1 区域环境地质调查. 这是宏观调查、收集环境监测资料、总结分类和填图的过程. 一些性状参数不足的也可以在这一阶段取样补足. 根据具体的评价服务目标,对于宏观 规划者可用1∶50 0 0 0 比例尺,针对具体工程时,可用1∶10 0 0 0 比例尺. 2 筛选评价要素及建立相应的数值评价标准. 根据具体评价区域的实际情况,并考 虑社会经济等条件,在充分调查研究的基础上,选取域内评价要素,然后,对要素和 变量进行相关分析,剔除相关程度高的因子及变量,并对连续变量进行离散化成若干 状态的变量. 因子和变量选取的原则是选取对域内地质环境质量总体敏感而且具有一定 独立性即为自变量的因子及变量. 3 划分单元. 单元大小划分应适当. 太多计算工作量大,太少又很难反映局域分异的 情况. 单元划分时应充分注意区域的边界条件和明显分异的区域. 可根据地形、地质、地 貌突变等边界来划分. 划分时各单元的面积应相等或基本相等. 常用的单元划分法为等间 距法和多边形法. 4 选取模型区. 模型区的选取可按均匀分布和随机分布的原则进行. 均匀分布的实质 是等间距取样. 即在评价域内以相等的距离 单元数 选取一定数量的单元作为模型样本. 其特点是所取样本在评价区内均匀分布,适合于地质环境要素及变量在域内比较均 匀、变异不大的情况. 也就是说,当评价域的总体质量可用任一单元的质量水平来表征 时,采用均匀分布取样是合适的. 而对于环境要素及变量分异严重时,评价的结果往往 与选取样本的起始单元及取样分布函数有关. 有时,可能漏掉奇异性较大的单元. 随机分 布原则就是按照某种随机分布函数来确定随机样本. 由此可见,采用不同的方法确定的 模型样本得出的模型和结论可能会有差异. 因此,具体选取时,可根据评价区的具体实 际情况确定选取方法并采用多种方法进行检验. 5 计算各因子及因子状态指标的信息权重及信息量. 6 根据信息权重及信息量建立信息权模型. 信息模型的建立可先作出变量信息量关 系图,然后进行拟合. 亦可采用多元统计分析方法回归得出. 7 对样本单元进行评价和进行误差显著性检验. 误差显著性检验是反映模型可靠性 指标不可缺少的工作. 方法是设定精度ζ 误差 后,根据信息权模型对模型区 样本单 元 进行回代评价并不断修正模型参数,直到使各样本信息量与回代评价信息量的个体 误差小于设定误差为止. 然后,根据修正好的模型对其他单元进行外推评价并进行分级 分区. 若选取的模型区 样本单元 数为n ,获得的信息量模型为Ii 0 , 则 f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 6 /7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据 广西大学学报990 2 18 Ii 0 =f {W i j ,W y i ,I x i j ,Q }, 11 则模型与样本方差应满足 12 式中ζ为样本方差即误差. 8 环境质量分级分区. 根据信息权重对城市区域进行整体评价和质量分区,并编制 地质环境质量分区图. 4 结 论 信息权模型是在信息预测模型的基础上发展起来的信息评价方法,考虑了要素及 要素与状态指标 或变量 的层次关系和它们在地质环境质量中的贡献,采用数理逻辑 推理,权重的确定不受人为因素的干扰,确保了评价方法的可靠性. 方法简单,适用于 单因素及多因素综合评价. 根据评价要求,该法甚至可避开环境系统提供参数的不确定 性和不完备性并满足多数工程只需广义危险性识别的要求. 因而,具有广阔的应用前景. *中国科学院地质所工程地质力学开放实验室及广西区科委重点技术攻关项目 桂科政 96 450 2 2 资助 作者简介谭卓英 33岁,男,副教授 作者单位谭卓英 广西大学资源与环境学院,南宁,530 0 0 4 吴 恒 广西大学土木建筑工程学院,南宁,530 0 0 4 王思敬 中国科学院地质研究所,北京,10 0 0 2 9 参考文献 1 H a k e n H 著. 信息与自组织. 郭治安等译. 成都四川人民出版社,198 8 2 晏国珍. 水文工程地质与环境保护. 北京中国地质大学出版社,1994 责任编辑 唐汉民 收稿日期1998 -0 9-0 1 f i l e / / / E| / q k / g x d x x b / g x d x 99/ g x d x 990 2 / 990 2 18 . h t m (第 7 /7 页)2 0 10 -3-2 2 2 0 45 2 0 万方数据