基于随机样本的BP模型在水质评价中的应用.pdf
基于随机样本的 BP 模型在水质评价中的应用 * 邹志红 王学良 北京航空航天大学经济管理学院, 北京 100083 摘要 运用 BP 误差反向传播 模型对水环境质量进行综合评价, 主要针对以前 BP 模型在水质评价中存在的学习训 练样本过少, 没有检验样本等问题, 用随机数发生器在每个级别范围内产生大量的数据作为训练样本和检验样本, 并 尝试以 MSE 函数生成均方误差作为检验样本的输出值与期望输出值的比较, 检验网络评价未知样本的能力, 大大提 高了神经网络评价水质时的精度。 关键词 BP 神经网络 水质综合评价 随机数样本 检验 *国家自然科学基金资助项目 50378008 0 引言 人工神经网络能够避免评价者主观规定指标权 重的影响 ,具有很强的自学习 、 自适应能力,特别适用 于解决非线性问题, 因此把人工神经网络理论引入水 质评价领域 ,产生了较好的效果 。BP 神经网络是目 前人工神经网络中最具代表性的一种模型,本研究利 用BP 神经网络进行水质评价时 , 根据Matlab 7 中函 数UNIFRND 生成均匀分布随机数, 在每个级别内产 生大量的学习样本和检验样本 ,解决了传统上仅把水 质评价标准作为训练样本 、 没有检验样本等问题。 1 基于随机数样本的 BP 模型 BP 模型计算时是以大量的样本资料为基础, 当 样本数目较少或代表性较低时 ,训练出来的网络不能 很好的反映现实 ,尤其当参加训练的学习样本数少于 网络的连接权值数时, 训练得到的 BP 模型虽然对学 习样本有很高的逼近精度, 而对于非学习样本 ,则可 能出现错误的反映。另外 ,经过训练的网络还应该进 行性能测试 ,测试的方法就是选择检验样本向量, 将 其提供给网络, 检验网络对其分类的正确性。 一般用 BP 模型进行水质评价时, 仅将评价标准 每个级别所对应的指标值作为样本输入 ,相应级别作 为神经网络输出 ,BP 模型通过训练学习 ,训练出评价 指标与评价级别间复杂的对应关系 , 没有检测过程, 直接利用这样的网络模型进行综合评价 ,显然是违背 了人工神经网络应用的前提条件 , 因此 , 有必要找到 一种能克服这种缺陷的方法。 针对国家水质评价标准的特点 ,各类水质由各污 染指标浓度的上 下 限决定。因此在各级水质范围 内分别随机内插 N 个样本 , 并且统一数值标准的“方 向性” ,把“收益性”指标转换为“成本性”指标 DO ※ 1 DO ,方便以后的样本学习。在训练完学习样本以 后,为了证明学习过程的正确性, 需要有样本来检验 学习过程, 这些检验样本可以通过直接测取得到, 也 可以通过仿真得到 ,在样本数据较少或者难得到时, 也可以通过对学习样本加上适当的噪声或按照一定 规则插值得到, 鉴于此 , 可以通过随机数发生器在每 个级别范围内生成 n 个检验样本, 来检验 BP 网络评 价未知样本的能力。 2 BP 模型实例研究 本研究以某水域 S 的水环境质量评价为例, 说明 基于随机数样本的 BP 模型在水质评价中的应用过程。 2. 1 评价指标的确定 待测样本数据 见表 1 来源于 2003 年水域 S 的 21 个断面监测站 ,选择溶解氧、高锰酸盐指数、5日生 化耗氧量、氨盐 、 总氮 、 总磷和化学耗氧量等 7 项评价 指标 。 2. 2 网络结构的确定 根据输入要素的多少, 此 BP 模型可以确定为多 输入单输出 。评价指标值作为输入 ,输入层的单元数 为7; 水质级别值作为相应的输出 , 输出层单元数为 1; 已经证明含有一个隐含层的BP 网络能实现对任意 函数的任意逼近 ,故选用一个隐含层, 隐含层单元数 定为 4,即此 BP 模型的结构为 741。 2. 3 水质级别的判断标准 由于 BP 神经网络在运算的过程中选择 Sigmoid 函数作为作用函数, 它的输出值被限定在 0 和 1 之 间,有必要对输出值进行预处理, 规定各等级的期望 输出值为 0. 1, 0. 2, 0. 4, 0. 6, 0. 8, 0. 9, 这样就可以得 到每个输出值所代表的水质级别 见表 2 。 69 环 境 工 程 2007年 2 月第25 卷第1 期 表 1 水域 S的 7 项指标监测值mg L 检测点DOCODMnBOD5NH 4-N TNTPCODCr 18. 4096. 6925. 82 . 3115. 0570. 17430 29. 4553. 1252 . 0580 . 2891. 6090. 0420 . 667 38. 4455. 2834 . 651 . 0543. 9230. 10327 . 333 45. 1316. 1178 . 654 . 3036. 8110. 15132 59 . 74. 8752 . 350 . 4082. 7320. 07351 . 333 66. 2075. 7586. 62 . 9185. 7620. 17631 . 333 79. 8273. 6582 . 2580 . 3191. 8410. 0523 . 6667 89. 1823. 3832 . 150 . 3412. 1120. 04424 99. 8184. 1332 . 4080 . 4692. 2140. 03821 . 667 107. 8637 . 85 . 4331 . 9314. 8010. 17939 . 667 118 . 644 . 682 . 230 . 3422. 4750. 05425 . 667 129. 1823. 1672 . 2170 . 2451. 4880. 04521 139. 2094. 4172 . 5830 . 4122. 9180. 0521 140. 4094. 0172 . 3830 . 3622. 2690. 45820 . 333 158. 6354. 1086 . 4253 . 8147. 370. 11336 . 667 168. 8633 . 052 . 1330 . 3182. 1310. 05319 . 667 179. 1365. 2333 . 5920 . 8283. 6530. 58324 . 667 188. 6273 . 22 . 4250 . 3092. 2930. 06918 . 667 198. 9823. 2752. 30 . 3041. 8560. 04717 208. 9913. 3921 . 7920 . 3001. 2830. 0419 . 667 219. 2183. 2332 . 1170 . 2421. 4510. 0421 . 333 表 2 BP网络输出值的级别评价标准 水质级别ⅠⅡⅢⅣⅤⅥ 输出值0 . 10. 20. 40. 60. 80. 9 2. 4 生成学习样本 ,进行参数预处理 结合国家水质评价标准, 为Ⅵ 级水质的各项指标 设定一个上限, 使水域S 里所有达到 Ⅵ 级指标的检测 值都小于这个上限, 同样为Ⅰ级水质的各项指标设定 一个下限, 统一都取 0, 这样方便在每级水质里都能 内插大量的随机数样本, 提高了训练样本的泛化能 力。可调用 Matlab 7 工具箱中的均匀分布随机数发 生器函数 UNIFRND,在一级标准范围内内插 40 个训 练样本,其余各级标准范围内分别内插 40 个样本 ,这 样共计形成240 个具有不同参数特征的训练样本 ,供 BP 网络学习。然后对样本进行归一化处理, 使样本 状态参数处理到[ 0,1] 区间内, 以便提高训练速度和 灵敏性以及有效避开 Sigmoid 函数的饱和区, 更好发 挥Sigmoid 函数作用。可用如下公式 ri xi-minxi maxxi-minxi , xi∈ { DO,CODMn, } . 2. 5 BP 网络训练学习 该过 程根 据样本 确定 网络 连接 权值 , 采用 Levenberg- Marquardt 算法模式, 按照 BP 网络基本原理 进行误差反复修正。 2. 6 BP 网络效能检验 训练 BP 网络首先是确保训练好的网络模型对 非训练样本具有好的泛化能力 ,即有效逼近样本蕴含 的内在规律 ,而不是看网络模型对训练样本的拟合能 力。从存在性结论可知, 即使每个学习训练样本的误 差都很小, 并不意味着建立的模型已逼近训练样本所 蕴含的规律 。要分析建立的网络模型的泛化能力 ,必 须用检验样本误差的大小来评价其性能 。 用同样的方法生成检验样本,在每级水质标准里 各内插 10 个检验样本 ,共计形成 60 个样本, 把检验 样本输入训练好的网络里面。当训练步数为2 000 时,得到检验样本的 MSE 均方误差 为 2. 9628 10 -4 ,而训练好的学习样本的 MSE 为 2. 22210 -4 。 比较 2 个指标,说明此时神经网络对学习样本与检验 样本具有基本相同的泛化能力 , 具备一定的联想能 力,可以较好的用于评价未知样本。 2. 7 评价实施 根据检验阶段得到的训练好的权值和阈值,把水 域S 的检测数据经过预处理后带入上述训练好的网 络里面可以得到一系列输出值 ,结合隶属度函数即可 得到各检测点的综合评价结果 见表 3 。 3 结论 BP 评价数学模型可表示为 F [ W] X [ B] F 为网络计算值, [ W] 为权值矩阵 ,[ B] 为阈值矩 阵, X 为评价样本向量 ,与其他方法 模糊综合评价 法、 灰色聚类法等 相比, W 是通过对标准规律 例如 国家水质标准 的学习客观得到的, 避免了其他方法 中人为因素的影响。 在水质评价中, 各个影响指标与水质综合状况往 往呈现出复杂的非线性关系 ,BP 神经网络能通过学 习找到客观规律 ,在水质评价中为处理这些非线性问 题提供了较好的方法 。 BP 神经网络的建立是以大量样本资料为基础 的,当样本数量较少或代表性较低时, 训练出来的网 70 环 境 工 程 2007年 2 月第25 卷第1 期 表 3 水域 S水质评价结果 检测 断面 输出值 隶属度 ⅠⅡⅢⅣⅤⅥ 所属 级别 10 . 79640000. 0180. 9820Ⅴ 20 . 271200. 6440. 356000Ⅱ 30 . 79050000 . 04750 . 95250Ⅴ 40 . 899900000 . 010. 999Ⅵ 50 . 5345000 . 32750 . 672500Ⅳ 60 . 899100000 . 090. 991Ⅵ 70 . 331000. 3450. 655000Ⅲ 80 . 365800. 1710. 829000Ⅲ 90 . 363100 . 18450 . 8155000Ⅲ 100 . 79610000 . 01950 . 98050Ⅴ 110 . 4520000 . 740 . 2600Ⅲ 120 . 267100 . 66450 . 3355000Ⅱ 130 . 63130000 . 84350 . 15650Ⅳ 140 . 4873000 . 56350 . 436500Ⅲ 150 . 899600000 . 040. 996Ⅵ 160 . 342300 . 28850 . 7115000Ⅲ 170 . 75520000. 2240. 7760Ⅴ 180 . 375100 . 12450 . 8755000Ⅲ 190 . 309000. 4550. 545000Ⅲ 200 . 220500 . 89750 . 1025000Ⅱ 210 . 252400. 7380. 262000Ⅱ 络效果不太好。针对水环境质量分级标准的特点 ,训 练网络时可在各级标准的范围内产生多个样本,对网 络权值及阈值进行良好的训练 ,有效提高了网络的泛 化能力。 参考文献 [ 1] 孙鸿烈. 中国资源科学百科全书水资源学. 北京 中国大百科 全书出版社, 2000. [ 2] 赵林明, 胡浩之, 魏德华等. 多层前向人工神经网络. 郑州 黄河 水利出版社, 1999. [ 3] 董聪. 多层前向网络的逼近与泛化机制. 控制与决策, 1998, 13 413 -417. [ 4 ] 倪深海, 白玉慧. BP 神经网络模型在地下水水质评价中的应 用. 系统工程理论与实践, 2000, 8 124 -127. [ 5] 飞思科技产品研发中心. 神经网络理论与 MATLAB 7 实现. 北 京 电子工业出版社, 2005. [ 6] Qing Zhang and Stephen J. Tanley . Forecasting raw- water Quality Parameters ForThe North Saskatchewan By Neural network Modeling. Water Research, 1997, 31 9 2340-2350. [ 7] Simon Haykin. Neural Network A Comprehensive Foundation Second Edition . 北京 清华大学出版社 影印版 , 2001. [ 8] 闻新, 周露, 王丹力等. MATLAB 神经网络应用设计. 北京 科学 出版社, 2002. [ 9] G. Hao , K . K . Lai and M . Tan. A Neural Network Application in Personnel Scheduling.Annals of Operations Research, 2004, 128 65 -90. [ 10] 李莹, 邹经湘, 张新政. 河流水质的预测模型研究. 系统仿真学 报, 2001,13 3 139 -143. [ 11] 陆雍森著. 环境评价. 上海 同济大学出版社, 1999. [ 12] 李莹, 邹经湘, 张宇羽等. 自适应神经网络在水质预测建模中的 应用. 系统工程, 2001, 19 1 89-93. [ 13] A . Elkamel S. Abdul-Wahab and W. Bouhamra . Measurement and prediction of ozone level around a heavily industrialized area a neural network apporch. Advances in Environmental Researcth, 2001, 5 47 -59. [ 14] 孙涛, 潘世兵, 李永军. 人工神经网络模型在地下水水质评价分 类中的应用. 水文地质工程地质,2004, 3 58 -61. [ 15 ] 李晓峰, 徐玖平, 王荫清等. BP 人工神经网络自适应学习算法 的建立及其应用. 系统工程理论与实践,2004, 5 1 -8. [ 16] 陈雄华, 林成德, 叶武. 基于神经网络的企业信用等级评估. 系 统工程学报, 2002, 17 12 570 -575. 作者通讯处 邹志红 100083 北京航空航天大学经济管理学院 电话 010 82338729 E -mail zouzhihong buoa. edu. cn 2006- 03-23 收稿 简讯到2020 年我国平均气温可能比现在高 1. 3~ 2. 1℃ 人民日报北京 2006年 12月 26 日讯 到 2020 年, 我国年平均气温可能增加 1. 3~ 2. 1℃, 年平均降水量可能增加 2~ 3, 降水天数在北方显著增加, 降水区域差异将更为明显。 总体上, 北方水资源短缺状况将进一步加剧, 未来极端天气气候事件呈增 加趋势。 这是科技部、中国气象局、中国科学院、国家发展改革委 、外交部、国家环保总局联合发布的气候变化国家评估报告得 出的结论。 报告指出, 20世纪我国气候变化趋势与全球变暖的总趋势基本一致, 观测到的平均气温上升了 0. 5~ 0. 8℃, 略高于全球平均 值, 其中最暖的时期出现在最近 10 年。 目前主要观测到的气候变化带来的主要影响有 沿海海平面每年上升了1~ 3mm; 近 50 年 来, 渤海和黄海北部冰情等级下降, 西北冰川面积减少了 21, 西藏冻土最大减薄了 4~ 5m; 高原内陆湖泊水面升高; 青海和甘南 牧区产草量下降等。 报告全面评估了在全球气候变化背景下我国近百年来的气候变化观测事实及其影响, 预测了 21 世纪的气 候变化趋势。 气候变化国家评估报告编写工作于 2002 年 12月启动, 历时 4年时间, 12 个部门组织 150 多名专家进行跨学科、多领域的 综合研究, 先后九易其稿。 这是我国首次发布关于气候变化的国家评估报告。 摘自人民日报 71 环 境 工 程 2007年 2 月第25 卷第1 期 STUDY ONPOLYETHYLENE WASTE SLUDGE OF PAPERMAKING WASTE COMPOSITE Chai Xijuan Sun Kewei Wang Muping 59 Abstract The effect of filler particle size and content on the mechanical behavior of waste sludge of papermaking -reinforced polyethylene waste composite was investigated. In order to improve the general perance of the composite, the sodium hydroxide andKH -550 silane acting as filler modification agents and maleic anhydride modified polyethylene acting as additive of the system were applied. The results show the two kinds of agents can enhance the mechanical perance of the composite. At the same time, the maleic anhydride modified polyethylene canimprove the adhesion between the matrix and the filler. Keywords polyethylene, waste sludge of papermaking and waste composite OPTIMIZATION OF ENVIRONMENTAL MONITORING SITES BY ENTROPY WEIGHT MULTI- OBJECT DECISION MODELXu Lizhong Zhang Jiangshan Wang Feifeng 61 Abstract Entropy, one of the important concepts in thermodynamics, indicates the uncertain degree of a signal from the ination source, while entropy weight indicates the relatively important degree of a index inthe multi-object decision. It isintroduced the concept of entropy weight, property, analysis of its originality in the application to the optimization of environmental monitoring sites, and the entropy multi -object decision model is set up,which is proved to be feasible and reasonable in the case study . Keywords entropy weight, multi -object decision and optimal number of sites THE VELOCITY FIELD CONSTANT AND ITS AUTOMATIC CHECKING DEVICE Wang Shilong Wang Zhicheng 64 Abstract By means of study on velocity field constant for a flue, a to measure average velocity of gasin flue by constant of velocity fieldwas presented. Automatic checking device for velocity field constant simultaneously was developed. The technical difficult problem for automatic monitoring average velocity of flue gas was solved. Keywords velocity field constant, automatic continuous monitoring, average flow rate and gross emission EXPERIMENTONFLUEGASCONTINUOUSEMISSIONMONITORINGBASEDON DIFFERENTIAL OPTICAL ABSORPTION SPECTROSCOPYZheng Haiming Cai Xiaoshu 66 Abstract Differential optical absorption spectroscopy DOASmakes use of the flue gas pollutant different optical absorption characteristic at the UV -VIS wave band to measure their average concentration. By DOAS principle, experimental study was carried out to measure different concentration of SO2, NO2andNO. The DOAS technology can eliminate the influence of dust etc. The DOAS can be applied to monitoring the flue gas emission concentration and should correct the temperature effect on flue gas differential absorption characteristics. Keywords flue gas continuous emission monitoring , differential optical absorption spectroscopy DOAS, gas contamination and on -line monitoring APPLICATION OF BP MODELING BASED -ON RANDOM SAMPLES TO ASSESSMENT ON NATURAL WATER QUALITYZou Zhihong Wang Xueliang 69 Abstract This paper presents an error back propagation model to uate water quality comprehensively. Aiming at the problems of few training samples and no testing sampleswhen error back propagation model is applied in the field of water quality assessment, a great number of data can be generated through uni distribution random function as training samples and testing samples. Trying to anlysize the relationships of the output of testing samples and the expecting output using the MSE function inMATLAB 7 could raise the accountability of new sampling. This can greatly improve the accurancy of the ANN model in the water quality uation. Keywords BPANN, water quality synthetic uation, random samples and testing TECHNIQUES OF CORN STARCH WASTEWATER TREATMENT Cai Jing Chai Sheli Rui Mingxian et al 72 Abstract It is presented the characteristics of corn starch wastewater, the processes for this kind of wastewater treatment, some problems worth of considering and the choices of parameters in process design. Keywords corn starch wastewater and treatment processes THEINFLUENCEOFXIAOLANGDIRESERVOIRONRIVERWAYWATERQUALITY PURIFICATION ABILITYShi Yang Xu Zhixiu Mao Yuxia 74 Abstract According to “ Surface Water Environment Quality Standard” GB3838 -2002, it was uated the riverway water quality of 5 ENVIRONMENTAL ENGINEERING Vol. 25, No. 1,Feb. , 2007