葛店矿建筑物下条带采煤实践.pdf
2 0 1 1 年第2 0 期 科技 甚向导 ◇ 信息技术◇ 熵权核函数支持向量机 梁爽 张立坡 2 1 . 河南安飞电子玻璃有限公司 河南郑州4 5 0 0 1 6 ; 2 . 河南易安能源科技有限公 司技术 中心河南郑州4 5 0 0 0 2 1 【 摘要】 信息熵是用来描述和度量事件发生不确定度的一种方法, 能够把一些模糊量进行合理量化。本文利用分类对象样本的重要程度 建立样本概率空 间, 把 信息熵作为调 节到 支持 向量机 s V M 核 函数权重的依据 , 提 出了基于熵权核 函数的 支持向量机方法。该方法首先利 用信 息交互熵计算各个特征对分类任务的重要度, 然后用熵函数对样本的重要度度量核函数中的内积和欧氏距 离, 从而更加有效的支配核函数。 理 论分析和数值实验的结果都表明, 该方法比传统的S V M 具有更有效的分类能力和范化能力。 【 关键词】 支持向量机; 核函数; 熵权 0 . 引言 支持向量机以统计学习理论为基础. 具有简洁的数学形式 、 直观 的几何解释和好的泛化能力等优点 由于采用了核函数. 巧妙地解决 了“ 维数灾难” 问题. 使得算法复杂度与样本维数无关. 如何寻找到最 适合 的核函数是从理论走 向实际应用 时所 必须解决 的一个关键 问题 口 本文提 出一种基于交互熵 的权重核 函数支 持.向量 机方法 , 简称熵 权支持 向量机 E n t r 0 p v We i g h t e d S V M E WS V M E WS V M首先用交互熵 评估相应于分类任务的各个特征的重要性. 并依据重要性给各个特征 设定相应 的权重 . 使强相关特征获得 比弱相关特 征更大的权重。然后 将获得的权重应用到核函数的计算中. 从而避免核函数的计算被~些 弱相关或不相关的特征所支配 数值实验结果表明. E WS V M 比传统 的 S VM具有更 好的精度和泛化能力 1 . 支持向量机 支持向量机是在统计学习理论的V C维理论和结构风险最小原 理 的基础上发展起来的一种新 的机器学 习方法 。假设 存在样 本集 . , y ,y { 1 ,一 1 , n为输入维数 ,学习的 目标就是找到一个 超平面 ∞ x b O 将这两类样本完全分开 。 对线性可分 的情况 . 求解 最优超平 面的问题 可归结 为如下 二次规 划 问题 m j n 1 O~ 3 I .b t Y 6 J ≥1 / d i 0 ,i l , 2 , ,l 式 1 表示在经验风险为零的情况下使 V c维的界最小化 , 从而最 小化 v C维 , 这正是结构风险最小化原理 。这是一个凸规划问题 , 引入 拉格朗日函数进行求解 , 二次规划问题 1 的对偶问题为求解如下目标 函数的极大化 f f m a x W a ∑a ,一 ∑a i y l 一 6 一 1 i 1 i 1 t a i Y i D 2 l a /0,i l , 2 , L,Z 其中 , q为每个样本对应的拉格朗 日乘子。一般地 , 解中只有一部 分通 常是一 少部分 a i 不 为零 .对应 的样 本 就 是支 持 向量 S u p p o r t Ve c t o r , s v 。 2 . 熵权支持向量机 2 . 1熵权计算规则 理论中. 在线性可分的情况下 . 支持向量机就是建立一个超平面 使得可分的两类数据到该平面的距离最小. 通常称该平面为最优分离 超平面; 对于非线性可分问题, 是通过一个非线性映射 核函数 把原始 数据映射到另一个称之为特征空间的新数据集上. 使得新数据集在该 特征空间上是线性可分的 支持向量机方法最初是针对二类分类问题 提出的, 先按照规则 A将样本集 c分类, 形成了两个类 类 和类 l , 的 中心式和心 类 的任一元素 的发生和类 Y 的任一元素 Y 的发生之间存 在一定关系, 我们用条件概率 p 描述。一般的情况下 p x 满足 0 ≤p ≤1 。对于样本集合X A 的样本分类的信息熵为 H x 一∑p %p t ∑p j 1 6 P i 是样本分类属于集合A的概率。 同样集合 B的样本分类信息熵 记为 H s 。计算集合 A和集合 B的交互熵。 一 毫 耄 p 乃 s . t . p J 1 p , 1 7 f l f 1 交互熵是由 A获得的关于B的平均信息量 在这种方法中. 可以 计算样本集 c中每种分类规则的交互熵. 具有最低交互熵的特征是给 定特征集合中具有最高区分度的特征.亦即对分类贡献最大的特征 由此可 以用交互 熵来度量各个特征 相对于分类 的相 关性 交互熵越 大 .相关性 越强 假设 数据 集 c中 的每个样 本 由 n个 特征 { A , A , , A 来描述 , 则交互熵 I f I A, , I A , ,I A 描述 了各个特 征 的权重 熵权 S i g i n o i d核函数 r K ,y i t a n h a I A , r j , a O , r O , 1 o 2 . 2学习步骤 根据上述建 立的熵权 的计算规则 . 下面给出熵权支持 向量机 的具 体算法实现步骤 步骤 1 根据规则X对样本数据分类.构建学习样本空间和测试 样本空间 步骤 2 对学习样本空间和测试样本空间进行规一化处理 步骤 3 使用模糊理论建立样本概率空间和信道矩阵如式 1 1 . 需 要指出的是条件概率矩阵描述的样本之间的相互影响. 主要依据对系 统的了 解和历史测量参数。 计算学习样本空间和测试样本空间的信息 熵, 以及交互熵 , 构建熵权矩阵 I [ I A 。 , I A , , I A ] 。 P X / Y p x I / y 1 p f x , 2 M p x , Y m p x 2 1 p 扛2 2 、 p x A p / y , p / M p ,m 步骤 4 选取适当的核函数 . 建立熵权核函数. 并初始化支持向量 回归机的初始参数 . 以平均绝对误差和均方 差作为终止条件进行机器 学习。 3 . 在实验与分析 3 . 1背景资料 冷却水在循环系统中不断循环使用. 由于水的温度升高. 水流速 度的变化 . 水的蒸发. 各种无机离子和有机物质的浓缩. 冷却塔和冷水 池在室外受到阳光照射、 风吹雨淋、 灰尘杂物的进入, 以及设备结构和 材料等多种因素的综合作用. 会产生比直流系统更为严重的沉积物的 附着、 设备腐蚀和微生物的大量滋生. 以及由此形成的粘泥污垢堵塞 管道的问题。为了方便、 有效、 过程控制的执行循环水冷却处理方案, 防止冷却水在循环使用过程中会出现结垢、腐蚀和微生物滋生等问 题. 保证其安全稳定运行 . 有很多测控参数, 用来监测循环水水质。与 腐蚀性阴离子浓度及其腐蚀趋势相关的, 如 p H值、 氯离子 、 浓缩倍 万方数据 ◇ 信息技术◇ 科技 圈向导 2 0 1 1 年 第2 0 期 率、 水泵流量等; 依据新参数与经验参数之间的关系, 建立自动加药设 备 的数学模型 。 3 .2水质预测 比对 本文开发环境为 MA T L A B 7 .0 。 实验 中选用 S i g m o i d核 函数和熵权 S i g m o i d核 函数进行 比对 。结果如 图 1 所示 。 图 1 0 7 0 8年焦作 电厂 } } 2机组水质监测数据 比较 从实验结果可以看出. E WS V M在选定的数据集上的泛化能力优 于标准的C S V M 对数据集来说. 使用 E WS V M使平均测试精度增加 了3 . 0 %. 支持向量减少了 1 2 . 6 3 % 3 _3实验结果分析 2 机组冷却循环水测试数据学习熵权分布图如图 2 所示。 1 2 3 I 5 6 7 8 9 l 0 11 1 2 1 3 1 4 图 2熵权 分布图如图 由 可以看出p H值、 氯离子、 浓缩倍率、 水泵流量等参数对于水质 的影响是不 一样的 , 比如 p H值 、 浓缩倍 率 、 流速 的影 响大一些 , 氯离 子 、 环境温度 的影 响相对 小一 些 E WS V M正 是利用特征加权核 函数 反映这种差别的学习算法. 它通过特征加权减少弱相关特征 权重小 对分类结果 的影响 . 从而提高 了学 习算法的鲁棒性 。 4 . 结束语 交互熵一般被用度量 的两个集合之间相互关系 . 本文利用交互 熵 为依据提出了熵权支持向量机 . 即 E WS V M 讨论了熵权核函数的构 造及其性质。 理论分析表明通过特征加权不仅可以改变输入空间中点 与点之间的位置关系.还可以改变特征空间中点与点之间的位置关 系 熵权核函数的计算能够合理的给弱相关或不相关的特征分配相应 的权重 基于交互熵的数值实验结果表明. 本文提出的方法能够比较 明显地提高分类器的精度和泛化能力。 【 参考文献】 [ 1 ] C r i s t i a n i n i N a n d S h a w e T a y l o r J . A n I n t r o d u c t i o n t o S u p p o r t V e c t o r M a c h in e s a n d O t h e r K e r n e l B a s e d L e a r n i n g Me t h o d s . C a r n b r i d g e C a mb r id g e Un i v e r s it y P r e s s , 2 0 0 0 4 7 9 8 . [ 2 ] T a n P N , S t e i n b a c h M , K u m a r V . I n t r 0 d u c t i o n t 0 D a t a M i n i n g . A d d is o n We s l e y ,2 0 0 5 [ 3 ] V a p n i k V .T h e N a t u r e o f S t a t i s t i c a l L e a r n in g T h e o r y . N e w Y o r k S p r in g e r - V e r l a g , 1 9 9 5 [ 4 ] 张学工关于统计学习理论与支持向量机自动化学报, 2 0 0 0 , 2 6 1 3 2 4 2 . [ 5 ] 张永. 基于模糊支持向量机的多类分类算法研究 博士学位论文 大连 大连 理工大学 .2 0 0 8 . [ 6 ] M a n g a s a r i a n O L ,Mu s ic a n t D . N W is c o n s i n , 1 9 9 9 . [ 7 ] L i n C F , Wa n g S D . F I EE E T r a n s a c t i o n s o n N e u r a l Ne t w o r k s , 2 0 0 2 , 1 3 2 4 6 4 4 71 [ 8 ] L e e Y J , M a n g a s a r i a n O L . S S V I C C P 9 9 ,Ma d i s o n , P me e e d i n g s o ft h e F i r s tS I A MI n t e ma t io n a l 上接第3 0 2页 水泥砂浆为 1 0 1 5 c 珊铺完 2 3 行 , 应随时拉线检查 缝格的平直度, 如超出规定应立即修整, 将缝拨直, 并用橡皮锤拍实。 6 勾缝擦缝面层铺贴应交 2 4 h内进行擦缝、 勾缝工作, 中应采用 同品种、 同标号、 同颜色的水泥。 铺实修整好的砖面层上用浆壶往缝内 浇水泥浆, 然后用于水泥撒在缝上, 再用棉纱团擦揉, 将缝隙擦满。最 后将面上的水泥浆擦干净 f 7 养 护 铺完砖 2 4 h后 . 洒水养护 , 时间不应少 于 7天 。 5 . 结语 高层建筑结构改造的设计与施工 . 是一项综合性强、 涉及面广的 工程任务. 许多问题有待于总结和研究, 如 拆除工程中废品残值的估 算和固体废弃物的充分利用. 对成本测算有较大影响 施工组织中的 工序、 管理层机构、 人力布局、 劳动力的设施调配等都与新建结构有较 大不同。 特别是改造工程中的总体工期控制, 涉及到设计配合、 业主决 策、 监理作用、 总承包单位能力和权力范围等等诸方面的因素, 不同改 造工程的工期, 往往有很大的离散性, 没有现成的规律可循, 值得在实 践 中很好 的总结和研究。 【 参考文献】 [ 1 ] 何军志. 掺加工业固体废弃物的混凝土力学性能实验分析『 J 1 l 实验技术与管 理 .2 0 1 1 , 0 1 4 3 4 5 . [ 2 ] 周静. 浅谈打桩常遇问题及预防处理方法_ J 1 l太原城市职业技术学院学报, 2 0 1 1 _f 0 1 1 7 3 1 7 4 . 『 3 ] 朱江,李 丽娟,林凤兰, 郭永 昌, 钟根全.混 凝土结构无损检测 实验教学 的实践 与 探讨[ J 】 . 广东工业大学学报社会科学版 ,2 0 1 0 , S 1 1 2 1 1 2 2 , 1 2 6 . [ 4 ] 李志杰. 任务驱动教学法在混凝土结构教学中的运用『 J 1 . 中国新技术新产品, 2 0 1 1 , 0 2 3 7 1 3 7 2 . [ 5 ] 何文广, 李伟, 齐建家, 国绍文. 检测技术实践教学改革方法的研究【 J j . 价值工 程 .2 0 1 1 , 0 7 2 0 5 2 0 6 . 上接第 3 4 1 页 3 . 3 . 1 路面铣刨回收 R A P时, 应精确控制铣刨或 开挖厚度 , 以避免破坏下卧层路面结构。回收和存放 R A P时不得混入 基层废料、 水泥混凝土废料、 杂物和土等杂质。 3 . 3 .2 应适当提高新集料的加热温度 . 单最高温度不宜超过 2 0 0 ℃. 加热过程中回收沥青路面材料不得直接与明火接触. 以防止回收沥青 路 面材料表面沥青老化 3 . 3 - 3 控制再生沥青混合料温度离析 派专人随机检测后场成品 再生混合料的均一性 保证摊铺过程的连续性、 摊铺机进行速度均衡 性 ; 严格控制摊铺温度. 低温混合料一律不允许摊铺 避免由于机械原 因造成混合料的温度离析 3 . 3 .4 再生沥青混合料的级配变异性控制 将 R A P 分成两档或三 档 . 严格控制 R A P回收料中 0 . 0 7 5 ra m的通过率 . 严格控制 R A P的上 料速度和称量精度 4 . 环保效益 利用沥青路面厂拌热再生施工方法进行路面维修养护,可将路 面铣刨的废料重复利用. 既避免了回收的铣刨废料占用土地, 节约了 能源. 又避免了回收料对土地及水资源的污染. 具有很好的环保效益。 随着人们近年来对环保、 社会效益的关注. 沥青路面再生利用技术越 来越受到重视. 已成为公路工程建设中有待进一步发展的重要实用技 术。 【 参考文献】 [ 1 ] 杨平.沥青路面厂拌热再生利用研究[ D ] . 长沙理工大学,2 0 0 5 [ 2 ] 刘琳琳.沥青路面就地热再生工艺研究[ D ] . 大连理工大学,2 0 0 6 3 5 7 万方数据