基于支持向量机的中国石油需求量预测研究.pdf
2 0 1 3年 3月 第 2 8卷第2期 西安石油大学学报 自然科学版 J o u rna l o f X i a n S h i y o u U n i v e r s i t y N a t u r a l S c i e n c e E d i t i o n Ma r .2 O1 3 V o 1 . 2 8 No . 2 文章编号 1 6 7 3 -06 4 X 2 0 1 3 0 2 - 0 1 0 3 - 0 4 基 于支持 向量机 的中国石油 需求量预测研 究 李春锦, 闰云聚 西北工业大学 力学与土木建筑学院, 陕西 西安 7 1 0 1 2 9 摘要 根据 1 9 9 0 --2 0 1 1年 中国历年石油消费量相 关数据构造输入和输 出向量, 选用径向基 函数 R B F 作为其函数, 在 M A T L A B 2 . 1 0工具箱中设置相应变量进行参数寻优, 从而建立基于支持向 量机的石油需求量预测模型. 为了验证其效果 , 同时做 出了最小二 乘意义下的 3种预测拟合 曲线 , 数据误差分析结果表明, 支持向量机模型的预测精度高、 结果更为可靠. 用支持向量机模型预测了 2 0 1 2 _2 0 1 5年我 国的石油需求量. 关键词 石油需求量预测 ; 支持向量机 ; 回归算法 ; 核 函数 中图分类号 T E l 9 文献标识码 A 石油作为我国的基 础能源 , 占到 了国内能源 消 费的近四分之三‘ l J , 在我 国经济与社会发展 中起 着 重要 的作用. 科学地进行石油需求预测 , 可以克服或 消除石油生产的盲 目性 , 是保证经济平稳高速发展 需求 的必 要条 件. 支持 向量 机 s u p p o r t v e c t o r m a - c h i n e , S V M 嵋 是 由V a p n i k领导的 A T T B e l l 实验室 研究小组提出的一种新 的分类技术 , S V M是一种基 于统计学习理论的模式识别方法 , 主要应用于模 式 识别领域. 它可以较好地解决小样本 、 非线性和局部 极小点等问题. 为了能够更方便地指导我 国对石 油 的消费 , 本文将支持向量机应用到中国石油需求量 的预测中去 , 同时与其他几种方法预测 的结果进行 了对 比, 结果表明支持 向量机模型在训练样本较少 的情况下 , 仍有较高的预测精度和较强的泛化能力 , 能取得令人满意的结果. 1 支持 向量机基本原 理 支持向量机是从线性可分情况下的最优分类面 发展而来 的, 也是统计 学习理论 中最实用 的部 分. 其基本原 理 可用 图 1的二维情况说 明.图 1 中, 日代表最优分类超平面 , 左右两边分别代表两类 样本. 直线 和 分别为过分类超平 面最近的样 本且平行于分类超平面的平面, 它们之间的距离称 为分类间隔 m a r g i n . 在所给的数据样本点中, 一些 样本点 黑色点可以决定最优超平面的构造 , 这些 起作用的样本点在机器学习中被称为支持 向量. 图1 线性可分情况下的最优分类面 Fi g . 1 Op t i ma l c l a s s h y p e r p l a n e f o r t he li n e a r l y s e p a r a b l et u a fio n 图 2所示为非线性情况下 , 选择合适 的非线性 映射将低维空间内的点映射到高维空间上 , 在 高维 空间上作 出相应的最优超平 面可将两类点分开 , 然 后降维 , 进而达到在低维分类的 目的. 收稿 日期 2 0 1 2 - 0 9 . 1 5 基金项目 国家 自然科 学基金资助项 目 编号 5 0 8 7 5 2 1 2 ; 高等学校博士学科点专项科 研基金资助项 目 编号 2 0 1 2 6 1 0 2 1 3 0 0 0 4 ; 教育部博士点基金资助项 目 编号 2 0 0 8 0 6 9 9 0 0 1 9 作者简介李春锦 1 9 8 7 - , 男, 硕士研究生, 主要从事数据分析与处理研究. E - m a i l l i e h u n j i n 0 8 2 8 1 6 3 . c o n 李春锦等 基于支持 向量机 的中国石油需求量预测研究 一1 0 5 一 表 1 中国 1 9 9 0 --2 0 1 1石油消费量统计表 Ta b. 1 Statis tic a l ta b l e o f Ch i n a pe t r o l e um c o n s u m p tio n f r o m 1 9 9 0 t o 2 01 1 0 .4 0 .2 霹 0 1 0 图3 S V R模型参数选择 网格寻优 F i g . 3 P a r a me t e r s e l e c t i o n o f S VR mo d e l g r i d s e a r c h Ⅳ 验证集 图 4训练集和验证集的回归 曲线 F i g . 4 Re g r e s s i o n c ur v e s o f t r a i n i ng s e t a n d v a l i d a tio n s e t 见 2条曲线预测数据 点和原数据点基本 吻合 , 拟合 结果可信度高. 根据该核函数特点 , 将 回归拟合 曲线分别上移 和下移 , 如果原始数据样本点位于该 带之中时 , 则认为拟合 回归 曲线在该样本点处无 损失情况 出 现. 结合以往经验 , 选取不敏感参数 0 . 0 2 5 , 不 敏感带的宽度为 20 . 0 2 50 . 0 5 0 , 如图 5 . 2 \ 粕 婴 年 份 图 5 测试集拟合 曲线 £不敏感带 Fi g . 5 . Cu r v e f i t t i n g o f t e s t s e t a n d £ - i ns e n s i t i v e b e l t 由图 5可 以看 出, 9 5 % 置信 区间的 £带能够将 原始的样本点全部包含在该 区域 中. 由 £不敏感损 伤函数的性质得知 , 虽然预测值和实际值并 相等, 但在置信 区间为 9 5 % 的情况下可以认为该预测值 是无损失的. 3 实验结果测评 为了说明该 S VM模型预测数据的可靠性 , 本文 同时将样本数据采用传统的最小二乘意义下的曲线 拟合 。 得到了3 种预测拟合 曲线 , 即二次拟合 、 三次 拟合 、 四次拟合 , 其拟合曲线如图 6 . 2 、 删 积 延 年 份 图 6 最小二乘意义下的 曲线拟合 Fi g . 6 Fi t t i n g c u r v e s i n t h e s e ns e o f l e a s t s q ua r e s 对于 4种方法得 到的拟合 曲线 , 采用均方误差 MS E作为评测指标来衡量每种方法的误差. 仅从 时间序列 的角度来看 , MS E越小 , 表 明预测效果越 好. f MS E . 一 / f . ‘ 式中 为预测值 ; 为实际值 ; Z 为序列长度. 将 4种 回归预测 曲线在相应年份的函数值与原 始数据相 比较 , 分别求 出各个实验结果的均方误差 MS E , 作 出4种曲线的 MS E进行 比较 , 如图 7 . 由图 7可以直观地看 出, 由训练数据点拟合的 S V M预测曲线 的 MS E值 相对较小 , 所 以准确度也 相对较高. 故该方法要优于最小二乘意义下 的曲线 拟合. - - 1 0 6 - . 西安石油大学学报自然科学版 一 \ 莰 图 7 误 差分析 Fi g . 7 Er r o r a n a l y s i s 用训练好 的支 持 向量 机 模 型对 我 国 2 0 1 2 2 0 1 5年的石油需求量进行预测, 在 M A T L A B工具箱 中输入相应的程序命令 , 对未来 4 a的预测结果见 表 2 . 表 2 2 0 1 2 --2 0 1 5年石油需求量预测 结果 Ta b. 2 P r e d i c t i o n r e s u l t s o f Ch i na p e t r o l e u m d e m a n d f r o m 2 0 1 2 t 0 2 0 1 5 4 结 论 本文对支持向量机时间序列预测理论进行了分 析 , 在此基础上针对具体 问题建立 了支持向量机 回 归预测模型 , 最后利用该模型预测了 2 0 1 2 --2 0 1 5年 石油需求量. 通过数值仿真和讨论可以看 出 1 S V M是建立在结构风险最小化基础上 的 机器学习方法 , 它将函数估计最终转化为二次规划 问题 , 理论上可以得到最优解 , 从而避免了如神经网 络陷入局部最优等问题. 2 本文对支持向量回归机模型参数进行了优 化处理, 使该模型能更好地预测石油需求量这一 时 间序列的发展趋势. 3 误差分析 MS E 表明, 当训练样本数 目有 限时, 支持 向量机回归模 型 比最小二乘意义下的曲 线拟合具有更强 的泛化和预测能力 , 更具有推广性. 参 考 文 献 [ 1 ] 周风起. 中国石油供需展望及对策建议[ J ] . 国际石油 经济 , 2 0 0 1 , 9 5 5 - 8 . ZHOU F e n g q i .O u t l o o k a n d s t r a t e g y s u g g e s t i o n s f o r o i l s u p p l y a n d d e m a n d i n c h i n a [ J ] . I n t e r n a t i o n a l P e t r o l e u m E c o n o m i c s , 2 0 0 1 , 9 5 5 - 8 . [ 2 ] V a p n i k V N. T h e N a t u r e o f S t a t i s t i c a l L e a r n i n g T h e o r y [ M]. N e w Y o r k S p r i n g e r V e d a g , 1 9 9 5 . [ 3 ] 张学工. 关于统计学习理论与支持向量机[ J ] . 自动化 学报 , 2 0 0 0 , 2 6 1 2 3 41 . Z HANG X u e g o n g . I n t r o d u c t i o n t o s t a t i s t i c a l l e a r n i n g t h e o ry a n d s u p p o v e c t o r ma c h i n e s [ J ] . A c t a A u t o m a t i c a S i n i c a , 2 0 0 0, 2 6 1 2 3 - 4 1 . [ 4 ] 梅建新 , 段汕. 支持向量机在小样本识别 中的应用 [ J ] . 武汉大学学报 自然科学版, 2 0 0 2 , 4 8 6 7 3 2 . 73 4. ME I J i a n x i n, DUAN S h a n .T h e a p p l i c a t i o n o f s u p p o v e c t o r m a c h i n e s i n r e c o g n i t i o n o f s mal l s a m p l e [ J ] . Wu h a n U n i v e r s i t y J o u r n a l Na t u r a l S c i e n c e Ed i t i o n, 2 0 0 2, 4 8 6 7 3 2 - 7 3 4. [ 5 ] 胡国胜, 钱玲. 支持向量机的多分类算法[ J ] . 系统工 程与电子技术 , 2 0 0 6, 2 8 1 1 2 7 1 3 2 . H U G u o s h e n g , Q I A N L i n g . S u r v e y of mu l t i c l a s s i fi c a t i o n a l g o r i t h m s b a s e d O i l s u p p o v e c t o r m a c h i n e[ J ] . A e r o s p a c e El e c t r o ni c s I n f o r ma t i o n En g i ne e r i n g a n d Co n t r o l , C h i n a, 2 0 0 6, 2 8 1 1 2 7 1 3 2 . [ 6 ] 李国正, 王猛. 支持向量机导论[ M] . 北京 电子工业 出版社 , 2 0 0 4 2 4 4 5 . L I Gu o - z h e n g, WANG Me n g . An I n t r o d u c t i o n t o S u p p o Ve c t o r Ma c h i n e s a n d Ot h e r K e r n e l b a s e d L e a r n i n g Me t h -- o d s [ M] . B e i j i n g P u b l i s h i n g H o u s e o f E l e c t r o n i c s I n d u s t r y. 20 0 4 2 4_ 4 5. [ 7 ] 郭小荟 , 马小平 . 基 于 MA T L A B的支持 向量机工 具箱 [ J ] . 计算机应用与软件, 2 0 0 7, 2 4 5 7 5 9 . GUO Xi a o h ui , MA Xi a o p i n g .S up p o v e c t o r ma c h i ne s t o o l b o x i n m a t l a b e n v i r o n m e n t [ J ] . C o m p u t e r A p p l i c a t i o n s a n d So f t wa r e, 20 0 7, 2 4 57. 5 9. [ 8 ] 于美玲 , 张辉 . 基 于三次 曲线模 型 的我 国天然气 发展 前景预测[ ] . 当代石油石化, 2 0 1 1 9 1 8 . 2 1 . Y U Me i l i n g . Z HANG Hu i . T h e p r e d i c t i o n a b o u t c h i n a,s n a t u r a l g a s d e v e l o p me n t p r o s p e c t b a s e d o n c u b i c c u rve m o d e l [ J ] . P e t r o l e u m&P e t r o c h e m i c a l T o d a y , 2 0 1 1 9 1 8 21 . 责任编辑 张新 宝