基于进化博弈分析的煤矿安全生产管理研究.pdf
安徽理工大学 硕士学位论文 基于进化博弈分析的煤矿安全生产管理研究 姓名李丽 申请学位级别硕士 专业管理科学与工程 指导教师杨力 20110529 摘要 摘要 随着国民经济对能源需求的不断增加,一方面,煤矿产业作为我国能源的主 导产业,越来越受到全社会的广泛关注;另一方面,事故频发所造成的巨大经济 损失和人员伤亡问题也成为全社会关注的焦点。煤炭企业在快速发展的同时,如 何同时保障煤矿企业的利益与矿工生命财产安全,是全行业需认真思索、亟待解 决的课题。 矿工是煤矿企业能够正常运作的主体,矿工的生命财产安全定当是煤矿企业 需考虑的首要因素。但是,在当今社会,部分煤矿企业因为贪图眼前经济利益, 而减少生产成本,使煤矿安全不达标,置矿工安全于不顾。与此同时,部分矿工 为了获得超额利益或节省时间,而不按照安全操作规程工作,以至发生事故,不 仅损害了自身的生命财产安全,也损害了他人的利益。 本文首先介绍了博弈论的基本概念及其分类。其次,对煤矿企业和矿工的三 个方面建立博弈模型并进行传统博弈及进化博弈的分析,主要包括煤矿企业安 全达标的博弈分析、矿工安全操作的博弈分析以及煤矿企业安全达标与矿工安全 操作的博弈分析。然后,基于上述分析,对矿工冒险性行为进行研究,总结了矿 工冒险性行为的原因及管理对策。最后,引入案例,对上述研究结论进行印证分 析。 本文的创新在于首次对煤矿企业与矿工进行多角度分析,并对它们进行进化 博弈的分析,从而更加全面的了解我国煤矿安全生产管理机制,并提出相应的对 策及建议。 图[ 2 6 】表【2 6 ] 参[ 8 1 】 关键词煤矿企业;矿工;博弈;进化博弈 分类号F 2 7 3 .1 摘要 A b s t r a c t W i t ht h ei n c r e a s i n gd e m a n df o re n e r g yo nt h en a t i o n a le c o n o m y ,o nt h eo n eh a n d , c o a li n d u s t r ya st h el e a d i n ge n e r g yi n d u s t r yi nC h i n a , p a i dm o r ea t t e n t i o nb yt h ew h o l e s o c i e t y ;o nt h eo t h e rh a n d ,h u g ee c o n o m i cl o s s e sa n dc a s u a l t i e s ’p r o b l e mc a u s e db y f r e q u e n ta c c i d e n t sh a sb e c o m et h ea t t e n t i o nf o c u s .W i t hc o a le n t e r p r i s e sd e v e l o p e d f a s t l y ,i ti st h ei n d u s t r y ’Sn e e da n du r g e n ts u b j e c tt h a tp r o t e c tt h ei n t e r e s t so fm i n i n g c o m p a n i e sa n dm i n e r sl i v e sa n dp r o p e r t ys i m u l t a n e o u s l y . C o a lm i n e r sa r et h em a i nb o d yo ft h en o r m a lo p e r a t i o no fc o a le n t e r p r i s e s ,l i f e a n dp r o p e r t ys a f e t yo fm i n e r si st h ep r i m a r yf a c t o rc o n s i d e r e db yc o a le n t e r p r i s e . H o w e v e r ,i nt o d a y ’Ss o c i e t y ,b e c a u s eo fp a ac o a lm i n i n ge n t e r p r i s e st os e e ki m m e d i a t e e c o n o m i cb e n e f i t s ,w h i l er e d u c i n gp r o d u c t i o nc o s t s ,i ti n d u c et ol o wm i n es a f e t y s t a n d a r d s ,s e tt h ee x p e n s eo ft h em i n e r s ’s a f e t y .A n da tt h es a m et i m e ,i no r d e rt oe a r n b e n e f i t so rt os a v et i m e ,s o m em i n e r sd on o ti na c c o r d a n c e 谢t ht h es a f eo p e r a t i o n ,n o t o n l yd a m a g e d t h e i ro w nl i v e sa n dp r o p e r t y ,i ta l s ou n d e r m i n e so t h e r s ’i n t e r e s t s . T h i sp a p e ri n t r o d u c e st h eb a s i cc o n c e p t sa n dc l a s s i f i c a t i o no fg a m et h e o r y . S e c o n d l y ,b u i l dt h eg a m em o d e lo fm i n i n gc o m p a n i e sa n dm i n e r sf r o mt h r e ea s p e c t s a n da n a l y z eo nt h et r a d i t i o n a lg a m e sa n de v o l u t i o n a r yg a m et h e o r y ,w h i c hi n c l u d i n g g a m ea n a l y s i so fc o a lm i n i n ge n t e r p r i s es e c u r i t y s t a n d a r d sa n dm i n e r sc o n t i n u et o w o r k ;g a m ea n a l y s i so fc o a lm i n i n ge n t e r p r i s es e c u r i t ym o n i t o r i n ga n ds a f eo p e r a t i o n ; a n dg a m ea n a l y s i so ft h ec o a lm i n e r se n t e r p r i s es e c u r i t ys t a n d a r d sa n dt h es a f e o p e r a t i o n .T h e n ,b a s e do nt h ea b o v ea n a l y s i s ,s t u d ym i n e r s ’r i s ks e x u a lb e h a v i o r ,s u n l u pt h er e a s o n sa n dm a n a g e m e n ts t r a t e g i e so f m i n e r s ’r i s ka c t i v i t y .F i n a l l y ,c o n f i r mt h e a b o v ea n a l y s i sa n dc o n c l u s i o nb yi n t r o d u c i n gt h ec a s e . T h ei n n o v a t i o no ft h i sp a p e r ,w h i c hi sa n a l y z et h ec o a lc o m p a n i e sa n dm i n e r s ’o n m u l t i a n g l ea tt h ef i r s tt i m e ,a n du t i l i z et h ee v o l u t i o n a r yg a m et h e o r y .A n dt h e n u n d e r s t a n dc o m p r e h e n s i v e l yo fC h i n a ’Sc o a lm i n es a f e t yp r o d u c t i o nm a n a g e m e n t s y s t e ma n dp u tf o r w a r dc o u n t e r m e a s u r e sa n ds u g g e s t i o n s . F i g u r e 【2 6 】t a b l e [ 2 6 】r e f e r e n c e [ 81 】 K e yW o r d s - - c o a lm i n i n ge n t e r p r i s e s ,m i n e r s ,g a m e ,e v o l u t i o n a r yg a m e I I - 第1 章绪论 1绪论 1 .1 研究背景 在我国的能源工业中,煤矿在我国一次能源生产和消费结构中占7 0 %左右, 预计到2 0 5 0 年还将占5 0 %以上。因此,在相当长的时期内煤矿资源仍将是我国 的主要能源。当前,我国快速增长的经济,对煤矿工业的发展提出了更高的要求。 为此,必须加强煤矿安全生产,确保煤矿工业持续、稳定、健康的发展【1 3 】。 建国以来,我国煤矿工业安全生产技术得到了很大发展,在防治瓦斯、煤尘、 水火灾害及顶板事故的配套技术与装备方面都取得了很大的进展,极大地改善了 煤矿安全技术状况,但技术的改进并未实现对煤矿灾害事故的有效控制,目前煤 矿安全生产形势依然严峻【l 引。 我国9 5 %的煤矿开采是地下作业。煤矿事故占工矿企业一次死亡1 0 人以上 特大事故的7 2 .8 %至8 9 .6 % 2 0 0 2 - - 2 0 0 5 年 ;煤矿企业一次死亡1 0 人以上事 故中,瓦斯事故占死亡人数的7 l 蝌1 4 】。煤矿所面临的重大灾害事故是相当严峻的, 造成的损失是极其惨重的。由于煤矿事故多,死亡人数多,造成了我国煤矿的百 万吨死亡率一直居高不下。特别是煤矿重大及特大瓦斯 煤尘 灾害事故的频发, 不但造成国家财产和公民生命的巨大损失,而且严重影响了我国的国际声誉。实 际上,这些安全事故的发生不是偶然的,它是以往煤矿生产过程中存在问题的集 中暴露,涉及许多方面。通过对重特大事故发生的主要原因分析,主要归结为以 下几个方面①企业安全生产责任制不落实,措施不具体,执行不严格,安全管 理不到位;②企业生产设备状况差,事故隐患多;③职工自我保护意识差;安全 培训不到位;④对外包队伍管理薄弱;⑤拒不执行煤矿安全监察机构的整改和停 产指令。上述原因均可能与企业是否执行安全生产规定以及矿工是否执行安全操 作有关‘1 9 1 。 针对我国煤矿安全面临的严峻形势,国务院办公厅于2 0 0 5 年8 月发出国 务院办公厅关于坚决整顿关闭不具备安全生产条件和非法煤矿的紧急通知,要求 坚决整顿关闭不具备安全生产条件和非法煤矿,遏制煤矿事故频发多发的势头。 紧急通知强调,严格安全生产行政问责制,认真查处煤矿安全生产和煤矿事故背 后的失职读职、官商勾结和腐败现象。国家机关工作人员、国有企业负责人参与 投资入股办矿、接受贿赂、公开或暗中包庇袒护,致使煤矿未能停产整顿或关闭 取缔,甚至酿成事故的,要一查到底,依法严肃处理。凡己经投资入股煤矿 依法 购买上市公司股票的除外 的国家机关工作人员、国有企业负责人,自本通知下达 第1 章绪论 之日起1 个月内撤出投资,逾期不撤出投资的,依照有关规定给予处罚。通知还 强调各级煤矿安全监察机构要坚持从严执法,落实监察执法责任制,通过重点监 察、定期监察和专项监察,切实加强对煤矿整顿关闭工作的监督。发现该停不停、 该关不关或明停暗开的,要立即采取有力的监察执法措施【9 】。 经过系统有序的强力整治,近年来,煤矿行业安全生产形势持续好转,2 0 0 9 年,全国原煤生产突破3 0 亿吨,而煤炭百万吨死亡率首次降至1 以下,实现了行 业安全发展的历史性跨越。然而,从2 0 0 9 年以来一些大型煤矿连续发生的几起重 特大事故,特别是从2 0 1 0 年三月份以来的几起重特大事故来看,煤矿安全生产基 础仍不牢固,煤矿安全形势仍然极为复杂和严峻。 “前车覆,后车戒“ 。认真梳理引发矿难的复杂成因,从理念上廓清影响煤矿 安全运行的核心因素,探求遏制矿难的有效途径,努力构建煤矿行业安全生产长 效机制,提高煤炭行业整体安全运行水平和保障能力,是全行业需认真思索、亟 待破解的课题。 1 .2 研究现状 1 .2 .1 博弈论的研究概况 博弈论 G a m eT h e o r y ,有时也称为对策论,或者赛局理论,是研究具有斗 争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一 个新分支,也是运筹学的一个重要学科。目前在生物学、经济学、国际关系学、 计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。主要研究公式 化了的激励结构 游戏或者博弈 G a m e 间的相互作用,是研究具有斗争或竞 争性质现象的数学理论和方法1 2 1 。 对于博弈论的研究,开始于策墨洛 Z e r m e l o ,1 9 1 3 、波雷尔 B o r e l ,1 9 2 1 及 冯诺伊曼 v o nN e u m a n n ,1 9 2 8 ,后来由冯诺伊曼和奥斯卡摩根斯坦 y o n N e u m a n na n dM o r g e n s t e m ,1 9 4 4 ,1 9 4 7 首次对其系统化和形式化 参照 M y e r s o n ,1 9 9 1 【3 】。随后约翰福布斯纳什 J o h nF o r b e sN a s hJ r .,1 9 5 0 ,1 9 5 1 利用 不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。此外, 塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门 较完善的的学科f 1 5 】。 在博弈论中,一个著名例子是由塔克给出的“囚徒困境“ 博弈模型【1 0 】。该模 型用一种特别的方式为我们讲述了一个警察与小偷的故事。博弈论的案例还有很 .2 . 第1 章绪论 多,如经济学中的“智猪博弈“ ,价格战博弈,污染博弈,贸易战博弈论等。现如 今,很多问题都可以用博弈论来分析得出结果,也有很多学者做过各种有关博弈 方面的研究。但是,针对煤矿企业与矿工的博弈分析并不多见【弼J 。 在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条 件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信 息的条件是很难实现的【4 1 。在企业的合作竞争中,参与人之间是有差别的,经济 环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显 而易见的。与传统博弈理论不同,进化博弈理论并不要求参与人是完全理性的, 也不要求完全信息的条件【l 。 。 进化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在 方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一 种动态的均衡【l6 1 。进化博弈理论源于生物进化论,它曾相当成功地解释了生物进 化过程中的某些现象【l7 】o 如今,经济学家们运用进化博弈论分析社会习惯、规范、 制度或体制形成的影响因素以及解释其形成过程,也取得了令人瞩目的成绩。进 化博弈论目前成为进化经济学的一个重要分析手段,并逐渐发展成一个经济学的 新领域1 1 2 】。 1 .2 .2 我国煤矿安全生产管理的研究现状 面对我国煤矿当前严峻的安全现状,我国煤矿安全生产管理的研究相对滞后, 煤矿安全生产管理还没有引起我国主流学术界的重视。从发表的文章内容看,主 要是如何做好煤矿安全生产管理工作的基本思路【2 0 。,对于煤矿安全生产管理中涉 及的煤矿企业与矿工之间的收益分析的研究文献并不多见。 从为数不多的关于煤矿安全生产管理博弈分析的文献看,周忠科、徐亮 2 0 0 6 年 在我国煤矿安全生产与监管中的三方博弈分析中,针对我国煤矿安全事 故频繁的现状和特点,从煤矿的内部管理与政府对煤矿的监督两方面入手,深入 分析了我国煤矿安全监管体制中行为原因而存在的问题,从而建立了我国煤矿安 全管理中基于政府、煤矿和职工的三方博弈模型。根据博弈模型的求解结果,建 立了能使三方达到均衡的加强煤矿安全生产和完善监管体制的几点建议【4 1 1 。 肖兴志等人 2 0 0 7 年 在中国煤矿事故频发的博弈解释中,从博弈论的 视角出发,基于中央政府、地方政府、煤矿企业、矿工四个博弈主体的利益考虑, 通过中央政府与地方政府、地方政府与煤矿企业、煤矿企业与矿工之间三组博弈 的分析解释,分析论述了我国煤矿事故产生的根本原因,并提出了完善煤矿安全 .3 . 第1 章绪论 治理、降低煤矿事故率的政策建议【4 2 1 。 上述文章存在一个共同的问题,它们都只是对煤矿企业和矿工建立了传统博 弈模型。但是,在传统博弈理论中,常常假定参与人是完全理性的,且参与人在 完全信息条件下进行的,但在现实的经济生活中,参与人是很难做到完全理性与 完全信息的。 1 .3 研究目的 在煤矿安全生产管理的过程中,煤矿企业与矿工都会以自己的经济利益为出 发点选择自己的行为策略,这样就产生了一个博弈的问题。煤矿企业为了经济利 益的最大化可能会选择安全不达标,减少生产的成本;矿工为了自身收益最大化 可能会选择违规操作,增加额外收益。在这种条件下,如何建立更为有效地机制, 使双方都能以实现安全生产为出发点来选择自己的行为策略就显得尤为重要。 本文运用博弈论的方法对我国煤矿安全生产各相关者在生产安全管理中的收 益、损失进行分析的基础上,构建各利益相关者的收益函数,并分析各相关者在 生产安全管理中的合作与博弈行为。最终对我国煤矿企业安全生产管理提出对策 建议。 1 .4 研究方法及技术路线 本论文采用博弈理论对主要研究内容开展研究。主要方法包括 1 采用定性、定量和多重调研相结合的方法,多视角对煤矿企业安全达标 与矿工安全操作进行研究。 2 规范研究和实证研究相结合的研究方法,使论文的研究更具系统性、真 实性。 3 采用理论与实际相结合的方法,以理论指导实践,又以实践丰富理论, 从而使本论文研究所提出的措施和方案具有可操作性。 本文的技术路线如图1 所示。 .4 . 第1 章绪论 煤矿企业安全达标的博弈分析矿工安全操作的博弈分析 煤矿企业安全达标与矿工 安全操作的博弈分析 矿工冒险性行为分析 图1 论文技术路线 以 F i g lT e c h n o l o g yr o u t eo fp a p e r 1 .5 本文的创新点 1 运用传统博弈及进化博弈理论,构建煤矿企业安全达标的博弈模型,对 煤矿企业及矿工的行为进行了理论分析。在该模型中,煤矿企业为减少成本,可 能会降低安全投入,使煤矿安全不达标;矿工为了较高的工资可能会选择继续在 安全不达标的煤矿企业工作;若矿工离开该煤矿企业,企业为了寻找新的愿意在 安全不达标的煤矿企业工作的矿工,也需投入一定的费用。根据双方成本的变化, 引入煤矿企业安全达标与矿工继续工作的博弈模型。 2 运用传统博弈及进化博弈理论,构建矿工安全操作的博弈模型,对煤矿 企业及矿工的行为进行了理论分析。在该模型中,矿工为了节省时间、提高生产 量,可能会违规操作;煤矿企业有责任对矿工进行安全监察,但是,煤矿企业为 了节省监察成本,可能不对矿工进行有效监察;若煤矿企业对矿工进行安全监察 并查处矿工存在违规操作行为,会对矿工进行一定的处罚。根据双方成本的变化, 引入煤矿企业安全监察与矿工安全操作的博弈模型。 3 运用传统博弈及进化博弈理论,构建煤矿企业安全达标与矿工安全操作 的博弈模型,对煤矿企业及矿工的行为进行了理论分析。该模型是对上述两个模 型的综合描述,煤矿企业是否安全达标以及矿工是否安全操作均是煤矿安全事故 发生的隐患,基于双方对对方安全行为的信任,并且对事故发生的可能性估计较 - 5 . 第1 章绪论 低,不安全行为获得的收益高,煤矿企业可能选择安全不达标、矿工也可能选择 违规操作。但是若有一方在进行不安全行为,就有可能发生煤矿安全事故;若双 方都有不安全行为,安全事故发生的可能性将会更大。若发生安全事故,双方均 会造成一定的损失。根据双方成本的变化,引入煤矿企业安全投入与矿工安全操 作的博弈模型。 ’ .6 . 第2 章博弈论的理论概述 2 博弈论的理论概述 二I 寻并- 匕日’J 蔓E - ,匕叮1 研.必C .2 .1博弈论的基本概念及表述 2 .1 .1 博弈论的基本概念 为了更加直观的介绍博弈论文的相关概念,我们引入一个房地产开发的例子。 假设有一个房地产开发商A ,他正在考虑是否要开发一栋楼房,他有开发及不开 发两个选择,若要开发,他需投入1 亿元。同时有房地产商B ,他也面临同样的 困扰。再假定,市场上如果有两栋楼房同时出售,在需求大的时候,每栋楼的售 价为1 .4 亿元,需求小的时候,,每栋的售价为7 0 0 0 万元;市场上如果只有一栋楼 房在出售,那么,在需求大的时候,其售价为1 .8 亿元,需求小的时候为1 .1 亿元。 在这样的状况下,如果市场需求为大,房地产商A 与房地产商B 若都开发, 他们的利润均为4 0 0 0 万;如果双方都不开发,他们的利润均为0 ;如果一方开发、 一方不开放,则开发的一方利润为8 0 0 0 万,不开发的一方利润为O 。 如果市场需求为小,房地产商A 与房地产商B 若都开发,他们的利润均为 .3 0 0 0 万;如果双方都不开发,他们的利润均为O ;如果一方开发、一方不开放, 则开发的一方利润为1 0 0 0 万,不开发的一方利润为0 。 在这个例子中,无论你 开发商A 还是开发商B ,在决定是否开发时,不 仅要考虑市场需求的大小,而且要考虑对方的行动。如果我们假定双方同时决策, 每一方在做出自己的决定时并不知道对方的决定,再假定市场需求对双方都是已 知的,那么,如果市场需求大,双方都会开发,各得利润4 0 0 0 万;如果市场需求 小,一方是否开发依赖于他认为对方是否开发如果A 认为B 会开发,A 最好不 开发;反之亦然。另一方面,如果市场需求是不确定的,是否开发依赖于各自在 多大程度上认为市场需求是大的及对方是否开发。比如说,如果双方都认为市场 需求大的概率为0 .5 ,那么,不论对方是否开发,每一方的最优决策是开发,因 为在最坏的情况下开发可带来5 0 0 万的期望利润,而不开发的利润是0 。但是, 如果双方都认为高需求的概率为O .3 ,那么,一方会选择开发当且仅当他认为对方 开发的概率小于3 1 /4 0 时。 更为复杂但现实的情况是当市场需求不确定而不同开发商的开发决策要在不 同时间做出的时候。比如说,B 的决策要在A 之前做出,但B 在决策之前通过市 场调研对需求有了确切的了解,而A 却没有。那么,B 应该如何决策呢 如果B 在对市场需求有完全了解的情况下做出“开发“ 或“不开发“ 的决定,A 应该 .7 . 第2 章博弈论的理论概述 如何决策呢 显然,如果需求是大的,B 会选择开发;但如果需求是小的,B 是 否开发依赖于他多大程度相信A 会开发,而A 是否开发依赖于A 在多大程度上 认为需求是大的。假定A 认为高需求的概率为0 .5 ,且B 知道A 的这个“先验“ 信仰,B 将选择不开发,这是因为,如果B 开发,A 关于高需求的信仰不会向下 调整,A 将选择开发,B 的利润为.3 0 0 0 万。由于这个原因,均衡结果将是如果 B 知道需求是大的,B 决定开发,A 也开发,各得4 0 0 0 万利润;如.果B 知道需 求是小的,B 决定不开发,A 开发。有意思的是,在需求小的情况下,如果B 有 办法使A 相信需求确实是小的,B 就会决定开发;给定B 开发的情况下,A 的最 优选择是不开发。 让我们将上述例子命名为“房地产开发博弈”。这个简单的例子几乎涉及到博 弈论要讨论的所有重要问题。尽管我们已经非正式地给出了几种特殊情况下的答 案,要准确地描述这个问题需要有关博弈论的一些基本概念【l 】。 博弈论的基本概念包括参与人、行动、信息、战略、支付 效用 、结果和均 衡,其中,参与人、战略和支付是描述一个博弈所需要的最少的要素,而行动和 信息是其“积木“ 。参与人、行动和结果统称为“博弈规则”。博弈分析的目的是 使用博弈规则预测均衡。我们现在给出这些概念的准确定义【2 1 ‘2 5 1 。 1 参与人参与人指的是一个博弈中的决策主体,他的目的是通过选择行 动 或战略 以最大化自己的支付 效用 水平。参与人可能是自然人,也可能 是团体,如企业、国家,甚至若干个国家组成的集团 如O P E C 、欧盟、北约等 。 这里,重要的是,每个参.与人必须有可供选择的行动和一个很好定义的偏好函数 1 2 6 ] 。那些不作决策的被动主体只当作环境参数来处理。在房地产开发博弈中,有 两个参与人,即“开发商A ”和“开发商B ”,他们要做出“开发”或“不开发’’ 的决策,目的是最大化自己的利润水平,而写字楼的需求者则被当作环境变量放 在“市场需求’’中。当然,一个主体是否是参与人依赖于分析的目的。 除一般意.义上的参与人之外,为了分析的方便,在博弈论中,“自然“ 作为 “虚拟参与人“ 来处理。这里,“自然“ 是指决定外生的随机变量的概率分布的机 制。在房地产开发博弈中,对写字楼的市场需求是一个随机变量,我们可以假定, 在博弈的开始,“自然’,以一定的概率决定需求是大还是小。参与人决策的后果 依赖于自然的选择。在不完全信息博弈中,自然选择参与人的类型。与一般参与 人不同的是,自然作为虚拟的参与人没有自己的支付和目标函数 即所有结果对 它都是无差异的 。 在本文中,我们一般用i 1 ,⋯,刀代表参与人,N 代表“自然“ 。 .8 . 第2 章博弈论的理论概述 2 行动行动是参与人在博弈的某个时点的决策变量。一般地,我们用a , 表示第f 个参与人的一个特定行动,A i 徊, 表示可供f 选择的所有行动的集合 a c t i o ns e t 。参与人的行动可能是离散的,也可能是连续的。比如说,在房地产 开发博弈中,每个参与人都只有两种行动可供选择,即 A , { 开发,不开放 ,f A ,B 。在寡头产量竞争的库诺特模型中,行动是选择产 量g f A f { g ,q ,≥O 。 在刀人博弈中,r /个参与人的行动的有序集a 0 l .一,q ,⋯,口。 称为“行动组 合” a c t i o n p r o f i l e ,其中的第f 个元素口,是第f 个参与人的行动。在房地产开发博 弈中,如果A 选择不开发,B 选择开发,那么, 不开发,开发 就是一个行动组 合。事实上,这个例子中共有四个行动组合,其他三个分别为 开发,开发 , 开 发,不开发 , 不开发,不开发 。 3 信息信息是参与人有关博弈的知识,特别是有关“自然”的选择、其 ’ 他参与人的特征和行动的知识。信息集是博弈论中描述参与人信息特征的一个基 本概念,我们可以将其理解为参与人在特定时刻有关变量的值的知识。一个参与 人无法准确知道的变量的全体属于一个信息集。比如说,在房地产开发博弈中, 如果A 不知道市场需求是大还是小,而B 知道,那么,A 的信息集为{ 大,小 ,,一.一髭 B 的信息集.为{ 大 或{ 小 ;假定B 先行动A 后行动,那么,如果A 在行动前能 准确知道B 选择了什么行动,A 有关B 的行动 的信息集为{ 开发 或{ 不开发} , 反之,A 的信息集为{ 开发,不开发} 。 4 战略战略是参与人在给定信息集的情况下的行动规则,它规定参与人 在什么时候选择什么行动。因为信息集包含了一个参与人有关其他参与人之前行 动的知识,战略告诉该参与人如何对其他参与人的行动做出反应,因而战略是参 与人的“相机行动方案“ 。 一般地,我们用s ,表示第f 个参与人的一个特定战略,S j k } 代表第f 个参 与人的所有可选择的战略的集合。如果n 个参与人每人选择一个战略,n 维向量 s “,⋯,墨,⋯,S 。 称为一个战略组合,其中墨是第i4 “ 参与人选择的战略。 5 支付在博弈论中,支付或者是指在一个特定的战略组合下参与人得到 的确定效用水平,或者是指参与人得到的期望效用水平。支付是博弈参与人真正 关心的东西。我们假定每一个参与人的偏好都可以由一个v - N M “v o nN e u m a n n a n dM o r g e n s t e m ’’的缩写 期望效用函数来代表,他的目标是选择自己的战略以 最大化其期望效用函数。 令“,为第f 个参与人的支付 效用水平 ,“ 0 I ,.一,甜∥一,甜。 为n 个参与人 .9 . 第2 章博弈论的理论概述 的支付组合 p a y o f f p r o f i l e 。博弈的一个基本特征是一个参与人的支付不仅取决 干自己的战略选择,而且取决于所有其他参与人的战略选择,就是说,U ,是所有 参与人的战略选择的函数U , U i G l ,.一,s f .一,s 。 。 在房地产开发博弈中,参与人的利润水平即他们的支付。如果A 和B 同时行 动,那么 ,U A 偷需求,开发 U A f 氐需求,开发 U A 偷需求,开发 U A f 氐需求,开发 如此等等。 开发 材B 偷需求,开发,开发 4 0 0 0 开发 U B f 氐需求,开发,开发 .3 0 0 0 不开发1 8 0 0 0 不开发 1 0 0 0 6 结果结果是博弈分析者所感兴趣的所有东西,如均衡战略组合,均衡 行动组合,均衡支付组合等。在房地产开发博弈中,一个可能的结果是 高需求, 开发,开发 ;0 。,U 8 4 0 0 0 ,4 0 0 0 ,即自然选择了高需求,A 和B 都选择了开 发,A 和B 各得利润4 0 0 0 万。另一个可能的结果是 低需求,开发,不开发 , 0 。,U 8 0 0 0 0 ,0 ,即自然选择了低需求,A 选择了开发,B 选择了不开发,A 得1 0 0 0 万利润,B 得O 利润。 7 均衡均衡是所有参与人的最优战略的组合,一般记为 s 。 b ’,⋯,s ,。,⋯,s 。’J 。其中量’是第f 个参与人在均衡情况下的最优战略,它是f 的 所有可能的战略中使U ,或E u ,最大化的战略。因为一般来说,U ,是所有参与人的 战略组合的函数,f 的最优战略通常依赖于其他参与人的战略选择。为了把一个 特定的参与人与其他参与人区别,我们将用s 一, “,⋯,‘小s Ⅲ,⋯,S 。 表示由除f 之外的所有参与人的战略组成的向量。那么,说S , 是给定s 一,情况下第f 个参与人 的最优战略意味着U i I S i * s 一,J ≥“,b ,’,s 一,JV s ,’≠s ,。,均衡意味着,对所有的 f 1 , 2 ,⋯,n ,上式同时成立。 在博弈论里,有各种各样的均衡概念,上述定义是所有均衡概念的共同特征。 我们将看到,一个博弈可能有多个均衡存在。在房地产开发博弈中,假定开发商 A 和开发商B 同时选择行动,那么,如果需求大, 开发,开发 是唯一的一个 均衡;如.果需求小, 开发,不开发 是一个均衡, 不开发,开发 也是一个均 衡。缺乏唯一性是博弈论的一个主要问题。 2 .1 .2 博弈论的战略式表述 在博弈论里,一个博弈可以用两种不同的方式来表述,一种是战略式表述, .1 0 . 第2 章博弈论的理论概述 另一种是扩展式表述 或译为“展开式表述’’ 。尽管从理论上讲,这两种表述形 式几乎是完全等价的。但从分析的方便性的角度看,战略式表述更适合于静态博 弈,而扩展式表述更适合于讨论动态博弈‘2 7 。3 2 】。 战略式表述又称为标准式表述,在这种表述中,所有参与人同时选择各自的 战略,所有参与人选择的战略一起决定每个参与人的支付。 更为准确地讲,战略式表述给出 1 博弈的参与人集合f ∈F ,F 1 ,2 ,⋯,刀 ; 2 每个参与人的战略空间S ,,待1 , 2 ,⋯,甩; 3 每个参与人的支付函数甜,G l ,.一,墨,⋯,s 。 ,待1 , 2 ,⋯,1 1 。 我们将用G 豳l ’.一,S 。;”l ,.一,Ⅳ。} 代表战略式表述博弈。 一个博弈被称为有限博弈,如果第一,参.与人的个数是有限的,第二,每个 参与人可选择的战略是有限的。两人有限博弈的战略式表述,可以用矩阵表来直 观地给出。表1 是房地产开发博弈中开发商A 和B 同时行动博弈的战略式表述, 其中 a 是高需求的情况, b 是低需求的情况。表中左列是A 的战略空间, 上行是B 的战略空间,每一个数字格是对应战略组合下的支付 利润 ,其中第 一个数字是A 的利润,第二个数字是B 的利润,比如说,表1 a 第一行第二 列 8 0 0 0 ,0 是从战略组合 开发,不开发 得到的支付A 的利润为8 0 0 0 万, B 的利润是0 。 表1 房地产开发博弈 T a b l e lG a m eo f r e a le s t a t ed e v e l o p m e n t a 高需求情况 浆j 开发不开发 开发商A \ 开发 4 0 0 0 ,4 0 0 08 0 0 0 ,0 不开发 0 ,8 0 0 0 0 ,0 b 低需求情况 ~淤j 开发不开发 开发商A \ 开发一3 0 0 0 ,- 3 0 0 0 1 0 0 0 ,0 不开发 0 .1 0 0 00 ,0 第2 章博弈论的理论概述 2 .1 .3 博弈论的扩展式表述 博弈的扩展式表述所“扩展”的主要是参与人的战略空剐3 3 】。战略式表述简 单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描 述谁在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道些什 么。简单地说,在扩展式表述中,战略对应于参与人的相机行动规则,即什么情 况下选择什么行动,而不是简单的、与环境无关的行动选择。 具体来讲,博弈的扩展式表述包括以下要素 1 参与人集合江1 , 2 ,⋯,n ,此外,我们将用N 代表虚拟参与