岩石力学反问题.ppt
岩石力学反问题吕爱钟,第一章绪论,第一节反问题,一、反问题的内容及特点,固体力学的正问题是指在物体的几何形状、材料性质及外荷载已知的情形下,求其物体内部的应力分布与变形规律。而相应的反问题是指正问题中的某些待求量通过实地量测或人为指定变为已知量,而某些已知量作为待求量。,近几年固体力学所关心的反问题有孔形优化问题,即已知材料性质及外荷载,如何设计孔洞的形状,使孔洞周边或孔外域的二次应力场或位移场满足预先指定的要求。孔形优化问题也是岩石力学工作者所关心的一类反问题,它可以指导我们如何开挖巷道,使巷道在有一定工作空间的要求下处于最佳的受力状态,以利于巷道的维护。,矿山岩石力学所关心的第二类反问题是已知巷道的开挖形状,根据实地量测的变形规律位移场,求其描述这个系统的最佳模型及模型参数岩石的性质参数或原始地应力场,这类反问题称为位移反分析。,在数学中我们早就接触过反问题,例如,在初等代数学中已知方程求根若称为正问题的话,那么由根求方程的系数就是代数方程的反问题;在矩阵论中,由矩阵求特征值也对应着它的反问题已知特征值反求矩阵。,由“结果”推断“原因”的反问题在人类认识自然与改造自然中起到了重要的作用,例如,遥测与遥感技术是通过接收回波反射波信息去判断人们感兴趣的物体的形状,地球物理勘探中的反问题就是借助于地球表面接收到的主动场或被动场的数据,经过处理判断地层的结构。,应用反问题思想解决实际问题的例子比比皆是,例如(1)各类案件的侦破(2)建筑质量的判断(3)各类设备故障原因的调查与确定(4)各类事故的调查与责任的判定(5)考古研究(6)内科大夫看病,以往在矿山岩石力学中实际上也求解了一些反问题,例如,利用应力解除法求原始地应力,就是通过量测应变或位移反求荷载,平板试验就是利用量测位移反求岩体性质参数,所采用的求解方法都为逆法,只是未被普遍认识。,由“结果”推断的“原因”可能解不唯一多解性,即某一特定“结果”可能引起的“原因”有多种,这是反问题的一类不适定性,反问题还可能具有解的不存在性和解的不稳定性这些特点,如果反问题的提法不正确,可能会导致反问题的解不存在,反问题的不稳定性是指实测资料有一定的微小误差时,反求出的结果产生很大偏差,甚至无法控制。如果反问题的解存在,唯一且稳定,则我们称反问题为适定的。,不适定问题的解法研究已成为计算数学中心问题之一,在这一领域中理论上作出重要贡献的是原苏联学者古洪诺夫,1974年他出版了“不适定问题的解法”一书,这是有关这方面的第一本专著,美国、中国相继翻译成英文、中文出版。,二、研究岩石力学反问题的意义,巷道形状优化设计孔形优化是一项很有实际意义的工作,它可以指导我们如何设计巷道断面使巷道在有一定工作空间的要求下,处于容易维护的状态,达到既安全又经济的目的。,孔形优化是在岩石性质参数及原始地应力已知的条件下进行的,岩石的性质参数及地应力的确定是解决岩石力学问题的关键所在,岩石力学工作者多年来一直在专门研究这个问题,但效果并不理想。岩石性质参数的确定一般都是在实验室或现场试件进行的,试件尺寸与巷道尺寸比较仍然太小,试件不能反映实际岩体的结构,试件的受力状态与巷道的实际受力状态相差很大,这样根据试件确定的岩石性质参数对于解决实际的岩石力学问题,其结果相差很大。,计算结果与实际量测结果相差很大的原因并非完全是由以上原因引起的,通常的原始地应力测定可靠性较差或者是选择的力学模型不正确都可以造成很大的误差。以往求解岩石力学问题的主要特点是把力学模型的选择、岩石性质参数及地应力的确定三个过程单独进行的。现在,有了位移反分析我们可以直接利用实地量测的变形规律,根据选择的力学模型同时求出岩石性质参数及原始地应力。,实地量测就是一个最反映实际情况的现场试验,究竟采用何种力学模型这不能凭空事先决定,而必须由实地量测的变形规律在已知的一组模型里求出与实际变形规律最接近的最佳模型,这就是模型鉴别的内容。求出了模型包括参数和原始地应力,我们再按正问题去计算,预测以后开挖所表现的各种力学行为。,确定支护结构上的荷载,这是地下结构设计与地面结构设计的最大不同点,对于地面结构所承受的荷载较易确定,而地下支护结构所承受的荷载是不能事先知道的,结构承受的荷载取决于结构与岩体的相互作用,它的大小及分布规律与岩体性质、原始地应力场、支护刚度及支护时间等多种因素有关,分析结构与岩体的相互作用,要利用岩体和结构的力学模型,但由于目前岩体力学模型的研究尚未成熟,故根据相互作用从理论上精确给出结构上的荷载是困难的。,现在有了位移反分析,我们可以在可靠性较高的结构模型的基础上,利用结构上的位移量测值反求结构上的荷载,当结构的力学模型正确时,反算的荷载是可信的。,长期以来,地下结构的荷载缺乏合适的确定方法,设计主要依靠经验类比,从而往往导致安全储备不足而破坏或者安全储备过大而严重浪费。目前,位移反分析已广泛应用于岩体的力学性质参数及原始地应力的辨识。当然,利用位移反分析也可以辨识出支架上的荷载。,根据岩石力学的发展水平,地下结构上荷载的确定可划分为三个阶段第一阶段上世纪末和本世纪前半叶,沿用地面结构的特点,地下结构被看作仅是承受荷载的结构,荷载大小为了区别,这里的荷载称为主动荷载是根据当时的地压假说来确定。假定地下结构本身对作用在其上的荷载大小和分布不产生影响,在地压计算中不考虑地下结构的变形,即不考虑围岩抗力围岩抗力称为被动荷载。比较有影响的地压假说是冒落拱假说和压力拱假说。,第二阶段自本世纪30年代起,与第一阶段不同的是考虑在主动荷载作用下地下结构的变形,其特点是作用在地下结构上的荷载由主动荷载和被动荷载组成。主动荷载仍根据地压假说确定;被动荷载是根据围岩限制地下结构在主动荷载作用下产生的变形而引起的抗力来确定。围岩抗力通常根据熟知的文克尔E.Winkler假设围岩的弹性抗力与结构变位成正比计算。,第三阶段现代阶段,不再区分主动荷载和被动荷载,地下结构的荷载根据围岩支架共同作用原理来确定。即,给定支架、围岩的力学模型,通过计算围岩对支架的作用力来确定地下结构受到的荷载。常用的力学模型有弹性模型、弹塑性模型及粘、弹塑性模型等。,从理论上讲,根据支架围岩共同作用原理确定地下结构的荷载是完善的。这样获得的荷载能够综合反映岩体性质、原始地应力、地下结构的性质及开挖与支护间隔时间等多种因素的影响,不仅能够得到地下结构的法向荷载而且能够得到其切向荷载,克服了直接按主动荷载和被动荷载确定地下结构荷载的不足。但是,由于岩体是地质介质,其力学性质具有非均质、各向异性、流变性质等特性,更重要的是岩体是裂隙体,即岩体中含有断层、节理、裂隙等不连续面,因此,至今未能建立起符合实际情况的力学模型,故此,难以根据围岩支架共同作用原理有效地确定地下结构的荷载。,此外,人们曾通过在衬砌与围岩之间埋设测压元件直接量测地下结构的荷载。由于测压元件的刚度与围岩的刚度不匹配,测压元件的存在扰动了地下结构上的荷载分布,因此,通过测压元件量测得到的地下结构荷载不可靠,而且该方法不能量测地下结构的切向荷载,此外该法费用较高。,上述确定地下结构荷载的三个阶段都是沿用地面结构设计的思路先确定荷载,再进行结构设计、计算。地下工程的特点是应先求反问题再求正问题。这里的反问题指,通过量测受载后支架上某些点间的相对位移,反算支架的荷载。,第二节系统辨识和参数辨识,如果把所讨论的对象作为一个系统的话,则正问题是指已知描述系统的模型及输入,求输出,如图1.1所示,在这种情况下,不但模型结构是已知的,而且所有有关的参数也是已知的。而反问题是指通过量测输出,来求系统的模型或模型参数,有些情况下,当模型和模型参数已知时,反问题是指由输出求输入。按对系统的了解程度,反问题可分为系统辨识和参数辨识两类。,一、系统辨识,系统辨识是通过量测得到系统的输出和输入数据来确定描述这个系统的数学方程,即模型结构。为了得到这个模型,我们可以用各种输入来试探该系统并观测其响应输出,然后将输入输出数据进行处理来得到模型。,近年来,系统辨识的应用领域日益扩大,在通信工程、航空航天工程、地质学、经济学、生物学、医学等方面都得到应用,各个领域都在利用系统辨识方法建立各自系统的定量模型,从而由定性到定量地解决实际问题,另一方面,也由于现代计算工具发展,使许多问题可以通过计算机加以解决,这又推动了系统辨识的发展。,基于对系统先验信息的了解程度,我们可以把系统辨识问题分为两类“黑箱问题”也叫完全辨识问题,在这种情况下,被辨识的系统的基本特性是完全未知的。例如,系统是线性的还是非线性的,是动态的还是静态的,对这些基本的信息都一无所知,要辨识这类系统当然是很困难的,目前尚无有效的办法。,“灰箱问题”又叫不完全辨识问题,在这一类问题中,系统的某些基本特性例如线性为已知的,不能确切知道的只是系统方程的阶次和系数。当然,这类问题比“黑箱问题”容易处理。幸好,许多工程上的辨识问题属于“灰箱问题”,这样,系统辨识问题就简化为模型鉴别和参数辨识问题了,参数辨识是系统辨识中最重要也是研究得最成熟的部分。,二、参数辨识,参数辨识是近几年发展较快的年轻学科,在各个领域都引起了重视,它的名字还没有完全统一起来,参数辨识的其它名字有非线性估计nonlinearestimation、非线性回归nonlinearregression、参数优化optimizationofparameters,有的文献干脆称为建模modelbuilding或系统辨识identificationofsystems。“估计”是数理统计中的术语,“辨识”是电气工程上的术语。,对于矿山岩石力学问题,我们一般把易量测的位移作为系统的输出,巷道及支护的形状、尺寸作为输入,与模型结构有关的变形参数可作为模型参数,地应力既可以作为输入,也可看作为待识别的参数。,第二章参数辨识方法的基础知识,第一节参数辨识的几个要素,一、模型,在自然科学和工程领域中,模型的建立与实验、观察具有同等重要的地位,模型的建立是实验、观察、认识问题的一个飞跃。模型是实际系统“原型”的一种“类似”,它与“原型”必定存在一定的差别,任何原型都有数不清的层次和特征,能反映出原型一切特征的只能是原型本身,而不是模型。建模的目的不是将原型的一切方面都表达出来,模型只是在所要研究的主题范围内能表达人们最需要知道的那些特征即可,从而达到对原型的抽象,以模型为基础,较方便地对原型进行分析、研究,以便通过模型的预测结果来正确指导我们作出某种决策。,模型的表达形式可以是概念性的、物理的或者是数学的,这取决于模型建立的特定目的。采用数学描述的形式所建立的模型我们称为数学模型,它是系统中的各个物理量之间的关系所构成的数学结构,象代数方程、微分方程等等。不言而喻,目前在岩石力学中采用的弹性模型、弹塑性模型、粘弹模型都为数学模型。模型结构的形式有静态的或是动态的,线性的或是非线性的,参数是定常的或是时变的,确定型的或是随机型的,参数模型或是非参数模型。,二、参数和状态,由常微分或偏微分方程给出的数学模型,有时它的解是一组比较简单的代数方程。在任何情形下,都有自变量和因变量以及一些常数。因变量有时称为状态变量或信号,而常数称为参数。,在实验中,常常直接量测的是状态,而参数一般不能直接量测出来,参数只能由状态的量测值反求出来。有的教科书所关心的是参数估计问题,而有的教科书则侧重于状态的估计预测。参数估计与状态估计预测两个问题非常相似,在参数估计的同时,通常状态估计预测自动完成。,参数和状态这两个概念可以由下面的简单例子说明之。例1根据牛顿第二定律可知axtmFxt这里Fxt是x方向的力,axt是x方向的加速度,它们都是时间t的函数,m是质量。Fxt,axt我们可以看作为状态,而质量m则是参数。力和加速度通常可容易地通过量测获得。对此问题,质量不但可以根据力和加速度求得,而且也可以直接量测获得,但是对有些情况,质量则必须根据力和加速度推算而得,例如,要确定慧星和行星的质量就是一个例子,这时不可能直接量测而得它们的质量。,例2以初速度v0垂直上抛一个物体,已知物体离开地面的距离s可由公式sv0t-1/2gt2表示。这里g是重力加速度,它是一个参数,时间t为自变量,s是状态。v0既可看作为参数,也可看作为状态。,例3一等截面拉杆,截面积为A,原长为L,它一端固定,一端受拉力P的作用图2.1,每个截面都产生x方向的位移,距原点O,x处的截面位移为uxuxPx/EA这里ux为状态,x是自变量,E、A、P为参数,但A、P可直接量取获得,E必须由状态值求得。,以上所举的这些参数与统计参数比较,一般称为物理参数,象量测误差的方差、相关系数这样的参数称为统计参数。物理参数和统计参数在某些问题中可能都要辨识,而我们最关心的是物理参数的辨识。,三、准则函数,若模型能精确地反映我们对“原型”所关心的那些特征,则模型的输出就是系统的实际输出,如果对输出的量测值也不存在误差,且所讨论的反问题为适定的,则由量测的输出总可列出也只能列出与待辨识参数个数相等的独立方程,由这些方程即可唯一地求出待求的参数。,实际上,由于模型的近似性和量测误差的存在,则按以上方法求得的参数不能很好地反映整个系统的特征。如何能够求出反映整个系统的最优参数呢最直观的做法是量测的数量必须大大地超过待求参数的个数,这样可以降低量测噪声对待求参数的影响,这样列出的方程个数多于待求的参数个数,所得的方程组为矛盾方程组,通过适当的最优化技术可以求解这样的问题,使得在某种意义下求得的参数为最优参数。如何衡量最优最优准则如何确定这是参数辨识首先要解决的问题。,我们一般把最优化准则称为准则函数,记为J。准则函数总体上可分为两大类,一类是以输出信号为基础的准则函数,一类是以量测误差或参数的概率统计性质为基础的准则函数,后面我们将分别称为第一类和第二类准则函数。,,,第一类准则函数一般表示为系统的实际输出量测值yt和模型的输出ηt的偏差的某个函数,例如,可取等一些误差函数作为准则函数。式中n为量测数量,ηti是输入和参数的函数,给定模型结构也就是知道了ηti的函数形式,t是自变量。对于以时间作为自变量的模型,ti表示第i时刻,对于以位置作为自变量的模型,ti表示第i个位置。yti是已知的量测值,当输入为已知时,显然,准则函数J的大小随着所选的模型参数不同而不同,当J达到最小值时的参数即为最优参数。,对于第一类准则函数,参数辨识实际上可作为一个最优化问题处理,即通过所选的准则函数如何寻求使准则函数达到极小的参数值。就此而言,准则函数称为目标函数。根据求解的问题不同,在不同场合下J往往还有其它的名字,例如误差函数、损失函数、成本函数等等。,以量测误差或参数的概率统计性质为基础的第二类准则函数的参数辨识,事先考虑了输出信号量测误差的统计特性,把待求参数作为确定性常数或随机变量。参数的最优并不是象第一类准则函数直接以输出的偏差最小为衡量准则,而是以参数误差参数真值与参数估计值的差为最小或以特定输出量测值出现可能性为最大等概率统计特性为衡量准则。对于第二类准则函数,参数辨识作为估计问题处理,参数估计的具体实现同样离不开最优化技术。,两类准则函数相比,由于后者利用了一些概率统计知识,所以后者比前者的最大优点是可以计算量测噪声对参数辨识的影响程度,有时所求出的参数估计值具有较好的统计特性。,第二节参数辨识的方法分类,参数辨识具有多种方法。根据不同的准则函数可得出一系列参数辨识法,例如,以第一类准则函数为基础的最小二乘法、加权最小二乘法,以第二类准则函数为基础的最小方差法、极大似然法、贝叶斯法等等。以第一类准则函数为基础的各种参数辨识方法统称为确定性方法,以第二类准则函数为基础的各种参数辨识方法统称为随机性方法。,根据辨识的方式可分为离线辨识和在线辨识,所谓离线辨识是在全部量测数据的基础上求解模型参数;而在线辨识是指收集到新的量测值以后,就在前一次参数估计值的基础上立刻进行递推计算,尽快地给出新的估计值,例如,序贯最小二乘法就是一种在线辨识。准则函数选定以后,参数辨识的过程是寻求准则函数的极值点,对于岩土工程问题,根据问题的性质及寻求准则函数极值点的算法,参数辨识方法可分为逆法和正法两大类。,以第一类准则函数2-1为例说明逆法和正法。所谓逆法是指能把模型输出表示成待求参数的显函数,由模型输出的量测值,利用这个函数关系反求出待求参数,这个过程恰好与正问题的求解过程相反,逆法由此而得名。若考虑误差的存在,则这个方法的具体实施过程是这样的由2-1的J达到极小值的必要条件即J关于参数的一阶偏导数等于零所列的方程组,求解待求参数。,逆法的应用决定于模型输出是否能表示成待求参数的函数,以及函数关系的性质如何当模型输出是参数的线性函数时,一般才利用逆法。此时,由极值必要条件所列的以参数为未知量的方程组为线性方程组,线性方程组的求解是轻而易举的事。,模型输出可以是待解的微分方程组,也可以是它的解析解。若已有解析解,参数辨识就可以以解析解为出发点,这时计算量少。若无解析解则需要以待解方程组及具体问题的定解条件为出发点,在岩土工程中,这是一种普遍情形,这时要利用有限单元法等数值方法。,正法与逆法不同,它不是利用极值的必要条件求出待求参数,而是首先对待求参数指定“初值”,然后计算模型输出值并和输出量测值比较,如果吻合良好,假设的参数“初值”就是要找的参数值,实际上当然不会这么巧,这时修改参数值,重新计算模型输出值,重新比较一直到准则函数达到极小值,此时的参数值即为所要求的参数。若模型输出是待解的微分方程组,则由参数“初值”计算模型输出是求解正问题,由此看出此时的参数辨识过程是解一系列正问题,正法由此而得名。,可以看出,正法和逆法都是寻求准则函数的极小点,但寻求的算法不同。正法比逆法具有更广泛的适用性,它既适用于模型输出是参数的线性函数的情形,也适用于模型输出是参数的非线性函数的情形。它的另一个优点是仍可沿用现成的正问题计算方法及程序。最优化技术中的直接法是求解正法的有力工具,模式搜索法Hooke-Jeeves也有称步长加速法、变量轮换法、单纯形法、鲍威尔Powell法等方法都是最优化技术中广泛应用的直接法。以上用第一类准则函数说明了正法和逆法,同样对第二类准则函数也存在正法和逆法。,第三节参数辨识方法简述,本节主要讲述按第一、二类准则函数分类的各种参数辨识方法的基本思想,而不涉及方法的本身细节。,一、观测变量和参数之间的关系,一组可观测变量y,x1,,xk,一批参数β1,,βm和一组随机变量ε,ε1,,εp总可以假定以一定的函数关系存在。这里,我们只讨论每次观测只包含一个随机变量的情形,即只有一个ε存在,其它的ε1,,εp不考虑,不同次的观测用下标i区别,即第i次的观测包含的随机变量用εi表示。,选择一个量测变量y,并用其它量测变量x1,,xk表示,即yfx1,,xk;β1,,βm;ε2-2通常称y为因变量,称x1,,xk为自变量。如果误差ε是可加的,即yηx1,,xk;β1,,βmε2-3那么这是很幸运的,这对于我们求解问题是方便的,在式2-3中,ε的分布与未知参数β1,,βm无关。,把式2-3用矢量记法进行缩写对于书写是方便的,记X=(x1,x2,,xkT则第i次观测通过下标i表示,即yiηxi1,,xik;β1,,βmεiηXi;βεiηiεi,进行了n次量测,则有y1,,yn,ε1,,εn等等,为了书写更方便,则可记Yy1,,ynTεε1,,εnTX1,,Xn可写成矩阵形式,即X[X1,,Xn]T,ε的分布一般来说是未知的,如果εii1,,n是相关的,那么以第二类准则函数为基础的参数辨识困难较大,本文主要讨论εii1,,n不相关的情形。,二、线性问题,如果能够把ηX;β写成以下形式ηX;ββ1x1β2x2βmxm2-4即在同一时刻或同一位置,模型输出ηX;β是参数β的线性函数,则称式2-4为线性模型。对于线性模型,有yβ1x1β2x2βmxmε2-5由式2-5来确定参数β的估计值,称为线性估计。如果模型输出ηX;β是参数β的非线性函数,则称非线性模型,非线性模型的参数估计比线性模型的参数估计复杂。,三、常规最小二乘估计,已有一组量测值y1,,yn则在模型结构已知的情形下可写出使式2-6达到极小值的称为参数估计值。这个参数估计方法称为常规最小二乘法ordinaryleastsquares。对于线性模型,由逆法可以求出的解析式,对于非线性模型,一般用正法求解。常规最小二乘法没有利用ε的概率统计特性。,四、高斯马尔可夫估计Gauss-markovestimation,如果对于不同的量测时刻或量测位置,式2-5中的εii1,,n是不相关的,但εi的方差不尽相同,若令εi相应的方差分别为σ12,,σn2则可令准则函数为由2-7极小求出的参数估计值一般比常规最小二乘法求得的参数估计值好,这是因为量测精度越高,相应的量测数据占的比重越大,这由式2-7可清楚看出量测精度越高,误差εi的方差σi2越小。,五、最大似然估计maximumlikelihoodestimation,如果已知εii1,,n的联合分布形式,那么yii1,,n的联合分布即可确定,此时把参数作为未知的确定性常量,则yi的联合分布为条件分布,它可由概率密度函数pY/β描述。由pY/β极大求出的参数估计值称为参数β的最大似然估计。pY/β即为准则函数。最大似然估计与εii1,,n的分布有关,后面我们将会发现,如果εi是零均值同方差的独立正态分布高斯分布时,最大似然估计量与常规最小二乘估计量是相同的。,六、最大验后估计与贝叶斯估计,如果随机变量ε的分布已知并知道ε的分布参数,例如方差是已知的,待求参数β也为随机变量,并且它的概率密度函数pβ称为参数β的验前分布也为已知,那么根据贝叶斯定理,我们可以获得最大验后估计MAPestimation,MAP是MaximumAPosterior的简写和贝叶斯估计Bayes′sestimation。最大验后估计量是根据验后分布pβ/Y取极大值的条件求得的,它是观测值为Y的条件下,参数β的“最可能”数值。pβ/Y即为准则函数。,为了方便地说明贝叶斯估计,下面讨论待估参数只有一个分量的情形。设为β的估计值,则定义准则函数为使上式达到极小的称为贝叶斯估计。由式2-8可得贝叶斯估计量这就是参数验后分布pβ/Y的期望值。式2-8表示参数估计值对真值β的均方差,所以在取得观测值Y的条件下,平均来讲,随机参数β最靠近其贝叶斯估计值,因此,可以说是参数β的“最有效”的估计值。,最大似然估计、最大验后估计、贝叶斯估计与最小二乘估计、高斯马尔可夫估计一样,既适合线性模型的情形,也适合非线性模型的情形,但对于非线性模型,难于直接求出概率密度函数pY/β或pβ/Y,所以此时的参数估计也存在一定的困难,它们可通过线性模型的估计值经多次迭代而求得。当模型结构和参数β的验前分布满足一定的要求时,最大似然估计量、最大验后估计量、贝叶斯估计量与最小二乘估计量、高斯马尔可夫估计量是相同的。,第四节参数估计量的统计特性,上节介绍的各种参数辨识方法,一种情形是事先把参数作为确定性的量,一种情形是事先把参数作为随机变量。而两种情形求出的参数估计量都是随机变量,后种情形是显然的。前种情形也不难理解,由n次量测可求出参数估计值,由于量测误差的存在,所求出的估计值不可能是参数真值,如果另取一组n个量测值去求参数,由于误差的随机性,则得到的和上次不同,所以说,尽管参数β本身不是随机变量,但是这样求出的估计量却总是随机变量。估计量是随机变量,必须从统计的观点分析,衡量估计量的优劣,无偏性、有效性和一致性是鉴别和比较估计量好坏的重要标准。,一、无偏性,我们总是希望未知参数β与它的估计值在某种意义上最接近,当然作为某一次的估计值它与真值可能是不同的,然而,如果通过一系列试验求出的不同估计值,我们很自然地要求这些估计值的平均值与未知参数的真值相等,这就是说,要求参数β的估计量的数学期望也有称数学期望为均值等于参数的真值β,即如果关系式Eβ成立,那么我们称满足这种要求的估计量为参数β的无偏估计量。估计量的无偏性意味着无论重复多少次量测,要求估计值能在被估计参数的真值附近摆动,而其平均值就等于参数真值。,二、有效性,无偏性还不能完全决定估计量的性质,对于一个估计量,还需要进一步考虑到估计值和参数真值的平均偏离的大小,或者说估计值围绕真值摆动幅度的大小问题,方差能够反映估计值的这种离散程度,一个估计量的方差愈小,这个估计量取得接近它的数学期望的值就愈频繁,或者说未知参数的估计值处在它的真值附近的概率愈大。用不同估计方法得到的各种无偏估计中,某估计量的方差达到最小,则称该估计量为参数的有效估计。在参数β的所有无偏估计量中,可能存在一个方差最小的估计量,这个估计量叫做佳效估计量。,三、一致性,一个估计量,不论它是无偏的还是有偏的,也不论它的方差大小如何,我们总是希望当量测次数增加时,对未知参数β的估计值会愈来愈精确。或者说,估计值会越来越靠近参数的真值。因此提出了估计量的一致性要求,按照数学定义,如果随着量测次数n增加,依概率收敛于β,则称为β的一致估计。一致性也有这样定义的估计差-β的协方差矩阵cov[-β]作为估计值对真值的平均偏离程度的量度,若为无偏估计,则cov[-β]E[-β-βT]。如果满足则就是β的一致估计,也有称是相容估计量。,第三章简单线性模型的参数辨识,第一节引言,处理问题都是从简单到复杂,参数辨识也是一样,本章研究2个简单的线性代数模型的参数辨识问题,通过这些简单线性代数模型的讨论可以引出许多参数辨识有关的概念,对于非线性代数模型或者由微分方程表示的模型的参数辨识,在概念理解上没有增加任何复杂性。简单的代数模型除有利于教学外,实际上,在许多问题中也得到了广泛的应用。简单的代数模型也称为回归函数。本章只讨论以下两个模型模型1ηiβ1xi3-1模型2ηiβ1xi1β2xi23-2变量η称为因变量,xi,xi1,xi2称为自变量,它可以表示时间、位置、温度等等。在这些模型中,自变量xi也可以是时间t或位置等的各种函数,或者是它们的某些组合。,在这些模型中,自变量xi也可以是时间t或位置等的各种函数,或者是它们的某些组合。本章讨论的误差一般假定是可加的,例如,对于模型1有yiβ1xiεi3-3这里εi是未知误差,yi是在xi时处的量测值。式3-3给出的模型可以表示下列两种情形误差模型A,误差在量测中产生,即ηiβ1xiyiηiεi3-4误差模型B,误差噪声在过程中,即ηiβ1xiεiyiηi3-5这里ηi表示要量测的量,yi表示它的量测值。,必须注意,在这些模型中有这样的假定在xi中没有误差,即xi不是一个随机变量,而只有yi和εi是随机变量,在模型B中,ηi同样也是一个随机变量。在误差模型A中,只存在量测误差,而在ηi中不存在误差,为了确定εi,我们可以研究量测装置的误差特性,量测装置越精确,这些误差越小,随着技术不断改进,误差会愈来越小,系统模型本身假定是无误差的无噪声的是指对物理现象有充分的了解,以致于没有随机噪声参入ηi。,在误差模型B中,量测假定是无误差的,但模型η含有误差,误差是由某些随机性引起的,实际上,误差也可能是由于模型本身的近似性引起的。误差模型A和B分别表示了误差存在于量测中和模型中,实际上误差可以同时存在于量测和模型中。无论是误差模型A正确还是误差模型B正确,对于本章讨论的模型,参数辨识形式上是相同的,我们将把模型A作为本章讨论的模型。,第二节常规最小二乘估计简称OLS估计,常规最小二乘估计的准则函数由式2-6已经给出,即式中ηi是参数的函数,n表示n次量测,量测次数必须大于待求参数的个数。使3-6达到极小的参数值便为常规最小二乘估计量。常规最小二乘法的最早应用可以追溯到大约1795年,那时高斯为了完成行星轨道预测工作首先开创了此法,以后这种方法成为参数辨识的主要工具,虽然目前有其它几种方法可利用,例如,最大似然法、贝叶斯法等等,但最小二乘法仍然是工程师和科学家最熟悉的方法,这方法之所以普及,是因为它比其它方法容易理解,并且在获得参数估计量时不需要任何统计假设。但获得了参数估计量后,为了讨论估计量的统计特性,这时量测误差的统计信息必须给出。,以模型1为例,此时准则函数3-6可写为由dJ/dβ10,并用参数估计值β1*代替dJ/dβ10中的β1可得这里“∑”是的简写,以后凡是出现∑,都默认为。式3-8的解为β1*∑yixi∑xi2-13-9β1*估计值没有使用任何统计假设。由估计值的表达式可以看出至少需要一次量测,且至少一个xi不为零。,由xi时处的量测值yi,我们求得了参数估计值,在xi处模型输出的估计值我们可以根据模型求出,此时模型中的参数用估计值代替。用yi*表示xi处的估计值,则估计值为yi*β1*xi3-10设xi处的量测值yi减去估计值yi的差为ei,则eiyi-yi*3-11ei称为残差,注意ei不等于误差εi,但ei能够用来估计εi。,一估计量的均值和方差若误差εi是可加的,有零均值,且β1不是随机变量,由此我们可以求得模型1的参数估计值β1*的均值为Eβ1*∑xi2-1∑xiEyi∑xi2-1∑xiβ1xiβ1因此,在以上所述的假设下,最小二乘估计β1*是无偏估计。若再假定误差εi是互不相关的且具有相同的方差,则可求得β1*的方差为Vβ1*∑xi2-2∑xi2σ2σ2∑xi2-13-12从3-12可以看出量测次数越多,估计量的方差越小,当xi满足一定的取值要求时,有,这说明β1*是一致估计量。随着量测次数的增多,估计精度越来越高,这自然要求量测误差满足以上的假定,例如,量测是相关的,则以上结论不一定成立。同样必须注意,对于该模型有一个优化的量测位置,当量测位置时刻取在xi值较大处时,估计值的方差3-12越小,这样3-12给我们提供了最优量测位置,根据估计值方差安排量测位置,这是优化实验设计的内容。,二例题轴对称圆形巷道径向位移计算公式为此式是按平面应变条件求得的,式中μ为围岩的泊松比,E为围岩的弹性模量,R0为巷道半径,P0为原始地应力,r为围岩内任一点距巷道中心的距离。现假设ri处的径向位移uri量测值为yi,围岩的弹性模量和泊松比是已知的,根据yi使用常规最小二乘法确定原始地应力P0的估计值P0*。,3-23表示的模型,在E、μ、R0已知的情况下,符合模型1的情形,即β1P0,xi1μR02/Eri,则直接利用3-9可得P0*的方差可由3-12得到由此可以看出,ri越小,VP0*越小,即量测点越靠近巷道周边估计值P0*的方差越小,从而估计精度越高;反之,ri越大,VP0*越大,即量测点越远离巷道,估计值P0*的方差越大,从而估计精度越差。,第三节最大似然估计maximumlikelihoodEstimation,最大似然估计在估计理论中是一个很老的估计方法,1906年弗希尔R.A.Fisher首先使用了这个方法。为了方便,我们把最大似然估计简记为ML估计。ML估计是在量测误差分布已知的情形下的参数估计,它利用了有关量测的所有信息。ML估计的前提条件为误差是可加的,即yiηXi;βεi;式中的误差εii1,,n是相互独立的正态分布,且有零均值和已知方差σi2;参数β是确定性的量,即不是随机变量。因ε1,,εn是n个随机变量,则由以上的假定知y1,,yn也是n个随机变量。一次试验所获得的n次量测只是n个随机变量的样本值y1,,yn,这里随机变量和样本使用同一符号yii1,,n。,量测值yi是随机变量是指在同样的条件下,重复量测所得的各次量测值也会各不相同。这意味着同一观测者使用相同的仪器,如果试验是可重复的,那么在同一时刻或位置的量测值也可能是不会相同的,这主要是偶然误差引起的,例如,观测者本身感官分辨本领的限制,就是偶然误差的一个来源。为了辨识参数,对系统输出进行了n次量测yii1,,n,因εii1,,n是相互独立的,则这n次量测是相互独立的,每个yi的概率密度函数可由εi的概率密度函数确定,yii1,,n的联合概率密度函数称为样本的似然函数。因yii1,,n是相互独立的,则样本的似然函数为每个yi的概率密度之积,即,对于一组给定的量测值y1,,yn,似然函数3-34只是未知参数β的函数,选择使似然函数取得最大值的参数β*作为参数的估计值,这是很自然的一种选取估计值的办法,称β*为β的最大似然估计,即ML估计。3-34表示的似然函数即为ML估计的准则函数,使准则函数达到最大的似然估计β*应当是方程的解。由于似然函数L是多个因子的乘积,利用对数lnL进行计算比较方便lnL是单调函数,并且当L为最大时,lnL也为最大,所以这样做是可行的,所以通常解似然方程以求得ML估计β*。,由ML估计的前提条件可知εi的概率密度函数为在yiηXi;βεi中,εi的概率密度函数已知,ηXi;β是非随机的确定性量,则可以求出yi的概率密度函数为这样似然函数可根据式3-36写出,式3-37两边取对数,可得,由式(3-38)中,物理参数β只包含在JML中,其它两项与β无关,所以求lnL的极大点β*,也就是求JML的极小点注意式(3-38)中的负号,这样JML便为我们要讨论的准则函数,它与高斯马尔可夫估计中的准则函数2-7完全相同。由式(3-39)可以看出当σ12σ22σn2σ2时,这与常规最小二乘估计中的准则函数只差一个因子,这因子与参数β无关,所以使J达到极小值的β*也必使JML达到极小值,这说明此时ML估计与OLS估计相同,这正是第二章第三节中已给出的结论。,第四节最大验后估计贝叶斯估计,在最大似然估计中,利用了有关量测的所有信息,认为误差是可加的,误差εii1,,n是相互独立的正态分布,且有零均值和已知方差,事先把参数β作为是确定性的量。而在本节讨论的最大验后估计中,除把参数作为随机变量外,其它假设条件与最大似然估计相同。在以上假设条件下,同样可求出yii1,,n的联合概率密度函数py1,,yn/β,在求py1,,yn/β的时候把β作为常量,这时求得的py1,,yn/β与最大似然估计中求得的py1,,yn/β完全相同。在最大验后估计中,只知道py1,,yn/β还不够,还必须知道参数β的概率密度函数pβ,pβ称为验前分布,这里我们假定pβ是已知均值和方差的正态分布。,在pY/β[pY/β是py1,,yn/β的简写]和pβ已知的情形下,贝叶斯给出了验后概率密度函数pβ/Y,pβ/Y表示当量测结果恰好为某一组特定值的条件下,参数β的概率分布,即使式3-