- 多变量过程智能优化辨识理论及应用
- 杨平等
- 3703字
- 2022-11-23 13:54:25
1.1 基于最小二乘法的多变量过程辨识研究
尽管最小二乘方法开始用于过程辨识可追溯到20个世纪60年代,尽管过程辨识都以阐述最小二乘辨识理论为主,尽管关于最小二乘辨识理论的研究持续至今已有60多年,但是最小二乘辨识理论在实际工程中依然得不到推广应用。或许最大的原因是最小二乘辨识需要外加激励信号。已有研究表明,用最小二乘法辨识的充分必要条件是有2n阶持续激励。2n阶持续激励条件的保证是从外部施加白噪声或PRBS激励信号。可以发现,在众多的最小二乘辨识理论研究文献中,几乎给出的都是施加过白噪声或PRBS信号的算例。换句话说,不施加白噪声或PRBS信号,最小二乘辨识的可辨识性和准确性就得不到保证。而在实际控制工程应用中,没有现场工程师愿意外加激励信号而承担危及生产安全的风险。何况施加激励信号不但需要额外提供的硬件和软件,还需要专门技术人员的支持。显然,施加激励信号是推广应用最小二乘辨识理论的一大障碍。相对智能优化法辨识而言,不强求施加激励信号,也自然没有了这种推广应用障碍。
最小二乘辨识基本理论是建立在于开环辨识条件下的,并且所考虑的噪声变量是与输入变量不相关的。所以若要推广应用到实际的常见的闭环控制过程中就会出现了噪声变量与输入变量相关的问题,严格地说闭环反馈条件不满足最小二乘辨识基本理论建立的前提。于是最小二乘辨识理论的闭环条件下的应用就成了又一个应用障碍。虽然已提出多个解决方案,但是都比开环辨识的方案更复杂,所以依然绕不开这一大应用障碍。既然对于单变量过程辨识有闭环辨识障碍,那么对于多变量过程辨识,这一应用障碍就变得更大了。其实已有研究表明[30],闭环反馈条件只是应用最小二乘辨识的障碍,若用其他辨识方法并非如此。例如采用智能优化法辨识,理论上没有闭环反馈条件的限制,无论是单变量过程辨识还是多变量过程辨识,用智能优化法辨识,无论开环条件还是闭环条件都是一样的。
当被辨识过程的模型参数数量增加时,最小二乘辨识计算量随之大幅增加,尤其是矩阵求逆计算部分。另一方面,考虑到在线辨识和控制的需求,递推最小二乘法早已推出,并被许多学者认为是取代一次完成最小二乘算法的好算法。然而从工程应用的简单实用性和安全可靠性角度考虑,递推最小二乘法并不值得推荐,因为它把本可一次完成的计算化为一个收敛性不能确保的多次计算的复杂过程,显然不符合工程应用关于可靠和安全的基本要求。对于单变量过程辨识应用不推荐递推最小二乘法,对于多变量过程辨识应用更是如此。
许多研究者都认定一条研究思路,那就是把多变量过程辨识问题化解为单变量过程辨识问题。北京化工大学的潘立登早在20世纪90年代初就做过有价值的探索。一个r入m出的多变量过程模型,可以化简为m个r入1出的子模型,因此,一个r入m出的多变量过程模型辨识可以化简为m个r入1出的子模型辨识,这是毫无疑问的。可以证明,只要解决了多入一出的多变量过程子模型辨识问题,就可以解决多入多出的多变量过程辨识问题,不过这还是一个多变量过程辨识问题。若再把一个r入1出的子模型化解为r个单入单出的子子模型,那就可把多变量过程辨识问题化解为单变量过程辨识问题了。关键是子模型如何化简为子子模型,已给出的方法是用辅助模型法。据参考文献[46,47],当子模型用多变量过程辨识方法辨出后,可用子模型为辅助模型推出每个子子模型的输出变量序列,再利用子子模型的输入输出数据辨识出子子模型的参数。如此看来,这并没有真正地实现把多变量过程辨识问题化简为单变量过程辨识问题,而是先用多变量过程辨识方法辨识子模型,再用单变量过程辨识方法辨识子子模型。但这样的方法实质上没有多少积极的意义,反而使问题复杂化了,并且没有确切的证明来保证用子模型为辅助模型推出每个子子模型的输出变量的方法是准确可靠的,这种多了一次的辨识计算显然只会降低辨识精度。
可以证明,白噪声或PRBS信号是最优的辨识激励信号。这也就是众多研究者喜欢用白噪声或PRBS信号做辨识激励信号的原因之一。对于单变量过程辨识,可选用白噪声或PRBS信号来激励;对于多变量过程辨识,也可选用白噪声或PRBS信号来激励。对于多变量过程辨识时如何选用白噪声或PRBS信号来进行多个输入的同时激励,在经典过程辨识教科书中还找不到可遵循的原则。但是在许多文献中,都提出多变量过程辨识时多个输入的同时激励信号必须是互不线性相关的,否则辨识结果是不准确的。尤其是参考文献[28]还给出了同时阶跃激励下一个双入双出系统的辨识实例及辨识误差原因剖析。关于多变量过程辨识,本来就有依次激励接着依次辨识计算和同时激励接着一次辨识计算的两种辨识方案。依次激励接着依次辨识计算方案的本质是把多变量过程辨识化为单变量过程辨识的方案,遗憾的是实际工程应用中很难做到使一个输入改变时其他输入保持不变。同时激励接着一次辨识计算的辨识方案是更实用的方案,执行这个方案时采用多个输入的同时激励信号必须是互不线性相关的原则。关于这一原则,在参考文献[12]有阐述,但是还没有写进教科书中。参考文献[59,60]给出了用延迟PRBS构造互不线性相关的多个激励信号的方法。用此法可产生多变量过程辨识所需要的同时激励但互不线性相关的多个输入激励信号。
关于过程辨识的可辨识性的学术讨论至今很难有像可控性和可观性那样有明确的定义和明确的结论,也没有像可控性和可观性那样,求解一个可控性矩阵或可观性矩阵就可确定这个特性是否成立。按照学者Bellman和Astrom的说法,可辨识性和最小二乘估计的一致性差不多,若数据长度N→∞,模型参数估计值趋于真值θ,则模型参数θ就是可辨识的。问题是真实世界模型的真值θ永远也得不到,所谓的数据长度N→∞也是一种永远无法实现的假设。这样一来,在判别某过程是否具有可辨识性时,是无法根据参数估计的一致性定义来判断其可辨识性的。
学者Ljung给出一个更抽象的可辨识性概念定义[1]:可辨识性概念可定义为三个层次,即可辨识的、强可辨识的和参数可辨识的。
1.可辨识定义
若采用辨识方法I依据足够多的数据L(L为数据长度)在实验条件X下得到模型参数估计,从而得到与系统S等价的模型DT(S,M),即
则称系统S在模型类M、辨识方法I及实验条件X下是可辨识的,记作SI(M,I,X)。
2.强可辨识定义
若系统S对一切使DT(S,M)非空的模型都是SI(M,I,X)的,那么称系统是强可辨识的,记作SSI(I,X)。
3.参数可辨识定义
若系统S是SI(M,I,X)的,且DT(S,M)仅含一个元素,则称系统是参数可辨识的,记作PI(M,I,X)。
显然,这个定义没有工程实用性,人们无法利用这个定义判别执行某过程辨识时是否具有可辨识性。不过,这个定义却揭示了进行可辨识性时应该考虑的几个要素,即数据、模型类、辨识方法(准则与优化)和实验条件(激励)。若用参考文献[30]的说法就是,进行可辨识性时应该考虑的六个要素为数据、过程、模型、准则、优化和激励。按照这个思路,不妨再次做一个大胆的定性分析:就数据要素而言,数据应当包含过程的基本特性响应特征信息,否则不具备可辨识性;就过程而言,应当是所选用辨识方法适用的过程类型,例如适用于最小二乘法辨识的稳定过程;就模型要素而言,所选模型结构应当与过程相匹配,否则不具备可辨识性;就优化要素而言,所选优化方法应当是那种在已有条件下完成辨识计算并达到所期待的辨识准确度的方法,否则不具备可辨识性;就准则而言,所设计的准则应当能表征模型响应和过程响应之间的误差大小,否则不具备可辨识性;就激励要素而言,激励信号应当能激发出过程的基本特征响应,否则不具备可辨识性。在选择最小二乘法辨识方法的前提下,已有了不少有关可辨识性的研究成果[3]:稳定的过程具有可辨识性;对于n阶传递函数的辨识,在2n阶持续激励条件下才具有可辨识性;数据长度N≥2n才具有可辨识性;在闭环过程辨识时,控制器的阶数必须足够高。以上研究结果都是针对单变量过程辨识而言的,对于多变量过程辨识还未见有价值的有关可辨识性的研究成果。
纵观最小二乘法辨识方法前提下的有关可辨识性的研究,使作者领悟出一条更有可操作性的新研究思路,即把最小二乘法过程辨识的可辨识性当作过程辨识模型的最小二乘解的存在性来对待,这样做可使问题大为简化。最小二乘法过程辨识的可辨识性存在与否等价为相对应的最小二乘解的存在与否,而最小二乘解的存在与否取决于最小二乘算式中的逆矩阵存在是否。进而,最小二乘算式中的逆矩阵存在是否取决于这个逆矩阵的两方面的数据构成,即过程响应数据和过程激励数据。此外,最小二乘解的存在可以抽象为纯线性代数学的问题,或者说是一个多元代数方程联立求解的问题。当模型结构选定以后,求解模型参数就是辨识计算的任务。求解模型参数的最小二乘方程的维度就取决于模型参数变量的个数。而数据长度N首先要满足最小二乘方程的维度的要求。例如,针对单变量过程辨识的可辨识性,已得到数据长度N≥2n的研究结果。至于多变量过程辨识的可辨识性与数据长度N的关系还有待研究。针对单变量过程辨识的可辨识性,根据研究最小二乘算式中的逆矩阵中过程激励数据确保逆矩阵存在的条件,前辈已得出结论:2n阶持续激励条件下才具有可辨识性。至于多变量过程辨识的可辨识性与过程激励数据的关系,尚未见有公认的理论研究成果。