2) the optimal control parameters
优化控制参数
3) optimization of the control's parameters
优化控制器参数
5) optimizing control parameter
参数优化控制
补充资料:递阶控制最优化方法
递阶控制的最优化算法,它是在大系统的分解和协调的三种基本方法──目标协调法、模型协调法和混合法的基础上发展起来的。递阶控制最优化方法按开环递阶控制和递阶反馈控制分为两类。
开环递阶控制最优化方法 关于离散线性二次型问题有田村坦之的三级递阶算法,关于非线性系统有哈桑-辛预估法和三级共态预估法,G.科恩提出了一种统一的方法。
田村坦之三级递阶算法 这是依据目标协调法,选择关联拉格朗日乘子λ作为第三级的协调变量,拉格朗日乘子λ 作为第二级的协调变量的一种求下列极值问题的三级递阶算法(图1)。
其中第一级是在给定的λi和λi(i=1,2,..., N)下,按采样时刻k再进行一次分解,然后用参数最优化的方法,对每一采样时刻k求Li的极小解。第二级是在给定的λi下,求的极大解;而第三级则是求的极大解。这里L 是拉格朗日函数,λ是拉格朗日乘子,λ是关联拉格朗日乘子,x是状态变量,u是控制变量,z 是关联输入变量,Li,λi,λi,Xi,ui,Zi分别为各子系统的拉格朗日函数,关联拉格朗日乘子,拉格朗日乘子,状态变量,控制变量和关联输入变量, i=1,2,...,N 。田村坦之三级递阶算法提供了一个用简单的参数最优化方法求解复杂的动态最优化问题的范例。按照同样的思路,田村坦之还建立了一种时延算法,用以解决系统的状态变量和控制变量有多次纯时延,且都有上、下界的一类离散线性二次型问题。这些方法已成功地用来解决诸如河流污染控制和拥挤时刻交通管制等问题。
哈桑-辛预估法 这是借助于把预估的状态和控制代入状态方程中除分块对角线一次项外的其他项,以及目标函数中除分块对角线二次项外的其他项的办法,把一个非线性问题化成线性二次型问题的递阶算法。哈桑-辛预估法由于采用了分解协调技术,并保留了状态方程中的D项和目标函数中的h项,因而在存储量和解题速度上都优于拟线性化法。
三级共态预估法 这是通过对共态变量λi的预估,把原来第一级对状态变量 xi和共态变量λi同时求解的一个两点边值问题,化成两级对xi和λi分开求解的两个单点边值问题,?钩傻囊恢秩兜萁姿惴āH豆蔡す婪ㄓ捎诎岩桓隽降惚咧滴侍庾郊兜牧礁龅サ惚咧滴侍猓芸饲蠼飧丛拥睦杩ㄌ峋卣笪⒎址匠蹋蚨诖娲⒘亢徒馓馑俣壬暇庞诠?-辛预估法。
统一的方法 G.科恩在无限维凸规划的基础上,依据辅助问题原理和松弛原理,建立了一种统一的方法。所谓辅助问题原理,是指把一个满足一定条件的函数的约束极值问题(下称主问题),转化成另一个满足一定条件的函数的约束极值问题(下称辅助问题),并通过求辅助问题的极小解,来获得主问题的极小解。把辅助问题原理和松弛原理结合起来,就得到一个综合算法。
统一方法的基本特点,在于辅助问题主要取决于泛函K(u)的性质(当J1=0时),因此通常把K(u)称做核;还由于对核的约束相当和缓,因而可通过选择不同的核,推出某些经典的算法(如梯度法,牛顿-拉夫森法)和大多数分解协调算法(如目标协调法,模型协调法,混合法等),并为探索新的算法提供了依据。
递阶反馈控制最优化方法 目前为数不多,远不如开环递阶最优化方法成熟。
线性二次型问题的最优反馈控制 图2示出整个系统的闭环控制结构。可以看出,每个子系统实现各自的闭环控制,且上面有协调级。每个子系统的控制律可表示成。这一方法的特点是离线计算,在线使用,递阶结构在这里只是离线计算的一种手段;它虽然避开了求解整体黎卡提矩阵方程,但仍需对整体矩阵X求逆。
非线性系统的最优反馈控制 求最优反馈控制律的一般步骤是:先用某种方法求出作为共态变量和状态变量函数的开环最优控制,然后利用共态变量和状态变量之间的线性关系,消去共态变量,就得到作为状态变量的函数的最优反馈控制律。最优反馈控制律与系统的初始状态有关,是非线性系统的一个本质特征。为了减弱最优反馈控制律对初始状态的依从关系,一个可能的方法是:把实测的状态当作初始状态,用某种迭代算法去计算最优反馈控制律中所包含的初始状态的某个函数 q的新值,以改进控制律。这一方法只有当计算q值的时间远比系统动态过程的时间为小时,才能在线使用。
稳态系统的在线递阶控制 这是利用来自稳态系统的实测反馈信息,使系统达到最优的一种递阶控制方法。一个具有控制器的快系统,在慢扰动作用下,就是一个稳态系统。这种系统只有适当改变控制器的设定值,方能实现在线稳态最优。如果设定值的变动并不频繁,可把这个系统看成是在一系列稳态下运行。
稳态系统采用两级递阶控制结构(图3)。把系统的实测关联数据,经处理后作为反馈信息传递到上级决策单元。上级决策单元将依据反馈信息来寻找协调变量的最优值,而下级系统则按上级决策单元给出的协调变量在实际系统的近似模型上求约束极值问题的解。这一寻优过程将一直进行到满足预定的精度为止,然后按所得结果去调整控制器的设定值。接着又在实际系统中进行测量和反馈,重复这一过程。
鉴于上级单元是按反馈信息寻优,也就是按实际系统寻优,而下级单元则是按近似模型寻优,由此得到的解既非按实际系统最优,也非按近似模型最优,它只不过是实际系统的一个次优控制。然而,由于在递阶结构中采用了系统的实测信息,因而所得结果较开环控制为优。
参考书目
M.G.辛著,李敉安、邝硕等译,《大系统的动态递阶控制》,科学出版社,北京,1983。(M.G.Singh, Dynamical Hierarchical Control, North-Holl and Pabl.Co.,Amsterdam, 1980.)
开环递阶控制最优化方法 关于离散线性二次型问题有田村坦之的三级递阶算法,关于非线性系统有哈桑-辛预估法和三级共态预估法,G.科恩提出了一种统一的方法。
田村坦之三级递阶算法 这是依据目标协调法,选择关联拉格朗日乘子λ作为第三级的协调变量,拉格朗日乘子λ 作为第二级的协调变量的一种求下列极值问题的三级递阶算法(图1)。
其中第一级是在给定的λi和λi(i=1,2,..., N)下,按采样时刻k再进行一次分解,然后用参数最优化的方法,对每一采样时刻k求Li的极小解。第二级是在给定的λi下,求的极大解;而第三级则是求的极大解。这里L 是拉格朗日函数,λ是拉格朗日乘子,λ是关联拉格朗日乘子,x是状态变量,u是控制变量,z 是关联输入变量,Li,λi,λi,Xi,ui,Zi分别为各子系统的拉格朗日函数,关联拉格朗日乘子,拉格朗日乘子,状态变量,控制变量和关联输入变量, i=1,2,...,N 。田村坦之三级递阶算法提供了一个用简单的参数最优化方法求解复杂的动态最优化问题的范例。按照同样的思路,田村坦之还建立了一种时延算法,用以解决系统的状态变量和控制变量有多次纯时延,且都有上、下界的一类离散线性二次型问题。这些方法已成功地用来解决诸如河流污染控制和拥挤时刻交通管制等问题。
哈桑-辛预估法 这是借助于把预估的状态和控制代入状态方程中除分块对角线一次项外的其他项,以及目标函数中除分块对角线二次项外的其他项的办法,把一个非线性问题化成线性二次型问题的递阶算法。哈桑-辛预估法由于采用了分解协调技术,并保留了状态方程中的D项和目标函数中的h项,因而在存储量和解题速度上都优于拟线性化法。
三级共态预估法 这是通过对共态变量λi的预估,把原来第一级对状态变量 xi和共态变量λi同时求解的一个两点边值问题,化成两级对xi和λi分开求解的两个单点边值问题,?钩傻囊恢秩兜萁姿惴āH豆蔡す婪ㄓ捎诎岩桓隽降惚咧滴侍庾郊兜牧礁龅サ惚咧滴侍猓芸饲蠼飧丛拥睦杩ㄌ峋卣笪⒎址匠蹋蚨诖娲⒘亢徒馓馑俣壬暇庞诠?-辛预估法。
统一的方法 G.科恩在无限维凸规划的基础上,依据辅助问题原理和松弛原理,建立了一种统一的方法。所谓辅助问题原理,是指把一个满足一定条件的函数的约束极值问题(下称主问题),转化成另一个满足一定条件的函数的约束极值问题(下称辅助问题),并通过求辅助问题的极小解,来获得主问题的极小解。把辅助问题原理和松弛原理结合起来,就得到一个综合算法。
统一方法的基本特点,在于辅助问题主要取决于泛函K(u)的性质(当J1=0时),因此通常把K(u)称做核;还由于对核的约束相当和缓,因而可通过选择不同的核,推出某些经典的算法(如梯度法,牛顿-拉夫森法)和大多数分解协调算法(如目标协调法,模型协调法,混合法等),并为探索新的算法提供了依据。
递阶反馈控制最优化方法 目前为数不多,远不如开环递阶最优化方法成熟。
线性二次型问题的最优反馈控制 图2示出整个系统的闭环控制结构。可以看出,每个子系统实现各自的闭环控制,且上面有协调级。每个子系统的控制律可表示成。这一方法的特点是离线计算,在线使用,递阶结构在这里只是离线计算的一种手段;它虽然避开了求解整体黎卡提矩阵方程,但仍需对整体矩阵X求逆。
非线性系统的最优反馈控制 求最优反馈控制律的一般步骤是:先用某种方法求出作为共态变量和状态变量函数的开环最优控制,然后利用共态变量和状态变量之间的线性关系,消去共态变量,就得到作为状态变量的函数的最优反馈控制律。最优反馈控制律与系统的初始状态有关,是非线性系统的一个本质特征。为了减弱最优反馈控制律对初始状态的依从关系,一个可能的方法是:把实测的状态当作初始状态,用某种迭代算法去计算最优反馈控制律中所包含的初始状态的某个函数 q的新值,以改进控制律。这一方法只有当计算q值的时间远比系统动态过程的时间为小时,才能在线使用。
稳态系统的在线递阶控制 这是利用来自稳态系统的实测反馈信息,使系统达到最优的一种递阶控制方法。一个具有控制器的快系统,在慢扰动作用下,就是一个稳态系统。这种系统只有适当改变控制器的设定值,方能实现在线稳态最优。如果设定值的变动并不频繁,可把这个系统看成是在一系列稳态下运行。
稳态系统采用两级递阶控制结构(图3)。把系统的实测关联数据,经处理后作为反馈信息传递到上级决策单元。上级决策单元将依据反馈信息来寻找协调变量的最优值,而下级系统则按上级决策单元给出的协调变量在实际系统的近似模型上求约束极值问题的解。这一寻优过程将一直进行到满足预定的精度为止,然后按所得结果去调整控制器的设定值。接着又在实际系统中进行测量和反馈,重复这一过程。
鉴于上级单元是按反馈信息寻优,也就是按实际系统寻优,而下级单元则是按近似模型寻优,由此得到的解既非按实际系统最优,也非按近似模型最优,它只不过是实际系统的一个次优控制。然而,由于在递阶结构中采用了系统的实测信息,因而所得结果较开环控制为优。
参考书目
M.G.辛著,李敉安、邝硕等译,《大系统的动态递阶控制》,科学出版社,北京,1983。(M.G.Singh, Dynamical Hierarchical Control, North-Holl and Pabl.Co.,Amsterdam, 1980.)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条