1) optimal return function
最优回报函数
1.
By relying on stochastic calculus method,we give a sufficient theorem for optimal return function.
研究了一类奇异随机收获模型的最优收获控制策略及相应的最优回报函数问题。
2.
A sufficient con- dition for optimal return is obtained,and the explicit form of optimal return function,the corrresponding impulse and regular control strategies are also given.
首次在比例再保险模型中引入脉冲控制过程,为获得最优回报函数,不但给出了该函数所应满足的充分性定理,而且得出了该函数的具体解析式及相应的最优脉冲与正则控制策略。
3.
By utilizing both stochastic calculus and the classical impulse control theory,we give a set of sufficient conditions for its solution in terms of optimal return function.
利用随机积分及脉冲控制理论,我们不但给出了最优回报函数应满足的充分性条件,而且在一定条件下得出了其显解及相应的最优控制策略。
2) optimal return function
最优返回函数
3) reward function
回报函数
1.
Survey of apprenticeship learning based on reward function approximating;
基于回报函数逼近的学徒学习综述
2.
Survey of apprenticeship learning based on reward function learning
回报函数学习的学徒学习综述
3.
During the learning process,the reward function is controlled automatically to earn the optimal policy.
针对机器人足球比赛的多智能体环境下智能体的训练问题,提出了一种将模糊控制与Q-Learning相结合的学习方法,并在学习过程中自动调节回报函数以获得最优策略,此方法的有效性在中型组的仿真平台上得到了验证,并取得了较好效果,还可将它改进应用于其他多智体环境。
4) return function
回报函数
1.
By using the optimal control policy of stochastic analysis, the optimal control policies and the corresponding maximal return function are obtained for different parameters.
考虑一类带有分红过程和借贷过程的比例再保险模型,为推广其应用,将其费用函数进行了推广,利用随机分析中的最佳控制理论,针对不同的参数得出了不同情形下的最佳控制策略及相应的最大回报函数。
2.
By using the optimal control policy of stochastic analysis, we obtain its optimal control polices and the corresponding maximal return functions for different parameters.
利用随机分析中的最优控制理论,通过数学分析,针对不同的参数得出了不同情形下最优控制策略及相应的最大回报函数。
5) best function
最优函数
6) optimality function
最优性函数
1.
Each subproblem is relaxed and the optimality function is presented by using the minimax function.
应用图论、群论等,把该问题分解为有限多个子问题,在每个子问题中克服了优化变量的时断时续性质,并将子问题松弛化,利用极大极小函数给出了松弛子问题的最优性函数,该函数在其零点使松弛子问题的一阶必要条件成立。
2.
The conclusion of equivalence between the optimality function and the one-order optimality condition is concluded.
论述了最优性函数与一阶最优性条件的等价性。
3.
The contents include the layout optimization models of the difform graph elements, the optimality conditions , the optimality functions, the optimization algorithms for the subproblems, the algorithms for the non-overlap constraints and the unproved genetic algorithm.
主要包括不同图元的布局优化模型、子问题的最优性条件、最优性函数和优化算法、判断不干涉性算法及改进的遗传算法。
补充资料:动力学系统函数寻优
在一组约束条件下,寻找动力学系统的一组函数,使给定的指标达到最优值(极小或极大值)的方法,属于多次运行仿真。动力学系统函数寻优方法有三类:极大值原理法(见极大值原理)、动态规划法(见动态规划)和直接函数寻优法。前两种方法只能处理最优控制问题,即被寻优的函数是以时间为自变量的。
直接函数寻优法是计算机仿真中常用的方法。它的基本思路是先将被寻优的函数表示成一些已知的基函数的代数和,从而将对函数的寻优转变成为对这些代数项的权系数寻优,即变成为参数寻优问题。以一个寻优函数u(x)为例,设u(x)能表示成:
其中lj(x)是定义在[ɑ,b]上的已知标量基函数,αj是可调权系数(参数)。给出一组参数α1,α2,...,αm,便确定一个函数 u(x)。x可以是系统中的状态变量或时间变量。基函数lj(x)可以是阶梯形函数、折线形函数、多点插值函数等。当选定基函数后,函数u(x)的寻优问题便转变成一组参数(α1,α2,...,αm)的寻优问题。如果在系统模型中加入实现上式的函数插值器,则函数的迭代寻优过程与参数寻优类同(见动力学系统参数寻优)。
对于n个函数寻优的情形,有n个相应的上述表达式,也就有n×m个参数寻优。
直接函数寻优法是计算机仿真中常用的方法。它的基本思路是先将被寻优的函数表示成一些已知的基函数的代数和,从而将对函数的寻优转变成为对这些代数项的权系数寻优,即变成为参数寻优问题。以一个寻优函数u(x)为例,设u(x)能表示成:
其中lj(x)是定义在[ɑ,b]上的已知标量基函数,αj是可调权系数(参数)。给出一组参数α1,α2,...,αm,便确定一个函数 u(x)。x可以是系统中的状态变量或时间变量。基函数lj(x)可以是阶梯形函数、折线形函数、多点插值函数等。当选定基函数后,函数u(x)的寻优问题便转变成一组参数(α1,α2,...,αm)的寻优问题。如果在系统模型中加入实现上式的函数插值器,则函数的迭代寻优过程与参数寻优类同(见动力学系统参数寻优)。
对于n个函数寻优的情形,有n个相应的上述表达式,也就有n×m个参数寻优。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条