1) constrained average optimal policy
约束平均最优策略
2) P-constraint optimal policy
p-约束最优策略
3) constraint optimal policies
约束最优策略
1.
In addition,by the mechanics of introducing Lagrange mutiplicity and mean-value theory,we prove the existence of constraint optimal policies, moreover prove that the constraint optimal policies may be markovian or the convex conbination of two markovian policies.
另外,利用引入Lagrange乘子的技巧和中间值定理,证明了约束最优策略的存在性,并进一步证明约束最优策略可取为马氏策略或两个马氏策略的凸组合。
4) average optimal stationary policy
平均最优平稳策略
1.
By using the Lagrange multipliers approach,the existence of an average optimal stationary policy and a constrained average-optimal policy can be confirmed.
可以证明受控排队系统存在平均最优平稳策略与约束平均最优策略。
5) ε(≥0)-optimal policies
ε(≥0)-平均最优马氏策略
6) average cost optimal policy
平均费用最优策略
补充资料:占优策略均衡
占优策略:
无论其他参与者采取什么策略,某参与者的唯一的最优策略就是他的占优策略。
占优策略均衡:
由博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。
无论其他参与者采取什么策略,某参与者的唯一的最优策略就是他的占优策略。
占优策略均衡:
由博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条