1) discrete-time Markov decision process
离散时间马氏决策过程
2) discrete time Markov decision process(DTMDP)
离散时间Markov决策过程
4) Markovian decision scheme with discrete time
时间离散的马氏决策规划
1.
In the Markovian decision scheme with discrete time the transfer of situation only relys on the situation and decision of the present.
关于时间离散的马氏决策规划的状态的转移,仅依赖于当前的状态与决策。
5) Markov decision processes
马氏决策过程
1.
Optimal control of probabilistic discrete event systems on Markov decision processes;
基于马氏决策过程的概率离散事件系统最优控制
2.
In this paper, the relative value iteration algorithm for average reward Markov decision processes (MDP)is investigated.
本文研究平均报酬马氏决策过程(MDP)的相对值迭代算法。
3.
In this paper, a new policy iteration method called temporal differences(TD for short) policy iteration method for Markov decision processes with averagecriteria is considered.
本文考虑平均准则模型马氏决策过程的一种改进的策略迭代算法:即时差分(TD:Temporal-Differences)策略迭代法。
6) Markov decision process
马氏决策过程
1.
By use of the method of Markov Decision Process(MDP),the optimal eptimal equation that the minimal expected discounted cost satisfies is constructed,and a(U~*_t,y~*_t(b))structure optimal policy is obtained:If the storehouse capacity less than U~*_t,then expand to U~*_t,and order to U~*_t;else the storehouse capacity keep constant,and order to y~*_t(b)case the inventory less tha.
利用马氏决策过程(MDP)的方法,建立了最小折现成本所满足的最优方程,在此基础上,得到了一个(Ut*,yt*(b))结构的最优策略:当仓库容量小于Ut*时将容量扩充到Ut*,并订货至Ut*;否则保持仓库容量不变,且当存贮量小于yt*(b)时订货到yt*(b),反之不订货。
2.
This paper studies average optimality in Markov decision processes with countable state space, nonempty action sets and unbounded reward function.
本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优不等式中的和有定义时最优不等式也成立。
补充资料:离散时间周期序列的离散傅里叶级数表示
(1)
式中χ((n))N为一离散时间周期序列,其周期为N点,即
式中r为任意整数。X((k))N为频域周期序列,其周期亦为N点,即X(k)=X(k+lN),式中l为任意整数。
从式(1)可导出已知X((k))N求χ((n))N的关系
(2)
式(1)和式(2)称为离散傅里叶级数对。
当离散时间周期序列整体向左移位m时,移位后的序列为χ((n+m))N,如果χ((n))N的离散傅里叶级数(DFS)表示为,则χ((n+m))N的DFS表示为
式中χ((n))N为一离散时间周期序列,其周期为N点,即
式中r为任意整数。X((k))N为频域周期序列,其周期亦为N点,即X(k)=X(k+lN),式中l为任意整数。
从式(1)可导出已知X((k))N求χ((n))N的关系
(2)
式(1)和式(2)称为离散傅里叶级数对。
当离散时间周期序列整体向左移位m时,移位后的序列为χ((n+m))N,如果χ((n))N的离散傅里叶级数(DFS)表示为,则χ((n+m))N的DFS表示为
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条