1) adaptive critic control
自适应评价控制
3) adaptive heuristic critic
自适应启发评价
1.
The adaptive heuristic critic(AHC) reinforcement learning frame is approximate of the value function and the policy function of Markov decision process(MDP),the stochastic MDPs can be converted to deterministic MDPs by the policy gradient reinforcement learning.
自适应启发评价(AHC)增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数,策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程。
2.
First,the main algorithms,temporal difference, \%Q \%learning and adaptive heuristic critic,are roundly introduced.
首先全面地介绍了强化学习理论的主要算法 ,即瞬时差分法、Q 学习算法及自适应启发评价算法 ;然后介绍了强化学习的应用情况 ;最后讨论了强化学习目前所要研究的问
4) adaptive heuristic critic algorithm
自适应评价算法
5) adaptive critic elements
自适应评价单元
补充资料:简单自适应控制系统
分子式:
CAS号:
性质:又称简单自适应控制系统,它对过程环境条件与参数变化,用一些简单实用的方法辨识出来,同时也采用一些简单实用的方法来修正控制器参数或控制规律。常用的有自整定PID参数调节器,它是一种较为简单而又比较有效的自适应控制方法。采用反映系统特性变化信息的过渡过程曲线,来自动整定PID参数,以使系统一直能在最优的状况下运行。
CAS号:
性质:又称简单自适应控制系统,它对过程环境条件与参数变化,用一些简单实用的方法辨识出来,同时也采用一些简单实用的方法来修正控制器参数或控制规律。常用的有自整定PID参数调节器,它是一种较为简单而又比较有效的自适应控制方法。采用反映系统特性变化信息的过渡过程曲线,来自动整定PID参数,以使系统一直能在最优的状况下运行。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条