2) exploration policy
探索策略
1.
This paper elaborates on the low learning efficiency in reinforcement learning due to improper generalization and random exploration policy under deterministic MDPS and proposes a hierarchical reinforcement learning algorithm based on system model.
针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题,本文提出基于模型的层次化强化学习算法。
补充资料:教学策略
教学策略
instructional strategy
教学策略(instruetional strategy)教师在教学过程中为达到一定的教学目标而采取的一系列教学方式和行为。教师可根据学科特点、题材及儿童的年龄阶段选择不同的教学方法,如讲授法、讨论法、发现法、指导发现法、自学辅导法等。 (蒋兆灿撰车丈博审)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条