1) average reward criteria
平均报酬准则
2) average reward
平均报酬
1.
Aim To investigate the model free multi step average reward reinforcement learning algorithm.
目的 讨论平均准则下控制马氏链的强化学习算法,在事先未知状态转移矩阵及报酬函数的条件下,通过试凑法寻找使得长期每阶段期望平均报酬最大的最优控制策略。
2.
On the basis of analyzing and investigating the exist algorithms,and using the linear parameter estimation theory,a new class of average reward multi-step temporal-difference learning algorithms based on linear function approximations and recursive least s.
对非周期不可约Markov链上的线性函数近似平均报酬指标即时差分学习方法进行了研究。
3.
An average reward reinforcement learning algorithm for control Markov chains is presented.
目的是寻找使得长期每阶段期望平均报酬最大的最优控制策略。
3) standardized average abnormal rate of return
标准化平均异常报酬
4) average rate of return
平均报酬率
5) expected totall reward criterion
期望总报酬准则
6) average criterion
平均准则
1.
This paper discusses the continuous time Markov decision processes in a semi-Markov environment with the average criterion.
本文讨论半马氏环境连续时间马氏决策过程中的平均准则。
2.
For a special Markov decision process based on the continuous-time Markov decision processes with the average criterion,a new set of conditions is proposed for both the optimality and constrained optimality for a controlled queuing system.
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程—受控排队系统平均最优以及约束最优的新条件。
补充资料:访问者数目、平均停留时间和平均消费支出
访问者数目、平均停留时间和平均消费支出
小。访问者数目、平均停留时间和平均消费支出访问者数目指国外来访者入境人数(包括旅游者和短途旅行者)。停留时间指国外来访者在一国(旅游目的地国家和地区)内的度夜天数。平均停留时间,即平均停留天数,指报告期内平均每一个访间者停留的度夜天数。访问者在一国内停留时间的长短,与该国的旅游资源、旅游活动项目、旅游设施、旅游服务质量以及旅游行业部门的接待安排和旅游宣传等对访问者的吸引力大小有密切关系。它决定访间者的消费支出,也决定一国的国际旅游作业的收入。一国国际旅游业延长访问者的停留时间,等于接待了更多的访间者。因此,旅游目的地国家和地区把吸引更多的访问者到该国或该地区参观、游览、娱乐、消遣、休憩,并延长其停留时间作为提高该国该地区的国际旅游业经济效益的一个很重要的方面。其计算公式如下:平均停留天数一报告期接待人天数(度夜人天数)报告期接待人数(度夜人数) 有些国家和地区,特别是中小国家,通过接待国外来访者,还与该国或该地区的常住人口总数作比较.计算其旅游密度,以此说明该国该地区发展国际旅游事业的普遍程度,其计算公式如下:旅游密度-报告期国外来访者入境人数常住人口总数计算国外来访者平均消费支出,国际上一般用三个指标来表一是访问者平均每人每天消费支出额。计算公式为:访间者平均每人每天消费支出额报告期访问者消费支出总额报告期访间者度夜人天数这个指标的计算,不受访问者人数的多少和访问者停留时间长短的影响:二是访问者平均每人消费支出额,计算公式为:访问者平均每人消费支出额报告期访问者消费支出总额报告期访问者人数 报告期访问者平均、报告期平均一~,~一、、,,~,一入~,一一,~ 母人母大泊费支出钡停留大叙这个指标的计算,不受访问者人数多少的影响.但受停留时间长短的影响。停留时间长,每人消费支出就大。反之,则小。 三是访问者平均每天消费支出额.其计算公式为:访间者平均每天消费支出额报告期访问者消费支出总额报告期日历天数报告期访问者平均、报告期日~~一、、,~..一入一,,母人母大摘费支出钡十均人致这个指标的计算,不受停留时间长短的影响,但受访问者人数多少的影响。访问者人数愈多,日平均消费支出额就愈大反之.则愈
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条