奖惩函数,Reward function,音标,读音,翻译,英文例句,英语词典

您的位置：首页 -> 词典 -> 奖惩函数

1) Reward function 点击朗读

奖惩函数

A reward function which is fit to traffic control is put forward. 点击朗读

将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数。

The scheduling and dispatching rules of agents,the method for dividing state space and the reward functions were all examined.

文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题。

2) Rewards and punishment coefficient 点击朗读

奖惩系数

3) penalty function 点击朗读

惩罚函数

Research on multi-modal smooth transition strategy based on penalty function; 点击朗读

基于惩罚函数的多模态平稳过渡策略研究

The Multi-object Path Planning Based on Penalty Function NPGA; 点击朗读

基于惩罚函数NPGA的多目标路径规划

The Dynamic Object Path Planning Based on Penalty Function Niche Pareto Genetic Algorithm;

基于惩罚函数NPGA的足球机器人动态目标规划

更多例句>>

4) punishment function 点击朗读

惩罚函数

This paper proposes the methods of using punishment function to realize GA with constrains, and then constructing GA program by Matlab tools.

介绍了通过惩罚函数法解决含约束条件遗传算法的实现问题。

更多例句>>

5) reward functions 点击朗读

奖赏函数

For action values are more flexible than traditional state values,it is easier to design more optimized reward functions and improve learning performance.

针对强化学习算法收敛速度慢、奖赏函数的设计需要改进的问题,提出一种新的强化学习算法。

6) rewards and punishment 点击朗读

奖惩

Establishing a strict human resource management system, assessing the rewards and punishment system which matches up the target management, implementing standardized management, raising the quality of the whole staff members, urging them to move to proper post reasonably.

建立严格的人事管理制度与目标管理相配套的考核奖惩制度,实行标准化管理,提高人员整体水平,促使人员合理流动;实行聘任制,增强职工竞争上岗意识;逐步推行聘用合同制、人才引用制,从而建立起现代化医院人事制度。

更多例句>>

补充资料：高斯函数模拟斯莱特函数

　　尽管斯莱特函数作为基函数在原子和分子的自洽场（SCF）计算中表现良好，但在较大分子的SCF计算中，多中心双电子积分计算极为复杂和耗时。使用高斯函数(GTO)则可使计算大大简化,但高斯函数远不如斯莱特函数(STO)更接近原子轨道的真实图象。为了兼具两者之优点，避两者之短,考虑到高斯函数是完备函数集合,可将STO向GTO展开：
　　
　　
　　式中X(ζ_S,A,n_S,l,m)定义为在核A上，轨道指数为ζ_S，量子数为n_S、l、m 的STO；g是GTO：
　　
　　
　　其变量与STO有相似的定义；N_gi是归一化常数：
　　
　　
　　r_A是空间点相对于核A的距离;c_i是组合系数；K是用以模拟STO的GTO个数（理论上，K→∞，但实践证明K只要取几个，便有很好的精确度）。
　　
　　c_i和ζ在固定K值下, 通过对原子或分子的 SCF能量计算加以优化。先优化出 ζ_S＝1 时固定K值的c_i和(i＝1,2,...,K)，然后利用标度关系式便可得出ζ_S的STO展开式中每一个GTO的轨道指数，而且，c_i不依赖于ζ_S,因而ζ_S＝1时的展开系数就是具有任意ζ_S的STO的展开系数。对不同展开长度下的展开系数和 GTO轨道指数已有表可查。
　　

说明：补充资料仅用于学习参考，请勿用于其它任何用途。

参考词条

准精确惩罚函数外惩罚函数法

惩罚函数法内惩罚函数外惩罚函数非二次惩罚函数惩罚函数方法

说明：双击或选中下面任意单词，将显示该词的音标、读音、翻译等；选中中文或多个词，将显示翻译。
	您的位置：首页 -> 词典 -> 奖惩函数 1) Reward function 奖惩函数 1. A reward function which is fit to traffic control is put forward. 将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数。 2. The scheduling and dispatching rules of agents,the method for dividing state space and the reward functions were all examined. 文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题。 2) Rewards and punishment coefficient 奖惩系数 3) penalty function 惩罚函数 1. Research on multi-modal smooth transition strategy based on penalty function; 基于惩罚函数的多模态平稳过渡策略研究 2. The Multi-object Path Planning Based on Penalty Function NPGA; 基于惩罚函数NPGA的多目标路径规划 3. The Dynamic Object Path Planning Based on Penalty Function Niche Pareto Genetic Algorithm; 基于惩罚函数NPGA的足球机器人动态目标规划更多例句>> 4) punishment function 惩罚函数 1. This paper proposes the methods of using punishment function to realize GA with constrains, and then constructing GA program by Matlab tools. 介绍了通过惩罚函数法解决含约束条件遗传算法的实现问题。更多例句>> 5) reward functions 奖赏函数 1. For action values are more flexible than traditional state values,it is easier to design more optimized reward functions and improve learning performance. 针对强化学习算法收敛速度慢、奖赏函数的设计需要改进的问题,提出一种新的强化学习算法。 6) rewards and punishment 奖惩 1. Establishing a strict human resource management system, assessing the rewards and punishment system which matches up the target management, implementing standardized management, raising the quality of the whole staff members, urging them to move to proper post reasonably. 建立严格的人事管理制度与目标管理相配套的考核奖惩制度,实行标准化管理,提高人员整体水平,促使人员合理流动;实行聘任制,增强职工竞争上岗意识;逐步推行聘用合同制、人才引用制,从而建立起现代化医院人事制度。更多例句>> 补充资料：高斯函数模拟斯莱特函数　　尽管斯莱特函数作为基函数在原子和分子的自洽场（SCF）计算中表现良好，但在较大分子的SCF计算中，多中心双电子积分计算极为复杂和耗时。使用高斯函数(GTO)则可使计算大大简化,但高斯函数远不如斯莱特函数(STO)更接近原子轨道的真实图象。为了兼具两者之优点，避两者之短,考虑到高斯函数是完备函数集合,可将STO向GTO展开：　　　　　　式中X(ζ_S,A,n_S,l,m)定义为在核A上，轨道指数为ζ_S，量子数为n_S、l、m 的STO；g是GTO：　　　　　　其变量与STO有相似的定义；N_gi是归一化常数：　　　　　　r_A是空间点相对于核A的距离;c_i是组合系数；K是用以模拟STO的GTO个数（理论上，K→∞，但实践证明K只要取几个，便有很好的精确度）。　　　　c_i和ζ在固定K值下, 通过对原子或分子的 SCF能量计算加以优化。先优化出 ζ_S＝1 时固定K值的c_i和(i＝1,2,...,K)，然后利用标度关系式便可得出ζ_S的STO展开式中每一个GTO的轨道指数，而且，c_i不依赖于ζ_S,因而ζ_S＝1时的展开系数就是具有任意ζ_S的STO的展开系数。对不同展开长度下的展开系数和 GTO轨道指数已有表可查。　　说明：补充资料仅用于学习参考，请勿用于其它任何用途。参考词条准精确惩罚函数外惩罚函数法

©2011 dictall.com