说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 奖惩函数
1)  Reward function
奖惩函数
1.
A reward function which is fit to traffic control is put forward.
将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数
2.
The scheduling and dispatching rules of agents,the method for dividing state space and the reward functions were all examined.
文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题。
2)  Rewards and punishment coefficient
奖惩系数
3)  penalty function
惩罚函数
1.
Research on multi-modal smooth transition strategy based on penalty function;
基于惩罚函数的多模态平稳过渡策略研究
2.
The Multi-object Path Planning Based on Penalty Function NPGA;
基于惩罚函数NPGA的多目标路径规划
3.
The Dynamic Object Path Planning Based on Penalty Function Niche Pareto Genetic Algorithm;
基于惩罚函数NPGA的足球机器人动态目标规划
4)  punishment function
惩罚函数
1.
This paper proposes the methods of using punishment function to realize GA with constrains, and then constructing GA program by Matlab tools.
介绍了通过惩罚函数法解决含约束条件遗传算法的实现问题。
5)  reward functions
奖赏函数
1.
For action values are more flexible than traditional state values,it is easier to design more optimized reward functions and improve learning performance.
针对强化学习算法收敛速度慢、奖赏函数的设计需要改进的问题,提出一种新的强化学习算法。
6)  rewards and punishment
奖惩
1.
Establishing a strict human resource management system, assessing the rewards and punishment system which matches up the target management, implementing standardized management, raising the quality of the whole staff members, urging them to move to proper post reasonably.
建立严格的人事管理制度与目标管理相配套的考核奖惩制度,实行标准化管理,提高人员整体水平,促使人员合理流动;实行聘任制,增强职工竞争上岗意识;逐步推行聘用合同 制、人才引用制,从而建立起现代化医院人事制度。
补充资料:高斯函数模拟斯莱特函数
      尽管斯莱特函数作为基函数在原子和分子的自洽场(SCF)计算中表现良好,但在较大分子的SCF计算中,多中心双电子积分计算极为复杂和耗时。使用高斯函数(GTO)则可使计算大大简化,但高斯函数远不如斯莱特函数(STO)更接近原子轨道的真实图象。为了兼具两者之优点,避两者之短,考虑到高斯函数是完备函数集合,可将STO向GTO展开:
  
  
  式中X(ζS,A,nS,l,m)定义为在核A上,轨道指数为ζS,量子数为nS、l、m 的STO;g是GTO:
  
  
  其变量与STO有相似的定义;Ngi是归一化常数:
  
  
  rA是空间点相对于核A的距离;ci是组合系数;K是用以模拟STO的GTO个数(理论上,K→∞,但实践证明K只要取几个,便有很好的精确度)。
  
  ci和ζ在固定K值下, 通过对原子或分子的 SCF能量计算加以优化。先优化出 ζS=1 时固定K值的ci和(i=1,2,...,K),然后利用标度关系式便可得出ζS的STO展开式中每一个GTO的轨道指数,而且,ci不依赖于ζS,因而ζS=1时的展开系数就是具有任意ζS的STO的展开系数。对不同展开长度下的展开系数和 GTO轨道指数已有表可查。
  

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条