说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 奖赏函数
1)  reward functions
奖赏函数
1.
For action values are more flexible than traditional state values,it is easier to design more optimized reward functions and improve learning performance.
针对强化学习算法收敛速度慢、奖赏函数的设计需要改进的问题,提出一种新的强化学习算法。
2)  Reward function
奖惩函数
1.
A reward function which is fit to traffic control is put forward.
将Agent技术与Q学习算法相结合,应用到城市交通控制领域中,对单交叉口的交通流进行了控制研究,介绍了路口Agent的结构模型以及基于Q学习算法的学习机制的实现,提出了一种适用于交通控制的奖惩函数。
2.
The scheduling and dispatching rules of agents,the method for dividing state space and the reward functions were all examined.
文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题。
3)  Reward [英][rɪ'wɔ:d]  [美][rɪ'wɔrd]
奖赏
1.
Delta EEG Activity in Left Orbitofrontal Cortex in Rats Related to Food Reward and Craving;
食物奖赏和渴求行为相关的大鼠左侧眶额叶皮质Delta频段脑电活动(英文)
2.
Reward prediction,reward prediction error and the brain processes induced by them are necessary for the homeostasis with the fine regulations.
奖赏可以激励动物去进行和维持与个体生存和种族延续有关的行为。
3.
Objective:To investigate the effects of caffeine on the rewarding effects of opiates using morphine conditioned place preference (CPP) in rats.
目的:本文以大鼠条件性位置偏爱(CPP)为模型,探讨咖啡因对阿片类物质奖赏效应的影响。
4)  A prize or an award.
奖品或奖赏
5)  drug reward
药物奖赏
6)  reward circuit
奖赏回路
补充资料:奖赏


奖赏
reward

  奖赏(reward)亦称“正强化物”.指在反应后出现的能够增强那一反应的事物。学习心理学的研究表明,奖赏会使机体产生对奖赏的期待,从而促使人或动物去进行某些活动。动物实验中经常用食物等能满足生理需要的事物来作为奖赏。对人的奖赏可分为精神奖赏与物质奖赏。运用奖赏来调节人的行为时可以对做某个反应进行奖赏,鼓励人去做某事;也可以对不做某个反应进行奖赏,防止人做某事,这是一种以赏代罚的方法,适合于消除一些无法强行禁止的错误。使用奖赏时要注意及时和强度适当。若不及时则其效果明显降低,甚至于没有影响;强度过高或过低会造成强化的对比效应。 (周国帕撰戚立夫审)
  
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条