2) metagame
元对策
1.
In this paper, the non-zero-sum Markov games are adopted as a framework for multi-agent reinforcement learning, and the learning model and learning algorithms of the metagame reinforcement learning are brought forward.
文中采用非零和Markov对策作为多Agent系统学习框架,并提出元对策强化学习的学习模型和元对策Q算法。
3) duality countermeasure
二元对策
1.
We consider a class of duality countermeasure problems in which the participants are of different potentials.
讨论一类二元对策问题。
4) game element
对策元素
补充资料:Blotto对策
Blotto对策
Blotto games
B一川幽〕对策!BI峨劝〕g别nes;6.ooT,o“I,p“l 一类正规形式的二人零和对策(two一peoonzerc)一sum缪me)其中局中人的纯策略(见策略(对策论中的)(strategy〔in缪me theory)))是有限资源(可分割的或不可分割的)在多个对象土的分配,而增益或支付等于个体对象的增益或支付之和,这一对策是以一个虚构的Blotto土校来命名的,据说他是第一个参预这种类型的对策的人物
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条