说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> Markov对策
1)  Markov game
Markov对策
1.
A layered multi-agent coordination method based on Markov games is presented.
提出了一种分层的基于Markov对策的多智能体协调方法 ,根据多智能体之间的竞争和合作的关系 ,高层采用零和Markov对策解决与对手之间的竞争 ,低层采用团队Markov对策完成与团队内部的合作 。
2.
Non zero sum Markov game and reinforcement learning based on Q algorithm is a feasible frame for the research on the mechanism of multiagent system s cooperation.
MAS的协作机制研究 ,当前比较适用的研究框架是非零和 Markov对策及基于 Q-算法的强化学习 。
3.
In order to design reasonable defending policy,decompose a subtask,half field defense,into some one-vs-one defense subtask and pose it as a problem of zero-sum Markov games.
为制定合理的防守策略,将Robocup比赛中的一个子任务——半场防守任务分解为多个一对一防守任务,采用了基于Markov对策的强化学习方法解决这种零和交互问题,给出了具体的学习算法。
2)  Markov games
Markov对策
1.
Each AGV is treated as a rational agent in the system, which has two level decisions: on the option level, an agent adopts a reinforcement learning method under the Markov games architecture and makes decision to execute a subtask with the best response to the other AGV s current option; on the action level, an agent learns an opt.
系统中的每一个 AGV都由一个具有两级决策能力的智能体控制 :在选择级 ,智能体采用 Markov对策框架下的强化学习方法 ,以根据其他 AGV当前的子任务建立自己的最有反应子任务 ;在行动级 ,智能体通过强化学习建立优化的动作策略来完成由选择级确定的子任务 。
2.
In this paper,Markov games as a framework for reinforcement learning are studied.
论文研究了Markov对策模型作为学习框架的强化学习,提出了针对RoboCup仿真球队决策问题这一类复杂问题的学习模型和具体算法。
3)  zero-sum Markov game
零和Markov对策
1.
According to the relationship of competition and cooperation among the multiple agents, this method adopts the zero-sum Markov game in high layer to compete with the opponent and adopts the team Markov game in low layer to accomplish cooperation in the team.
提出了一种分层的基于Markov对策的多智能体协调方法 ,根据多智能体之间的竞争和合作的关系 ,高层采用零和Markov对策解决与对手之间的竞争 ,低层采用团队Markov对策完成与团队内部的合作 。
4)  team Markov game
团队Markov对策
1.
According to the relationship of competition and cooperation among the multiple agents, this method adopts the zero-sum Markov game in high layer to compete with the opponent and adopts the team Markov game in low layer to accomplish cooperation in the team.
提出了一种分层的基于Markov对策的多智能体协调方法 ,根据多智能体之间的竞争和合作的关系 ,高层采用零和Markov对策解决与对手之间的竞争 ,低层采用团队Markov对策完成与团队内部的合作 。
5)  non-zero-sum Markov games
非零和Markov对策
6)  Markov decision chain
Markov决策链
补充资料:Blotto对策


Blotto对策
Blotto games

B一川幽〕对策!BI峨劝〕g别nes;6.ooT,o“I,p“l 一类正规形式的二人零和对策(two一peoonzerc)一sum缪me)其中局中人的纯策略(见策略(对策论中的)(strategy〔in缪me theory)))是有限资源(可分割的或不可分割的)在多个对象土的分配,而增益或支付等于个体对象的增益或支付之和,这一对策是以一个虚构的Blotto土校来命名的,据说他是第一个参预这种类型的对策的人物
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条