1) stochastic cooperative game
随机合作对策
1.
This paper extends notions of superadditivity and convexity to stochastic cooperative games.
本文将凸性扩展到随机合作对策中,从而得到凸随机合作对策具有超可加性与非空的核心,且凸随机合作对策的核心满足Minkowski和与Minkowski差。
2) repeated n-person stochastic cooperative game
重复n人随机合作对策
1.
Core of a repeated n-person stochastic cooperative game;
重复n人随机合作对策的核心
2.
The conception of τ-dominance in repeated n-person stochastic cooperative game is defined in this paper, and refines core of repeated n-person stochastic cooperative game with it, then the conception of τ-core of repeated n-person stochastic cooperative game is defined.
在重复n人随机合作对策中定义了τ-优超的概念,并通过运用τ-优超的概念对重复n人随机合作对策中的核心进行了精炼,即定义了重复n人随机合作对策的τ-核心。
3) stochastic games
随机对策
1.
Q -learning from original single-agent framework is extended to non-cooperative multi-agent framework, and the theoretic framework of multi-agent learning is proposed under general-sum stochastic games with Nash equilibrium point as learning objective.
将 Q- learning从单智能体框架上扩展到非合作的多智能体框架上 ,建立了在一般和随机对策框架下的多智能体理论框架和学习算法 ,提出了以 Nash平衡点作为学习目标 。
4) stochastic game
随机对策
1.
A local learning algorithm for multi-agent-based stochastic games is proposed in light of the fact that the individual performs local perception and interaction in group.
基于群体环境中个体agent局部感知和交互的生物原型,提出一种随机对策框架下的多agent局部学习算法。
5) cooperative game
合作对策
1.
Study on harmony of project construction processes based on cooperative game theory;
基于合作对策的工程进度协调问题研究
2.
Monotonic solution of dynamic cooperative games on matroids
拟阵上动态结构合作对策的单调解
3.
This paper establishes a cooperative game model based on n-people cooperative game by ways of game theory, and adopts Shapley value method, Core method, and simplified MCRS method to analyze the example and discusse the meanings of different results.
分析了互联电网的特点和问题,指出跨区域互联电网合作的必要性,并运用博弈论构建了基于多人合作对策的互联电网合作对策模型,并采用Shapley值法、核心法和简化的MCRS法等分配方式进行了算例分析,探讨了不同计算结果的寓意。
6) cooperative games
合作对策
1.
Mult person cooperative games on the income distribution of the railway passenger train;
铁路客运收入分配的多人合作对策问题
2.
By employing the theory of cooperative games, a mathematical model is proposed for rational apportionment of returns among railway transportation enterprises.
利用多人合作对策模型解决铁路运输企业间收益(利润)的合理分配。
3.
A mathematical model for rational share of the lowest expenses for adjustment of railway empty cars is proposed based on the cooperative games.
借助多人合作对策的思想建立了铁路空车调整问题中最小费用合理分摊的数学模型,给出了建立理想分摊向量和特征函数的一种方法,并提供了具体解法,比较有效地解决了空车调整中最小费用的合理分摊问题,为最优调运方案的实际实施提供了前提和保障。
补充资料:随机对策
随机对策
stochastic game
的双人零和随机对策.假定当任何平稳策略代入转移函数F(、、lx、,广‘一’)中{l寸Ma芦oB链的遍历性成、).,则已经记一明J一这样的对策和平稳最优策略的值存在.这些结果已经被推厂‘到对状态和初等策略数目无限制的情形和别的性能指标形式的情形.卜卜注】在1981年,J .F .Mertells和ANe犯na幻证明了兵有极限均值性能指标的任意随机对策的值的存在性1 AZ]. 关于使用折扣性能指标的随机对策的渐近理论,已经有大量的研究,见IAI]一IA3].随机对策啤以出印拓cgan祀;cT0xacm,ee脚盯pa] 一种动态对策(dy口amicg日1lles),这}!寸转移分布函数不依赖于对策的历史,即 F(x*}x、,了”),」一,x、_,、〔‘卜勺= “F(义*}x*_1,、(“一,)).随机对策首先是由L.5.Shapley(〔l})定义的,他研究了带实性能指标的双人零和随机对策(SllaPle,对策(Shapley games)).在ShaP]ey对策中,对策状态集X和局中人纯策略集都是有限的,并且在任何一步对于由局中人所作出的任何一种两择一选择,都存在一中断该对策的非零概率.由于这一条件,对策在有限多步后中断的概率为1,夕卜且每个局中人的性能指标的数学期望均为有限.任何这样的对策都有一个值,并目.两个局中人都有平稳最优策略(stationary oPtilllalstral卿巴),即按这些策略,局中人在对策过程的每一阶段选择的初等策略,仅取决于目前的状态.Shaplev还发现了一种办法,据此有可能既找到对策的值,又找到最优策略. 对另一种随机对策也已进行了研究,与Shapley对策的区别在于可以是无穷的;这样的对策称为具有极限均值性能指标的随机对策(stochastic,mes with hmtingtl飞浅In Pay Off).即具有 “l(p)一,12(p)一。,二SUp溶l青”(·*,一)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条