1) replacing eligibility traces
替代传导径迹
1.
Each agent takes the others different from the environment, and maintains the others replacing eligibility traces to estimate the other s behaviors during learning, at the same time estimates itself behavior.
提出一种多智能体增强式学习方法 ,每个智能体在学习过程中将其他智能体和环境区分开来 ,并且通过维持其他智能体的替代传导径迹来预测它们的行为 ,从而也确定了自身的行为 。
4) spare ways
路径替代
5) Leadership substitutes
领导替代
补充资料:感觉传导途径 1脊髓断面标示主要传导束的位置
李瑞端绘
[图]
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条