1) watkins's Q(λ)reinforcement learning
自加强Watkins'sq(λ)学习算法
2) λ-γlearning
λ-γ学习算法
3) self-adaptive strenthen learning algorithm
自适应强化学习算法
4) Self-learning algorithm
自学习算法
1.
Knowledge library can be built and weights can be adjusted using Self-Learning algorithm, eventually The most precise target and evaluation function can be gotten to direct the strategy of robot.
本文介绍了基于自学习算法的足球机器人决策过程中选择最优目标点的设计,使机器人从诸多候选点中选出评价最优的点作为目标点,并通过自学习算法建立知识库,对权值不断修正,最终得到较精确的点的评价函数,指导机器人的决策。
5) self learning algorithm
自学习算法
1.
In view of the characteristics of pH value,a self learning algorithm is proposed,and a self learning expert controller which being fit for controlling pH value is designed.
针对pH 值控制特点,提出一种自学习算法并设计了适于pH 值控制的自学习专家控制器。
2.
The realizaton of self learning algorithm with Field Programmable Gate Arrays(FPGA) technique is studied.
介绍复合神经网络模型及特性,讨论了基于假逆矩阵的自学习算法,研究用现场可编程门电路(FPGA)实现复合神经网络的自学习过程,电路设计成半并行全数字式。
6) Roth-Erev reinforcement learning method
Roth-Erev加强学习法
补充资料:逆推学习算法
分子式:
CAS号:
性质:又称逆推学习算法,简称BP算法,是1986年鲁梅哈特(D. E. Rumelhart)和麦克莱朗德(J. L. McClelland)提出来的。用样本数据训练人工神经网络(一种模仿人脑的信息处理系统),它自动地将实际输出值和期望值进行比较,得到误差信号,再根据误差信号从后(输出层)向前(输入层)逐层反传,调节各神经层神经元之间的连接权重,直至误差减至满足要求为止。反向传播算法的主要特征是中间层能对输出层反传过来的误差进行学习。这种算法不能保证训练期间实现全局误差最小,但可以实现局部误差最小。BP算法在图像处理、语音处理、优化等领域得到应用。
CAS号:
性质:又称逆推学习算法,简称BP算法,是1986年鲁梅哈特(D. E. Rumelhart)和麦克莱朗德(J. L. McClelland)提出来的。用样本数据训练人工神经网络(一种模仿人脑的信息处理系统),它自动地将实际输出值和期望值进行比较,得到误差信号,再根据误差信号从后(输出层)向前(输入层)逐层反传,调节各神经层神经元之间的连接权重,直至误差减至满足要求为止。反向传播算法的主要特征是中间层能对输出层反传过来的误差进行学习。这种算法不能保证训练期间实现全局误差最小,但可以实现局部误差最小。BP算法在图像处理、语音处理、优化等领域得到应用。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条