1) reinforcement learning algorithm
增强学习算法
1.
The Research of PID parameters adjusting method Based on reinforcement learning algorithm;
基于增强学习算法的PID参数调整方法研究
2) Sarsa reinforcement learning algorithm
Sarsa增强学习算法
3) reinforcement learning algorihm
增强式学习算法
4) Profit-sharing Reinforcement Learning approach
Profit-sharing增强学习算法
6) reinforcement learning
增强学习
1.
Parallel machines scheduling with reinforcement learning;
基于增强学习的平行机调度研究
2.
Optimized negotiation strategy based on reinforcement learning;
一种优化的基于增强学习协商策略
3.
A survey of direct policy search methods in reinforcement learning;
增强学习中的直接策略搜索方法综述
补充资料:逆推学习算法
分子式:
CAS号:
性质:又称逆推学习算法,简称BP算法,是1986年鲁梅哈特(D. E. Rumelhart)和麦克莱朗德(J. L. McClelland)提出来的。用样本数据训练人工神经网络(一种模仿人脑的信息处理系统),它自动地将实际输出值和期望值进行比较,得到误差信号,再根据误差信号从后(输出层)向前(输入层)逐层反传,调节各神经层神经元之间的连接权重,直至误差减至满足要求为止。反向传播算法的主要特征是中间层能对输出层反传过来的误差进行学习。这种算法不能保证训练期间实现全局误差最小,但可以实现局部误差最小。BP算法在图像处理、语音处理、优化等领域得到应用。
CAS号:
性质:又称逆推学习算法,简称BP算法,是1986年鲁梅哈特(D. E. Rumelhart)和麦克莱朗德(J. L. McClelland)提出来的。用样本数据训练人工神经网络(一种模仿人脑的信息处理系统),它自动地将实际输出值和期望值进行比较,得到误差信号,再根据误差信号从后(输出层)向前(输入层)逐层反传,调节各神经层神经元之间的连接权重,直至误差减至满足要求为止。反向传播算法的主要特征是中间层能对输出层反传过来的误差进行学习。这种算法不能保证训练期间实现全局误差最小,但可以实现局部误差最小。BP算法在图像处理、语音处理、优化等领域得到应用。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条