1) Stochastic approximation
随机逼近
1.
A simple Algorithm of Model-Free Control with a Reformative Method of Simultaneous Perturbation Stochastic Approximation;
一种简易的无模型控制算法——改进的同时扰动随机逼近控制
2.
A stochastic approximation for parameters Markov decision processes;
参数Markov决策过程的随机逼近算法
3.
Enlightened by the technique used in extended least squares (ELS) algorithm for parameters identifying, based on stochastic approximation principle a new adaptive algorithm was concluded from EM algori.
本文借用增广最小二乘法(ELS)参数辩识算法中的运算技巧,应用随机逼近原理,在EM算法的基础上推导出一种具有自适应能力的离子通道信号参数估计技术,仿真证明其估计精度较高,稳健性强,而且易于实现。
2) mapping closure approximation
随机映射逼近
3) stochastic level value approximation
随机水平值逼近
4) random weighting approximation
随机加权逼近
1.
The asymptotic expansion for the distribution of a U - statistic is considered under assumptions that the samples are independently but not identically distributed, and its Edge-worth expansion is proved to hold with remainder o ( n -1/2 ) under comparatively general conditions while a random weighting approximation to the distribution of interest with accuracy of o (n -1/2) is constructed.
探讨了独立样本情形下U-统计量的分布的渐近展开,在较一般的条件下证明其Edgeworth展开的余项之误差可达到o(N-1/2),并构造精度为o(n-1/2)的随机加权逼近。
6) accelerated stochastic approximation
加速随机逼近
补充资料:随机逼近
在有随机误差干扰的情况下,用逐步逼近的方式估计某一特定值的数理统计方法。1951年,H.罗宾斯和S.门罗首先研究了此问题的一种形式:设因素x的值可由试验者控制,x的"响应"的指标值为Y,当取x之值x进行试验时,响应Y可表为Y=h(x)+ε,式中h(x)为一未知函数,ε为随机误差。设目标值为A,要找这样的x,使h(x)=A。分别以Y-A和h(x)-A代替Y和h(x)。不妨设A=0,问题就在于找方程h(x)=0的根x。例如若x为施药量,Y为衡量药物反应的某种生理指标,则问题在于找出施药量x,以使该生理指标控制于适当的值A。
若随机误差 ε=0,且h(x)为已知函数,则数值分析中提供了许多近似解法。例如可用牛顿迭代法求解:从一适当选择的初始值x0出发,用迭代公式xi+1=xj+αjyj,式中yj=h(xj);但当h(x)未知且有随机误差干扰时,αj和yj无法算出。罗宾斯等将上述算法稍作修改,引进迭代程序xi+1=xj-bjYj,式中Yj为当x=xj时Y的响应值,bj为适当选定的常数。假定 h(x)为x的递增函数且增长速度不快于线性,而各次量测相互独立,则理论研究证明了,只要取bj>0满足则由此算法决定的序列{xj}以概率1收敛到x(见概率论中的收敛)。上述算法叫罗宾斯-门罗程序,这是随机逼近的开创性的工作。
在有的问题中,要找的不是h(x)的零点,而是其极值点慜,它满足h′(慜)=0。但试验观测到的不是h′(x)+ε而只是h(x)+ε,故上述算法不能用于逼近慜。J.基弗和J.沃尔弗维茨依据用差商逼近h′(x)的想法在 1952年提出了一个算法(基弗-沃尔弗维茨程序)以解决估计慜的问题。
1951年以来,随机逼近的研究已取得了很大的进展。在理论上,讨论了量测误差不独立的情形和带约束条件的情形,以及h(x)具有更一般性质的情形。也考虑了时间连续时的算法和修正系数bj的选择,并对算法的渐近性质作了深入的研究。在方法上,也从纯概率发展到结合使用微分方程等工具。随机逼近在优化问题、适应控制、调节及跟踪系统等方面都有应用。
参考书目
M.T.Wasan,Stochastic ApproxiMation,cambridge Univ. Press,cambridge,1969.
H.Robbins and S.Monro,A Stochastic Approximation Method,Ann. Math. Statist.,Vol.22(1),1951.
若随机误差 ε=0,且h(x)为已知函数,则数值分析中提供了许多近似解法。例如可用牛顿迭代法求解:从一适当选择的初始值x0出发,用迭代公式xi+1=xj+αjyj,式中yj=h(xj);但当h(x)未知且有随机误差干扰时,αj和yj无法算出。罗宾斯等将上述算法稍作修改,引进迭代程序xi+1=xj-bjYj,式中Yj为当x=xj时Y的响应值,bj为适当选定的常数。假定 h(x)为x的递增函数且增长速度不快于线性,而各次量测相互独立,则理论研究证明了,只要取bj>0满足则由此算法决定的序列{xj}以概率1收敛到x(见概率论中的收敛)。上述算法叫罗宾斯-门罗程序,这是随机逼近的开创性的工作。
在有的问题中,要找的不是h(x)的零点,而是其极值点慜,它满足h′(慜)=0。但试验观测到的不是h′(x)+ε而只是h(x)+ε,故上述算法不能用于逼近慜。J.基弗和J.沃尔弗维茨依据用差商逼近h′(x)的想法在 1952年提出了一个算法(基弗-沃尔弗维茨程序)以解决估计慜的问题。
1951年以来,随机逼近的研究已取得了很大的进展。在理论上,讨论了量测误差不独立的情形和带约束条件的情形,以及h(x)具有更一般性质的情形。也考虑了时间连续时的算法和修正系数bj的选择,并对算法的渐近性质作了深入的研究。在方法上,也从纯概率发展到结合使用微分方程等工具。随机逼近在优化问题、适应控制、调节及跟踪系统等方面都有应用。
参考书目
M.T.Wasan,Stochastic ApproxiMation,cambridge Univ. Press,cambridge,1969.
H.Robbins and S.Monro,A Stochastic Approximation Method,Ann. Math. Statist.,Vol.22(1),1951.
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条