1) mean value interval estimation
均值区间估计
1.
Normal population mean value interval estimation algorithms based on mathematical statistic theory as a new data correlation algorithms is advanced.
分析了用于多传感器数据融合的集中式与分布式卡尔曼滤波器,提出了一种新的基于数理统计理论的数据关联算法———正态母体均值区间估计算法,当传感器性能及干扰噪声的统计特性发生突变时,能大大提高数据融合的精度和准确性。
2) Average estimation
均值估计
1.
Considering the low precision of such general methods as average estimation and AR(P) model direct prediction in predicting the drift error coefficients of strapdown gyroscope,an improved AR(P) model is presented in this paper.
针对目前通用的均值估计法和AR(P)模型直接预测法对捷联陀螺漂移误差系数预测精度不高的情况,对AR(P)模型直接预测法进行了改进,建立了基于误差系数漂移量的AR(P)模型,首先预测漂移量,进而预测出漂移误差系数值。
3) mean value estimate
均值估计
1.
The average order and mean value estimates of the error term of function δ_k~r(n);
函数δ_k(n)r次方误差项的阶及均值估计
2.
According to relation between and zeros of Riemann ζ-function,there is an estimate of that mean value estimates of P(n),and in interval (x,x+y) are given.
讨论有关素因子函数在小区间上的均值性质,通过与Riemannξ-函数的零点间的关系,得到的一个渐近估计,从而给出P(n),P(n)/P(n),A(n)/ω(n)和B(n)/Ω(n)等函数在小区间[x,x+y]上的均值估计。
4) mean value estimates
均值估计
1.
The mean value estimates for some arithmetic functions of prime factors are given, and the similiar mean value estimates over arithmetic progressions for these function are also ob-tained.
得到了几个有关素因子函数的均值估计,以及这些函数在算术级数中的均值估计。
6) Estimate of mean
均值估计
1.
In the research of group sampling, and give the estimate of mean with its character in the common method of group sampling, but they do not pay attention to the effect of each group in the general stage to estimate result.
在集团抽样调查中,[1]和[2]给出了一般抽样方法及均值估计和它性质的论述,但未考虑各集团在总体中的地位对估计结果的影响。
补充资料:区间估计
参数估计的一种形式。通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。例如,估计一种药品所含杂质的比率在1~2%之间;估计一种合金的断裂强度在1000~1200千克之间,等等。在有的问题中,只需要对未知量取值的上限或下限作出估计。如前例中,一般只对上限感兴趣,而在第二例中,则只对下限感兴趣。
在数理统计学中,待估计的未知量是总体分布的参数θ或θ的某个函数g(θ)。区间估计问题可一般地表述为:要求构造一个仅依赖于样本X=(x1,x2,...,xn)的适当的区间[A(X),B(X)],一旦得到了样本X的观测值尣,就把区间[A(尣),B(尣)]作为θ或g(θ)的估计。至于怎样的区间才算是"适当",如何去构造它,则与所依据的原理和准则有关。这些原理、准则及构造区间估计的方法,便是区间估计理论的研究对象。作为参数估计的形式,区间估计与点估计是并列而又互相补充的,它与假设检验也有密切的联系。
置信区间理论 这是1934年,由统计学家J.奈曼所创立的一种严格的区间估计理论。置信系数是这个理论中最为基本的概念。
置信系数 奈曼以概率的频率解释为出发点,认为被估计的θ是一未知但确定的量,而样本X是随机的。区间[A(X),B(X)]是否真包含待估计的θ,取决于所抽得的样本X。因此,区间 [A(X),B(X)]只能以一定的概率包含未知的θ。对于不同的θ,π(θ)之值可以不同,π(θ)对不同的θ取的最小值1-α(0<α<1)称为区间[A(X),B(X)]的置信系数。与此相应,区间[A(X),B(X)]称为θ的一个置信区间。这个名词在直观上可以理解为:对于"区间[A(X),B(X)]包含θ"这个推断,可以给予一定程度的相信,其程度则由置信系数表示。
对θ的上、下限估计有类似的概念,以下限为例,称A(X)为θ的一个置信下限,若一旦有了样本X,就认为θ不小于A(X),或者说,把θ估计在无穷区间[A(X),∞)内。"θ不小于A(X)"这论断正确的概率为θ)。π1(θ)对不同的θ取的最小值1-α(0<α<1)称为置信下限A(X)的置信系数。
在数理统计中,常称不超过置信系数的任何非负数为置信水平。
优良性准则 置信系数1-α 反映了置信区间[A(X),B(X)]的可靠程度,1-α愈大,[A(X),B(X)]用以估计θ时,犯错误(即θ并不在[A(X),B(X)]之内)的可能性愈小。但这只是问题的一个方面。为了使置信区间[A(X),B(X)] 在实际问题中有用,它除了足够可靠外,还应当足够精确。比如说,估计某个人的年龄在 5至95岁之间,虽十分可靠,但太不精确,因而无用。通常指定一个很小的正数α(一般,α 取0.10,0.05,0.01等值),要求置信区间[A(X),B(X)]的置信系数不小于1-α,在这个前提下使它尽可能地精确。对于"精确"的不同的解释,可以导致种种优良性标准。比较重要的有两个:一是考虑区间的长度B(X)-A(X)愈小愈好。这个值与X有关,一般用其数学期望Eθ(B(X)-A(X))作为衡量置信区间[A(X),B(X)] 精确程度的指标。这个指标愈小, 置信区间的精确程度就愈大。另一个是考虑置信区间 [A(X), B(X)]包含假值(指任何不等于被估计的 θ 的值)θ┡ 的概率,它愈小,[A(X),B(X)]作为θ的估计的精度就愈高。
如果A(X)是θ的置信下限,则在保证A(X)的置信系数不小于1-α的前提下,A(X)愈大,精确程度愈高。这也可以用[A(X) ,∞)包含假值θ┡(θ┡<θ)的概率来衡量,此概率愈小,置信下限A(X)的精确程度愈高。对置信上限有类似的结果,若在某个准则下,一个置信区间(或上、下限)比其他置信区间都好,则称它为在这个准则下是一致最优的。例如,在上述准则下,置信系数1-α的一致最优置信下限A(X)定义为:A(X)有置信系数1-α ,且对任何有置信系数1-α的置信下限A1(X),当θ┡<θ时,成立
有时,对所考虑的置信区间(或上、下限)加上某种一般性限制,在这个前提下寻找最优者。无偏性是经常用的限制之一,如果一个置信区间(上、下限)包含真值θ的概率,总不小于包含任何假值θ┡的概率,则称该置信区间(上、下限)是无偏的。同变性(见统计决策理论)也是一个常用的限制。
求置信区间的方法 最常用的求置信区间及置信上、下限的方法有以下几种。
一种是利用已知的抽样分布(见统计量)。例如,设x1,x2,...,xn为正态总体N(μ,σ2)(见正态分布)中抽出的样本,要作μ 的区间估计,记,· 则服从自由度为n-1的t分布。指定α>0,找这个分布的上α/2分位数tα/2(n-1),则有 即由此得到 μ 的一个置信系数为 1-α 的置信区间 。类似地可以定出μ的置信系数为1-α的置信上、下限分别为。
另一种是利用区间估计与假设检验的联系,设要作θ的置信系数为1-α 的区间估计,对于任意的θ0,考虑原假设为 H:θ=θ0,备择假设为 K:θ≠θ0。设有一水平为α 的检验,它当样本X属于集合A( θ0)时接受H。若集合{θ0∶X∈A(θ0)}是一个区间,则它就是θ的一个置信区间,其置信系数为1-α。就上例而言,对假设H:μ=μ0的检验常用t检验:当时接受μ=μ0,集合 即为区间 这正是前面定出的μ的置信区间。若要求θ的置信下限(或上限),则取原假设为θ≤θ0(或θ≥θ0),备择假设为θ>θ0(或θ<θ0),按照同样的方法可得到所要求的置信下(上)限。
还有一种方法是利用大样本理论(见大样本统计)。例如,设x1,x2,...,xn为抽自参数为p的二点分布(见概率分布)的样本,当n→∞时,依分布收敛(见概率论中的收敛)于标准正态分布N(0,1),以 uα/2记N (0,1)的上 α/2 分位数,则有。所以,可作为p的一个区间估计,上面的极限值1-α就定义为它的渐近置信系数。
费希尔的信任推断法 20世纪30年代初期,统计学家R.A.费希尔提出了一种构造区间估计的方法,他称之为信任推断法。其基本观点是:设要作θ的区间估计,在抽样得到样本X以前,对θ一无所知,样本X透露了θ的一些信息,据此可以对θ取各种值给予各种不同的"信任程度",而这可用于对θ作区间估计。例如,设X是从正态总体N(θ,1)中抽出的样本,则服从标准正态分布N(0,1),由此可知,对任何α)有即
费希尔把这个等式解释为:在抽样以前,对于θ落在区间内的可能性本来一无所知,通过抽样,获得了上述数值,它表达了统计工作者对这个区间的"信任程度",若取b)=-α=uα/2,则得到区间,其信任程度为 1-α。即当用上述区间作为θ的区间估计时,对于"它能包含被估计的θ"这一点可给予信任的程度为1-α。
在本例以及其他某些简单问题中,用费希尔的方法与用奈曼的方法得出一致的结果。但是,这两个方法不仅在基本观点上不一致,而且在较复杂的问题中,所得出的结果也不同。一个著名的例子是所谓的费希尔-贝伦斯问题:设两个正态分布μ1,μ2,σ娝,σ娤都未知,要求μ1-μ2的区间估计。费希尔用他的方法提供了一个与奈曼理论不一致的解法,奈曼在1941年曾对此进行了详尽的讨论。
另外,贝叶斯方法(见贝叶斯统计)也是一个重要的构造区间估计的方法。统计决策理论中引进的一些概念和优良性准则,也可用于区间估计。此外序贯方法(见序贯分析)在区间估计中也有了相当的发展。
区域估计 有时要对两个或更多的参数θ=(θ1,θ2,...,θk)(k>1),例如正态分布N(μ,σ2)中的μ与σ2,同时进行估计;这时,每当有样本X,就由X在θ的取值的k维空间Rk内定出一个区域Q(X),而把θ估计在Q(X)内。这种估计叫做区域估计。所用区域一般为比较简单的几何形状,如长方体、球或椭球等。关于区域估计的置信系数、优良性准则及其求法等,与区间估计情况相似。
容忍限与容忍区间 这是一个与区间估计有密切联系的概念,但处理的问题不同。给定β,у,0<β<1,0<у<1,以F记总体分布。若T(X)为一统计量,满足条件,则称 T(X)为总体分布F 的上(β,у)容忍限。类似地可定义下(β,у)容忍限。若T1(X)和T2(X)为两个统计量,T1(X)≤T2(X),且,则称 [T1(X),T2(X)] 为总体分布的一个(β,у)容忍区间。例如,X是某产品的质量指标,而F为其分布,则(β,у)容忍区间[T1(X),T2(X)]的意义是:至少有1-β的把握断言"至少有100(1-у)%的产品,其质量指标落在区间[T1(X),T2(X)]之内"。可以说,容忍区间估计的是总体分布的概率集中在何处,而非总体分布参数。
参考书目
J.Neyman, Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability,Philosophical Transactions of the Royɑl Society, Vol. 236, 1937.
陈希孺著,《数理统计引论》,科学出版社,北京,1981。
在数理统计学中,待估计的未知量是总体分布的参数θ或θ的某个函数g(θ)。区间估计问题可一般地表述为:要求构造一个仅依赖于样本X=(x1,x2,...,xn)的适当的区间[A(X),B(X)],一旦得到了样本X的观测值尣,就把区间[A(尣),B(尣)]作为θ或g(θ)的估计。至于怎样的区间才算是"适当",如何去构造它,则与所依据的原理和准则有关。这些原理、准则及构造区间估计的方法,便是区间估计理论的研究对象。作为参数估计的形式,区间估计与点估计是并列而又互相补充的,它与假设检验也有密切的联系。
置信区间理论 这是1934年,由统计学家J.奈曼所创立的一种严格的区间估计理论。置信系数是这个理论中最为基本的概念。
置信系数 奈曼以概率的频率解释为出发点,认为被估计的θ是一未知但确定的量,而样本X是随机的。区间[A(X),B(X)]是否真包含待估计的θ,取决于所抽得的样本X。因此,区间 [A(X),B(X)]只能以一定的概率包含未知的θ。对于不同的θ,π(θ)之值可以不同,π(θ)对不同的θ取的最小值1-α(0<α<1)称为区间[A(X),B(X)]的置信系数。与此相应,区间[A(X),B(X)]称为θ的一个置信区间。这个名词在直观上可以理解为:对于"区间[A(X),B(X)]包含θ"这个推断,可以给予一定程度的相信,其程度则由置信系数表示。
对θ的上、下限估计有类似的概念,以下限为例,称A(X)为θ的一个置信下限,若一旦有了样本X,就认为θ不小于A(X),或者说,把θ估计在无穷区间[A(X),∞)内。"θ不小于A(X)"这论断正确的概率为θ)。π1(θ)对不同的θ取的最小值1-α(0<α<1)称为置信下限A(X)的置信系数。
在数理统计中,常称不超过置信系数的任何非负数为置信水平。
优良性准则 置信系数1-α 反映了置信区间[A(X),B(X)]的可靠程度,1-α愈大,[A(X),B(X)]用以估计θ时,犯错误(即θ并不在[A(X),B(X)]之内)的可能性愈小。但这只是问题的一个方面。为了使置信区间[A(X),B(X)] 在实际问题中有用,它除了足够可靠外,还应当足够精确。比如说,估计某个人的年龄在 5至95岁之间,虽十分可靠,但太不精确,因而无用。通常指定一个很小的正数α(一般,α 取0.10,0.05,0.01等值),要求置信区间[A(X),B(X)]的置信系数不小于1-α,在这个前提下使它尽可能地精确。对于"精确"的不同的解释,可以导致种种优良性标准。比较重要的有两个:一是考虑区间的长度B(X)-A(X)愈小愈好。这个值与X有关,一般用其数学期望Eθ(B(X)-A(X))作为衡量置信区间[A(X),B(X)] 精确程度的指标。这个指标愈小, 置信区间的精确程度就愈大。另一个是考虑置信区间 [A(X), B(X)]包含假值(指任何不等于被估计的 θ 的值)θ┡ 的概率,它愈小,[A(X),B(X)]作为θ的估计的精度就愈高。
如果A(X)是θ的置信下限,则在保证A(X)的置信系数不小于1-α的前提下,A(X)愈大,精确程度愈高。这也可以用[A(X) ,∞)包含假值θ┡(θ┡<θ)的概率来衡量,此概率愈小,置信下限A(X)的精确程度愈高。对置信上限有类似的结果,若在某个准则下,一个置信区间(或上、下限)比其他置信区间都好,则称它为在这个准则下是一致最优的。例如,在上述准则下,置信系数1-α的一致最优置信下限A(X)定义为:A(X)有置信系数1-α ,且对任何有置信系数1-α的置信下限A1(X),当θ┡<θ时,成立
有时,对所考虑的置信区间(或上、下限)加上某种一般性限制,在这个前提下寻找最优者。无偏性是经常用的限制之一,如果一个置信区间(上、下限)包含真值θ的概率,总不小于包含任何假值θ┡的概率,则称该置信区间(上、下限)是无偏的。同变性(见统计决策理论)也是一个常用的限制。
求置信区间的方法 最常用的求置信区间及置信上、下限的方法有以下几种。
一种是利用已知的抽样分布(见统计量)。例如,设x1,x2,...,xn为正态总体N(μ,σ2)(见正态分布)中抽出的样本,要作μ 的区间估计,记,· 则服从自由度为n-1的t分布。指定α>0,找这个分布的上α/2分位数tα/2(n-1),则有 即由此得到 μ 的一个置信系数为 1-α 的置信区间 。类似地可以定出μ的置信系数为1-α的置信上、下限分别为。
另一种是利用区间估计与假设检验的联系,设要作θ的置信系数为1-α 的区间估计,对于任意的θ0,考虑原假设为 H:θ=θ0,备择假设为 K:θ≠θ0。设有一水平为α 的检验,它当样本X属于集合A( θ0)时接受H。若集合{θ0∶X∈A(θ0)}是一个区间,则它就是θ的一个置信区间,其置信系数为1-α。就上例而言,对假设H:μ=μ0的检验常用t检验:当时接受μ=μ0,集合 即为区间 这正是前面定出的μ的置信区间。若要求θ的置信下限(或上限),则取原假设为θ≤θ0(或θ≥θ0),备择假设为θ>θ0(或θ<θ0),按照同样的方法可得到所要求的置信下(上)限。
还有一种方法是利用大样本理论(见大样本统计)。例如,设x1,x2,...,xn为抽自参数为p的二点分布(见概率分布)的样本,当n→∞时,依分布收敛(见概率论中的收敛)于标准正态分布N(0,1),以 uα/2记N (0,1)的上 α/2 分位数,则有。所以,可作为p的一个区间估计,上面的极限值1-α就定义为它的渐近置信系数。
费希尔的信任推断法 20世纪30年代初期,统计学家R.A.费希尔提出了一种构造区间估计的方法,他称之为信任推断法。其基本观点是:设要作θ的区间估计,在抽样得到样本X以前,对θ一无所知,样本X透露了θ的一些信息,据此可以对θ取各种值给予各种不同的"信任程度",而这可用于对θ作区间估计。例如,设X是从正态总体N(θ,1)中抽出的样本,则服从标准正态分布N(0,1),由此可知,对任何α)有即
费希尔把这个等式解释为:在抽样以前,对于θ落在区间内的可能性本来一无所知,通过抽样,获得了上述数值,它表达了统计工作者对这个区间的"信任程度",若取b)=-α=uα/2,则得到区间,其信任程度为 1-α。即当用上述区间作为θ的区间估计时,对于"它能包含被估计的θ"这一点可给予信任的程度为1-α。
在本例以及其他某些简单问题中,用费希尔的方法与用奈曼的方法得出一致的结果。但是,这两个方法不仅在基本观点上不一致,而且在较复杂的问题中,所得出的结果也不同。一个著名的例子是所谓的费希尔-贝伦斯问题:设两个正态分布μ1,μ2,σ娝,σ娤都未知,要求μ1-μ2的区间估计。费希尔用他的方法提供了一个与奈曼理论不一致的解法,奈曼在1941年曾对此进行了详尽的讨论。
另外,贝叶斯方法(见贝叶斯统计)也是一个重要的构造区间估计的方法。统计决策理论中引进的一些概念和优良性准则,也可用于区间估计。此外序贯方法(见序贯分析)在区间估计中也有了相当的发展。
区域估计 有时要对两个或更多的参数θ=(θ1,θ2,...,θk)(k>1),例如正态分布N(μ,σ2)中的μ与σ2,同时进行估计;这时,每当有样本X,就由X在θ的取值的k维空间Rk内定出一个区域Q(X),而把θ估计在Q(X)内。这种估计叫做区域估计。所用区域一般为比较简单的几何形状,如长方体、球或椭球等。关于区域估计的置信系数、优良性准则及其求法等,与区间估计情况相似。
容忍限与容忍区间 这是一个与区间估计有密切联系的概念,但处理的问题不同。给定β,у,0<β<1,0<у<1,以F记总体分布。若T(X)为一统计量,满足条件,则称 T(X)为总体分布F 的上(β,у)容忍限。类似地可定义下(β,у)容忍限。若T1(X)和T2(X)为两个统计量,T1(X)≤T2(X),且,则称 [T1(X),T2(X)] 为总体分布的一个(β,у)容忍区间。例如,X是某产品的质量指标,而F为其分布,则(β,у)容忍区间[T1(X),T2(X)]的意义是:至少有1-β的把握断言"至少有100(1-у)%的产品,其质量指标落在区间[T1(X),T2(X)]之内"。可以说,容忍区间估计的是总体分布的概率集中在何处,而非总体分布参数。
参考书目
J.Neyman, Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability,Philosophical Transactions of the Royɑl Society, Vol. 236, 1937.
陈希孺著,《数理统计引论》,科学出版社,北京,1981。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条