1) Data Processing of Experimental Error
实验误差数据处理
4) error processing for GIS data
GIS数据误差处理
补充资料:实验数据的误差处理
物理实验的观测值都有误差,从而使实验结果带有不确定性。实验数据误差处理的目的是估计实验结果不确定性的大小,即估计实验结果的精度。实验误差包括系统误差和随机误差这两类性质不同的误差。由于实验条件不正常或观测者不小心而导致歪曲测量结果的过失误差应当从测量中排除。
系统误差 是在一定的实验条件下具有固定数值的误差。判断系统误差的存在及其来源的方法主要有:①变化可能形成系统误差的实验条件,并比较不同条件下的测量结果;②对测得的数据进行统计假设检验(见数据的统计处理方法),以判断观测值的分布是否与随机误差的预期分布一致。
实验前,应尽可能地消除导致系统误差的因素,在多次观测中,适当地改变产生系统误差的实验条件(如将条件对称地或随机地配置,使结果中的系统误差相互抵消),有可能减少或消除最终结果中的系统误差,已经判明的系统误差数值应从测量结果中扣除。
随机误差 是由于测量的偶然误差或被研究的物理现象本身的随机性质所引起的观测结果的不确定性。在一定的实验条件下重复测量某一个物理量的数值,各次测量会得到不同的结果:观测值服从某种统计分布,观测值的分布愈宽,则从一次实验得到的一个特定观测值的不确定性愈大,即随机误差愈大,误差理论的主要内容是如何估计实验观测结果的随机误差。
把通过实验观测得到某物理量θ的估计值记为,观测结果 的精度可以用在某个给定的置信水平 ξ下附近的一个误差区间,即置信区间,来表示,或者写作
。
置信区间中包含被测物理量真值θ的概率为ξ:如果在相同的实验条件下重复多次观测,由此得出多个不同的置信区间,则平均有份额为ξ的区间包含有被测物理量的真值,显然,在一定的置信水平下,置信区间愈小则实验结果的误差愈小,结果愈精密。
常用标准误差(分布方差的二次方根)表征一个统计分布的宽度,测量的偶然误差大多服从正态分布,若物理量θ的观测值服从标准误差为σ的正态分布,观测值中不包含系统误差,观测值分布的期待值(平均值)为被测物理量的真值θ,则对于一个观测值θ,区间的置信水平为68.3%,通常略去"置信水平68.3%"这句话而将结果简单地记作
。
对于N次重复测量得到的正态观测值θ1,θ2,...,θN,算术平均值 也服从期待值为被测其值θ的正态分布,其标准误差为,则将观测结果记为
置信区间 的置信水平为68.3%,若标准误差σ未知,需要由观测值来估计,则可用表示估计值的误差,置信区间的置信水平为ξ,或记作
其中
系数的数值由自由度N-1的t分布表查出,在测得数据较多时,如N>10,,可以简单地采用S作为观测结果的标准误差。
若对于同一个物理量θ有N个不同精度的正态观测结果θ1,θ2,...,θN,它们的标准误差分别为σ1,σ2,...,σN,可采用加权平均值
作为总的观测结果,加权平均值服从正态分布,其标准误差为
置信区间的置信水平是68.3%。
在同时测量多个物理量的情况下,测量结果的精度由对于所有被测物理量的一个置信区域来表示,在一定的置信水平下,置信区域的大小和形状不但同各个观测值的误差有关,而且与它们之间的相关程度有关。
已知直接观测值的误差,如何估计通过计算得到的间接观测值的误差,叫做误差传播问题,如果直接观测值服从正态分布,而且间接观测值是直接观测值的线性函数,则间接观测值也服从正态分布,其标准误差可以用简单的误差传播公式由直接观测值的误差算出,一般函数的误差传播问题,只有在各直接观测值的误差都较小的条件下,才可以近似地使用误差传播公式。很多实验观测结果(如一般情况下的间接观测值)并不服从正态分布。在测量结果的不确定性主要由被研究的物理现象本身的随机性质所决定的场合,观测值一般也不服从正态分布,早期的物理实验中,对于不服从正态分布的观测值也采用其标准误差表征实验结果的精度。这种情况下,相应误差区间的置信水平并不是68.3%,而同观测值分布的具体形式有关。在观测值不服从正态分布的一般情况下,要想在确定的概率意义下表示实验结果的误差,即对于一定的置信水平求得相应的置信区间,必须应用数理统计学参量估计的方法(见数据的统计处理方法)。
参考书目
李惕碚著:《实验的数学处理》,科学出版社,北京,1980。
系统误差 是在一定的实验条件下具有固定数值的误差。判断系统误差的存在及其来源的方法主要有:①变化可能形成系统误差的实验条件,并比较不同条件下的测量结果;②对测得的数据进行统计假设检验(见数据的统计处理方法),以判断观测值的分布是否与随机误差的预期分布一致。
实验前,应尽可能地消除导致系统误差的因素,在多次观测中,适当地改变产生系统误差的实验条件(如将条件对称地或随机地配置,使结果中的系统误差相互抵消),有可能减少或消除最终结果中的系统误差,已经判明的系统误差数值应从测量结果中扣除。
随机误差 是由于测量的偶然误差或被研究的物理现象本身的随机性质所引起的观测结果的不确定性。在一定的实验条件下重复测量某一个物理量的数值,各次测量会得到不同的结果:观测值服从某种统计分布,观测值的分布愈宽,则从一次实验得到的一个特定观测值的不确定性愈大,即随机误差愈大,误差理论的主要内容是如何估计实验观测结果的随机误差。
把通过实验观测得到某物理量θ的估计值记为,观测结果 的精度可以用在某个给定的置信水平 ξ下附近的一个误差区间,即置信区间,来表示,或者写作
。
置信区间中包含被测物理量真值θ的概率为ξ:如果在相同的实验条件下重复多次观测,由此得出多个不同的置信区间,则平均有份额为ξ的区间包含有被测物理量的真值,显然,在一定的置信水平下,置信区间愈小则实验结果的误差愈小,结果愈精密。
常用标准误差(分布方差的二次方根)表征一个统计分布的宽度,测量的偶然误差大多服从正态分布,若物理量θ的观测值服从标准误差为σ的正态分布,观测值中不包含系统误差,观测值分布的期待值(平均值)为被测物理量的真值θ,则对于一个观测值θ,区间的置信水平为68.3%,通常略去"置信水平68.3%"这句话而将结果简单地记作
。
对于N次重复测量得到的正态观测值θ1,θ2,...,θN,算术平均值 也服从期待值为被测其值θ的正态分布,其标准误差为,则将观测结果记为
置信区间 的置信水平为68.3%,若标准误差σ未知,需要由观测值来估计,则可用表示估计值的误差,置信区间的置信水平为ξ,或记作
其中
系数的数值由自由度N-1的t分布表查出,在测得数据较多时,如N>10,,可以简单地采用S作为观测结果的标准误差。
若对于同一个物理量θ有N个不同精度的正态观测结果θ1,θ2,...,θN,它们的标准误差分别为σ1,σ2,...,σN,可采用加权平均值
作为总的观测结果,加权平均值服从正态分布,其标准误差为
置信区间的置信水平是68.3%。
在同时测量多个物理量的情况下,测量结果的精度由对于所有被测物理量的一个置信区域来表示,在一定的置信水平下,置信区域的大小和形状不但同各个观测值的误差有关,而且与它们之间的相关程度有关。
已知直接观测值的误差,如何估计通过计算得到的间接观测值的误差,叫做误差传播问题,如果直接观测值服从正态分布,而且间接观测值是直接观测值的线性函数,则间接观测值也服从正态分布,其标准误差可以用简单的误差传播公式由直接观测值的误差算出,一般函数的误差传播问题,只有在各直接观测值的误差都较小的条件下,才可以近似地使用误差传播公式。很多实验观测结果(如一般情况下的间接观测值)并不服从正态分布。在测量结果的不确定性主要由被研究的物理现象本身的随机性质所决定的场合,观测值一般也不服从正态分布,早期的物理实验中,对于不服从正态分布的观测值也采用其标准误差表征实验结果的精度。这种情况下,相应误差区间的置信水平并不是68.3%,而同观测值分布的具体形式有关。在观测值不服从正态分布的一般情况下,要想在确定的概率意义下表示实验结果的误差,即对于一定的置信水平求得相应的置信区间,必须应用数理统计学参量估计的方法(见数据的统计处理方法)。
参考书目
李惕碚著:《实验的数学处理》,科学出版社,北京,1980。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条