标准差的计算
标准偏差,又名标准差、均方差、standard deviation,可以用希腊字母σ表示。
标准偏差反映一个数据集的离散程度,标准偏差越小,这些值偏离平均值就越少,反之亦然。
在统计学中,我们经常通过从总体中随机抽取样品来观察,对应的就会有样本标准偏差(sample standard deviation )和总体标准偏差(population standard deviation)。
样本标准偏差和总体标准偏差的计算公式如下:
总体标准偏差:针对总体数据的偏差,所以要平均 1/N。
样本标准偏差,也称实验标准偏差:针对从总体抽样,利用样本来计算总体偏差,为了使算出的值与总体水平更接近,就必须将算出的标准偏差的值适度放大,即1/(N-1)。
在Excel中,要计算样本标准偏差可以使用函数STDEV.S、STDEV、STDEVA,要计算总体标准偏差可以使用函数STDEV.P、STDEVPA、STDEVP。
如下图所示,分别演示了如何直接用STDEV.S、STDEV.P 函数以及间接用上述公式计算一组数据的样本标准偏差和总体标准偏差:
公式如下:
Visual Basic
'样本标准偏差
=STDEV.S(A2:A6)
'样本标准偏差
=(SUMPRODUCT((A2:A6-AVERAGE(A2:A6))^2)/(COUNT(A2:A6)-1))^(1/2)
'总体标准偏差
=STDEV.P(A2:A6)
'总体标准偏差
=(SUMPRODUCT((A2:A6-AVERAGE(A2:A6))^2)/COUNT(A2:A6))^(1/2)
标准偏差和标准误差是统计学中的两个变异性估计量。两者只有一字之差,但是所表示的估计含义却很不同。
首先,从英文名字来讲,标准偏差是standard deviation,deviation有“离差”的意思,标准偏差表征的是数据的离散程度;而标准误差的英文名是standard error,表征的是单个统计量在多次抽样中呈现出的变异性。可以这样理解,前者是表示数据本身的变异性,而后者表征的是抽样行为的变异性。
从计算公式来看,标准偏差计算公式:
标准误差的计算公式:
其中, s就是上式的标准偏差,但它表示n次抽样得到的样本统计量(如均值)的标准偏差。
这个公式体现的具体过程如下:
1. 从总体中进行n次抽样(每一次抽样的数量不定,也不一定为1)。
2. 计算每次抽样的统计量,如均值、中位数、百分位数等。
3. 计算某个统计量的标准偏差,并根据抽样次数计算标准误差。
当样本当标准偏差固定时,抽样次数越大,标准误差越小,直观来看,减小抽样分布的标准误差最直接的办法是增大抽样规模,并且标准误差和数据规模呈现平方根的关系,也就是说要让抽样的标准误差减小一半,抽样次数要增大到原来的4倍。
从另一方面来说,如果抽样行为已经完成,那么抽样次数n是固定的,此时,这个抽样分布的标准偏差就可以作为标准误差的估计。
其中E为误差=测定值—真实值。
标准误差一般用SE表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。
标准差与标准误差的意义、作用和使用范围均不同。标准差(亦称单数标准差)一般用SD表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标。