标准偏差和标准误差是统计学中的两个变异性估计量。两者只有一字之差,但是所表示的估计含义却很不同。
首先,从英文名字来讲,标准偏差是standard deviation,deviation有“离差”的意思,标准偏差表征的是数据的离散程度;而标准误差的英文名是standard error,表征的是单个统计量在多次抽样中呈现出的变异性。可以这样理解,前者是表示数据本身的变异性,而后者表征的是抽样行为的变异性。
从计算公式来看,标准偏差计算公式:
标准误差的计算公式:
其中, s就是上式的标准偏差,但它表示n次抽样得到的样本统计量(如均值)的标准偏差。
这个公式体现的具体过程如下:
1. 从总体中进行n次抽样(每一次抽样的数量不定,也不一定为1)。
2. 计算每次抽样的统计量,如均值、中位数、百分位数等。
3. 计算某个统计量的标准偏差,并根据抽样次数计算标准误差。
当样本当标准偏差固定时,抽样次数越大,标准误差越小,直观来看,减小抽样分布的标准误差最直接的办法是增大抽样规模,并且标准误差和数据规模呈现平方根的关系,也就是说要让抽样的标准误差减小一半,抽样次数要增大到原来的4倍。
从另一方面来说,如果抽样行为已经完成,那么抽样次数n是固定的,此时,这个抽样分布的标准偏差就可以作为标准误差的估计。
综上所述,标准误差比标准偏差具有更丰富的含义,这个更丰富来自于n的引入,即抽样分布的规模,数据的规模和抽样行为相关。从普适性来讲,标准偏差的适用性更广,他只表征数据本身的特点,无论是统计量的总体,还是抽样产生的统计数据,只要是数据,都可以计算出标准偏差。