版权归原作者所有,如有侵权,请联系我们

[科普中国]-组间方差

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

组间方差是各组平均数对总平均数离差平方的算术平均数。而总方差组内方差和组间方差三者间的关系如下:

总方差=组内方差+组间方差;

组间方差的计算方法:先求各组平均值,再算其方差;

组内方差=总方差-组间方差。

组间方差的计算方法

1)方差 s=[(x1-x)^2 +(x2-x)^2 +.(xn-x)^2]/n  (x为平均数)

2)方差是各个数据分别与其平均数之差的平方的和的平均数,用字母D表示。在概率论和数理统计中,方差(Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。1在许多实际问题中,研究随机变量和均值之间的偏离程度有着重要意义。其中,x表示样本的平均数,n表示样本的数量,xi表示个体,而s^2就表示方差。

总方差=组内方差+组间方差;

组间方差的计算方法:先求各组平均值,再算其方差;

组内方差=从方差-组间方差。

标准差(Standard Deviation) ,中文环境中又常称均方差,但不同于均方误差(mean squared error,均方误差是各数据偏离真实值的距离平方的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示。假设有一组数值X1,X2,X3,......XN(皆为实数),其平均值(算术平均值)为μ。

组间方差举例

在统计学中,方差分析ANOVA)是一系列统计模型及其相关的过程总称,其中某一变量的方差可以分解为归属于不同变量来源的部分。其中最简单的方式中,方差分析的统计测试能够说明几组数据的平均值是否相等,因此得到两组的T检定。在做多组双变量T检定的时候,错误的概率会越来越大,特别是第一型错误,因此方差分析只在二到四组平均值的时候比较有效。

举例如下:

某公司下属8个部门的营业额(单位万元)为:80,85,96,110,125,130,145,160

假设以是否超过100万元来分组

第一组 80,85,96

第二组 110,125,130,145,160

计算:

总算术平均数(X总 bar) = 116.375

第一组内算术平均数(X1 bar) = 87

第二组内算术平均数(X2 bar) = 134

组间方差(δ) = [ (87 - 116.375)^2 × 3 + (134 - 116.375) ^2 × 5 ] ÷ ( 3 + 5 )

= 517.73

可见,上面的计算没有把8个标志值分别与总算术平均数进行比较,而只是分别在两个组中取出算术平均数。

本词条内容贡献者为:

杜强 - 高级工程师 - 中国科学院工程热物理研究所