方差研究的历史发展
中文:变异和标准偏差
右图显示了计算公式方差的公式。
注:这个公式的分母在某些文献定义中是n-1。例如,在MATLAB中使用方差函数var时,
Var(x,1)表示除以n,var(x,0)
样本中数据与样本平均值之差的平方和的平均值称为样本方差;样本方差的算术平方根称为样本标准差。样本方差和样本标准差都是对样本波动的度量。样本方差或标准差越大,样本数据波动越大。
数学上一般用e {[x-E(X)] 2}来度量随机变量X对其均值E(X)的偏离程度,称为X的方差。
定义
设X为随机变量,若e {[x-e (x)] 2}存在,则e {[x-e (x)] 2}称为X的方差,记为D(X)或DX。即d (x) = e {[x-e (x)] 2},σ (x) = d (x) 0.5(与x同维)称为标准差或均方差。也就是统计学用来衡量一组数据的离散程度。
从方差的定义可以得出以下常用的计算公式:
D(X)=E(X^2)-[E(X)]^2
S 2 = [(x1-x拉)2+(x2-x拉)2+(x3-x拉)2+…+(xn-x拉)2]/n
方差的几个重要性质(假设每个方差都存在)。
(1)设c为常数,则D(c)=0。
(2)若X为随机变量,C为常数,则D (CX) = (C 2) D (X)。
(3)设X和Y是两个独立的随机变量,则D(X+Y)=D(X)+D(Y)。
(4)d(X)= 0的充要条件是X以1的概率取常数值c,即P{X=c}=1,其中e (x) = c。
方差是标准差的平方。
————————————————
方差和标准差。方差和标准差是衡量离散趋势的最重要和最常用的指标。方差是每个变量值的方差平方及其均值的平均值,是衡量数值型数据离散程度的最重要的方法。标准差是方差的平方根,用s表示,对应的标准差计算公式为
标准差和方差的区别在于标准差和变量的计算单位是一样的,比方差更清晰,所以我们在分析中往往更多的使用标准差。
(甘肃省,2002)某校初三A班和B班举行计算机汉字输入速度竞赛。两个班的学生输入每分钟汉字数。经过统计和计算,结果如下表所示:
班级平均字数的方差是A 55135149191 B 55135110。
一位同学根据上表得出如下结论:
①A班和B班学生的平均水平相同;
②B班优秀生数量多于A班(每分钟150汉字以上视为优秀);
③A班学生成绩波动大于b班,正确结论是_ _ _ _ _ _(填序号)。
解决方法:填写①、②、③,显然①、③是正确的。对于第二个结论,因为A的中位数是149,说明A班的优秀人数少于一半,而B的中位数是151,说明B班的优秀人数超过一半,所以B班的优秀人数多于A班。