标准差能很客观准确的反映一组数据的离散程度,但是对于不同的项目,或同一项目不同的样本,标准差就缺乏可比性了,因此对于方法学评价来说又引入了变异系数CV。
不过日常的质控工作检测的都是同一质控物所以有标准差就足以反应了,同时质控的目的是发现有没有实验错误,要设制警报线,并不是要评价检测方法,所以只可能使用标准差,而不用变异系数。
①频数的通俗解释:频数出现的次数,小组里数据的个
数。
②数据的分组整理——分三个步骤:
一是确实分组的方法,先分组,这是整理的难点,分
组的方法,根据需要确定。分组的方法确定《课
标》不作要求。
二是累计各小组的频数,并计算相应的频率,用频数
分布表表示整理的结果。
三是根据频数分布表画出频数分布直方图。
③观察频数分布表和分布图,获得数据分布的信息和分布
1°数据分布最多,最集中(众数组)和最少的小组;
2°数据分布(频数)的变化趋势与分布状态;
3°中位数和平均数在哪个小组,是否是偏态分布;
4°获取所需要的其他数据信息。2100433B
最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。
(Moving Range)
两个或多个连续样本值中最大值与最小值之差,这种差是按这样方式计算的:每当得到一个额外的数据点时,就在样本中加上这个新的点,同时删除其中时间上“最老的”点,然后计算与这点有关的极差,因此每个极差的计算至少与前一个极差的计算共用一个点的值。一般说来,移动极差用于单值控制图,并且通常用两点(连续的点)来计算移动极差。
由于误差的不可控性,因此只由两个数据来评判一组数据是不科学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度。和越大离散度也就越大。
但是由于偶然误差是成正态分布的,离均差有正有负,对于大样本离均差的代数和为零的。为了避免正负问题,在数学有上有两种方法:一种是取绝对值,也就是常说的离均差绝对值之和。而为了避免符号问题,数学上最常用的是另一种方法--平方,这样就都成了非负数。因此,离均差的平方和成了评价离散度一个指标。
由于离均差的平方和与样本个数有关,只能反应相同样本的离散度,而实际工作中做比较很难做到相同的样本,因此为了消除样本个数的影响,增加可比性,将标准差求平均值,这就是我们所说的方差成了评价离散度的较好指标。
我们知道,样本量越大越能反映真实的情况,而算数均值却完全忽略了这个问题,对此统计学上早有考虑,在统计学中样本的均差多是除以自由度(n-1),它是意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n-1。
① 离散程度的通俗解释——波动大小,
② 为什么要研究一组数据的离散程度。
全面认识一组数据的两个特征:
探索平均数的代表性。
实际问题的需要。
③探索如何表示一组数据的离散程度——方差的形
成过程。
首先,极差——比较粗略;
其次,平均差,比极差更全面,不常用;
再次,选择方差,但数值的单位与原数据单位不
一致。
最后,常用标准差。 δ = S2
④统计含义的解释——方差全面地平均地反映,
标准差全面地直接地反映。
偏离平均数——指与平均数的离差。
平均的——指离差的平均数的平均值。
全面的——指考虑了每个数据的离差。
直接的——指数值单位与原数据单位一致。
⑤应用条件——平均数相同。特殊情况,平均数相
差很小、近似相等时也可以用,不
受两组数据个数的差异限制。
⑥实际作用:
1°直接比较:
同一时间事物或现象的整齐性、均匀性、一致性的差异;
不同时间过程的稳定性、均衡性、一致性的差异;
2°比较平均数的代表性:
3°与平均数配合作统计分析:如:Vδ =
4°样本估计总体。样本比较估计总体的差异,用样本
标准差,估计总体标准差。
*样本估计总体的方法有两个:点估计和区间估计。
只要求会点估计,即直接用样本的特征数作为总体
相应参数的估计值。
由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。
CV变异系数的公式:(标准偏差SD、平均值MN)标准差与平均数的比值称为变异系数,记为C.V(Coefficient of Variance)。用公式表示为:CV=σ/μ。
如果数据在a1:a10变异系数=stdev(a1:a10)/average(a1:a10)
变异系数越小好1、变异系数:当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响,而变异系数可以...
样本数据 平均值 标准差 变异系数 统计修正系数 标准值 0.182 0.196 0.187 0.182 0.182 0.166 0.183 0.010 0.053 0.960 0.175 0.165 0.180 0.011 0.062 0.958 0.173 0.181 0.180 0.010 0.057 0.964 0.174 1.24 0.298 0.353 1.186 0.305 0.091 1.62 0.430 0.535 1.243 0.313 0.135 2.33 0.603 0.765 1.269 0.334 0.202 2.63 0.772 0.935 1.212 0.394 0.304 0.16 0.725 0.911 1.258 0.397 0.288 0.187 0.686 0.887 1.293 0.404 0.277 0.189 0.653 0.865 1.32
391.6 0.26 506.3 0.20 578.5 0.18 394 0.26 732.4 0.14 412.5 0.25 373.4 0.27 766.4 0.13 475.9 0.21 619.2 0.16 515.6 0.20 501.1 0.20 352.6 0.29 434.8 0.23 377.4 0.27 290.5 0.35 531.1 0.19 399.9 0.25 419.6 0.24 407.9 0.25 506.8 0.20 559.5 0.18 535.2 0.19 395.5 0.26 506.1 0.20 282.1 0.36 488.6 0.21 523.9 0.19 518.9 0.20 326.1 0.31 340 0.30 478.6 0.21 402 0.25 552.4 0.18 313.9 0.32 591 0.17 384.4 0.26 5
最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。极差=最大标志值—最小标志值
R=xmax-xmin
(其中,xmax为最大值,xmin为最小值)
例如 :12 12 13 14 16 21
这组数的极差就是 :21-12=9
另附:方差计算公式:s2=
移动极差(Moving Range),是指两个或多个连续样本值中最大值与最小值之差,这种差是按这样方式计算的:每当得到一个额外的数据点时,就在样本中加上这个新的点,同时删除其中时间上“最老的”点,然后计算与这点有关的极差,因此每个极差的计算至少与前一个极差的计算共用一个点的值。一般说来,移动极差用于单值控制图,并且通常用两点(连续的点)来计算移动极差。
(一)极差(二星)
1.含义:极差是最简单的变异指标。它就是总体或分布最大的标志值与最小的标志值之差,又称全距,用R表示。
2.公式要熟记
3.作用:极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。
4.特点:仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。
(二)标准差和方差(一星)
1.含义:方差是总体所有单位标志值与其平均数离差之平方的平均数。标准差是方差的平方根,用σ表示。
2.地位:应用最广泛的统计离散程度的测度方法。
3.计算:(了解)
(三)离散系数(标准差系数)(三星)
作用:极差、标准差、方差都是反映数据分散程度的绝对值。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。用于比较对不同组别数据的离散