当前位置:首页 >> 农林牧渔 >>

本章介绍测量资料分散程度的统计量,最常用的是标准差一组资料的全


STAT0_var

1

4.1 全距(range)
?

本章介紹測量資料分散程度的統計量,最常用 的是標準差

? ? ?

一組資料的全距 = 該組資料內最大值 - 最小值
內四分位距 = Q3-Q1。 半內四分位距 = (Q3-Q1)/2

STAT0_var

2

4.2 標準差與變異數
?

資料:X1, X2, …, X3

?
?

deviation from mean:
均代表。

xi ? x

整體的離差,以絕對值之平均,或以平方和之平 數學上平方和較易運算 樣本變異數(sample variance):平方和 / (n-1) 以 n-1 代替 n,是為了估計的精度

? ? ?

STAT0_var

3

sample standard deviation,S

計算: 1. 平均數; 2. 每筆數據與平均數的離差; 3. 這些離差的平方; 4. 離差平方的總和; 5. 除以 n-1; 6. 開根號。

STAT0_var

4

平均數 = 9.5

一定為 0
STAT0_var 5

Computation formula for s

S xx ? ?( xi ? x ) ? ?x ?
2 2 i

( ?xi ) 2 n

証明:

?( xi ? x ) ? 0
STAT0_var 6

? x ? 8 ? 11 ? 7 ? ... ? 7 ? 9 ? 76 ? x ? 64 ? 121 ? ... ? 81 ? 754
2

(76 ) 2 S xx ? 754 ? ? 32 8 32 s ? ? 2.14 7

STAT0_var

7

標準差的特性
? ?

標準差是用來測量資料分散度的測值 標準差代表資料變化、風險

?
? ?

標準差的單位與資料單位相同
將資料同時加減一常數,標準差不變 將資料同時乘上一常數,標準差也同時乘上此常數

STAT0_var

8

4.3 標準差的應用
?

謝比雪夫(Chebyshev)定理: 對任何資料,以及任何一個大於1的常數 k,該 組資料落於平均數加減 k 個標準差之的比例, 至少是 1- 1/k2 。

?

母體時,μ, σ為 mean, std. dev.

P(|x-μ|>kσ) < 1/k2, or, P(|x-μ|<kσ) >1- 1/k2

STAT0_var

9

1)

k=3。 1-1/32 =8/9,或 88.9% ,比例是 88.9%。 1-1/k2 = 0.9375,k = 4。 範圍是介於3.34與3.66之間。

2)

STAT0_var

10

鐘型分配

大約有68% 的資料,落於平均數加減一個標準差之間的範圍,( x ? s, x ? s ) 大約有95% 的資料,落於平均數加減兩個標準差之間的範圍,( x ? 2 s, x ? 2 s ) 大約99.7% 的資料,落於平均數加減三個標準差之間的範圍,( x ? 3s, x ? 3s )

?

Chebyshev 定理較嚴密,用於任一分配,一般鐘型

資料可用上述的結果,稱為「經驗法則」(empirical

rule)
STAT0_var 11

平均數加減三個標準差之間的範圍是35.54與121.64。

原始資料中,有兩個數據小於35.54,沒有比121.64大的數據。 因此,我們有108筆數據落在這個範圍之內 ,

108 ? 100 ? 98.2% 110 98.2% 的資料落於平均數加減三個標準差之間的範圍內。

STAT0_var

12

標準單位

z-score

? 標準單位告訴我們某筆數據在整組資料中,位於平均 數以上或以下,多少個標準差以外的距離。 ? x = μ+zσ ? 多數資料 |z| < 3 ? |z|<1,資料位於中間部位

STAT0_var

13

拉克先生的體重比平均值多了30磅, 克拉克女士的體重比平均數多了20磅。 換算成標準單位: 克拉克先生是1.67,克拉克女士則是1.82
各自的年齡層而言,克拉克女士比克拉克先生要更超重一些。
STAT0_var 14

變異係數 coefficient of variation
這是一相對變異的測度值,常用於比較

測量彈簧的變異程度比較小,顯示其準確度較高。
STAT0_var 15

*4.4 分組資料的標準差

(1)

STAT0_var

16

(2)

S = 10 x 1.435 = 14.35

STAT0_var

17

4.5 更進一步的描述
分配的形式有: ? 標準形式:左右對稱的鐘型分配 ? 尾巴在左側:skew-to-left 左偏分配 (負偏斜分配) ? 尾巴在右側:skew-to-right 右偏分配 (正偏斜分配)

可不可以用一個數來分辨?
STAT0_var 18

Coefficient of skewness
?( xi ? x ) sk ? 3 s
? ? ?
3 n ( n ?1)( n ? 2 )

sk≒0,資料近對稱分配

sk>0,資料呈現右偏分配
sk<0,資料呈現右偏分配

STAT0_var

19

Q1 = me= Q3= 由圖中可以明顯的看到,這組資料是右偏分配; 中位數靠向長方形的左側, 而右邊的「長鬚」也比左邊的長了一些。
STAT0_var 20

Coefficient of kurtosis 峰態係數
如果和鐘型分配比較,又有長尾(long-tail) 分配 (有極值的分配),和短尾分配(shorttail),可以峰態係數來分辨
kur ?
n ( n ?1) ( n ?1)( n ? 2 )( n ?3)

?( xi ? x ) 4 ( n ?1) 2 ? 3 ( n ? 2)( n ?3) 4 s

? ?

Kur≒0,資料近鐘型分配 kur>0,資料呈現長尾分配

?
STAT0_var

kur<0,資料呈現短尾分配
21

例: 分析老忠實噴泉的噴發間隔時間的分配 型態
直方圖:
45 40 35 30

waiting time between eruptions

頻率

25 20 15 10 5 0 39 49 59 69 79 89 99 109 119 其他

基本統計量:

mean St. Dev. skewness kurtosis

78.218 14.603 -0.423 1.338

由偏態及峰態係數估計間隔時間的分配是接近對稱,長尾型的分 配,其直方圖也確實呈現此現象。
STAT0_var 22

反J型 以及 U型 分配

STAT0_var

23



相关文章:
统计学复习资料
统计误差归纳起来可分为两类:测量误差与抽样误差。 ...第三章 集中量数 集中量数用来表现数据资料的典型...平均数与标准差、方差相结合原则:描述一组数据时既...
统计学与测量1
统计学与测量1_医药卫生_专业资料。医学书籍第一章 心理统计的作用 第一节 心理...(2)离中量数, 表示一组数据分散程度的指标,如:四分差、标准差、 方差等。...
统计学第四章测试答案
统计学第四章测试答案_财务管理_经管营销_专业资料...个标准差的范围之内 17、如果一组数据不是对称分布...比较两组数据的离散程度最适合的统计量是( ) A....
方差
量数,这些差异量数有标准差或方差,全距,平均差,...它是度量数据分散程度的一个很重要的统计特征数。...讨论对一组数据的描述,尚未涉及总体问题,故本章方差...
评价数据离散程度的指标
原则上具有两种性质: 为非负数值, 与测量资料具有...图2 简单来说,标准差是一组数据平均值分散程度的...变异系数(CV)在描述波动情况的统计量时有一个变异...
医学统计学复习资料最终版
根据样本资料计算 出来的相应指标为统计量,常用大写...第2章 计量资料的统计描述 1.频数:计量资料经分组...(全距) ,即最大值和最小 值之差 R;③确定组...
标准差
最优资本结构中的应用 展开 编辑本段简介 标准差(...原则上具有两种性质: 为非负数值,与测量资料具有...简单来说,标准差是一组数据平均值分散程度的一种...
数理统计_方差与标准差
数理统计_方差与标准差_数学_自然科学_专业资料。对...对一组数据的描述,尚未涉及总体问题,故本 章方差的...它基本具备一个良好的差异量数应具备的条件:①反应...
现代心理与教育统计学复习资料
统计误差归纳起来可分为两类:测量误差与抽样误差。 ...第三章 集中量数 集中量数用来表现数据资料的典型...平均数与标准差、方差相结合原则:描述一组数据时既...
第二章计量资料的统计描述
第二章 计量资料的统计描述一、教学大纲要求(一)掌握...极差、四分位数间距、方差、标准差、变异系数。 (...二、 教学内容精要计量资料又称为测量资料,它是...
更多相关标签: