当前位置:首页 >> 农林牧渔 >>

本章介绍测量资料分散程度的统计量,最常用的是标准差一组资料的全


STAT0_var

1

4.1 全距(range)
?

本章介紹測量資料分散程度的統計量,最常用 的是標準差

? ? ?

一組資料的全距 = 該組資料內最大值 - 最小值
內四分位距 = Q3-Q1。 半內四分位距 = (Q3-Q1)/2

>
STAT0_var

2

4.2 標準差與變異數
?

資料:X1, X2, …, X3

?
?

deviation from mean:
均代表。

xi ? x

整體的離差,以絕對值之平均,或以平方和之平 數學上平方和較易運算 樣本變異數(sample variance):平方和 / (n-1) 以 n-1 代替 n,是為了估計的精度

? ? ?

STAT0_var

3

sample standard deviation,S

計算: 1. 平均數; 2. 每筆數據與平均數的離差; 3. 這些離差的平方; 4. 離差平方的總和; 5. 除以 n-1; 6. 開根號。

STAT0_var

4

平均數 = 9.5

一定為 0
STAT0_var 5

Computation formula for s

S xx ? ?( xi ? x ) ? ?x ?
2 2 i

( ?xi ) 2 n

証明:

?( xi ? x ) ? 0
STAT0_var 6

? x ? 8 ? 11 ? 7 ? ... ? 7 ? 9 ? 76 ? x ? 64 ? 121 ? ... ? 81 ? 754
2

(76 ) 2 S xx ? 754 ? ? 32 8 32 s ? ? 2.14 7

STAT0_var

7

標準差的特性
? ?

標準差是用來測量資料分散度的測值 標準差代表資料變化、風險

?
? ?

標準差的單位與資料單位相同
將資料同時加減一常數,標準差不變 將資料同時乘上一常數,標準差也同時乘上此常數

STAT0_var

8

4.3 標準差的應用
?

謝比雪夫(Chebyshev)定理: 對任何資料,以及任何一個大於1的常數 k,該 組資料落於平均數加減 k 個標準差之的比例, 至少是 1- 1/k2 。

?

母體時,μ, σ為 mean, std. dev.

P(|x-μ|>kσ) < 1/k2, or, P(|x-μ|<kσ) >1- 1/k2

STAT0_var

9

1)

k=3。 1-1/32 =8/9,或 88.9% ,比例是 88.9%。 1-1/k2 = 0.9375,k = 4。 範圍是介於3.34與3.66之間。

2)

STAT0_var

10

鐘型分配

大約有68% 的資料,落於平均數加減一個標準差之間的範圍,( x ? s, x ? s ) 大約有95% 的資料,落於平均數加減兩個標準差之間的範圍,( x ? 2 s, x ? 2 s ) 大約99.7% 的資料,落於平均數加減三個標準差之間的範圍,( x ? 3s, x ? 3s )

?

Chebyshev 定理較嚴密,用於任一分配,一般鐘型

資料可用上述的結果,稱為「經驗法則」(empirical

rule)
STAT0_var 11

平均數加減三個標準差之間的範圍是35.54與121.64。

原始資料中,有兩個數據小於35.54,沒有比121.64大的數據。 因此,我們有108筆數據落在這個範圍之內 ,

108 ? 100 ? 98.2% 110 98.2% 的資料落於平均數加減三個標準差之間的範圍內。

STAT0_var

12

標準單位

z-score

? 標準單位告訴我們某筆數據在整組資料中,位於平均 數以上或以下,多少個標準差以外的距離。 ? x = μ+zσ ? 多數資料 |z| < 3 ? |z|<1,資料位於中間部位

STAT0_var

13

拉克先生的體重比平均值多了30磅, 克拉克女士的體重比平均數多了20磅。 換算成標準單位: 克拉克先生是1.67,克拉克女士則是1.82
各自的年齡層而言,克拉克女士比克拉克先生要更超重一些。
STAT0_var 14

變異係數 coefficient of variation
這是一相對變異的測度值,常用於比較

測量彈簧的變異程度比較小,顯示其準確度較高。
STAT0_var 15

*4.4 分組資料的標準差

(1)

STAT0_var

16

(2)

S = 10 x 1.435 = 14.35

STAT0_var

17

4.5 更進一步的描述
分配的形式有: ? 標準形式:左右對稱的鐘型分配 ? 尾巴在左側:skew-to-left 左偏分配 (負偏斜分配) ? 尾巴在右側:skew-to-right 右偏分配 (正偏斜分配)

可不可以用一個數來分辨?
STAT0_var 18

Coefficient of skewness
?( xi ? x ) sk ? 3 s
? ? ?
3 n ( n ?1)( n ? 2 )

sk≒0,資料近對稱分配

sk>0,資料呈現右偏分配
sk<0,資料呈現右偏分配

STAT0_var

19

Q1 = me= Q3= 由圖中可以明顯的看到,這組資料是右偏分配; 中位數靠向長方形的左側, 而右邊的「長鬚」也比左邊的長了一些。
STAT0_var 20

Coefficient of kurtosis 峰態係數
如果和鐘型分配比較,又有長尾(long-tail) 分配 (有極值的分配),和短尾分配(shorttail),可以峰態係數來分辨
kur ?
n ( n ?1) ( n ?1)( n ? 2 )( n ?3)

?( xi ? x ) 4 ( n ?1) 2 ? 3 ( n ? 2)( n ?3) 4 s

? ?

Kur≒0,資料近鐘型分配 kur>0,資料呈現長尾分配

?
STAT0_var

kur<0,資料呈現短尾分配
21

例: 分析老忠實噴泉的噴發間隔時間的分配 型態
直方圖:
45 40 35 30

waiting time between eruptions

頻率

25 20 15 10 5 0 39 49 59 69 79 89 99 109 119 其他

基本統計量:

mean St. Dev. skewness kurtosis

78.218 14.603 -0.423 1.338

由偏態及峰態係數估計間隔時間的分配是接近對稱,長尾型的分 配,其直方圖也確實呈現此現象。
STAT0_var 22

反J型 以及 U型 分配

STAT0_var

23


相关文章:
统计学第四章测试答案
统计学第四章测试答案_财务管理_经管营销_专业资料...个标准差的范围之内 17、如果一组数据不是对称分布...可以计算的测 度离散程度的统计量是( ) A.方差 ...
第二套题及答案
用来测定一组资料的集中量数,平均数总是优于中位...标准差系数大的离散程度就小 正确答案:C 符合市场...用中位数作为集中趋势的测量指标比较合适 一般常用...
统计学课后习题
第一章 1. 导论 Q:什么是统计学? A:统计学是...平均数也是应用最广泛的集中趋势测 值,具有优良的...6. Q:简述异众比率、四分位差、方差或标准差的...
统计学复习资料
测得值=真值+误差 统计误差归纳起来可分为两类:...第三章 集中数 集中数用来表现数据资料的典型...平均数与标准差、方差相结合原则:描述一组数据时既...
卫生统计学题库(1)
C 5. D 6. B 第二章一、 名词解释:平均数 标准正态分布 计量资料统计描述及正态分布 标准差 参考值范围 二、 填空题: 1、 医学统计资料按研究指标的性质...
思考与练习参考答案
1章 绪论 思考与练习参考答案一、最佳选择题 1....组负偏峰分布资料的平均水平时,适宜的统计量是( A...全距 观察值取值范围 标准差 观察值平均离开均数的...
现代心理与教育统计学第03章习题解答
有全距、四分位差、百分位差、平均差、标准差和...是对一组数据中造成各 种变异的总和的测量,通常...因此,方差是推论 统计中最常用的统计量数。 ? ③...
《教育统计与测量》练习题库及答案
组的客观分析,对人们的心理特征及个别差异进行 估测...标准正态分布(也称 Z 分布)的离差统计量公式是__...错 6.反映总体内个体间分散程度的一种统计指标称为...
第十章 研究资料的整理与分析
第十章本章学习目标: 研究资料的整理与分析 1.理解量化资料整理与分析中的几个...常用的差异 指标有方差、标准差和差异系数。从下列两组数据可以看出,描述一组...
统计学(复习)
第三章. 用统计量描述数据 1、水平的度量 描述...根据总体数据计算的,称为总体方差(标准差),记为 ?...样本方差是常用的统计量之一,是描述一组数 据变异...
更多相关标签:
样本统计量的标准差 | 常用统计量 | 常用统计量主要有哪些 | 常用统计量的分布 | 常用的统计量有 | 标准差 离散程度 | 标准差越大 离散程度 | 标准差和离散程度 |