当前位置:首页 >> 农林牧渔 >>

本章介绍测量资料分散程度的统计量,最常用的是标准差一组资料的全


STAT0_var

1

4.1 全距(range)
?

本章介紹測量資料分散程度的統計量,最常用 的是標準差

? ? ?

一組資料的全距 = 該組資料內最大值 - 最小值
內四分位距 = Q3-Q1。 半內四分位距 = (Q3-Q1)/2

>
STAT0_var

2

4.2 標準差與變異數
?

資料:X1, X2, …, X3

?
?

deviation from mean:
均代表。

xi ? x

整體的離差,以絕對值之平均,或以平方和之平 數學上平方和較易運算 樣本變異數(sample variance):平方和 / (n-1) 以 n-1 代替 n,是為了估計的精度

? ? ?

STAT0_var

3

sample standard deviation,S

計算: 1. 平均數; 2. 每筆數據與平均數的離差; 3. 這些離差的平方; 4. 離差平方的總和; 5. 除以 n-1; 6. 開根號。

STAT0_var

4

平均數 = 9.5

一定為 0
STAT0_var 5

Computation formula for s

S xx ? ?( xi ? x ) ? ?x ?
2 2 i

( ?xi ) 2 n

証明:

?( xi ? x ) ? 0
STAT0_var 6

? x ? 8 ? 11 ? 7 ? ... ? 7 ? 9 ? 76 ? x ? 64 ? 121 ? ... ? 81 ? 754
2

(76 ) 2 S xx ? 754 ? ? 32 8 32 s ? ? 2.14 7

STAT0_var

7

標準差的特性
? ?

標準差是用來測量資料分散度的測值 標準差代表資料變化、風險

?
? ?

標準差的單位與資料單位相同
將資料同時加減一常數,標準差不變 將資料同時乘上一常數,標準差也同時乘上此常數

STAT0_var

8

4.3 標準差的應用
?

謝比雪夫(Chebyshev)定理: 對任何資料,以及任何一個大於1的常數 k,該 組資料落於平均數加減 k 個標準差之的比例, 至少是 1- 1/k2 。

?

母體時,μ, σ為 mean, std. dev.

P(|x-μ|>kσ) < 1/k2, or, P(|x-μ|<kσ) >1- 1/k2

STAT0_var

9

1)

k=3。 1-1/32 =8/9,或 88.9% ,比例是 88.9%。 1-1/k2 = 0.9375,k = 4。 範圍是介於3.34與3.66之間。

2)

STAT0_var

10

鐘型分配

大約有68% 的資料,落於平均數加減一個標準差之間的範圍,( x ? s, x ? s ) 大約有95% 的資料,落於平均數加減兩個標準差之間的範圍,( x ? 2 s, x ? 2 s ) 大約99.7% 的資料,落於平均數加減三個標準差之間的範圍,( x ? 3s, x ? 3s )

?

Chebyshev 定理較嚴密,用於任一分配,一般鐘型

資料可用上述的結果,稱為「經驗法則」(empirical

rule)
STAT0_var 11

平均數加減三個標準差之間的範圍是35.54與121.64。

原始資料中,有兩個數據小於35.54,沒有比121.64大的數據。 因此,我們有108筆數據落在這個範圍之內 ,

108 ? 100 ? 98.2% 110 98.2% 的資料落於平均數加減三個標準差之間的範圍內。

STAT0_var

12

標準單位

z-score

? 標準單位告訴我們某筆數據在整組資料中,位於平均 數以上或以下,多少個標準差以外的距離。 ? x = μ+zσ ? 多數資料 |z| < 3 ? |z|<1,資料位於中間部位

STAT0_var

13

拉克先生的體重比平均值多了30磅, 克拉克女士的體重比平均數多了20磅。 換算成標準單位: 克拉克先生是1.67,克拉克女士則是1.82
各自的年齡層而言,克拉克女士比克拉克先生要更超重一些。
STAT0_var 14

變異係數 coefficient of variation
這是一相對變異的測度值,常用於比較

測量彈簧的變異程度比較小,顯示其準確度較高。
STAT0_var 15

*4.4 分組資料的標準差

(1)

STAT0_var

16

(2)

S = 10 x 1.435 = 14.35

STAT0_var

17

4.5 更進一步的描述
分配的形式有: ? 標準形式:左右對稱的鐘型分配 ? 尾巴在左側:skew-to-left 左偏分配 (負偏斜分配) ? 尾巴在右側:skew-to-right 右偏分配 (正偏斜分配)

可不可以用一個數來分辨?
STAT0_var 18

Coefficient of skewness
?( xi ? x ) sk ? 3 s
? ? ?
3 n ( n ?1)( n ? 2 )

sk≒0,資料近對稱分配

sk>0,資料呈現右偏分配
sk<0,資料呈現右偏分配

STAT0_var

19

Q1 = me= Q3= 由圖中可以明顯的看到,這組資料是右偏分配; 中位數靠向長方形的左側, 而右邊的「長鬚」也比左邊的長了一些。
STAT0_var 20

Coefficient of kurtosis 峰態係數
如果和鐘型分配比較,又有長尾(long-tail) 分配 (有極值的分配),和短尾分配(shorttail),可以峰態係數來分辨
kur ?
n ( n ?1) ( n ?1)( n ? 2 )( n ?3)

?( xi ? x ) 4 ( n ?1) 2 ? 3 ( n ? 2)( n ?3) 4 s

? ?

Kur≒0,資料近鐘型分配 kur>0,資料呈現長尾分配

?
STAT0_var

kur<0,資料呈現短尾分配
21

例: 分析老忠實噴泉的噴發間隔時間的分配 型態
直方圖:
45 40 35 30

waiting time between eruptions

頻率

25 20 15 10 5 0 39 49 59 69 79 89 99 109 119 其他

基本統計量:

mean St. Dev. skewness kurtosis

78.218 14.603 -0.423 1.338

由偏態及峰態係數估計間隔時間的分配是接近對稱,長尾型的分 配,其直方圖也確實呈現此現象。
STAT0_var 22

反J型 以及 U型 分配

STAT0_var

23


相关文章:
统计学第四章测试答案
统计学第四章测试答案_财务管理_经管营销_专业资料...个标准差的范围之内 17、如果一组数据不是对称分布...比较两组数据的离散程度最适合的统计量是( ) A....
标准差教案
本节课我们就要来学习反应一组数据稳定程度的两个量...样本数据的分散程度的大小,最常用的统计量是标准差...方差来代替标准差作为 测量样本数据分散程度的工具。...
数理统计_方差与标准差
数理统计_方差与标准差_数学_自然科学_专业资料。对...量数,这些差异量数有标准差或方差,全距,平均差,...对一组数据的描述,尚未涉及总体问题,故本 章方差的...
山东省平邑县高中数学第二章统计2.2.2用样本的数字特征...
山东省平邑县高中数学第二章统计2.2.2用样本的...考察样本数据的分散程度的大小,最常用的统计量是 ....来代替标准差,作为测量样本数据 分散程度的工具: 2...
标准差意义
简介 标准差( Standard Deviation ) ,在概率统计中...原则上具有两种性质: 为非负数值,与测量资料具有...图2 简单来说,标准差是一组数据平均值分散程度的...
标准差说课稿
又一个描述了变量分布的统计量,标准差和方差是描述...计算及其运用,这既是本节的重点,又是本章的重 点...考察样本数据的分散程度的大小,最常用的统计量是标准...
标准差
最优资本结构中的应用 展开 编辑本段简介 标准差(...作为统计分布程度( statistical dispersion)上的测量。...简单来说,标准差是一组数据平均值分散程度的一种...
标准差与标准误的区别
标准差与标准误的区别_数学_自然科学_专业资料标准差与标准误的区别一、标准...标准差最常用的统计量,一般用 于表示一组样本变量的分散程度;标准误一般用于...
2.3.2 方差与标准差(1)
组数据的集中程度差异不 大时,就不容易得出结论. 考察样本数据的分散程度的大小,最常用的统计量是方差和标准差. 三、建构数学 1.方差: 一般地, 设一组样本...
统计学4章练习题+答案
第4 章练习题 1、一组数据中出现频数最多的变量...比较两组数据离散程度最适合的统计量是(D) A.极差...进行测量后发现,平均车速是 85 公里/小时,标准差是...
更多相关标签:
常用统计量 | 常用统计量的分布 | 常用的统计量 | 标准差越大 离散程度 | 标准差与离散程度 | 标准差和离散程度 | 标准差 离散程度 | 数据的分散程度 |