当前位置:首页 >> 高中教育 >>

03单变量综合性描述统计量


医学统计学
魏沙 讲师
基础医学院预防医学教研室(J-C202) Tel:027-68891232 E-Mail:annworld@163.com
统计学 湖北中医药大学预防医学教研室 1

本章内容
定量资料的描述
? 第一节 中心趋势指标 一、算术平均数 二、中位数 三、几何均数 四、众数 ? 第二节 离散与变异性指标 一、全距 二、方差与标准差 三、变异系数 四、四分位间距 五、多样性指数
统计学

定性资料的描述
第三节 率、比及其注 意事项

湖北中医药大学预防医学教研室

2

第一节、中心趋势指标
? 常用的中心趋势指标有:算术均数、几何均 数、中位数、众数,统称为平均数 (average) 一、算术平均数( The Arithmetic mean) 简称均数(Mean)或均值,定义为所有 测量值之和除以变量值个数(即,样本含量 Sample Size)。反映一组呈对称分布的变 量值在数量上的平均水平。
统计学 湖北中医药大学预防医学教研室 3

(1)直接计算法 n 公式 : ? xi
x?
i ?1

n

?x ? x ? x ?
1

2

n

? ... ? xn n

举例1:试计算1,3,7,9的均数?
x1 ? x2 ? ... ? xn 1 ? 3 ? 7 ? 9 x? ? ?5 n 4
统计学 湖北中医药大学预防医学教研室

4

(2)加权法
变量值

xi
1 3 7 9 合计

加权均数的计算原理 频数与变量值的 频数 fi 积( fixi) 1 1 2 6 2 14 3 27

权数

wi
1/8 2/8 2/8 3/8 1.0

?
i ?1

4

f i =8

?f
i ?1

4

i

xi =48

?x f ? ?xw ? ?x f 1? 1 ? 3 ? 2 ? 7 ? 2 ? 9 ? 3 x? ? ?f 1? 2 ? 2 ? 3 ?f
i ?1 k i i
k k i i ?1 i i i ?1 i k
统计学 湖北中医药大学预防医学教研室

k

i ?1

i

i ?1

i

5

【例 3.2】 组段(i) (1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75

合计

组中值=(下限值+上限值)/2 表 3.2 150 名成年男子血清总胆固醇水平(mmol/L) 组中值(xi) 频数(fi) fixi (2) (3) (4) 2.75 1 2.75 3.25 9 29.25 3.75 26 97.50 4.25 32 136.00 4.75 37 175.75 5.25 22 115.50 5.75 14 80.50 6.25 7 43.75 6.75 2 13.50 150 694.50

x?
统计学

?x f
i ?1 k i

k

i

?f
i ?1

?

2.75 ? 1 ? 3.25 ? 9 ? 3.75 ? 26 ? ... ? 6.75 ? 2 694.50 ? ? 4.63mmol/L 1 ? 9 ? 26 ? ... ? 2 150
湖北中医药大学预防医学教研室 6

i

均数的特征

1、 最常用,特别是正态分布资料; 2、 均数对极值特别敏感, 极大值或极小值通常将均数拉向自己;
3、
统计学

? (x ? x) ? 0
i ?1 i
湖北中医药大学预防医学教研室 7

n

二、 中位数与百分位数
11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,>60,>60

平均存活天数?
(一)中位数(median) 是将每个变量值从小到大排列,位置 居于中间的那个变量值。
存活天数 秩次
统计学

2, 3, 4, 7, 9, 10, 13, 15, 50,>60,>60 1 2 3 4 5 6 7 8 9 10 11
湖北中医药大学预防医学教研室 8

计算
公式: n为奇数时

M?X

(

n ?1 ) 2

n为偶数时

? 1? M ? ?X n ?X n ? ( ?1) 2 ? (2) 2 ?
湖北中医药大学预防医学教研室 9

统计学

例 9名中学生甲型肝炎的潜伏期分别 为12,13,14, 14, 15, 15, 15, 19 17, 天,求其中位数。

M ? X 9?1 ? X 5 ? 15(天)
2

如果只调查了前八位中学生,则: ? ? M ? ? X 8+X 8 ? 2 ? X 4+X 5)2 ? 14+15)2 ? 14.5(天) ( ( +1 ? 2 2 ?
统计学 湖北中医药大学预防医学教研室 10

频数表资料的中位数
M ? 所在组段下限值 ? (n ? 50% ? 至该下限值的累计频数 ) 组距 所在组段下限值至上限值间的频数 (n ? 50% ? ?f L) M ? L ?i? fm

(n ? 50% ? ?f L )
下限值L
统计学

i; fm
上限值U
11

中位数M
湖北中医药大学预防医学教研室

表 3.3 组段(i) (1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75

合计

150 名成年男子血清总胆固醇水平(mmol/L)测定 频数(fi) 累计频数 cfi) ( 累计频率 (2) (3) (4) 1 0~0.0067 1 10 0.0067~0.0667 9 36 0.0667~0.2400 26 68 0.2400~0.4533 32 105 0.4533~0.7000 37 127 0.7000~0.8467 22 141 0.8467~0.9400 14 148 0.9400~0.9867 7 150 0.9867~1.0000 2 150

中位数=4.5+0.5x[(150x50%-68)/37]=4.59
统计学 湖北中医药大学预防医学教研室 12

中位数的特征
1. 计算时只利用了位置居中的测量值 优点:对极值不敏感 缺点:并非考虑到每个观测值 2. 适用于各种分布类型的资料, 特别适合于:大样本偏态分布资料 或者一端或两端无确切数值的资料

统计学

湖北中医药大学预防医学教研室

13

(二)百分位数(percentile)

X%

(100 ? X )%

PX

百分位数示意图
统计学 湖北中医药大学预防医学教研室 14

1.直接计算法
设有n个原始数据从小到大排列,第X 百分位数的计算公式为:
当 nX % 为带有小数位时:

PX ? X [trunc( nX %)?1]
当 nX % 为 整数时:

1 PX ? ? X ( nX %) ? X ( nX %?1) ? ? 2?
统计学 湖北中医药大学预防医学教研室 15

例 对某医院细菌性痢疾治愈者的住院 天数统计,120名患者的住院天数从小到大 排列如下,试求第5百分位数和第99百分位 数。 患 者: 1 2 3 4 5 6 7 8 9 ? 117 118 119 120 住院天数: 2 2 2 3 3 4 4 5 ? 40 40 42 45 1
(1)n=120, ? 5% ? 6 120 ,为整数:

1 1 P5 ? ? X ( 6 ) ? X ( 7 ) ? ? (3 ? 4) ? 3.5(天 ) ? 2 2?
统计学 湖北中医药大学预防医学教研室 16

患 者: 1 2 3 4 5 6 7 8 9 ? 117 118 119 120 住院天数: 1 2 2 2 3 3 4 4 5 ? 40 40 42 45

(2) 120 ? 99% ? 118.8 ,带有小数, 故取整 trunc(118.8)= 118

P ? X ?trunc( nX %)?1? ? X (119) ? 42(天) 99

统计学

湖北中医药大学预防医学教研室

17

2.频数表法
公式:

(n ? X % ? ?f L ) PX ? L ? i ? fm

统计学

湖北中医药大学预防医学教研室

18

例 试分别求表3.3频数表的第25、第75百分位数。
表 3.3 组段(i) (1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75

合计

150 名成年男子血清总胆固醇水平(mmol/L)测定 频数(fi) 累计频数 cfi) ( 累计频率 (2) (3) (4) 1 0~0.0067 1 10 0.0067~0.0667 9 36 0.0667~0.2400 26 68 0.2400~0.4533 32 105 0.4533~0.7000 37 127 0.7000~0.8467 22 141 0.8467~0.9400 14 148 0.9400~0.9867 7 150 0.9867~1.0000 2 150

P25=4.0+0.5x[(150x25%-36)/32]=4.02
P75=5.0+0.5x[(150x75%-105)/22]=5.17
统计学 湖北中医药大学预防医学教研室 19

三、 几何均数(geometric mean)

可用于反映一组经对数转 换后呈对称分布或正态分布的 变量值在数量上的平均水平。

统计学

湖北中医药大学预防医学教研室

20

(1)直接法
G ? n X1 X 2 ? X n 1 ? lg X lg G ? (lg X 1 ? lg X 2 ? ? ? lg X n ) ? n n lg X ?1 ? 几何均数:变量 G ? lg n 对数值的算术均 lg 表示以10为底的对数; 数的反对数。
lg 表示以10为底的反对数 X ? 0, 为正值
统计学 湖北中医药大学预防医学教研室

?1

其他对数(如自然 对数)变换获得相 同的几何均数 21

例3.6 测定10名伤寒病人血清 抗体滴度分别为1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1: 16,1:64, 1:128,求其平均抗体滴度。 以其滴度的倒数为原变量值,代入公式有:
G ? n x1 ? x2 ? x3 ? ...? xn ? 10 4 ? 4 ? 4 ? 4 ? 4 ? 16 ? 16 ? 16 ? 64 ? 128 ? 10 3.4359738 1010 ? 11.313708 ?

? k ? ? ? log( xi ) ? ?1 i ?1 ?1 ? log(4) ? log(4) ? ... ? log(128) ? ? ? log ? G ? log ? ? n 10 ? ? ? ? ? ? ? ? ?1 ?10.53605 ? ? log ? ? log ?1[1.0.53605] ? 11.313708 ? 10 ? ?
统计学

平均抗体滴度为: 1:11

湖北中医药大学预防医学教研室

22

(2)加权法 公式:

G ? lg

?1

? f lg X ) ( ?f
23

统计学

湖北中医药大学预防医学教研室

例3.6的血清抗体滴度资料的频数表
表 3.4 血清抗体滴度资料的几何均数计算 对数值 原始变量值 频数(fi) filg(xi) [lg(xi)] 4 0.60206 5 3.01030 16 1.20412 3 3.61236 64 1.80618 1 1.80618 128 2.10721 1 2.10721 合计 ? f =10 ? f lg( x) =10.53605
? k ? fi lg( xi ) ? ?? ? f lg x ? ?10.53605 ? ?1 i ?1 ?1 ? ? ? lg ? G ? lg ? ? lg ?1 ? ? log ?1 (1.053605) ? 11.313708 ? k ? 10 ? ? ? ? ? ?f ? ? ? ? fi ? ? i ?1 ? ?

该资料的几何平均数为 11.3,即其平均抗体滴度为 1:11
统计学 湖北中医药大学预防医学教研室 24

几何均数的特征
? 1、几何均数适用于对数正态分布,如 药物的效价、抗体的滴度、传染性疾病 的潜伏期等资料。

? 2、变量x服从对数正态分布,即表示变 量lg(xi)服从正态分布。对于lg(xi),具 有正态分布的所有特性。
统计学 湖北中医药大学预防医学教研室 25

四、众数(Mode) 是一群数据中出现次数(频数)最多的值。适用 于大样本;较粗糙。 例 有 16 例 高 血 压 病 人 的 发 病 年 龄 ( 岁 ) 为 : 42,45,48,51,52,54,55,55,58,58,58,58,58,61,61,62, 试 求众数。 众数的特征 1、对于某些数据而言,例如均匀分布,并不存在众数; 2、对于某些数据存在两个或多于两个的众数; 3、定性数据可以存在众数; 众数对于进一步的统计学计算与分析不具备应用价值。
统计学 湖北中医药大学预防医学教研室 26

五、其他位置指标
? 1、四分位数(Quartile)(三个四分位数)

P0
P 10

P25
P20 P30

P50
P40 P50
P60

P75
P70

P 100
P 80
P90

2、十分位数(Centile): 9个十分位数

? 3、百分位数(Percentile)99个百分位数

统计学

湖北中医药大学预防医学教研室

27

第二节 离散与变异性指标
例:设甲、乙、丙三人,采每人的耳垂血,然后作红 细胞计数,每人数5个计数盘,得结果如下(万/mm3) 盘编号 甲 1 560 2 540 3 4 5 合计 乙 丙
580 560 540 520 500 480 460 440 420

500 460 440
2500

520 510 500 490 480
2500

510 505 500 495 490
2500

均数
统计学

500

500

500



乙 丙
28

湖北中医药大学预防医学教研室

离散与变异性指标
? ? ? ? ? ?
多 样 性 指 数
统计学

变 标 方 四 全 异 准 差 分 距 位 系 差 间 数 距
29

湖北中医药大学预防医学教研室

一、全距(Range)与绝对差
全距为最大值与最小值之差,也叫极差 缺点:仅利用了两个极端值。

绝对差=?(x - x )? 0, 不能作为变异度指标

统计学

湖北中医药大学预防医学教研室

30

二、方差与标准差
方差(Variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 (一)样本方差为各变量值到样本均数距离的平方和除 以自由度的商值,即

S2 ?
(二)总体方差定义为
N

? (x
i ?1

n

i

? x)

2

n ?1

? ?
2
统计学

(xi ? ? ) 2 ?
i ?1

N
31

湖北中医药大学预防医学教研室

标准差(standard deviation)
? 样本标准差为样本方差的平方根;

s?

? (x
i ?1

n

i

? x)

2

? 总体标准差为总体方差的平方根。

n ?1

??
统计学

? (x
i ?1

N

i

? ?)

2

N
32

湖北中医药大学预防医学教研室

样本标准差实用公式

s?
统计学

?x
i ?1

n

2 i

?

(? x i )
i ?1

n

2

n

n ?1
湖北中医药大学预防医学教研室 33

仍然用钉螺抽样数据为例,

? x ? 1+3+3+7+7+9+9+9=48,n=8
?x
S?
2

?1 ? 3 ? 3 ? 7 ? 7 ? 9 ? 9 ? 9 ? 360
2 2 2 2 2 2 2 2

?x

2

?? x? ?
n ?1 n

2

482 360 ? 8 ? 3.21(只/平方米) ? 8 ?1

统计学

湖北中医药大学预防医学教研室

34

? 样本标准差的加权公式

?fx
i ?1 i

k

2 i

?

(? f i x i )
i ?1

k

2

s?

?f
i ?1 i

k

i

?f
i ?1

k

?1
35

统计学

湖北中医药大学预防医学教研室

组段 (1) 2.53.03.54.04.55.05.56.06.5-6.75 合计

表 3.6 胆固醇数据的标准差计算表 组中值(xi) 频数(fi) fixi (2) (3) (4) 2.75 1 2.75 3.25 9 29.25 3.75 26 97.50 4.25 32 136.00 4.75 37 175.75 5.25 22 115.50 5.75 14 80.50 6.25 7 43.75 6.75 2 13.50 150 694.50
(? f i x i ) 2
i ?1 n

fixi2
(5) 7.5625 95.0625 365.625 578.000 834.8125 606.375 462.875 273.4375 91.125 3314.875

?f
i ?1

n

i

xi2 ?
n

s?
统计学

?f
i ?1 i

n

i

?f
i ?1

?

?1

(694.50) 2 3314 875 ? . 150 ? 0.8165239 0.817 mmol/L ? 150 ? 1
36

湖北中医药大学预防医学教研室

随机变量xi的标准化
? 如果随机变量xi服从正态分布,均数和标 准差分别为 x 和s,则随机变量xi的标准 化正态离差值(Standard normal deviation)又称为标准化得分值 (Standard Scores )为:

统计学

xi ? x Zi ? s

湖北中医药大学预防医学教研室

37

三、变异系数 (coefficient of variation) s CV ? ? 100 % x
变异系数(coefficient of variation, CV) 常用于比较度量单位不同或均数相差 悬殊的两组(或多组)资料的变异程度。
统计学 湖北中医药大学预防医学教研室 38

某地7岁男孩身高的均数为123.10cm, 标准差为4.71;体重均数为22.59kg,标准 差为2.26kg, 比较其变异度?

身高

体重
统计学

4.71 CV ? ?100% ? 3.83% 123.10 2.26 CV ? ?100% ? 10.14% 22.29
湖北中医药大学预防医学教研室 39

四、四分位数间距 (inter-quartile range)
? 四分位数间距,用IQR表示:
IQR=

P 100

P75
P50

P ? P25 ? Q3 ? Q1 75

? 第三四分位数:Q3 第一四分位数:Q1

P25
P0
40

统计学

湖北中医药大学预防医学教研室

第三节 率、比及其注意事项
一、率(rate): 在特定条件下,可能发生某 现象的总例数中,实际发生某现象的强度或 频率。

实际发生该现象的频数 率? ?比例基数 可能发生某现象的总例数 比例基数为1%,1 0 , 1/ 万, 1/ 十万等 00
统计学 湖北中医药大学预防医学教研室 41

二、比(ratio)
? 构成比(Proportion,constituent ratio): 构成比指标用以表示事物内部某一构成成分 在全部构成中所占的比例或比重。

某一构成成分的例数 构成比 ? (or ?100%) 所有构成成分的总例数 ? 相对比( relative ratio)是由两个有关联 的指标之比。

甲指标 相对比 ? 乙指标
统计学 湖北中医药大学预防医学教研室 42

三、应用率比指标时的注意事项
? 1、保证有足够的样本含量;

? 2、不要将率和比指标混淆;
? 3、注意平均率的计算;(p1+p2)/2

?p = p

? 4、率和比指标比较时,要有可比性(不可比时可 采用率标准化);
? 5、不要简单由样本率的差异做出结论。率比和均 数一样都有抽样误差,需采用假设检验下结论。
统计学 湖北中医药大学预防医学教研室 43

直接法标准化举例
两种疗法治疗某病的治愈率比较
甲法 组别 治疗人数 治愈人数 治愈率(%) 儿童 100 40 40.0 成人 50 30 60.0 合计 150 70 46.7 治疗人数 50 100 150 乙法 治愈人数 治愈率(%) 10 20.0 80 80.0 90 60.0

统计学

湖北中医药大学预防医学教研室

44

某病两种治疗方法的治疗效果
甲法 组别
标准治疗 人数 治愈率 (%) 预期 治愈数 治愈率 (%)

乙法
预期 治愈数

儿童 成人 合计

150 150 300

40.0 60.0 46.7

60 90 150

20.0 80.0 60.0

30 120 150

统计学

湖北中医药大学预防医学教研室

45

The class is over Thanks!

统计学

湖北中医药大学预防医学教研室

46


相关文章:
利用Excel和SPSS进行单变量描述性统计分析
模块二 利用 Excel 和 SPSS 进行单变量描述性统计分析 《演练项目》参考案例 ...文档贡献者 ueyaekwoh 贡献于2010-09-03 专题推荐 Photoshop介绍 Photoshop新手...
第03章描述统计
03章 分类变量描述... 暂无评价 23页 20财富...1 j ?1 T T 1 第 3 章 统计资料的综合(Data...只适用于单峰情形) 给出两个描述偏倚程度的统计量...
《统计学》综合技能训练题03版
统计学》综合技能训练题03版_教育学_高等教育_...数量标志又称为变量,某同学的成绩 80 分, “80 ...其中,用图形、表格和概括性的数字对 数据进行描述的...
实验二SPSS的单变量描述统计
实验二 SPSS 的单变量描述统计 一.实验目的 1.通过对单变量进行频数分析,获得某些描述统计量和描述数值范围的统计量,了解变量 的取值分布情况。 2.通过单变量的...
统计03
03统计描述 42页 免费如要投诉违规内容,请到百度...)。 5、在销售量综合指数 A、商品价格变动引起销售...各组次数都为 1 B、各组变量值不等 C、变量数列...
生物统计学基本概念及公式
*Result 窗口 *Explorer 窗口 单变量综合性描述统计量 常用的中心趋势指标:算术均数、几何均数、中位数、众数,统称为平均数(average) 算术平均数 The Arithmetic ...
spss学习笔记
(研究变量的相关性) 6、 聚类/集群分析(研究样本/变量的相似性) 7、 Compare...1、 Means(单变量描述) 单变量综合描述统计量的计算,可以分组求均值,例如,提交...
统计学上机作业
SPSS 做单变量描述性统计指标计算 上机项目名称: 二...0.030817081 0.047961897 0.065369566 0.1...3.得到结果如下图所示: T检验 单个样本统计量 ...
统计学习题03
第三章一、单项选择题 数据的描述 B、变量值的...15、统计学将数据分布的不对称性称作偏态。 16、...但甲市场价格较高的乙产品成交量(2 万千克)占总...
第4章 均值比较
1.MEANS 过程 MEANS 过程计算指定变量的综合描述统计...、总和、 观测量数、方差等一系列单变量描述统计量...举例(data09--03) 现有银行雇员工资为例,检验男女...
更多相关标签: