当前位置:首页 >> 高中教育 >>

03单变量综合性描述统计量


医学统计学
魏沙 讲师
基础医学院预防医学教研室(J-C202) Tel:027-68891232 E-Mail:annworld@163.com
统计学 湖北中医药大学预防医学教研室 1

本章内容
定量资料的描述
? 第一节 中心趋势指标 一、算术平均数 二、中位数 三、几何均数 四、众数 ? 第二节 离

散与变异性指标 一、全距 二、方差与标准差 三、变异系数 四、四分位间距 五、多样性指数
统计学

定性资料的描述
第三节 率、比及其注 意事项

湖北中医药大学预防医学教研室

2

第一节、中心趋势指标
? 常用的中心趋势指标有:算术均数、几何均 数、中位数、众数,统称为平均数 (average) 一、算术平均数( The Arithmetic mean) 简称均数(Mean)或均值,定义为所有 测量值之和除以变量值个数(即,样本含量 Sample Size)。反映一组呈对称分布的变 量值在数量上的平均水平。
统计学 湖北中医药大学预防医学教研室 3

(1)直接计算法 n 公式 : ? xi
x?
i ?1

n

?x ? x ? x ?
1

2

n

? ... ? xn n

举例1:试计算1,3,7,9的均数?
x1 ? x2 ? ... ? xn 1 ? 3 ? 7 ? 9 x? ? ?5 n 4
统计学 湖北中医药大学预防医学教研室

4

(2)加权法
变量值

xi
1 3 7 9 合计

加权均数的计算原理 频数与变量值的 频数 fi 积( fixi) 1 1 2 6 2 14 3 27

权数

wi
1/8 2/8 2/8 3/8 1.0

?
i ?1

4

f i =8

?f
i ?1

4

i

xi =48

?x f ? ?xw ? ?x f 1? 1 ? 3 ? 2 ? 7 ? 2 ? 9 ? 3 x? ? ?f 1? 2 ? 2 ? 3 ?f
i ?1 k i i
k k i i ?1 i i i ?1 i k
统计学 湖北中医药大学预防医学教研室

k

i ?1

i

i ?1

i

5

【例 3.2】 组段(i) (1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75

合计

组中值=(下限值+上限值)/2 表 3.2 150 名成年男子血清总胆固醇水平(mmol/L) 组中值(xi) 频数(fi) fixi (2) (3) (4) 2.75 1 2.75 3.25 9 29.25 3.75 26 97.50 4.25 32 136.00 4.75 37 175.75 5.25 22 115.50 5.75 14 80.50 6.25 7 43.75 6.75 2 13.50 150 694.50

x?
统计学

?x f
i ?1 k i

k

i

?f
i ?1

?

2.75 ? 1 ? 3.25 ? 9 ? 3.75 ? 26 ? ... ? 6.75 ? 2 694.50 ? ? 4.63mmol/L 1 ? 9 ? 26 ? ... ? 2 150
湖北中医药大学预防医学教研室 6

i

均数的特征

1、 最常用,特别是正态分布资料; 2、 均数对极值特别敏感, 极大值或极小值通常将均数拉向自己;
3、
统计学

? (x ? x) ? 0
i ?1 i
湖北中医药大学预防医学教研室 7

n

二、 中位数与百分位数
11个大鼠存活天数: 4,10,7,50,3,15,2,9,13,>60,>60

平均存活天数?
(一)中位数(median) 是将每个变量值从小到大排列,位置 居于中间的那个变量值。
存活天数 秩次
统计学

2, 3, 4, 7, 9, 10, 13, 15, 50,>60,>60 1 2 3 4 5 6 7 8 9 10 11
湖北中医药大学预防医学教研室 8

计算
公式: n为奇数时

M?X

(

n ?1 ) 2

n为偶数时

? 1? M ? ?X n ?X n ? ( ?1) 2 ? (2) 2 ?
湖北中医药大学预防医学教研室 9

统计学

例 9名中学生甲型肝炎的潜伏期分别 为12,13,14, 14, 15, 15, 15, 19 17, 天,求其中位数。

M ? X 9?1 ? X 5 ? 15(天)
2

如果只调查了前八位中学生,则: ? ? M ? ? X 8+X 8 ? 2 ? X 4+X 5)2 ? 14+15)2 ? 14.5(天) ( ( +1 ? 2 2 ?
统计学 湖北中医药大学预防医学教研室 10

频数表资料的中位数
M ? 所在组段下限值 ? (n ? 50% ? 至该下限值的累计频数 ) 组距 所在组段下限值至上限值间的频数 (n ? 50% ? ?f L) M ? L ?i? fm

(n ? 50% ? ?f L )
下限值L
统计学

i; fm
上限值U
11

中位数M
湖北中医药大学预防医学教研室

表 3.3 组段(i) (1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75

合计

150 名成年男子血清总胆固醇水平(mmol/L)测定 频数(fi) 累计频数 cfi) ( 累计频率 (2) (3) (4) 1 0~0.0067 1 10 0.0067~0.0667 9 36 0.0667~0.2400 26 68 0.2400~0.4533 32 105 0.4533~0.7000 37 127 0.7000~0.8467 22 141 0.8467~0.9400 14 148 0.9400~0.9867 7 150 0.9867~1.0000 2 150

中位数=4.5+0.5x[(150x50%-68)/37]=4.59
统计学 湖北中医药大学预防医学教研室 12

中位数的特征
1. 计算时只利用了位置居中的测量值 优点:对极值不敏感 缺点:并非考虑到每个观测值 2. 适用于各种分布类型的资料, 特别适合于:大样本偏态分布资料 或者一端或两端无确切数值的资料

统计学

湖北中医药大学预防医学教研室

13

(二)百分位数(percentile)

X%

(100 ? X )%

PX

百分位数示意图
统计学 湖北中医药大学预防医学教研室 14

1.直接计算法
设有n个原始数据从小到大排列,第X 百分位数的计算公式为:
当 nX % 为带有小数位时:

PX ? X [trunc( nX %)?1]
当 nX % 为 整数时:

1 PX ? ? X ( nX %) ? X ( nX %?1) ? ? 2?
统计学 湖北中医药大学预防医学教研室 15

例 对某医院细菌性痢疾治愈者的住院 天数统计,120名患者的住院天数从小到大 排列如下,试求第5百分位数和第99百分位 数。 患 者: 1 2 3 4 5 6 7 8 9 ? 117 118 119 120 住院天数: 2 2 2 3 3 4 4 5 ? 40 40 42 45 1
(1)n=120, ? 5% ? 6 120 ,为整数:

1 1 P5 ? ? X ( 6 ) ? X ( 7 ) ? ? (3 ? 4) ? 3.5(天 ) ? 2 2?
统计学 湖北中医药大学预防医学教研室 16

患 者: 1 2 3 4 5 6 7 8 9 ? 117 118 119 120 住院天数: 1 2 2 2 3 3 4 4 5 ? 40 40 42 45

(2) 120 ? 99% ? 118.8 ,带有小数, 故取整 trunc(118.8)= 118

P ? X ?trunc( nX %)?1? ? X (119) ? 42(天) 99

统计学

湖北中医药大学预防医学教研室

17

2.频数表法
公式:

(n ? X % ? ?f L ) PX ? L ? i ? fm

统计学

湖北中医药大学预防医学教研室

18

例 试分别求表3.3频数表的第25、第75百分位数。
表 3.3 组段(i) (1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75

合计

150 名成年男子血清总胆固醇水平(mmol/L)测定 频数(fi) 累计频数 cfi) ( 累计频率 (2) (3) (4) 1 0~0.0067 1 10 0.0067~0.0667 9 36 0.0667~0.2400 26 68 0.2400~0.4533 32 105 0.4533~0.7000 37 127 0.7000~0.8467 22 141 0.8467~0.9400 14 148 0.9400~0.9867 7 150 0.9867~1.0000 2 150

P25=4.0+0.5x[(150x25%-36)/32]=4.02
P75=5.0+0.5x[(150x75%-105)/22]=5.17
统计学 湖北中医药大学预防医学教研室 19

三、 几何均数(geometric mean)

可用于反映一组经对数转 换后呈对称分布或正态分布的 变量值在数量上的平均水平。

统计学

湖北中医药大学预防医学教研室

20

(1)直接法
G ? n X1 X 2 ? X n 1 ? lg X lg G ? (lg X 1 ? lg X 2 ? ? ? lg X n ) ? n n lg X ?1 ? 几何均数:变量 G ? lg n 对数值的算术均 lg 表示以10为底的对数; 数的反对数。
lg 表示以10为底的反对数 X ? 0, 为正值
统计学 湖北中医药大学预防医学教研室

?1

其他对数(如自然 对数)变换获得相 同的几何均数 21

例3.6 测定10名伤寒病人血清 抗体滴度分别为1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1: 16,1:64, 1:128,求其平均抗体滴度。 以其滴度的倒数为原变量值,代入公式有:
G ? n x1 ? x2 ? x3 ? ...? xn ? 10 4 ? 4 ? 4 ? 4 ? 4 ? 16 ? 16 ? 16 ? 64 ? 128 ? 10 3.4359738 1010 ? 11.313708 ?

? k ? ? ? log( xi ) ? ?1 i ?1 ?1 ? log(4) ? log(4) ? ... ? log(128) ? ? ? log ? G ? log ? ? n 10 ? ? ? ? ? ? ? ? ?1 ?10.53605 ? ? log ? ? log ?1[1.0.53605] ? 11.313708 ? 10 ? ?
统计学

平均抗体滴度为: 1:11

湖北中医药大学预防医学教研室

22

(2)加权法 公式:

G ? lg

?1

? f lg X ) ( ?f
23

统计学

湖北中医药大学预防医学教研室

例3.6的血清抗体滴度资料的频数表
表 3.4 血清抗体滴度资料的几何均数计算 对数值 原始变量值 频数(fi) filg(xi) [lg(xi)] 4 0.60206 5 3.01030 16 1.20412 3 3.61236 64 1.80618 1 1.80618 128 2.10721 1 2.10721 合计 ? f =10 ? f lg( x) =10.53605
? k ? fi lg( xi ) ? ?? ? f lg x ? ?10.53605 ? ?1 i ?1 ?1 ? ? ? lg ? G ? lg ? ? lg ?1 ? ? log ?1 (1.053605) ? 11.313708 ? k ? 10 ? ? ? ? ? ?f ? ? ? ? fi ? ? i ?1 ? ?

该资料的几何平均数为 11.3,即其平均抗体滴度为 1:11
统计学 湖北中医药大学预防医学教研室 24

几何均数的特征
? 1、几何均数适用于对数正态分布,如 药物的效价、抗体的滴度、传染性疾病 的潜伏期等资料。

? 2、变量x服从对数正态分布,即表示变 量lg(xi)服从正态分布。对于lg(xi),具 有正态分布的所有特性。
统计学 湖北中医药大学预防医学教研室 25

四、众数(Mode) 是一群数据中出现次数(频数)最多的值。适用 于大样本;较粗糙。 例 有 16 例 高 血 压 病 人 的 发 病 年 龄 ( 岁 ) 为 : 42,45,48,51,52,54,55,55,58,58,58,58,58,61,61,62, 试 求众数。 众数的特征 1、对于某些数据而言,例如均匀分布,并不存在众数; 2、对于某些数据存在两个或多于两个的众数; 3、定性数据可以存在众数; 众数对于进一步的统计学计算与分析不具备应用价值。
统计学 湖北中医药大学预防医学教研室 26

五、其他位置指标
? 1、四分位数(Quartile)(三个四分位数)

P0
P 10

P25
P20 P30

P50
P40 P50
P60

P75
P70

P 100
P 80
P90

2、十分位数(Centile): 9个十分位数

? 3、百分位数(Percentile)99个百分位数

统计学

湖北中医药大学预防医学教研室

27

第二节 离散与变异性指标
例:设甲、乙、丙三人,采每人的耳垂血,然后作红 细胞计数,每人数5个计数盘,得结果如下(万/mm3) 盘编号 甲 1 560 2 540 3 4 5 合计 乙 丙
580 560 540 520 500 480 460 440 420

500 460 440
2500

520 510 500 490 480
2500

510 505 500 495 490
2500

均数
统计学

500

500

500



乙 丙
28

湖北中医药大学预防医学教研室

离散与变异性指标
? ? ? ? ? ?
多 样 性 指 数
统计学

变 标 方 四 全 异 准 差 分 距 位 系 差 间 数 距
29

湖北中医药大学预防医学教研室

一、全距(Range)与绝对差
全距为最大值与最小值之差,也叫极差 缺点:仅利用了两个极端值。

绝对差=?(x - x )? 0, 不能作为变异度指标

统计学

湖北中医药大学预防医学教研室

30

二、方差与标准差
方差(Variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 (一)样本方差为各变量值到样本均数距离的平方和除 以自由度的商值,即

S2 ?
(二)总体方差定义为
N

? (x
i ?1

n

i

? x)

2

n ?1

? ?
2
统计学

(xi ? ? ) 2 ?
i ?1

N
31

湖北中医药大学预防医学教研室

标准差(standard deviation)
? 样本标准差为样本方差的平方根;

s?

? (x
i ?1

n

i

? x)

2

? 总体标准差为总体方差的平方根。

n ?1

??
统计学

? (x
i ?1

N

i

? ?)

2

N
32

湖北中医药大学预防医学教研室

样本标准差实用公式

s?
统计学

?x
i ?1

n

2 i

?

(? x i )
i ?1

n

2

n

n ?1
湖北中医药大学预防医学教研室 33

仍然用钉螺抽样数据为例,

? x ? 1+3+3+7+7+9+9+9=48,n=8
?x
S?
2

?1 ? 3 ? 3 ? 7 ? 7 ? 9 ? 9 ? 9 ? 360
2 2 2 2 2 2 2 2

?x

2

?? x? ?
n ?1 n

2

482 360 ? 8 ? 3.21(只/平方米) ? 8 ?1

统计学

湖北中医药大学预防医学教研室

34

? 样本标准差的加权公式

?fx
i ?1 i

k

2 i

?

(? f i x i )
i ?1

k

2

s?

?f
i ?1 i

k

i

?f
i ?1

k

?1
35

统计学

湖北中医药大学预防医学教研室

组段 (1) 2.53.03.54.04.55.05.56.06.5-6.75 合计

表 3.6 胆固醇数据的标准差计算表 组中值(xi) 频数(fi) fixi (2) (3) (4) 2.75 1 2.75 3.25 9 29.25 3.75 26 97.50 4.25 32 136.00 4.75 37 175.75 5.25 22 115.50 5.75 14 80.50 6.25 7 43.75 6.75 2 13.50 150 694.50
(? f i x i ) 2
i ?1 n

fixi2
(5) 7.5625 95.0625 365.625 578.000 834.8125 606.375 462.875 273.4375 91.125 3314.875

?f
i ?1

n

i

xi2 ?
n

s?
统计学

?f
i ?1 i

n

i

?f
i ?1

?

?1

(694.50) 2 3314 875 ? . 150 ? 0.8165239 0.817 mmol/L ? 150 ? 1
36

湖北中医药大学预防医学教研室

随机变量xi的标准化
? 如果随机变量xi服从正态分布,均数和标 准差分别为 x 和s,则随机变量xi的标准 化正态离差值(Standard normal deviation)又称为标准化得分值 (Standard Scores )为:

统计学

xi ? x Zi ? s

湖北中医药大学预防医学教研室

37

三、变异系数 (coefficient of variation) s CV ? ? 100 % x
变异系数(coefficient of variation, CV) 常用于比较度量单位不同或均数相差 悬殊的两组(或多组)资料的变异程度。
统计学 湖北中医药大学预防医学教研室 38

某地7岁男孩身高的均数为123.10cm, 标准差为4.71;体重均数为22.59kg,标准 差为2.26kg, 比较其变异度?

身高

体重
统计学

4.71 CV ? ?100% ? 3.83% 123.10 2.26 CV ? ?100% ? 10.14% 22.29
湖北中医药大学预防医学教研室 39

四、四分位数间距 (inter-quartile range)
? 四分位数间距,用IQR表示:
IQR=

P 100

P75
P50

P ? P25 ? Q3 ? Q1 75

? 第三四分位数:Q3 第一四分位数:Q1

P25
P0
40

统计学

湖北中医药大学预防医学教研室

第三节 率、比及其注意事项
一、率(rate): 在特定条件下,可能发生某 现象的总例数中,实际发生某现象的强度或 频率。

实际发生该现象的频数 率? ?比例基数 可能发生某现象的总例数 比例基数为1%,1 0 , 1/ 万, 1/ 十万等 00
统计学 湖北中医药大学预防医学教研室 41

二、比(ratio)
? 构成比(Proportion,constituent ratio): 构成比指标用以表示事物内部某一构成成分 在全部构成中所占的比例或比重。

某一构成成分的例数 构成比 ? (or ?100%) 所有构成成分的总例数 ? 相对比( relative ratio)是由两个有关联 的指标之比。

甲指标 相对比 ? 乙指标
统计学 湖北中医药大学预防医学教研室 42

三、应用率比指标时的注意事项
? 1、保证有足够的样本含量;

? 2、不要将率和比指标混淆;
? 3、注意平均率的计算;(p1+p2)/2

?p = p

? 4、率和比指标比较时,要有可比性(不可比时可 采用率标准化);
? 5、不要简单由样本率的差异做出结论。率比和均 数一样都有抽样误差,需采用假设检验下结论。
统计学 湖北中医药大学预防医学教研室 43

直接法标准化举例
两种疗法治疗某病的治愈率比较
甲法 组别 治疗人数 治愈人数 治愈率(%) 儿童 100 40 40.0 成人 50 30 60.0 合计 150 70 46.7 治疗人数 50 100 150 乙法 治愈人数 治愈率(%) 10 20.0 80 80.0 90 60.0

统计学

湖北中医药大学预防医学教研室

44

某病两种治疗方法的治疗效果
甲法 组别
标准治疗 人数 治愈率 (%) 预期 治愈数 治愈率 (%)

乙法
预期 治愈数

儿童 成人 合计

150 150 300

40.0 60.0 46.7

60 90 150

20.0 80.0 60.0

30 120 150

统计学

湖北中医药大学预防医学教研室

45

The class is over Thanks!

统计学

湖北中医药大学预防医学教研室

46


相关文章:
03数值资料的统计描述
3.2 MEANS 过程 MEANS 过程用来对数据集中的数值变量计算简单的描述性统计量。 该过程对数据集中有 VAR 语句指定的一些数值变量的全部非缺失的观测计算简单的描述...
第十章 单变量描述统计
第十章 单变量描述统计 调查所得的原始资料经过审核、 整理与汇总后, 还...但要选哪一种方法就要视乎变 量的测量层次,彼此的关系可以综合如表 9-7: ...
实验二SPSS的单变量描述统计
实验二 SPSS 的单变量描述统计 一.实验目的 1.通过对单变量进行频数分析,获得某些描述统计量和描述数值范围的统计量,了解变量 的取值分布情况。 2.通过单变量的...
第十八章 SPSS FOR WINDOWS统计软件概述
2.2.2 Descriptives 过程 (data09-02) 该过程可以计算单变量描述统计量。...2.2.3 Explore 过程(data09-03) 该过程用于计算指定变量的综合探索统计量和...
市场营销调研复习资料
刘清华我爱你贡献于2012-07-03 0.0分 (0人评价...均值比较:指定变量的综合描述统计量,包括均值、标准...总和、观测量、 1 方差等等一系列单变量描述统计量...
描述性统计
统计分析往往是从了解数据的基本特征开始的.描述数据分布特征的统计量可分为两类...下面我们通过例子来学习单变量频数分析操作. 1) 输入分析数据 在数据编辑器窗口...
商务统计方法模拟试题二答案
单变量描述统计量计算 D、多变量的描述统计量计算 7、关于两独立样本 t ...显著性概率 p 值>0.05,所以接受原假设 H0,学生成绩跟 85 分没有显著性差异...
SPSS问卷分析之编码录入及描述统计详解
杨雷文库贡献于2011-03-29 0.0分 (0人评价)暂无...分析: Descriptives:过程可以计算单变量描述统计量...(1)Means 过程:对指定变量综合描述分析,分组计算...
统计学课后作业答案
排序形成单变量分值的频数分布和累计频数分布: 网络...(5)对网民年龄的分布特征进行综合分析:分布,均值=...=5000,小样本正态分布,σ 未知,用 t 统计 量...
数据的统计分析技巧
统计量) (或配对) 、 基本统计量-显 (变量含义一 双方差 对比直方图、含组 示描述性统计 致、可比) 箱线图、雷达图 Minitab:统计多总体均值比 方差分析-单...
更多相关标签:
描述性统计量 | 描述统计量 | spss描述统计量分析 | 描述统计量分析 | spss描述性统计量 | 什么是描述性统计量 | spss描述统计量 | excel 描述统计量 |