当前位置:首页 >> 机械/仪表 >>

第7章基于秩次的非参数检验


基于秩次的非参数检验 1. 问题的提出 前面学习了连续型资料两组样本均数差异的假设检验方 法: 小样本用 t 检验,条件是变量服从正态分布和方差齐; 大样本用标准正态分布的 Z 检验。 如果是小样本,变量的分布不清,或者已知不服从正态 分布或经变量转换后仍不服从正态分布时,如何检验两个样 本或多个样本均数差异的统计学意义呢? 需要一种不依赖于分布假定的检验方法, 即非参数检验。 2. 基本概念
1

前面介绍的检验方法首先假定分析变量服从特定的已知 分布(如正态分布),然后对分布参数(如均数)作检验。 这类检验方法称参数检验(parametric test)。 今天介绍的检验方法不对变量的分布作严格假定,检验 不针对特定的参数,而是模糊地对变量的中心位置或分布位 置作比较。这类检验称非参数检验(nonparametric test), 由于其对总体分布不作严格假定,所以又称任意分布检验。 (distribution-free test) 非参数检验的优点: a.不受总体分布的限制,适用范围广。 b.适宜定量模糊的变量和等级变量。 c.方法简便易学。 缺点:
2

如果是精确测量的变量,并且已知服从或者经变量转换 后服从某个特定分布(如正态分布),这时人为地将精确测 量值变成顺序的秩, 将丢失部分信息, 造成检验功效能下降。 基于秩次非参数检验(秩和检验)的基本思想 假设变量 X 有观察值 1.1, 1.3, 1.7, 4.3, 11.4 显然这变量不服从正态分布, 观察值间差异较大, 既不对称, 标准差也较大。但如果将变量作转换,变成秩变量 Y=1,2,3, 4,5,则分布对称了,观察值间的差异也均匀了,标准差也 减小了。然后对这秩分布的中心位置(中位数)作检验,这就 是秩和检验。 7.1 配对样本的符号秩检验 (Wilcoxon signed rank test) 例7.1 为研究出生先后的孪生兄弟间智力是否存在差异,
3

12 对孪生兄弟测试的结果见表 7.3。 表 7.3 12 对孪生兄弟测试结果
对子 兄的 弟的 得分 秩次 对子 兄的 弟的 得分 秩次 号 得分 得分 差 号 得分 得分 差 1 86 88 2 3 7 77 65 -12 -10 2 71 77 6 7 8 91 90 -1 -1.5 3 77 76 -1 -1.5 9 70 65 -5 -5.5 4 68 64 -4 -4 10 71 80 9 9 5 91 96 5 5.5 11 88 81 -7 -8 6 72 72 0 12 87 72 -15 -11

T+=24.5,T-=41.5 符号秩检验的分布理论:假定有 4 个差值,如果 H0 成立 时,这 4 个差值有同等的概率取正值或负值,即每个值取正
4

值的概率等于 1/2。4 个差值每种组合发生的可能性就是:
1 1 1 1 P ? ? ? ? ? 0.0625 2 2 2 2

。所有可能的秩和情况和 T*的分布见

表 7.1。 表 7.1

n=4 时所有可能秩和情况和 T*的分布
概率 P 0.0625 0.0625 0.0625 0.1250 0.1250 0.1250

正差数 负差值 正秩和 负秩和 检验统计 * 的秩次 的秩次 T+ T量T 1,2,3,4 -- 10 0 0 2,3,4 1 9 1 1 1,3,4 2 8 2 2 1,2,4 3 7 3 3 3,4 1,2 7 3 3 1,2,3 4 6 4 4 2,4 1,3 6 4 4 1,4 2,3 5 5 5
5

2,3 1,3 4 1,2 3 2 1 -

1,4 2,4 1,2,3 3,4 1,2,4 1,3,4 2,3,4 1,2,3,4

5 4 4 3 3 2 1 0

5 6 6 7 7 8 9 10

5 4 4 3 3 2 1 0

0.1250 0.1250 0.0625 0.0625 0.0625

如果零假设成立,观察的结果应该服从这分布,即出现 极端的可能性很小。如果真是出现小概率,那么我们对零假 设的真实性产生怀疑,拒绝零假设。

6

表 7.2 Wilcoxon 符号秩检验的判断原则
检验假设 双侧检验 H0:Md(d)=0 H1:Md(d)≠0 单侧检验(1) H0:Md(d)=0 H1:Md(d)>0 若 T-≤T?(n), 则拒绝 H0 若│Z│>Z? , 则拒绝 H0 单侧检验(2) H0:Md(d)=0 H1:Md(d)<0 若 T+≤T?(n), 则拒绝 H0 若│Z│>Z?, 则拒绝 H0

统计决策: * 小 样 本 查 表若 T ≤T?/2(n), 法 则拒绝 H0 大 样 本 正 态若│Z│>Z?/2 , 近似法 则拒绝 H0

当研究例数较大时(n>50), 秩和 T 的分布近似正态分布, 可以用正态分布理论作假设检验。 这时正态分布的均数和标准差分别等于: ?T=n(n+1)/4
7

?T ?

n(n ? 1)( 2n ? 1) / 24
*

检验的公式为:

? T Z?
?

?

T T

? 0.5

T ?

*

? n(n ? 1) / 4 ? 0.5

n(n ? 1)( 2n ? 1) / 24

具体计算步骤: a. 建立检验假设: H0: 中位数为零; H1:中位数不等于零;α=0.05 b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平 均秩。分别求正号和负号的秩和,取绝对值小的为 T。 c. 确定概率:查附表 10,在 n=11 时,T0.05=11。现 24.5>11, 故 p>0.05。

8

7.2 两独立样本的秩和检验(Wilcoxon rank sum test) 例 7.2 在缺氧条件下, 观察 4 只猫与 12 只兔的生存时 间(分),结果见表 7.5。试判断猫、兔在缺氧条件下生存时 间的差异是否具有统计学意义。 这是生存时间资料, 一般不服从正态分布, 样本也较小, 需考虑用非参数检验---秩和检验。 秩和检验的基本思想:两组观察值共有 n 例,设例数较 少的组有 n1 例,按观察值大小顺序分别编秩为 1,2,…,n。如 果零假设成立,观察的结果有较大的可能出现分布在中间的 结果。如果极端的结果出现,则可能零假设不成立,我们就 拒绝零假设。

9

表 7.5
生存 时间 25 34 44 46 46 n1=5 猫 秩次

缺氧条件下猫与兔的生存时间(分)比较
生存 秩次 时间 15 1 15 2 16 3 17 4 19 5 生存 时间 21 21 23 25 27 兔 秩次 6 7 8 9.5 11 生存 时间 28 28 30 35 n2=14 秩次 12 13 14 16 T2=111.5

9.5 15 17 18 19 T1=78.5

当样本较大时,秩和的分布近似正态分布,可以用正态 分布理论作假设检验。这时正态分布的均数和标准差分别等 于:
10

?T*=n1(n+1)/2

? n n ( n ? 1 ) ?1 ? ? T2? ? 2 2 12 ? ? 检验公式为:
Z?
2 ?T ?

?

(t k3 ? t k ) ? ? 3 n ?n ? ?

| T * ? n1 (n ? 1) / 2 | ?0.5

具体计算步骤: a. 建立检验假设: H0:Md1=Md2,即两总体分布位置相同; H1:Md1≠Md2,即两总体分布位置不同;α=0.05 b. 编秩和计算秩和:
11

两组混合编秩,有相同值求平均秩(仅有同组相同值可 忽略)。当 n1<n2 时,取较小样本的秩和为检验统计量 T*= R 1; 当 n1=n2 时, 取秩和较小者为检验统计量 T*=min(R1, R 2) 。 本例求例数较少组的秩和 T*=78.5。 c. 确定概率: T 值在表中两数字值之间时, p 值大于相应界值, 反之则 小于。n1=5,n2=14,n2-n1=9,查附表 11,TL0.01=22,TU0.01 =78,T*>TU0.01,P<0.01,故拒绝 H0,可认为猫、兔在缺氧 条件下的生存时间的中位数不相等。 7.3 多个样本分布位置相同的假设检验 1.完全随机化设计资料分布位置的假设检验(KruskalWallis test)
12

表 7.7
A 2.7 2.4 2.2 3.4

不同吸烟习惯母亲的新生儿体重(kg)
A 3 2 1 9 4 15 相应秩次 rij B C 4 7 5.5 12.5 5.5 9 9 3 4 15 37.5 D 11 12.5 14 3 37.5

出生体重 xij B C D 2.9 3.3 3.5 3.2 3.6 3.6 3.2 3.4 3.7 3.4 ni Ri

计算步骤: a. 建立检验假设: H0:k 个总体中位数相等; H1:k 个总体中位数不等;α=0.05。
13

b. 计算统计量:各组混合编秩。如不同组间出现相同值, 求平均秩。计算各组的秩和。 2 ? ? 如果 H0:成立,第 i 组秩和的期望(总体均数) Ri 与方差 Ri 分别为:

? Ri
2 ? Ri

ni (n ? 1) ? 2

ni (n ? ni )(n ? 1) ? 12 在此基础上建立检验统计量:

H ??
i ?1

k

?Ri ? ? Ri ?2
?
2 Ri

??

k

?Ri ? ni (n ? 1) / 2?2

i ?1 ni ( n ? ni )( n ? 1) / 12

当 H0 成立时,该检验统计量近似服从自由度为(k-1)的?2 分
14

布。为简化运算,由上式推导出如下公式:
k R2 12 H? ( ? i ) ? 3( n ? 1) n( n ? 1) i ?1 ni

12 152 152 37.52 37.52 H? ( ? ? ? ) ? 3(14 ? 1) ? 9.375 14(14 ? 1) 4 3 4 3
HC ? H 1?

校正:
HC ?

?
p ?1

m

3 (t 3 ? t ) ( n ? n) p p

9.375 ? 9.5018 3 3 3 [(2 ? 2) ? (3 ? 3) ? (2 ? 2)] 1? 143 ? 14

c. 确定概率和判断结果:自由度(df)=4-1=3,查χ2 值表得
15

χ2 0.05(3) =7.815,p<0.05,故拒绝零假设,说明不同吸烟习 惯对新生儿体重有影响。 2.随机化区组设计资料分布位置的假设检验 (Friedman test) 与配对设计的思想一样,为控制某些因素对试验效应的 混杂影响,可以在设计时,将试验对象配成组,再随机地分 配处理因素给每组中的各个对象,这种设计称随机化区组设 计。 对于随机化区组设计资料,考虑 k 个处理组的分布差异 时,可采用由 M. Friedman 在符号检验基础上扩展的秩和检 验,称为 Friedman 检验(Friedman test)。令 xij 为第 i 区 组(i=1,2....b)、第 j 处理组(j=1,2....k)的个体观察 值,数据按区组(b 行)与处理组(k 列)排列如表 7.8。
16

表 7.8 随机化区组设计的资料格式 处理组 区 组 1 2 ... k 1 x11 x12 ... x1k 2 x21 x22 ... x2k ┆ ┆ ┆ ┆ ┆ b xb1 xb2 ... xbk

其检验假设为 H0:k 个处理组效应的中位数相等; H1:k 个处理组效应的中位数不全相等。 进行 Friedman 检验时,首先在每区组(行)内将观察值 按其数值由小到大排秩,然后再按处理组(列)求秩和,最后
17

产生一个综合区组内差异的检验统计量。 令 rij 为第 i 区组、 第 j 处理组观察值 xij 所对应的秩次, 因为每一区组(行)内有 k 个从 1 到 k 的整数秩,所以任何区 组(行)的秩和为

k (k ? 1) rij ? ? 2 j ?1
k

r ? 令 R 为第 j 处理组的秩和,即 R =
j j

k

j ?1

ij

,故总秩和为

?

bk (k ? 1) Ri ? 2 j ?1
k

当 H0 成立时,第 j 列秩和的期望与方差分别为

18

? Ri

b(k ? 1) ? , 2

2 ? Rj

大样本时,统计量 取其加权和,
k

Zj ?

R j ? ? Rj
2 ? Rj

b(k 2 ? 1) ? 12
~ N(0,1)

? k ?1? 2 ? ? ?? ?Z j ? ? j ?1 ? k ? j ?1
2 k

?R

j ? b( k ? 1) / 2

?

2

kb(k ? 1) / 12
2

2 近似服从自由度为(k-1)的 ? 分布,通过与 ? 分布界值的比 较便可作出判定。 与 K-W 检验统计量的情况相似,可导出计算式

19

k 12 2 ? ? R ? j ? 3b(k ? 1) bk ( k ? 1) j ?1 2

例 7.4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件 下测量核黄素浓度,试验结果如表 7.9 所示。问四种条件下 的测量结果的差异是否具有统计学意义? 表 7.9 甘蓝叶核黄素浓度测量值( ?g /g)
测量条件 批 次 甲 乙 丙 1 27.2(2) 24.6(1) 39.5(4) 2 23.2(1) 24.2(2) 43.1(4) 3 24.8(2) 22.2(1) 45.2(4) Rj 5 4 12 丁 38.6(3) 39.5(3) 33.0(3) 9



(1) 建立检验假设
20

H0:四种测量条件下的测量结果的中位数相等; H 1: 四种测量条件下的测量结果的中位数不全相等。 (2) 将同一批的四个测量结果由小到大排秩,持平数据 取平均秩次。将各秩次列于相应测量值旁边的括号内。 (3) 计算与各测量条件相应的(列向)秩和 Rj, 记于表 7.9 的最后一行。
2 ? (4) 代入(7.19)式,计算 统计量。b=3,k=4, 12 2 ? ? (5 2 ? 4 2 ? 12 2 ? 9 2 ) ? 3(3)( 4 ? 1) ? 8.2, 3(4)( 4 ? 1)

v ? k ?1? 3
(5) 确定 P 值并判断结果。?=0.05,

?

2 0.05, 3

=7.815。

21

? > ?0.05 ,P<0.05,故拒绝 H0,可以认为四种条件下测量结
2

2

果有统计学意义。 3.k 组秩均值的多重比较 无论是用 K-W 检验, 还是用 Friedman 检验, 当拒绝零假 设时, 并不能直接判断 k 组中哪些组间差异具有统计学意义, 为此需进行组间的多重比较(multiple comparison)。 对于完全随机设计资料,令 Ri 和 R j 分别为欲比较的第 i 组与第 j 组样本的平均秩。 平均秩差数的绝对值用 Ri ? R j 表示, 则其平均秩差数的方差为

22

?1 1 ? ? ? ? ? nj ? ? ? ni ? 式中 n 为 k 组的总样本含量,ni,nj 分别为第 i 组与第 j 组 样本含量。其检验假设为 H0:第 i 组与第 j 组中位数相等; H1:第 i 组与第 j 组中位数不等。 用正态近似法,其检验统计量为
2 Ri ? R j

n ( n ? 1) ? 12

Z ij ?

Ri ? R j

? Ri ? R j

然后将 Zij 值与标准正态分布的界值比较。设共有 c 个 Zij,即总共进行 c 次比较。则用?/c 作检验水准。
23

例 7.5 仍以例 7.3 出生体重数据(见表 7.7)为例,四 个吸烟组平均秩分别为: R 1 =15/4=3.75, R 2 =15/3=5.0, R 3 =37.5/4=9.375, R 4 =37.5/3=12.50 本例主要考虑不吸烟组的平均秩与另外三组平均秩的比 较,共有三个比较对,即 c=3。若?=0.05,则限定每一个 Z 检验第 I 类错误概率不超过 0.05/3=0.0167, 由标准正态分 布获得该多重检验的界值为 Z0.0167=2.12。当所求得的 Zij≥ 2.12 时,判断第 i 和 j 两组处理差异有统计学意义。 用(7.24)式分别求得三个比较对的 Zij 值为
Z1,4 ?

?n(n ? 1) /12?(1/ ni ? 1/ n4 )

R1 ? R4

?

3.75 ? 12.50

?14(14 ? 1) /12?(1/ 4 ? 1/ 3)

? 2.74

24

5 ? 12.5 Z 2, 4 ? ? 2.20 Z 3,4 ? 9.375 ? 12.5 ? 0.97 , 17.5(1 / 3 ? 1 / 3) 17.5(1 / 4 ? 1 / 3) 因为 Z1,4 与 Z2,4 均大于 Z0.0167, 可认为当前尚在吸烟的母亲 与从不吸烟母亲相比,他们的新生儿的出生体重差异具有统 计学意义。 对于随机化区组设计资料,当用 Friedman 检验拒绝 H0 后,采用同样的过程对 Ri 的 R j 的秩和平均差进行多重比较,

与上法的唯一不同在于用下式计算两组平均秩之差的方差,

?

2 Ri ? R j

k (k ? 1) ? 6b

检验的其他步骤与前面介绍的完全相同。

25


相关文章:
基于秩次的非参数检验
基于秩次的非参数检验_预防医学_医药卫生_专业资料。第十章一、选择题 基于秩次的非参数检验习题 1.两小样本均数比较,方差不齐时,下列说法不正确的是( )。 ...
第十一章 非参数检验
53页 免费 2425第十一章 基于秩次... 暂无评价 64页 免费 第十三章 非参数检验 17页 免费 第7章 非参数检验 26页 免费 第十一章非参数检验 60页 免费喜欢...
第10章 非参数检验
spss 第10章 非参数检验 150页 5财富值 第10章 基于秩次的非参数检... 32...非参数假设检验 9页 免费 非参数检验 19页 免费 非参数检验 7页 免费 第七...
07秩和检验
Ch7 秩和检验 7.1 非参数统计概述 .前面第四、 五章介绍的假设检验具有两个...非参数检验方法很多,本章将介绍基于秩次的非参数检验,用于单变量分析的有 ...
统计1
第七章 假设检验基础 一、核心内容:假设检验的基本步骤;单样本 t 检验、配对 ...基于秩次的非参数检验 一、核心内容:非参数统计的概念和适用范围;单样本设计、...
关于基于秩次的非参数检验,下列说法错误的是___. A.符...
关于基于秩次的非参数检验,下列说法错误的是___. A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正...
卫生统计学 (2)
第一章 1.总体 2.样本 3.抽样 4.变异 5.统计量 6.同质 7.变异 8.等级...第十章 基于秩次的非参数检验 1.参数检验 2.非参数检验 4.符号秩和检验 第...
卫生统计学第7版
卫生统计学(本科预防)(第 7 版) 目录 第一章绪论 第一节医学中统计思维的...第九章基于秩次的非参数检验 第一节配对设计资料的符号秩和检验 第二节两组...
秩和检验
秩和检验_医药卫生_专业资料。第十章 基于秩次的非参数检验 【教学要求】掌握...(七)多个样本两两比较的秩和检验 对完全随机设计多个样本比较用 Kruskal-...
第十一章 非参数检验
第二节 两个独立样本的非参数检验方法 一、秩和检验法 秩和即秩次的和或...46 50 68 78 84 92 等级 1 4 5 7 8 2 3 6 9 10 11 等级和 T1 ?...
更多相关标签: