当前位置:首页 >> 机械/仪表 >>

第7章基于秩次的非参数检验


基于秩次的非参数检验 1. 问题的提出 前面学习了连续型资料两组样本均数差异的假设检验方 法: 小样本用 t 检验,条件是变量服从正态分布和方差齐; 大样本用标准正态分布的 Z 检验。 如果是小样本,变量的分布不清,或者已知不服从正态 分布或经变量转换后仍不服从正态分布时,如何检验两个样 本或多个样本均数差异的统计学意义呢? 需要一种不依赖于分布假定的检验方法, 即非参数检验。

2. 基本概念
1

前面介绍的检验方法首先假定分析变量服从特定的已知 分布(如正态分布),然后对分布参数(如均数)作检验。 这类检验方法称参数检验(parametric test)。 今天介绍的检验方法不对变量的分布作严格假定,检验 不针对特定的参数,而是模糊地对变量的中心位置或分布位 置作比较。这类检验称非参数检验(nonparametric test), 由于其对总体分布不作严格假定,所以又称任意分布检验。 (distribution-free test) 非参数检验的优点: a.不受总体分布的限制,适用范围广。 b.适宜定量模糊的变量和等级变量。 c.方法简便易学。 缺点:
2

如果是精确测量的变量,并且已知服从或者经变量转换 后服从某个特定分布(如正态分布),这时人为地将精确测 量值变成顺序的秩, 将丢失部分信息, 造成检验功效能下降。 基于秩次非参数检验(秩和检验)的基本思想 假设变量 X 有观察值 1.1, 1.3, 1.7, 4.3, 11.4 显然这变量不服从正态分布, 观察值间差异较大, 既不对称, 标准差也较大。但如果将变量作转换,变成秩变量 Y=1,2,3, 4,5,则分布对称了,观察值间的差异也均匀了,标准差也 减小了。然后对这秩分布的中心位置(中位数)作检验,这就 是秩和检验。 7.1 配对样本的符号秩检验 (Wilcoxon signed rank test) 例7.1 为研究出生先后的孪生兄弟间智力是否存在差异,
3

12 对孪生兄弟测试的结果见表 7.3。 表 7.3 12 对孪生兄弟测试结果
对子 兄的 弟的 得分 秩次 对子 兄的 弟的 得分 秩次 号 得分 得分 差 号 得分 得分 差 1 86 88 2 3 7 77 65 -12 -10 2 71 77 6 7 8 91 90 -1 -1.5 3 77 76 -1 -1.5 9 70 65 -5 -5.5 4 68 64 -4 -4 10 71 80 9 9 5 91 96 5 5.5 11 88 81 -7 -8 6 72 72 0 12 87 72 -15 -11

T+=24.5,T-=41.5 符号秩检验的分布理论:假定有 4 个差值,如果 H0 成立 时,这 4 个差值有同等的概率取正值或负值,即每个值取正
4

值的概率等于 1/2。4 个差值每种组合发生的可能性就是:
1 1 1 1 P ? ? ? ? ? 0.0625 2 2 2 2

。所有可能的秩和情况和 T*的分布见

表 7.1。 表 7.1

n=4 时所有可能秩和情况和 T*的分布
概率 P 0.0625 0.0625 0.0625 0.1250 0.1250 0.1250

正差数 负差值 正秩和 负秩和 检验统计 * 的秩次 的秩次 T+ T量T 1,2,3,4 -- 10 0 0 2,3,4 1 9 1 1 1,3,4 2 8 2 2 1,2,4 3 7 3 3 3,4 1,2 7 3 3 1,2,3 4 6 4 4 2,4 1,3 6 4 4 1,4 2,3 5 5 5
5

2,3 1,3 4 1,2 3 2 1 -

1,4 2,4 1,2,3 3,4 1,2,4 1,3,4 2,3,4 1,2,3,4

5 4 4 3 3 2 1 0

5 6 6 7 7 8 9 10

5 4 4 3 3 2 1 0

0.1250 0.1250 0.0625 0.0625 0.0625

如果零假设成立,观察的结果应该服从这分布,即出现 极端的可能性很小。如果真是出现小概率,那么我们对零假 设的真实性产生怀疑,拒绝零假设。

6

表 7.2 Wilcoxon 符号秩检验的判断原则
检验假设 双侧检验 H0:Md(d)=0 H1:Md(d)≠0 单侧检验(1) H0:Md(d)=0 H1:Md(d)>0 若 T-≤T?(n), 则拒绝 H0 若│Z│>Z? , 则拒绝 H0 单侧检验(2) H0:Md(d)=0 H1:Md(d)<0 若 T+≤T?(n), 则拒绝 H0 若│Z│>Z?, 则拒绝 H0

统计决策: * 小 样 本 查 表若 T ≤T?/2(n), 法 则拒绝 H0 大 样 本 正 态若│Z│>Z?/2 , 近似法 则拒绝 H0

当研究例数较大时(n>50), 秩和 T 的分布近似正态分布, 可以用正态分布理论作假设检验。 这时正态分布的均数和标准差分别等于: ?T=n(n+1)/4
7

?T ?

n(n ? 1)( 2n ? 1) / 24
*

检验的公式为:

? T Z?
?

?

T T

? 0.5

T ?

*

? n(n ? 1) / 4 ? 0.5

n(n ? 1)( 2n ? 1) / 24

具体计算步骤: a. 建立检验假设: H0: 中位数为零; H1:中位数不等于零;α=0.05 b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平 均秩。分别求正号和负号的秩和,取绝对值小的为 T。 c. 确定概率:查附表 10,在 n=11 时,T0.05=11。现 24.5>11, 故 p>0.05。

8

7.2 两独立样本的秩和检验(Wilcoxon rank sum test) 例 7.2 在缺氧条件下, 观察 4 只猫与 12 只兔的生存时 间(分),结果见表 7.5。试判断猫、兔在缺氧条件下生存时 间的差异是否具有统计学意义。 这是生存时间资料, 一般不服从正态分布, 样本也较小, 需考虑用非参数检验---秩和检验。 秩和检验的基本思想:两组观察值共有 n 例,设例数较 少的组有 n1 例,按观察值大小顺序分别编秩为 1,2,…,n。如 果零假设成立,观察的结果有较大的可能出现分布在中间的 结果。如果极端的结果出现,则可能零假设不成立,我们就 拒绝零假设。

9

表 7.5
生存 时间 25 34 44 46 46 n1=5 猫 秩次

缺氧条件下猫与兔的生存时间(分)比较
生存 秩次 时间 15 1 15 2 16 3 17 4 19 5 生存 时间 21 21 23 25 27 兔 秩次 6 7 8 9.5 11 生存 时间 28 28 30 35 n2=14 秩次 12 13 14 16 T2=111.5

9.5 15 17 18 19 T1=78.5

当样本较大时,秩和的分布近似正态分布,可以用正态 分布理论作假设检验。这时正态分布的均数和标准差分别等 于:
10

?T*=n1(n+1)/2

? n n ( n ? 1 ) ?1 ? ? T2? ? 2 2 12 ? ? 检验公式为:
Z?
2 ?T ?

?

(t k3 ? t k ) ? ? 3 n ?n ? ?

| T * ? n1 (n ? 1) / 2 | ?0.5

具体计算步骤: a. 建立检验假设: H0:Md1=Md2,即两总体分布位置相同; H1:Md1≠Md2,即两总体分布位置不同;α=0.05 b. 编秩和计算秩和:
11

两组混合编秩,有相同值求平均秩(仅有同组相同值可 忽略)。当 n1<n2 时,取较小样本的秩和为检验统计量 T*= R 1; 当 n1=n2 时, 取秩和较小者为检验统计量 T*=min(R1, R 2) 。 本例求例数较少组的秩和 T*=78.5。 c. 确定概率: T 值在表中两数字值之间时, p 值大于相应界值, 反之则 小于。n1=5,n2=14,n2-n1=9,查附表 11,TL0.01=22,TU0.01 =78,T*>TU0.01,P<0.01,故拒绝 H0,可认为猫、兔在缺氧 条件下的生存时间的中位数不相等。 7.3 多个样本分布位置相同的假设检验 1.完全随机化设计资料分布位置的假设检验(KruskalWallis test)
12

表 7.7
A 2.7 2.4 2.2 3.4

不同吸烟习惯母亲的新生儿体重(kg)
A 3 2 1 9 4 15 相应秩次 rij B C 4 7 5.5 12.5 5.5 9 9 3 4 15 37.5 D 11 12.5 14 3 37.5

出生体重 xij B C D 2.9 3.3 3.5 3.2 3.6 3.6 3.2 3.4 3.7 3.4 ni Ri

计算步骤: a. 建立检验假设: H0:k 个总体中位数相等; H1:k 个总体中位数不等;α=0.05。
13

b. 计算统计量:各组混合编秩。如不同组间出现相同值, 求平均秩。计算各组的秩和。 2 ? ? 如果 H0:成立,第 i 组秩和的期望(总体均数) Ri 与方差 Ri 分别为:

? Ri
2 ? Ri

ni (n ? 1) ? 2

ni (n ? ni )(n ? 1) ? 12 在此基础上建立检验统计量:

H ??
i ?1

k

?Ri ? ? Ri ?2
?
2 Ri

??

k

?Ri ? ni (n ? 1) / 2?2

i ?1 ni ( n ? ni )( n ? 1) / 12

当 H0 成立时,该检验统计量近似服从自由度为(k-1)的?2 分
14

布。为简化运算,由上式推导出如下公式:
k R2 12 H? ( ? i ) ? 3( n ? 1) n( n ? 1) i ?1 ni

12 152 152 37.52 37.52 H? ( ? ? ? ) ? 3(14 ? 1) ? 9.375 14(14 ? 1) 4 3 4 3
HC ? H 1?

校正:
HC ?

?
p ?1

m

3 (t 3 ? t ) ( n ? n) p p

9.375 ? 9.5018 3 3 3 [(2 ? 2) ? (3 ? 3) ? (2 ? 2)] 1? 143 ? 14

c. 确定概率和判断结果:自由度(df)=4-1=3,查χ2 值表得
15

χ2 0.05(3) =7.815,p<0.05,故拒绝零假设,说明不同吸烟习 惯对新生儿体重有影响。 2.随机化区组设计资料分布位置的假设检验 (Friedman test) 与配对设计的思想一样,为控制某些因素对试验效应的 混杂影响,可以在设计时,将试验对象配成组,再随机地分 配处理因素给每组中的各个对象,这种设计称随机化区组设 计。 对于随机化区组设计资料,考虑 k 个处理组的分布差异 时,可采用由 M. Friedman 在符号检验基础上扩展的秩和检 验,称为 Friedman 检验(Friedman test)。令 xij 为第 i 区 组(i=1,2....b)、第 j 处理组(j=1,2....k)的个体观察 值,数据按区组(b 行)与处理组(k 列)排列如表 7.8。
16

表 7.8 随机化区组设计的资料格式 处理组 区 组 1 2 ... k 1 x11 x12 ... x1k 2 x21 x22 ... x2k ┆ ┆ ┆ ┆ ┆ b xb1 xb2 ... xbk

其检验假设为 H0:k 个处理组效应的中位数相等; H1:k 个处理组效应的中位数不全相等。 进行 Friedman 检验时,首先在每区组(行)内将观察值 按其数值由小到大排秩,然后再按处理组(列)求秩和,最后
17

产生一个综合区组内差异的检验统计量。 令 rij 为第 i 区组、 第 j 处理组观察值 xij 所对应的秩次, 因为每一区组(行)内有 k 个从 1 到 k 的整数秩,所以任何区 组(行)的秩和为

k (k ? 1) rij ? ? 2 j ?1
k

r ? 令 R 为第 j 处理组的秩和,即 R =
j j

k

j ?1

ij

,故总秩和为

?

bk (k ? 1) Ri ? 2 j ?1
k

当 H0 成立时,第 j 列秩和的期望与方差分别为

18

? Ri

b(k ? 1) ? , 2

2 ? Rj

大样本时,统计量 取其加权和,
k

Zj ?

R j ? ? Rj
2 ? Rj

b(k 2 ? 1) ? 12
~ N(0,1)

? k ?1? 2 ? ? ?? ?Z j ? ? j ?1 ? k ? j ?1
2 k

?R

j ? b( k ? 1) / 2

?

2

kb(k ? 1) / 12
2

2 近似服从自由度为(k-1)的 ? 分布,通过与 ? 分布界值的比 较便可作出判定。 与 K-W 检验统计量的情况相似,可导出计算式

19

k 12 2 ? ? R ? j ? 3b(k ? 1) bk ( k ? 1) j ?1 2

例 7.4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件 下测量核黄素浓度,试验结果如表 7.9 所示。问四种条件下 的测量结果的差异是否具有统计学意义? 表 7.9 甘蓝叶核黄素浓度测量值( ?g /g)
测量条件 批 次 甲 乙 丙 1 27.2(2) 24.6(1) 39.5(4) 2 23.2(1) 24.2(2) 43.1(4) 3 24.8(2) 22.2(1) 45.2(4) Rj 5 4 12 丁 38.6(3) 39.5(3) 33.0(3) 9



(1) 建立检验假设
20

H0:四种测量条件下的测量结果的中位数相等; H 1: 四种测量条件下的测量结果的中位数不全相等。 (2) 将同一批的四个测量结果由小到大排秩,持平数据 取平均秩次。将各秩次列于相应测量值旁边的括号内。 (3) 计算与各测量条件相应的(列向)秩和 Rj, 记于表 7.9 的最后一行。
2 ? (4) 代入(7.19)式,计算 统计量。b=3,k=4, 12 2 ? ? (5 2 ? 4 2 ? 12 2 ? 9 2 ) ? 3(3)( 4 ? 1) ? 8.2, 3(4)( 4 ? 1)

v ? k ?1? 3
(5) 确定 P 值并判断结果。?=0.05,

?

2 0.05, 3

=7.815。

21

? > ?0.05 ,P<0.05,故拒绝 H0,可以认为四种条件下测量结
2

2

果有统计学意义。 3.k 组秩均值的多重比较 无论是用 K-W 检验, 还是用 Friedman 检验, 当拒绝零假 设时, 并不能直接判断 k 组中哪些组间差异具有统计学意义, 为此需进行组间的多重比较(multiple comparison)。 对于完全随机设计资料,令 Ri 和 R j 分别为欲比较的第 i 组与第 j 组样本的平均秩。 平均秩差数的绝对值用 Ri ? R j 表示, 则其平均秩差数的方差为

22

?1 1 ? ? ? ? ? nj ? ? ? ni ? 式中 n 为 k 组的总样本含量,ni,nj 分别为第 i 组与第 j 组 样本含量。其检验假设为 H0:第 i 组与第 j 组中位数相等; H1:第 i 组与第 j 组中位数不等。 用正态近似法,其检验统计量为
2 Ri ? R j

n ( n ? 1) ? 12

Z ij ?

Ri ? R j

? Ri ? R j

然后将 Zij 值与标准正态分布的界值比较。设共有 c 个 Zij,即总共进行 c 次比较。则用?/c 作检验水准。
23

例 7.5 仍以例 7.3 出生体重数据(见表 7.7)为例,四 个吸烟组平均秩分别为: R 1 =15/4=3.75, R 2 =15/3=5.0, R 3 =37.5/4=9.375, R 4 =37.5/3=12.50 本例主要考虑不吸烟组的平均秩与另外三组平均秩的比 较,共有三个比较对,即 c=3。若?=0.05,则限定每一个 Z 检验第 I 类错误概率不超过 0.05/3=0.0167, 由标准正态分 布获得该多重检验的界值为 Z0.0167=2.12。当所求得的 Zij≥ 2.12 时,判断第 i 和 j 两组处理差异有统计学意义。 用(7.24)式分别求得三个比较对的 Zij 值为
Z1,4 ?

?n(n ? 1) /12?(1/ ni ? 1/ n4 )

R1 ? R4

?

3.75 ? 12.50

?14(14 ? 1) /12?(1/ 4 ? 1/ 3)

? 2.74

24

5 ? 12.5 Z 2, 4 ? ? 2.20 Z 3,4 ? 9.375 ? 12.5 ? 0.97 , 17.5(1 / 3 ? 1 / 3) 17.5(1 / 4 ? 1 / 3) 因为 Z1,4 与 Z2,4 均大于 Z0.0167, 可认为当前尚在吸烟的母亲 与从不吸烟母亲相比,他们的新生儿的出生体重差异具有统 计学意义。 对于随机化区组设计资料,当用 Friedman 检验拒绝 H0 后,采用同样的过程对 Ri 的 R j 的秩和平均差进行多重比较,

与上法的唯一不同在于用下式计算两组平均秩之差的方差,

?

2 Ri ? R j

k (k ? 1) ? 6b

检验的其他步骤与前面介绍的完全相同。

25


相关文章:
第7章基于秩次的非参数检验
第7章基于秩次的非参数检验_机械/仪表_工程科技_专业资料。基于秩次的非参数检验 1. 问题的提出 前面学习了连续型资料两组样本均数差异的假设检验方 法: 小...
第七章 基于秩次的非参数检验
秩和检验 91页 免费如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 第七章 基于秩次的非参数检验 隐藏>> 第七章 基...
基于秩次的非参数检验
基于秩次的非参数检验_预防医学_医药卫生_专业资料。第十章一、选择题 基于秩次的非参数检验习题 1.两小样本均数比较,方差不齐时,下列说法不正确的是( )。 ...
基于秩次的非参数检验
第七章 基于秩次的非参数检验 前言: 前言: 1. 问题的提出: 问题的提出: 前面学习了连续型资料两组样本均数差异的假设检验方法: 前面学习了连续型资料两组样本...
第十章基于秩次的非参数检验
基与秩次的非参数检验 44页 2财富值如要投诉违规内容,请到百度文库投诉中心;如要提出功能问题或意见建议,请点击此处进行反馈。 第十章基于秩次的非参数检验 统计...
第十一章 非参数检验
53页 免费 2425第十一章 基于秩次... 暂无评价 64页 免费 第十三章 非参数检验 17页 免费 第7章 非参数检验 26页 免费 第十一章非参数检验 60页 免费喜欢...
卫生统计学综合一及答案
有统计学意义 【答案】C 2.关于基于秩次的非参数检验,下列说法错误的是___....7 的同学被抽取 C.全班有四个学习小组,随机抽取其中 1 组 D.每名学生抽一...
第十二章 基于秩转换的非参数检验
第十二章 基于秩转换的非参数检验_医学_高等教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 第十二章 基于秩转换的非参数检验_医学_高等教育_教育专区。统计...
兰州大学《卫生统计学》15秋在线作业1满分答案
关于基于秩次的非参数检验,下列说法错误的是( ) A. 符号秩和检验中,差值为...秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 正确答案 :B 7...
第10章 非参数检验
spss 第10章 非参数检验 150页 5财富值 第10章 基于秩次的非参数检... 32...7页 免费 第七章 SPSS非参数检验 66页 免费如要投诉违规内容,请到百度文库投诉...
更多相关标签:
非参数秩和检验 | 非参数秩和检验 spss | 秩转换的非参数检验 | 基于秩次的非参数检验 | 8.7 秩和检验 | 第七章 非参数检验 | spss15章非参数检验 | 第四章非参数检验作业 |