当前位置:首页 >> 能源/化工 >>

平均数差异显著性检验统计检验力和效果大小的估计原理与方法


第 30 卷 总第 115 期

心理学探新
PSYCHOLOGICAL EXPLORATI N O

2010 年

第 1期

平均数差异显著性检验统计检验力和 效果大小的估计原理与方法
胡竹菁
(江西师范大学 心理学院 ,南昌 330022)

摘   : 该文以平均数差异显著性检验为例 ,对实验数据进行假设检验后 ,继续对其统计检验 要 力和效果大小进行估计的基本原理和方法作一介绍 。 关键词 : 平均数差异显著性检验 ; 假设检验 ; 统计检验力 ; 效果大小 中图分类号 : B841. 2     文献标识码 : A     文章编号 : 1003 - 5184 (2010) 01 - 0068 - 06

1  引言

hen 的 d 值和 k 值 ……” 。在我国现有的心理或

[1 ]

在心理学研究中 ,应用 Z检验 、检验 、 检验或 t F 卡方检验等推断统计方法会得到对某种类型的样本 统计量 (如样本平均数 、 方差 、 相关系数 、 比率或实 计数等 )的几个样本统计量之间的差异是否显著的 假设检验结果 ,但是 ,假设检验结果并不能有助于了 解它们之间的差异到底有多大 , 其差异显著性有多 重要 。因此 ,现代心理统计学的发展要求通过计算 统计检验力 (或效果大小 ) 来达到这些目的 。当今 国内外心理与教育统计学最重要的发展趋势之一是 有关“统 计 检 验 力 ( power of test ) 和 效 果 大 小 ( effect size ) ” 的计算方法问题越来越重要了 。随着 心理学科的发展 ,目前美国心理学会的学术期刊已 经明确要求研究者在投稿时需要在文章中提供有关 “ 统计力 ” 效果大小 ” 和“ 等方面的数据 。例如 ,美国 心理协会最新版 (第 5 版 ) 的《写作手册 》 一书中 , 明确要求 :“ 作者对于自己的研究假设进行检验时 , 必须考虑采取严格的统计力 ( statistics power) 。我 们可以通过特定的 α水平 、 效果大小和样本大小来 决定统计力 ,而这关系到正确地拒绝作者想要检验 的假设的可能性 …… 为了让读者能够充分地了解到 你的研究发现的重要性 , 在你的结果段落中呈现效 果大小 ( effect size ) 的索引或关系强度 ( strength of a relationship ) 是必要的 。你可以使用一些一般效 果大小的估计值来估计你研究结果的效果大小或关 2 2 2 系强度 ,包括 (但不是受限于 ) : γ , η , ω ……Co2

教育统计教材中 , 比较重视如何控制 α型错误的问 题 , 对于如何计算和控制 β型错误并由此提高统计 [2 - 5 ] 检验力问题则较少介绍 。鉴于目前国外较为著 [6 - 9 ] 名的心理统计学教材 都重视统计检验力和效果 大小的估计原理与估计方法 , 文章拟以平均数差异 显著性检验为例 , 对实验数据进行假设检验后 , 继续 对其统计检验力和效果大小进行估计的基本原理和 方法进行介绍 。 2  统计检验力的含义与估计原理 对平均数进行差异显著性检验时 , 通常将检验 的虚无假设设为 H0 :μ =μ , 或 μ - μ = 0, 这是假 1 0 1 0 设 μ 与 μ 在统计学意义上 , 两个平均数之间实质 1 0 上是没有显著差异的 ; 而将虚无假设的反面设为 μ H1 :μ ≠ 0 , 这是假设 μ 与 μ 在统计学意义上 , 两 1 1 0 个平均数之间实质上是有显著差异的 。根据假设检 验的结果 , 无论是拒绝或者不拒绝虚无假设 , 都有可 能或者犯 α错误或者犯 β错误 。通常情况下 α和 β 不可能同时增大或减小 , α和 β的相互关系通常有 如表 1 和图 1 所示 。
表 1  假设检验的各种可能结果
H0 为真 H0 为假

接受 H0 正确决策 , 概率 = 1 - α =置信度 第二类错误 , 概率 =β

拒绝 H0 第一类错误 , 概率 = α =检验水平 正确决策 , 概率 = 1 - β =统计检验力

图 1 α和 β关系示意图 http://www.cnki.net

? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

第 1期

胡竹菁   平均数差异显著性检验统计检验力和效果大小的估计原理与方法

69

   当虚无假设是 H0 : μ =μ 时 , 虚无假设分布 1 0 ( null hypothesis distribution, NHD ) 是以零为中心的 正态分布 , 以对平均数的检验为例 , 所谓虚无假设分 布 , 就是指当虚无假设 H0 为真时 , X - μ 或 X1 - X2 0 的分布 。由于可以通过预先设定 α水平的方式来 控制当虚无假设为真时拒绝它可能会犯错误的概 率 。因此 , 在此基础上得到的虚无假设差异显著性 检验的 Z 统计量分布 (或 t 统计量分布 ) 在置信度 范围内也是以零为中心的分布 ( a central Z ( or t) distribution ) 。 由表 1 可知 , 当虚无假设 H0 为假 (备择假设 H1 为真 ) 时 , 接受 H0 就会犯 β型错误 ; 拒绝 H0 , 则是做 出了正确的决策 , 其概率等于 1 - β 换言之 , 当 H1 。 为真 , 即 μ 与 μ 确实有差异时 , μ 与 μ 的距离即 1 0 1 0 表示 μ 与 μ 的真实差异 , 以 1 - β的概率接受 H1 。 1 0 1 - β反映着正确辨认真实差异的能力 , 统计学中称 之为统计检验力 ( power of test) 或效力 。也可以把 统计检验力 1 - β定义为 :“ 在虚无假设 H0 为假 (备 择假设 H1 为真 ) 时 , 正确拒绝 H0 的概率 ” 。 如果想要知道犯 β型错误的概率是多少 , 就要 知道备择假设的分布情况 ( alternative hypothesis dis2 tribution, AHD ) , 以对平均数差异显著性的检验为 例 , 所谓备择假设分布 , 就是指当虚无假设 H0 为 假 , 而备择假设 H1 为真时 , X - μ 或 X1 - X2 的分 0 布 。遗憾的是 , 由于与虚无假设相对立的备择假设 μ H1 :μ ≠ 0 是虚无假设 H0 :μ =μ 的补集 , 两个平 1 1 0 均数之间不相等的值几乎是无限多的 , 因此 , 它们之 间的差值到底是多少是不确定的 。在理论上 , 备择 μ 假设 H1 :μ ≠ 0 的分布值是一个不是以零为中心的 1 分布 ( a noncentral Z ( or t) distribution ) , 它是以什么 值为中心也有着无数多个选择 , 因此 , 一般情况下 , 难以对 β值或 ( 1 - β) 值作出准确的估计 。 另一方面 , 从总体上说 , 对统计检验力的分析是 一个近似值的分析 , 因此可以假设备择假设分布 (AHD )是一种正态分布 , 在此基础上得到的备择假设 差异显著性检验的 Z 统计量分布 (或 t统计量分布 ) 也是正态分布 。如果能找到某种备择假设分布的集 中值 , 就能对 β或 ( 1 - β)值作出某种近似的估计。 虽然在一般情况下由于不知道备择假设分布是 怎样的而无法精确计算 β型错误的值 , 但在以进行 平均数差异检验为目的的抽样实验中总会得到一个 Z (或 t) 统计量 , 如果备择假设分布服从正态分布 , 那么就可以利用这个在一次性抽样中所得到的 Z 值来作为估计备择假设分布的中心点 , 以此作为该 次实验中备择假设分布的期望值 ( The expected Z value,或称为备择假设分布的平均值 ) , 通常用希腊 δ 表示备择假设分布的期望 Z 值 。并假定在 字母“ ”

备择假设的分布中 , 大于这个 Z 统计量的备择假设 的数量与小于这个 Z 统计量的备择假设的数量各 占 50 % , 由此来对可能犯 β型错误的概率进行近似 的估计 。 由于 δ 是表示某种特殊的备择假设分布的平均 Z 值 , 因此它的计算方法也与 Z 值的计算方法密切 关联 。由于在估计 δ 值时 , 一方面假定备择假设的 分布是正态分布 , 另一方面也用一次抽样中所获得 的假设检验的 Z 统计量来作为 δ , 因此 , 两个独立 值 样本平均数差异显著性检验的 δ 值的计算方法将以 下列公式 1 所示的计算 Z 统计量的公式为基础 。 ( X1 - X2 ) - (μ - μ ) 1 2 (公式 1 ) Z = 2 2 σ1 σ2 +
n1 n2

如前所述 , 在两个独立样本平均数差异显著性 检验中 ,δ 是表示某种特殊的备择假设分布的期望 Z 值 (在 t检验中就是期望 t值 ) , 而样本平均数 X 1 的期望值是 μ , 样本平均数 X 2 的期望值是 μ , 与此 1 2 相应 , 计算两个独立样本平均数差异显著性检验的 δ 值的公式有如下列公式 2 所示 。 μ -μ 1 2 δ= (公式 2 ) 2 σ1 σ2 2 +
n1 n2

例如 , 当对两个实验分组的实验数据进行平均 数差异显著性检验时 , 如果用公式 1 计算的平均数 差异显著性检验统计量为 Z = 3. 0, 那么就可以把 δ 的计算结 “Z = 3. 0 ” 视为是公式 2 所得到的“ 值 ” 果 , 并且把“ 所有可能的备择假设的分布 ” 假设为是 以 3. 0 为中心的正态分布 , 这时 , 这次抽样检验结果 Z = 3. 0 就被视为该次实验中备择假设分布的期望 值 , 这有如图 2 所示 。

δ 图 2   = 3. 0 时的 δ 值分布及统计检验力示意图

在 α = 0. 05 水平上进行双侧检验时 , 作出接受 或拒绝虚无假设的临界值是 Zα = 1. 96。以此为 2 分界点 , 通常的统计决策是 : 当实际得到的 Z 值小 于 1. 96 时 , 就认为没有充分理由拒绝虚无假设 , 这 时在虚无假设为假 , 备择假设为真时有可能犯“ 拒 真的 β型错误 ”其可能犯 β型错误的概率值有如 , 图 2 中阴影部分所示 ; 而当实际得到的 Z 值大于 1. 96, 就会拒绝虚无假设 , 这时在虚无假设为假时就作 出了正确的决策 , 由于在正态分布条件下与 α = 0. 05 相应的 Z 值是 1. 96, 因此 , 其正确拒绝虚无假设
http://www.cnki.net

? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

70

心理学探新

2010 年

的概率值有如图 2 中以 1196 为分界线所示的右边 部分的面积 , 它等于 ( 1 - β) 。由于做出决策的临界 值定为 1. 96, 它离备择假设分布的期望 Z 值 δ= 3. 0 约一个标准差 , 即 3. 0 - 1. 96 = 1. 04, 查正态分布表 可知 , 阴影部分的面积 (也就是犯 β型错误的概率 ) 约为 0. 15, 统计检验力 ( 1 - β) 则为 1 - 0. 15 = 0. 85。 3  两独立样本平均数差异显著性检验统计检验力 的估计方法 根据上述统计检验力的估计原理 , 可以通过以 下几个步骤来估计两个独立样本平均数差异显著性 检验统计检验力 1 - β的值 : 步骤 1:根据已知条件建立需要检验的假设 ; 步骤 2:用相应的公式计算 Z 统计量 ; 步骤 3: 确定做出统计决策的 α水平及相应的 临界值 ; 步骤 4: 计算实际得到的 Z 值与 α水平临界值 的差 ; 步骤 5: 根据 Z 值与 α水平临界值的差查正态 分布表 , 确定可能犯的 β型错误或统计检验力 1 - β 的概率 。 例如 , 有研究者在甲乙两校中分别抽取 100 名 16 岁的男生进行智商测查 , 测得甲乙两校该年龄组 男生总智商的平均分分别为 115 分和 110 分 。根据 常模 , 该年龄组男生总智商的标准差是 15 分 。那 么 , 求取甲乙两校 16 岁男生平均智商差异显著性检 验统计检验力的过程有如下述 。 解 :已知数据是 : n1 = 100, X1 = 115,σ1 = 15 n2 = 100, X2 = 111,σ2 = 15 H0 :μ =μ 1 2 步骤 1:建立假设 : μ H1 :μ ≠ 2 1 步骤 2:用公式 1 计算检验统计量 :
σ
2 1

Z=

( X1 - X2 ) - ( 1 - μ ) μ 2 n1

σ +

2 2

=

115 - 111
2

n2

15 15 + 100 100

2

=

4 = 1. 89 2. 12

步骤 3: 确定做出统计决策的 α水平并做出决 策 :在显著性水平 α = 0. 05 时 , 其临界值为 Zα = 2 1. 96, 由于 Z = 1. 89 < Zα = 1. 96, 因此 , 正常情况下 2 做出的决策是 :没有充分的把握推论差异不是由偶 然因素造成的 , 换言之 , 没有充分理由去拒绝虚无假 设而接受虚无假设 。由此推断两校男生的总智商没 有显著差异 , 其差异是由于偶然因素造成的 。 在一般情况下 , 假设检验的过程至此已经完成 。 但是 , 如果要知道假设检验结果的统计检验力是多 少 , 则还需要做以下的工作 。 步骤 4: 计算实际得到的 Z 值与 α水平临界值 的差 , 得到 1. 89 - 1. 96 = - 0. 07。

? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

步骤 5: 根据 Z 值与 α水平临界值的差查正态 分布表 , 确定可能犯的 β型错误或统计检验力 1 - β 的概率 :查正态分布表可知 , 从中心点为零到右边 0. 07 个标准差所占的面积是 0. 0279, 加上中心点左 边的 0. 50 的面积 , 共有曲线下面积 0. 50 + 0. 0279 = 0. 5279, 约等于 53 % (如图 3 所示 ) 。这就是本例 情况下估计出来的犯 β型错误的概率值 , 其拒绝错 误的虚无假设 , 接受正确备择假设的概率是 ( 1 β) , 这就是统计检验力 , 在本例中 , 它的值是 1 0153 = 0. 47。
图 3  本例中的备择假设分布图 (α = 0. 05 )

如果用 Zβ 来表示图 3 中“ 拒绝或接受虚无假 设” 分界点到该正态分布曲线中点的距离 , 那么前 述求取 β或 1 - β过程中的前 4 步也可以用下列公 式 3 计算 。
Zβ = ( X 1 - X 2 ) - (μ - μ ) 1 2

σ2 σ2 1 2 +
n1 n2

- Zα

(公式 3 )

由此得到的 Zβ = 0. 07 与前述步骤 1 至步骤 4 得到的结果是一样的 。 上述计算表明 , 根据本例中的数据对平均数差 异显著性进行检验后 , 得到的 Z 统计量是 Z = 1. 89, 当显著性水平为 α = 0. 05 时 , Z = 1. 89 < Zα = 1. 96, 2 因此 , 接受虚无假设 , 认为两个样本平均数之间没有 显著差异 , 作出这种决策的统计检验力约为 47 % 。 这种计算平均数差异显著性检验统计检验力的过程 只是评估方法之一 , 另外一种评估平均数差异显著 性检验统计检验力的方法是表格换算法 , 换算的根 据之一是效果大小 ( effect size ) d 值的评估值 。正因 为统计检验力 1 - β值与效果大小有着密切关联 , 因 此 , 著名统计学家 J. Cohen ( 1992 ) 把统计检验力 1 - β定义为 :“ 显著性检验的统计检验力是在给定总 体效果大小 ( effect size ) , 显著性水平 α和样本容量 [ 10 ] N 的条件下拒绝 H0 的概率 ” 。 4  两独立样本平均数差异显著性检验效果大小的 估计方法
http://www.cnki.net

在本例中 , 假设 u1 = u2 , 当显著性水平为 α = 0105 时 , Zα = 1. 96, 代入公式 3 可得 :
Zβ = ( X 1 - X 2 ) - (μ - μ ) 1 2

σ2 1
n1

σ2 2 +
n2

- Zα =

115 - 111
2

15 15 + 100 100

2

- 1. 96 = - 0. 07

- 1196 = 1. 89

第 1期

胡竹菁   平均数差异显著性检验统计检验力和效果大小的估计原理与方法

71

效果大小 ( effect size,有时也被译为效应大小或 效应值 )是反映统计检验效果大小或处理效应大小 的重要指标 ,它表示不同处理下的总体平均数之间 差异的大小 ,可以在不同研究之间进行比较 。考虑 到“ 效应 ” 一词在统计学中很多地方使用 , 如方差分 析中的主效应 ,各因子效应等 ,为了不使读者产生不 必要的混淆 ,用效果大小一词来表示“effect size ” 的 内涵 。效果大小反映了两个总体受某种事物的影响 后的差异程度 。平均数差异显著性检验的效果大小 一般用符号 d 表示 。 在两个独立样本的方差和样本容量都相等的条 件下 , 公式 2 可作如下推导 :
δ=
(μ - μ ) 1 2

要比女性要高 , 反映这种平均数的 d 值就可以这样 来解释 , d 值越大则更容易在实际生活中看到男性 比女性要高 , d 值越小则在实际生活中看到男性比 女性高的可能性就会小些 。换言之 , d 值更能说明 在实际生活中所关心的差异 , 而不是数据上的差异 显著问题 。 d 值能知道观测到的差异是不是事实上 的差异 。

σ +σ
2 1

2 2

=

(μ - μ ) 1 2

σ 2
n

2

=

(μ - μ ) 1 2

=

(μ - μ ) 1 2

=

2
n

σ2

σ

2
n

n (μ - μ ) 1 2 n

2

σ

, 由此可得 :
δ=
(μ - μ ) 1 2 n

令 则有 进而有

σ 2 (μ - μ ) 1 2 d= σ δ= d
n

(公式 4 ) (公式 5 ) (公式 6 )

2 =δ 2
n

d=

δ
n

(公式 7 )

图 4  作为效果大小函数的两总体重叠图

2

由公式 6 可知 , 在实际计算过程中 , δ 值是 d 值 与样本量除以 2 之后的算术平方根两部分的乘积 。 这表明 , 在其他条件不变的情况下 , d 值越大 , δ 值也 δ β也越大 , 因 会越大 , 而 值越大 , 则统计检验力 1 此 , d 值与统计检验力 1 - β之间存在正相关的关系 。 d 值与统计检验力 1 - β之间有着密切关系 , 但 也要注意这两者之间的区别 :统计检验力 1 - β受样 本容量影响较大 , 而 d 值则不受样本容量影响 。可 以通过上述公式 5 在不考虑样本容量的情况下来计 算某个心理研究中的 d 值 。我们也可以通过把 d 值 视为两个总体分布的重叠量的途径来理解效果大小 的内涵 。图 4 列出了四种 d 值在两个总体中的重叠 情形 。 图 4 表明 , 表示效果大小的 d 值越大 , 重叠程度 就越小 , 平均数差异显著性检验的效果就会越明显 ; d 值越小则相反 。也可以这样来理解 , 即不管你取 哪种样本 , d 值总是作为一种标准的平均数差异的 估计 , 它与当前样本无关 。显然 , 传统的推断统计量 2 Z、 F 或 χ 值及相应的概率值 p值只是说明平均数 t、 的差异如何 , 但这种差异脱离样本推广到不同的抽 样群体时 , 差异究竟有多大则需要用反映效果大小 的 d 值来描述 。比如说 , 一般情况下 , 男性平均身高

J. Cohen ( 1992 )认为 , d = 0. 2 视为是低效果 , d = 0. 5 视为是中等程度的效果大小 , d = 0. 8 视为是

? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

高效果 。 上述公式 5 就是求效果大小的具体方法 , 利用 这一公式 , 可以对前面求统计检验力的相应数据求 该研究的效果大小 d 值 。已知的条件是 : n1 = 100, X 1 = 115,σ1 = 15 n2 = 100, X 2 = 111,σ2 = 15 由于 σ1 =σ2 = 15, 因此可以利用公式 5 来计算 该研究的 d 值 , 将数据代入公式后得 : (μ - μ ) 115 - 111 1 2 d= = = 0. 27 σ 15 即该研究的效果大小是 d = 0. 27, 根据 J. Co2 hen 的观点 , 这属于较小程度的效果大小 。 5  影响平均数差异显著性检验统计检验力的其他 因素 前面论述了效果大小与统计检验力的相互关 系 , 即在其他条件不变的情况下 , 效果大小 d 值越 大 , 统计检验力 1 - β值也越大 。此外 , 统计检验力 α 1 - β还受“ 水平 ” 样本量的大小 ” 和“ 这两个因素 的影响 。 公式 6即 δ= d
n

2

表明 ,δ 值是 d 值和样本容量

http://www.cnki.net

72

心理学探新

2010 年

除 2后的算术平方根的乘积。这表明 , 样本容量也是 影响 δ 值的因素之一 ,样本容量越大 ,δ 值也越大。 α水平 ” 对于另外一个即“ 因素 , 需要作进一步 的说明 。正常情况下 , 当选择 α = 0. 05 的临界水平 时 , 在正态分布的情况下 , 其相应的 Z 值为 1. 96。 以此为分界点 , 通常的统计决策是 :当实际得到的 Z 值大于 1. 96 时就会拒绝虚无假设 ; 实际得到的 Z 值 小于 1. 96 时就会接受虚无假设 。例如 , 前面所举的 例子中的检验结果是 Z = 1. 89, 由于小于 Z (α = 0. 05 ) = 1196 的临界值 , 因此一般是接受虚无假设 , 认为甲 乙两校男生在总智商方面没有显著差异 。做出这种 决策在虚无假设为假时就有可能犯 β型错误 。如图 3 所示 , 犯 β型错误的概率约等于 53 % , 与此相应的 统计检验力的值就是 1 - 0. 53 = 0. 47。 如果做出决策时把 α水平从 α = 0. 05 改为 α = 0. 10 的水平进行双尾检验 (其接受或拒绝虚无假设 的临界点等同于在 α = 0. 05 水平下进行单尾检验 时的临界点 ) 情况会是怎样呢 ? 我们仍然用前面所举的例子为例 。通过前两个 求解步骤得到的检验统计量仍为 Z = 1. 89。 步骤 3: 确定做出统计决策的 α水平并做出决 策 :查正态分布表可知 , 在显著性水平 α = 0. 10 (双 侧 )时 , 其临界值为 Zα = 1. 645, 由于 Z = 1. 89 > Zα = 2 2 1. 645, 因此 , 正常情况下做出的决策是拒绝虚无假设 而接受备择假设 , 认为甲乙两校男生在总智商方面 , 甲校男生的总智商比乙校男生的总智商要更好。 步骤 4: 计算实际得到的 Z 值与 α水平临界值 的差 , 得到 1. 89 - 1. 645 = 0. 245。 步骤 5: 根据 Z 值与 α水平临界值的差查正态 分布表 , 确定可能犯的 β型错误或统计检验力 1 - β 的概率 :查正态分布表可知 , 查正态分布表可知 , 从 中心点为零到左边 0. 245 个标准差所占的面积是 0. 0968, 约等于 0. 10, 如图 5 所示 , 其阴影部分的概 率值为 0. 50 - 0. 10 = 0. 40。 与前述一样 , Z = 1189 的检验统计量作为估计 ) 备择假设分布的中心点 (或期望值 δ , 建构一个正 态分布 ( 1. 89 左右两边各占 50 % 的面积 ) , 以 Z = 11645 作为接受或拒绝假设的分界点 , 如果实际获 得的 Z 值小于 Z = 11645 (图 5 左边阴影部分 ) 就接 受虚无假设 , 这时如果虚无假设为假则犯 β型错误 的概率值约为 40 % ; 如果实际获得的 Z 值大于 Z = 11645 (图 5 右边部分 ) 就拒绝虚无假设 , 这时如果 虚无假设为假则是作出了正确的决策 , 其正确决策 的概率值是 ( 1 - β) = 1 - 0140 = 60 % 。

图 5  备择假设分布图 (α = 0. 10 双侧检验 )

? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

   需要特别强调的是 , 当用上述五个步骤的方法 或公式 3 来计算 β型错误率或统计检验力 1 - β时 , 一定要根据是接受还是拒绝虚无假设的假设检验结 果 , 来确定通过 Z 统计量与显著性水平临界值之差 查 Z 分布表后所得到的概率值的两种不同意义 。 意义 1:当根据平均数差异显著性检验结果接 受虚无假设 (如本文例子在 α = 0. 05 双侧检验时 ) , 在虚无假设是真时 , 这是正确决策 ; 在虚无假设是假 时 , 就做了错误的决策 , 犯错误的概率是 β 在本文 ; 例子中 , 检验结果得到的 Z 统计量即 Z = 1. 89 与显 著性水平 α = 0. 05 双侧检验的临界值 Zα = 1. 96 之 2 差为 0. 07, 查 Z 分布表可得对应于平均数到 0. 07 个标准差的面积是约 0. 03, 如图 3 所示 , 由于是接 受虚无假设 , 那么 , 临界值 Zα = 1. 96 左边阴影部分 2 的面积都属于接受域 , 图中 1. 89 是这次实验中备择 假设分布的期望值 , 该点两边各占 50 % 的面积 , 而 临界点 1. 98 这个值在中心点 1. 89 的右边 , 因此 , 阴 影部分的面积就应该是 0. 50 + 0. 03 = 0. 53, 如果虚 无假设是假 , 接受 它做 出错 误决 策的 概率为 β = 0153。 意义 2:当根据平均数差异显著性检验结果拒 绝虚无假设 (如本文例子在 α = 0. 10 双侧检验时 ) , 在虚无假设是真时 , 错误决策的概率是显著性水平 α 在虚无假设是假时 , 就做了正确的决策 , 正确决 ; 策的概率是 1 - β 。在本文例子中 , 检验结果得到的 Z 统计量即 Z = 1. 89 与显著性水平 α = 0. 10 双侧检 验的临界值 Zα = 1. 645 之差为 0. 245, 查 Z 分布表 2 可得对应于平均数到 0. 245 个标准差的面积是约 0. 10。如图 5 所示 , 与图 3 相似 , 临界值 Zα = 1. 645 2 这次实验中是备择假设分布的期望值期望值 , 该点 两边各占 50 %的面积 , 其左边阴影部分的面积属于 接受域 , 由于 1. 645 这个值在中心点 1189 的左边 , 因此 , 阴影部分接受域的面积就应该是 0. 50 - 0. 10 = 0. 40, 如果虚无假设是假 , 这时拒绝它所做出正确 决策的概率为 1 - β = 1 - 0. 40 = 0160。 统计检验力与 α水平的关系还可以通过下列 图 6 来进一步理解 。该图表明 , 对于任何的 δ , 以 值 及由横轴表示的相应于该 δ 的统计检验力的值 , 其 变化将是 α的函数 。例如 , 在 δ = 2. 6 的情况下 , 当 α = 0. 10 时 , 其统计检验力为 0. 83; 当 α水平降低 到 α = 0. 05 时 , 统计检验力也降低到 0. 74; 当 α水
http://www.cnki.net

第 1期

胡竹菁   平均数差异显著性检验统计检验力和效果大小的估计原理与方法

73

平进一步降低到 α = 0. 01 时 , 统计检验力就降低到 只有 0. 50 了 。 上述分析表明 , 统计检验力 1 - β与统计检验过 程中进行决策时的 α水平是有密切关联的 , 统计检 验力 1 - β的值随着 α值的减小而降低 。随着 δ值 的增大而增大 。

图 6  作为固定 δ 值的 α的函数的统计检验力示意图

犯 β型错误的概率进行近似的估计 。 统计检验力与效果大小具有密切的关系 。效果 大小 d 值是反映统计检验效果大小或处理效应大小 的重要指标 , 是指两个总体受某种事物的影响后的 差异程度 。它与显著性水平 α和样本容量 n 都是统 计检验力评估中的重要影响因素 。 总之 , 当检验结果是接受虚无假设时 , 人们更关 注犯 II型错误的概率 β值的大小 , 或其反面即统计 检验力 1 - β值的大小 , β值越小 (也即统计检验力 越大 ) , 那么犯纳伪的可能性越小 ; 当检验结果是拒 绝虚无假设时 , 人们更关注两个平均数之间的实际 差异即效果大小 d 值的大小 , d 值越大 , 反映实际 差异越大 。 参考文献
1  美国心理协会 . 美国心理协会写作手册 (第五版 ) . 陈玉 玲等译 . 重庆大学出版社 , 2008: 14 - 15 2  张厚粲 ,孟庆茂 ,冯伯麟 . 心理与教育统计学 . 北京 : 北京 师范大学出版社 , 1988. 3  张敏强 . 教育与心理统计学 (修订版 ). 北京 : 人民教育出

6    总 结

以平均数差异显著性检验为例介绍了假设检验后 估计统计检验力和效果大小的基本原理和估计方法。 估计统计检验力的基本原理是以对两种假设分 布的分析为基础 。 虚无假设分布是以零为中心的正态分布 , 由于 我们可以通过预先设定 α水平的方式来控制当虚 无假设为真时拒绝它可能会犯错误的概率 。因此 , 在此基础上得到的虚无假设差异显著性检验的 Z 分布 (或 t分布值 )在置信度范围内也是以零为中心 的分布 ( a central Z ( or t) distribution ) 。 由于两个平均数之间不相等的值几乎是无限多 μ 的 ,因此 ,备择假设 H1 :μ ≠ 0 的分布值是一个不是 1 以零为中心的分布 , 它以什么值为中心也有着无数 多个选择 , 因此 , 一般情况下是难以对 β或 ( 1 - β) 值作出准确的估计的 。当如果假设备择假设分布服 从正态分布 , 用在一次性抽样中所得到的 Z 值来作 为估计备择假设分布的中心点 , 以此作为该次实验 中备择假设分布的期望值 δ 并假定在备择假设的 , δ 分布中 , 大于 值的备择假设的数量与小于 δ值的 备择假设的数量各占 50 %时 , 就可以由此来对可能

版社 , 2002. 4  甘怡群 ,等 . 心理与行为科学统计 . 北京 : 北京大学出版 社 , 2005. 5  舒华 ,张亚旭著 . 心理学研究方法 . 北京 : 人民教育出版 社 , 2008.
6  Barry H. Cohen. Exp laining p sychological statistics 3 rd E2 . dition. New York University, 2008. 7  A rthur A ron, Elaine N. A ron. Statistics for p sychology 影 .

印版 . 北京 : 世界图书出版公司 , 2006. 8  David C. Howell Fundamental statistics for the behavioral . sdience. B rooks/Cole Publishing Company, 1999.
9   R ichard P. Runyon. Fundamentals of behavioral statistics . 北京 : 人民邮电出版社 , 2004. 10   Cohen J. A power p rim er Psychological Bulletin, 1992, . 112: 155 - 159.

The Pr in c iple and M ethod of Esti a tin g the Sta tistica l m Power and Effect S ize W hen M ake Z Test
Hu Zhujing

( School of Psychology, J iangxi Normal University, Nanchang 30022 )

Abstract: This paper taked an examp le of the statistical analysis of significant difference betw een mean values, after hypothesis testing the experim ental data, this paper briefly introducted the basic p rincip le and methods of estim ating the power of test and effect size. Key words: statistical analysis of significant difference betw een mean values; hypothesis testing; the power of test; effect size

? 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved.

http://www.cnki.net


相关文章:
《教育统计学》作业答案
意义:第一,各科标准分数的单位是绝对等价的;第二、标准分数的正负和大小可以反映出 考生在全体考分中所处的地位。 2、请说出平均数差异的显著性检验的基本原理。...
《教育统计学》作业答案
《教育统计学》作业答案_电大_成人教育_教育专区。...标准分数的正负和大小可以反映出 考生在全体考分中...2、请说出平均数差异的显著性检验的基本原理。 答:...
201401统计学A试题
下列有关回归分析中统计检验方法的正确表述有( )。...A.回归系数显著性检验采用 F 检验 B.回归方程显著...)6. 正如标准差可以说明平均数代表性大小一样,估计...
第二节 样本平均数与总体平均数差异显著性检验
第二节 样本平均数总体平均数差异显著性检验_教育学_高等教育_教育专区。生物统计学 课后自学课件第二节 样本平均数与总体平均数差异显著性检验在实际工作中我们...
生物统计附试验设计_复习题_FXT222194_1112
《生物统计附试验设计》复习题及答案一、名词解释 1...区间估计 3、正态分布 4、试验设计 5、样本标准误...2、进行多个平均数间的差异显著性检验。若仍采用 ...
统计学第五章课后题及答案解析
样本单位数总体方差 3.根据重复抽样的资料,一年级...() 7.估计区间的大小既取决于概率保证程度,又取决...其平均净重 251 克, 按规定显著性水平α =0.05,...
北师教育统计学作业答案
从自变量的一个取值去估计因变量的相应取值的完整...标准分数的正负 大小可以反映出考生在全体考分中...2、请说出平均数差异的显著性检验的基本原理。 答:...
统计学问答题
数据,平均数的代表性较差,此时 应考虑中位数或众数...答:在比较二组数据的差异程度时,由于方差和标准差...举例 2.说明区间估计的基本原理 答:总体参数的区间...
武汉理工大学网络学院统计学原理作业
武汉理工大学网络学院统计原理作业_理学_高等教育_教育专区。1. 显著性水平...若各群的规模大小差异很大时,适宜采用( )。 分值:2.0 (A) 比率估计法 (B)...
教育统计与测量网上综测答案
统计量| 小概率事件|小概率事件原理|显著性水平 11...一定概率去说明总体参数所在区间的可能性的估计方法。...进行平均数差异检验, t=3.42,查表,可知有显著差异...
更多相关标签:
平均数差异显著性检验 | 平均数显著性检验 | spss差异显著性检验 | 显著性差异检验 | 均值差异显著性检验 | matlab显著性差异检验 | 数据差异显著性检验 | t检验 显著性差异 |