当前位置:首页 >> 高三数学 >>

2015-2016学年高二数学人教A版选修1-2学案:1.2 独立性检验的基本思想及其初步应用_图文

1.2 独立性检验的基本思想及其初步应用 1、理解教材新知 独立性检验的有关概念 [导入新知] 1.分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. 2.2×2 列联表 假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表 (也称 2×2 列联表)为: y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 3.等高条形图 将列联表中的数据用高度相同的两个条形图表示出来, 其中两列的数据分别对应不同的 颜色,这就是等高条形图. 4.K2 统计量 为 了 使 不 同 样 本 容 量 的 数 据 有 统 一 的 评 判 标 准 , 我 们 构 造 一 个 随 机 变 量 K2 = n?ad-bc?2 ,其中 n=a+b+c+d 为样本容量. ?a+b??c+d??a+c??b+d? 5.独立性检验 利用随机变量 K2 来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为 两个分类变量独立性检验. [化解疑难] 反证法原理与独立性检验原理的比较 反证法原理——在假设 H0 下,如果推出一个矛盾,就证明了 H0 不成立. 独立性检验原理——在假设 H0 下,如果出现一个与 H0 相矛盾的小概率事件,就推断 H0 不成立,且该推断犯错误的概率不超过小概率. 独立性检验的步骤 1 [导入新知] 独立性检验的具体做法 (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 α, 然 后查下表确定临界值 k0. P(K2≥k0) k0 P(K2≥k0) k0 0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.828 n?ad-bc?2 (2)利用公式 K = ,计算随机变量 K2 的观测值 k. ?a+b??c+d??a+c??b+d? 2 (3)如果 k≥k0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 α;否则,就 认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关系”, 或者在样本数据中没有 发现足够证据支持结论“X 与 Y 有关系”. [化解疑难] 详析独立性检验 (1)通过列联表或观察等高条形图判断两个分类变量之间有关系,属于直观判断,不足 之处是不能给出推断“两个分类变量有关系”犯错误的概率, 而独立性检验可以弥补这个不 足. (2)列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立 性检验的方法确认所得结论在多大程度上适用于总体. 列联表和等高条形图的应用 [例 1] 某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学 生 426 人中有 332 人在考前心情紧张, 性格外向的学生 594 人中有 213 人在考前心情紧张. 作 出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系. [解] 作列联表如下: 性格内向 考前心情紧张 332 2 性格外向 213 总计 545 考前心情不紧张 总计 94 426 381 594 475 1 020 相应的等高条形图如图所示: 图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例. 从图中可以看出 考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高, 可以认 为考前紧张与性格类型有关. [类题通法] 细解等高条形图 (1)绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形 图的高度是相同的;两列的数据对应不同的颜色. (2)等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色 a c 区域的高度,如果两个高度相差比较明显?即a+b和c+d相差很大?,就判断两个分类变量之 ? ? 间有关系. [活学活用] 为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下: 父母吸烟 子女吸烟 子女不吸烟 总计 237 678 915 父母不吸烟 83 522 605 总计 320 1 200 1 520 利用等高条形图判断父母吸烟对子女吸烟是否有影响? 解:等高条形图如下: 由图形观察可以看出子女吸烟者中父母吸烟的比例要比子女不吸烟者中父母吸烟的比 3 例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”. 独立性检验的原理 [例 2] 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的 数据: 患心脏病 每晚都打鼾 不打鼾 总计 30 24 54 未患心脏病 224 1 355 1 579 总计 254 1 379 1 633 根据列联表的独立性检验,能否在犯错误的概率不超过 0.001 的前提下认为每晚都打鼾 与患心脏病有关系? [解] 由列联表中的数据,得 K2 的观测值为 1 633×?30×1 355-224×24?2 k= 254×1 379×54×1 579 ≈68.033>10.828. 因此,在犯错误的概率不超过 0.001 的前提下,认为每晚都打鼾与患心脏病有关系. [类题通法] 解决独立性检验问题的思路 解决一般的独立性检验问题,首先由题目所给的 2×2 列联表确定 a,b,c,d,n 的值, 然后代入随机变量 K2 的计算公式求出观测值 k,将 k 与临界值 k0 进行对比,确定有多大的 把握认为“两个分类变量有关系”. [活学活用] 某生产线上,质量监督员甲在生产现场时,990 件产品中有合格品 982 件,次品 8 件; 不在生产现场时,510 件产品中有合格品 493 件,次品 17 件.能否在犯错误的概率不超过 0.001 的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系? 解:根

更多相关标签: