当前位置:首页 >> 高中教育 >>

2012高考一轮复习理科课件变量间的相关关系与统计案例


考 点 串 串 讲 1.变量之间的两种关系 (1)函数关系 函数关系是确定性的关系,变量之间的关系可以用函数表示, 例如:圆的面积 S 与半径长 r 之间就是确定性关系,可以用函数 S =πr2 表示. (2)相关关系 相关关系是变量之间有一定的联系, 但不能完全用函数来表达, 例如,人的体重 y 与身高 x 有关.一般来说,身体越高体重越重, 但不能用一个函数来严格地表示身高

与体重之间的关系.

(3)相关关系与函数关系的异同点. 关系 函数关系 相关关系 异同点 两者均是指两个变 量 相同点 之间的关系 是一种确定性关系 是一种非确定性关系 ①一个为可控变量,另 是两个可控变量之 间 一个为随机变量; 的关系 不同点 ②两个都是随机变量 不一定是因果关系,也 是一种因果关系 可能是伴随关系 是一种理想关系模型 是更为一般的情况

2.散点图 (1)散点图定义 将样本中 n 个数据点(xi,yi)(i=1,2,?,n)描在平面直角坐标 系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点 图. (2)利用散点图可以判断变量之间有无相关关系 利用散点图可以作出如下判断: ①如果所有样本点都落在某一函数图象上,那么变量之间具有 函数关系,就用该函数来描述它们之间的关系. ②如果所有样本点都落在某一函数图象附近,那么变量之间具 有相关关系. ③如果所有样本点都落在某一直线附近,那么变量之间具有线 性相关关系.

(3)正相关、负相关 如果散点图中点散布的位置是从左下角到右上角的区域, 即一个 变量由小变大时,另一个变量的值也由小变大,这种相关称为正相 关.如年龄由小变大时(一定范围内),体内脂肪含量也在由小变大. 反之,如果散点图中点散布的位置是从左上角到右下角的区域, 即一个变量的值由小变大时,另一变量的值由大变小,这种相关称为 负相关. (4)散点图和回归直线的画法 ①建立直角坐标系,两轴的长度单位可以不一致. ②将 n 个数据点(xi,yi)(n=1,2,3, ?,n)描在平面直角坐标系中. ③描的点可以是实心点,也可以是空心点. ④画回归直线时,一定要画在多数点经过的区域,实际画线时, 先观察有哪两个点在直线上. ⑤具体作回归直线时,用一条透明的直尺边缘在这些点间移动, 使它尽量靠近或通过大多数点,然后画出直线.

3.线性回归直线 (1)线性回归方程、直线 一般地,设有(x,Y)的 n 对观察数据如下: x x1 x2 x3 ? xn Y y1 y 2 y3 ? y n 当 y=bx+a 使 Q=(y1-bx1-a)2+(y2-bx2-a)2+?+(yn-bxn ^ ^ ^ -a)2 取得最小值时,就称y =b x+a 为拟合这 n 对数据的线性回归 方程,将该方程所表示的直线称为回归直线.

?xiyi-n- - x y
^ 其中b=
i= 1

n

?x2-n-2 x i
i= 1

n

1n 1n ^ y ^x x ,a = --b -(-= ?xi,-= ?y i) y ni= 1 ni= 1

说明: ①用此法推导出的直线方程表示直线上各点与对应的散点 的坐标差的平方和最小,这种思想方法叫做最小二乘法,利用的是二 次函数的最值问题. ②由不具有线性相关关系的两个变量推出的回归方程没有意义.

(2)求回归直线方程的步骤 ①作出散点图,判断散点是否在一条直线附近; ^ ^ ②如果散点在一条直线附近,用公式求出a ,b ,并写出线性回 归方程. (3)回归直线方程的应用:研究变量间的相关关系,能帮助发现 事物发展的一些规律,为我们的判断和决策提供依据. ^ ^ (4)回归直线中一次项系数为b ,常系数为a ,这与一次函数习惯 表示不同.

(5)一般地,我们可以利用回归直线方程进行预测,但这里所得 的值是预报值,而不是精确值,它带有很大的随机性,可能对于某 一次实际值会有很大的出入,这是因为: ①线性回归方程中的截距和斜率都是通过样本估计出来的,存 在随机误差,这种误差可以导致预测结果的偏差. ②即使截距和斜率的估计没有误差,也不可能百分之百地保证 ^ 对应于 x 的预报值,y 能够与实际值 y 很接近,我们不能保证点(x, y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附 近. 尽管我们利用回归直线方程所得到的值仅是一个预报值,它具 有随机性,但它是我们根据统计规律所得到的结论,因而结论正确 的概率是最大. 故我们可以放心大胆地利用回归直线方程进行预测.

4.线性回归模型 (1)线性回归模型 y=a+bx+e 中 a 和 b 为模型的未知参数,e 称为随机误差. (2)随机误差产生的原因主要有 ①用线性回归模型近似真实模型(真实模型是客观存在的,通常 我们并不知道真实模型是什么)所引起的误差. ②忽略了某些因素的影响 ③观测误差

x y ? ?xi--??yi--?
i= 1

n

^ ^ ^ ^ ④在回归直线方程y =a +bx 中b= x ? ?xi--?2
i= 1 n

^ y , = -- a

1n 1n ^-其中-= ? xi, -= ?y i.(-, -)称为样本点的中心. bx x y x y ni= 1 ni= 1

5.线性回归与线性相关 (1)回归分析是对具有相关关系的两个变量进行统计分析的一 种常用方法. x y ? ?xi--??yi--?
i= 1 n

(2)相关系数 r= x y ? ?xi--? ? ?yi--?2
2 i= 1 i= 1 n n

(3)用 r 来描述线性相关关系的强弱. 当 r>0 时,两个变量正相关.当 r<0 时,两个变量负相关.当 |r|越接近 1 相关性越强,r 越接近 0 时,几乎不存在线性相关关系. 当|r|>0.75 时,认为两个变量有很强的线性相关关系.因而求 回归直线方程才有意义.

6.残差平方和残差分析 (1)总偏差平方和: ? (yi--)2 y
i= 1 n

^ (2)残差:数据点和它在回归直线上相应位置的差异(yi-y i)称e i ^ =yi-y i 为残差. ^ (3)残差平方和: ? (yi-y )2
i= 1 n



(4)回归平方和=总偏差平方和-残差平方和

^ ? ?yi-y?2
i= 1

n

(5)R2=1-

? ?yi- y ?2
i= 1

n

R2 取值越大,说明残差平方和越小.也就是模型的拟合效果越 好(即 R2 越接近于 1,回归效果越好) (6)通过残差e 1,e 2,?,e n 来判断模型拟合效果的分析工作称 为残差分析.
∧ ∧ ∧

7.线性回归分析的一般步骤 (1)从一组数据出发,求出两个变量的相关系数 r,确定二者之 间是否具有线性相关关系. ^ (2)如果具有线性相关关系, 求出回归方程y =bx+a.其中 a 是常 数项,b 是回归系数. (3)根据回归方程, 由一个变量的值预测或控制另一个变量的值.

8.非线性回归问题 两个变量不呈线性关系,不能直接利用线性回归方程建立两个 变量的关系. 可以通过变换的方法转化为线性回归模型. y=c1ec2. 如 我们可以通过对数变换把指数关系变为线性关系.令 z=lny,则变 换后样本点应该分布在直线 z=bx+a(a=lnc1,b=c2)的周围.

一般地,建立回归模型的基本步骤为: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报 变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间 的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系, 则选用线性回归方程 y=kx+a); (4)按一定规则估计回归方案中的参数(如最小平方法); (5)得出结果后分析残差是否有异常(个别数据对应残差过大, 或 残差呈现不随机的规律性等等), 若存在异常, 则检查数据是否有误, 或模型是否合适等.

9.独立性检验 (1)与列联表相关的概念 ①分类变量:变量的不同“值”表示个体所属的不同类型,这 样的变量称为分类变量. ②列联表:两个分类变量的数表,称为列联表. (2)检验 χ2 一般地,假设有两个分类变量 X 和 Y,它们的值域分别为{x1, x2}和{y1,y2},其 2×2 列联表为 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d n?ad-bc?2 随机变量 χ2= (其中 n=a+b+c+d), ?a+b??d+c??a+c??b+d? 来确定在多大程度上可以认为两个分类变量有关系.

①如果 k>10.828,就有 99.9%的把握认为“X 与 Y 有关系”; ②如果 k>7.879,就有 99.5%的把握认为“X 与 Y 有关系”; ③如果 k>6.635,就有 99%的把握认为“X 与 Y 有关系”; ④如果 k>5.024,就有 97.5%的把握认为“X 与 Y 有关系”; ⑤如果 k>3.841,就有 95%的把握认为“X 与 Y 有关系”; ⑥如果 k>2.706,就有 90%的把握认为“X 与 Y 有关系”; ⑦如果 k≤2.706, 就认为没有充分的证据显示“X 与 Y 有关系”. (3)要推断 X 与 Y 有关系,按下面的步骤进行 ①假设 H0:X 与 Y 没有关系 ②根据 2×2 列联表与公式计算 χ2 的值 ③查对临界值,作出判断

10.独立性检验的基本思想 利用随机变量 χ2 来确定在多大程度上可以认为两个分类变量有 关系的方法称为两个分类变量的独立性检验. 要确定两个分类变量有关系,这一结论成立的可信程度,首先 假设该结论不成立,即假设结论“两个分类变量没有关系”成立, 在该假设下用我们构造的随机变量 χ2 应该很小,如果由观测数据计 算得到的 χ2 的观测值 k 很大,则在一定程度上说明假设不合理,根 据随机变量 χ2 的含义,可以通过 P(χ2≥6.635)≈0.01 来评价假设不 合理的程度, 由实际算出 k>6.635 说明假设不合理的程度约为 99%, 即两个分类变量有关系这一结论成立的可信度为 99%.

假设检验与反证法对比表 反证法 要证明结论 A 在 A 不成立的前提下 进行推理 推出矛盾,意味着结 论 A 成立 没有找到矛盾,不能 对 A 下任何结论,即 反证法不成功

假设检验 假设 H1 在 H1 不成立的条件 下, H0 成立的条件 即 下进行推理 推出有利于 H1 成立 的小概率事件发生, 意味着 H1 成立的可 能性 推出有利于 H1 成立 的小概率事件不发 生,接受原假设

11.统计知识在实际中的应用 (1)小概率事件 “小概率事件”通常指发生的概率小于 5%的事件,因为对于 这类事件来说,在大量的平均重复试验中,平均每试验 20 次,才能 发生一次,所以认为在一次试验中该事件几乎是不可能发生的.这 种认识便是我们进行推断的出发点,这里需注意两点:一是这里的 “几乎不可能发生”是针对“一次试验”来说的,因为如果试验次 数多了,该事件当然是很可能发生的;二是当我们运用“小概率事 件几乎不可能发生的原理”进行推断时,我们也有 5%的犯错误的 可能, 所以说, 在概率意义上所作的推理与过去确定性数学中的“若 a 则 b”式的推理是有所不同的.

(2)假设检验思想的步骤 ①提出统计假设.假设具体问题服从正态分布 N(μ,σ2). ②确定一次试验中的取值 a 是否落入范围(μ-3σ,μ+3σ). ③作出推断.如果 a∈(μ-3σ,μ+3σ),接受统计假设;如果 a?(μ-3σ,μ+3σ),由于这是小概率事件,就拒绝统计假设. 上面这种拒绝统计假设的推理,与我们学过的反证法有其类似 之处.事实上,用反证法证明一个问题时,先否定待证命题的结论 ——这本身可看成一个新的命题,当从它出发进行推理时,如果出 现了矛盾,就把这个矛盾归因于前述新命题的不正确,从而将它否 定.否定了这个新命题也就等于证明了原命题的结论.

典 例 对 对 碰 题型一 对相关关系的理解 例 1 下列关系中,具有相关关系的是________. ①正方形的边长与面积之间的关系; ②水稻产量与施肥量之间的关系; ③人的身高与年龄之间的关系; ④降雪量与交通事故的发生率之间的关系.

解析 两变量之间的关系有两种:函数关系与带有随机性的相 关关系. ①正方形的边长与面积之间的关系是函数关系. ②水稻产量与施肥量之间不是严格的函数关系,但是具有相关 性,因而是相关关系. ③人的身高与年龄之间的关系既不是函数关系,也不是相关关 系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他 们不具有相关关系. ④降雪量与交通事故的发生率之间具有相关关系. 答案 ②④ 点评 准确理解变量间的相关关系是解答本题的关键.事实 上,现实生活中相关关系是到处存在的,从某种意义上讲,函数关 系可以看作是一种理想的关系模型,而相关关系是一种普遍的关 系.两者区别的关键是“确定性”和“随机性”.

变式迁移 1 有五组变量: ①汽车的重量和汽车每消耗 1 升汽油所行驶的平均路程; ②平均日学习时间和平均学习成绩; ③某人每日吸烟量和其身体健康情况; ④正方形的边长和面积; ⑤汽车的重量和每公里耗油量. 其中两个变量成正相关的是( ) A.①③ B.②④ C.②⑤ D.④⑤

答案 C 解析 由正相关与负相关的概念可知②⑤是正相关, ①③为负 相关,④为函数关系,故选 C.

题型二 利用散点图判断相关关系 例2 5 个学生的数学和物理成绩如下表: 学生 A B C D E 学科 80 75 70 65 60 数学 70 66 68 64 62 物理 画出散点图,并判断它们是否有相关关系. 分析 涉及两个变量:数学成绩与物理成绩,可以以数学成绩 为自变量,考查因变量物理成绩的变化趋势.

解析 以 x 轴表示数学成绩,y 轴表示物理成绩,可得相应的 散点图如图所示:

由散点图可见,两者之间具有相关关系. 点评 判断变量之间有无相关关系,一种常用的简便可行的方 法就是绘制散点图.

变式迁移 2 对变量 x,y 有观测数据(xi,yi)(i=1,2,?,10),得散点图(1); 对变量 u,v 有观测数据(ui,vi)(i=1,2,?,10),得散点图(2).由 这两个散点图可以判断( )

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关

答案 C 解析 本题考查相关关系的正相关和负相关.夹在带状区域内 的点,总体呈上升趋势的属于正相关,总体呈下降趋势的属于负相 关.由这两个散点图可以判断,变量 x 与 y 负相关,u 与 v 正相关, 选 C.

题型三 线性回归方程的求法 例 3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记 录的产量 x(吨)与相应的生产能耗 Y(吨标准煤)的几组对照数据 x 3 4 5 6 Y 2.5 3 4 4.5 (1)请画出上表数据的散点图; ^ (2)请根据上表提供的数据,求出 Y 关于 x 的线性回归方程y = bx+a; (3)已知该厂技术改造前 100 吨甲产品能耗为 90 吨标准煤, 试根 据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技 术改造前降低多少吨标准煤?(3×2.5+4×3+5×4+6×4.5=66.5)

分析 (1)本题若没有告诉我们 y 与 x 间是呈线性相关的,应首 先进行相关性检验.如果本身两个变量不具备线性相关关系,或者 说它们之间相关关系不显著时,即使求出回归直线方程也是没有意 义的,而且其估计与预测也是不可信的.
n 2 (2)求回归直线方程的步骤:①计算出 -、-、 xi 、 xiyi 的值; x y i= 1 i= 1

?

n

?

^ ^ ^ ②计算回归系数a 、b;③写出回归直线方程y =bx+a.

解析

(1)如图所示:

-=4.5,y =3.5, = 66.5-4×4.5×3.5= - ^ (2)由系数公式可知,x b 86-4×4.52 66.5-63 =0.7, 5 ^=3.5-0.7×4.5=0.35,所以线性回归方程为y =0.7x+0.35. ^ a ^ (3)当 x=100 时,y =0.7x+0.35=70.35,90-70.35=19.65,所 以预测生产 100 吨甲产品的生产能耗比技术改造前降低 19.65 吨标 准煤.

变式迁移 3 高三(1)班学生每周用于数学学习的时间 x(单位:h)与数学成绩 y(单位:分)之间有如下对应数据: x 24 15 23 19 16 11 20 16 17 13 Y 92 79 97 89 64 47 83 68 71 59 某同学每周用于数学学习的时间为 18 小时, 试预测该生的数学 成绩.

解析

先求得b≈3.53,a≈13.44.
∧ ∧





因此回归直线方程为y =3.53x+13.44. 当 x=18 时,y =3.53×18+13.44≈77. 所以预测该生数学成绩在 77 分左右.

题型四 回归直线方程的特征 例 4 为了考察两个变量 x 和 y 之间的线性相关性,甲、乙两位 同学各自独立做了 10 次和 15 次试验,并且利用线性回归方法,求 得回归直线分别为 l1、l2,已知两人所得的试验数据中,变量 x 和 y 的数据的平均值都相等,且分别都是 s、t,那么下列说法正确的是 ( ) A.直线 l1 和 l2 一定有公共点(s,t) B.直线 l1 和 l2 相交,但交点不一定是(s,t) C.必有 l1∥l2 D.l1 与 l2 必定重合

^ ^ ^ a y ^x ^ 解析 线性回归直线方程为y =b x+a .而 ^= - -b- ,即a =t ^ ^ ^ -bs,t=b s+a .∴(s,t)在回归直线上.∴直线 l1 和 l2 一定有公共点 (s,t). 答案 A 点评 考查线性回归直线方程及方程中系数的求法.

变式迁移 4 已知 x 与 Y 之间的几组数据如下表: x 0 1 2 3 Y 1 3 5 7 ^ ^ ^ 则 Y 对于 x 的线性回归方程y =b x+a 必过( A.点(2,2) B.点(1.5,0) C.点(1,2) D.点(1.5,4)

)

答案

D

^ ^ ^ 解析 回归方程y =bx+a 必过(-,-),检验即可. x y

题型五 回归方程的应用 例 5 下表是几个国家近年来的男性与女性的平均寿命情况(单 位:岁). (1)如果男性与女性的平均寿命近似成线性关系,求它们之间的 回归直线方程; (2)科学家预测,到 2075 年,加拿大男性平均寿命为 87 岁,现 请你预测,到 2075 年,加拿大女性的平均寿命(精确到 0.1 岁). 男性平均 女性平均 调查 国家 寿命(x) 寿命(y) 年号 70 73 2000 中国 73.4 80.4 2002 韩国 71 75.5 2003 马来西亚 78.1 82.6 2005 美国 75.5 82 2001 法国 78.6 85.6 2004 日本

解析 i 1 2 3 4 5 6 xi 70 73.4 71 78.1 75.5 78.6 yi 73 80.4 75.5 82.6 82 85.6 xiyi 5110 5901.36 5360.5 6451.06 6191 6728.16 可得 ?xiyi=35742.08
i= 1 6

?x2=33306.38,-≈74.43, x i
i= 1

6

-=79.85,-2≈5539.82 y x

^ (1)设所求回归直线的方程为y =bx+a,

?xiyi-6- - x y
i= 1

6

^ 则b =

?x2-6-2 x i
i= 1

6

82.667 ^ y ^x = ≈1.23,a = --b -≈-11.7 67.46 ^ ∴所求回归直线方程为y =1.23x-11.7 ^ (2)当 x=87 时,y =1.23×87-11.7=95.31≈95.3 ∴可预测,到 2075 年,加拿大女性的平均寿命为 95.3 岁. 点评 利用回归直线方程对总体进行估计时,需先求出回归直 线方程,然后代入回归直线方程得到估计值.

变式迁移 5 某农科所对冬季昼夜温差大小与其反季节大豆新品种发芽多少 之间的关系进行了分析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 颗种子中的发芽数,得到如 下资料: 12 月 12 月 12 月 12 月 12 月 1日 2日 3日 4日 5日 10 11 13 12 8 温差 x(℃) 25 30 26 16 发芽数 Y(颗) 23 该农科所确定的研究方案是:先从这五组数据中选取 2 组,用 剩下的 3 组数据求回归直线方程, 再对被选取的 2 组数据进行检验. 日期

(1)求选取的 2 组数据恰好是不相邻 2 天数据的概率; (2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 ^ ^ ^ 2 日至 12 月 4 日的数据,求出 Y 关于 x 的回归直线方程y =b x+a ; (3)若由回归直线方程得到的估计数据与所选出的检验数据的误 差均不超过 2 颗,则认为得到的回归直线方程是可靠的,试问(2)中 所得的回归直线方程是否可靠?

解析 (1)设选取的不相邻 2 天数据为事件 A,因为从 5 组数据 中选取 2 组数据共有 10 种情况,每种情况都是等可能出现的,其 中 2 组数据恰好是选取相邻 2 天数据的情况有 4 种, 4 3 所以 P(A)=1- = . 10 5 3 所以选取的 2 组数据恰好是不相邻 2 天数据的概率是 . 5 - ^ (2)由所给数据, 可求得-=12,y =27, x 由系数公式, 求得b= 5 ^ - - ,a = y -b x =-3. 2 ^ 5 所以 y 关于 x 的回归直线方程为y = x-3. 2

^ 5 (3)当 x=10 时,y = ×10-3=22,|22-23|<2; 2 ^ 5 同理,当 x=8 时,y = ×8-3=17,|17-16|<2. 2 所以该农科所得到的回归直线方程是可靠的.

题型六 利用 χ2 判断相关关系 例 6 调查某医院某段时间内婴儿出生的时间与性别的关系,得 到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有 关系. 出生时间 晚上 白天 合计 性别 24 31 55 男婴 8 26 34 女婴 32 57 89 合计

89×?24×26-8×31?2 解析 由公式 χ2= 55×34×32×57 ≈3.68892>2.706. 故有 90%的把握认为婴儿的性别与出生时间是有关的. 点评 计算出的统计量 χ2 的值要与临界值 2.706 作比较,从而 得到答案,要特别注意最后结论的不同说法.

变式迁移 6 为了探究患慢性气管炎是否与吸烟有关,调查了 339 名 50 岁 以上的人,调查结果如下表所示: 患慢性 未患慢性 合计 气管炎 气管炎 43 162 205 吸烟 13 121 134 不吸烟 56 283 339 合计 试问:50 岁以上的人患慢性气管炎与吸烟习惯有关吗?

339×?43×121-162×13? 2 解析 由公式 χ2= 205×134×56×283 =7.469,因为 7.469>6.635, 所以我们有 99%的把握说: 岁以上的人患慢性气管炎与吸烟 50 习惯有关.

题型七 独立性检验的应用 例 7 某企业有两个分厂生产某种零件,按规定内径尺寸(单位: mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件 中各抽出了 500 件,量其内径尺寸,得结果如下表: 甲厂: [29.86, [29.90, [29.94, [29.98, [30.02, [30.06, [30.10, 分组 29.90) 29.94) 29.98) 30.02) 30.06) 30.10) 30.14) 12 63 86 182 92 61 4 频数 乙厂: [29.86, [29.90, [29.94, [29.98, [30.02, [30.06, [30.10,3 分组 29.90) 29.94) 29.98) 30.02) 30.06) 30.10) 0.14) 29 71 85 159 76 62 18 频数

(1)试分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填下面 2×2 列联表,并问是否有 99%的把 握认为“两个分厂生产的零件的质量有差异”. 甲厂 乙厂 合计 优质品 非优质品 合计 n?ad-bc?2 附:χ2= , ?a+b??a+c??c+d??b+d? P(χ2≥k) 0.05 0.01 k 3.841 6.635

(1)甲厂抽查的零件中有 360 件优质品, 从而甲厂生产的 360 零件的优质品率估计为 =72%; 500 乙厂抽查的零件中有 320 件优质品,从而乙厂生产的零件的优 320 质品率估计为 =64%. 500 (2) 甲厂 乙厂 合计 360 320 680 优质品 非优质品 140 180 320 500 500 1000 合计 1000×?360×180-320×140? 2 χ2= ≈7.35>6.635,所以有 99% 500×500×680×320 的把握认为“两个分厂生产的零件的质量有差异”.

解析

变式迁移 7 某研究机构为了研究人的脚的大小与身高之间的关系,随机抽 测了 20 人,得到如下数据: 1 2 3 4 5 6 7 8 9 10 序号 身高 192 164 172 177 176 159 171 166 182 166 x(厘米) 脚长 48 38 40 43 44 37 40 39 46 39 y(码) 11 12 13 14 15 16 17 18 19 20 序号 身高 169 178 167 174 168 179 165 170 162 170 x(厘米) 脚长 43 41 40 43 40 44 38 42 39 41 y(码)

(1)若“身高大于 175 厘米”的为“高个”,“身高小于等于 175 厘米”的为“非高个”;“脚长大于 42 码”的为“大脚”,“脚长 小于等于 42 码”的为“非大脚”. 请根据上表数据完成下面的 2×2 列联表: 高个 非高个 合计 大脚 12 非大脚 20 合计 (2)根据题(1)中表数据,若按 99%的可靠性要求,能否认为脚的 大小与身高之间有关系? (3)若按下面的方法从这 20 人中抽取 1 人来核查测量数据的误差. 将一个标有数字 1,2,3,4,5,6 的正六面体骰子连续投掷两次,记朝 上的两个数字的乘积为被抽取人的序号,试求:①抽到 12 号的概率; ②抽取“无效序号(超过 20 号)”的概率.

解析

(1)表格为:

高个 非高个 合计 5 2 7 大脚 1 12 13 非大脚 6 14 20 合计 (2)提出假设 H0:人的脚的大小与身高之间没有关系, 20×?5×12-1×2? 2 根据上述列联表可以求得 χ2= ≈8.802. 6×14×7×13 当 H0 成立时,2>7.879 的概率约为 0.005, χ 而这里 8.802>7.879, 所以我们有 99.5%的把握认为人的脚的大小与身高之间有关系. 4 1 (3)①抽到 12 号的概率为 P1= = ; 36 9 6 1 ②抽到“无效序号(超过 20 号)”的概率为 P2= = . 36 6

方 法 路 路 通 1.利用散点图只能大概判断变量之间有无相关关系,需要准确判 断时,必须计算出相关系数后判断. 2.若要推断的论述为 H1:“X 与 Y 有关系”,可以按如下步骤 判断结论 H1 成立的可能性: (1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量 是否有关系,但是这种判断无法精确地给出结论的可靠程度. ①在三维柱形图中, 主对角线上两个柱形高度的乘积 ad 与副对角 线上的两个柱形高度的乘积 bc 相差越大,H1 成立的可能性就越大. ②在二维条形图中,可以估计满足条件,X=x1 的个体中具有 Y= a y1 的个体所占的比例 , 也可以估计满足条件 X=x2 的个体中具有 Y a+b c =y1 的个体所占的比例 ,两个比例的值相差越大,H1 成立的可能 c+b 性就越大.

(2)可以利用独立性检验来考查两个分类变量是否有关系,并且 能较为准确地给出这种判断的可靠程度,具体做法是: n?ad-bc?2 根据观测数据计算由公式 χ2= 所给出 ?a+b??a+c??b+d??c+d? 的检验随机变量 χ2 的观测值 k,并且 k 的值越大,说明“X 与 Y 有 关系”成立的可能性越大.

3.回归分析是对具有相关关系的两个变量进行统计分析的方 法.两个变量具有相关关系是回归分析的前提. 有时散点图中的各点并不集中在一条直线的附近,仍可以按照 求回归直线方程的步骤求得回归直线方程.显然这种情形下求得的 回归直线方程没有实际意义. 所以求回归直线方程时应画出散点图, 判断是否具有线性相关关系. 4.求回归直线方程的步骤:
n 2 (1)计算出-、-、 x i 、 xiyi 的值; x y i= 1 i= 1

?

n

?

^ ^ (2)计算回归系数a 、b ; ^ ^ ^ (3)写出回归直线方程y =b x+a .

5.回归直线方程的应用: (1)描述两变量之间的依存关系;利用回归直线方程即可描述两 个变量间依存的数量关系. (2)利用回归方程进行预测:把自变量 x 代入回归方程对因变量 进行估计,即可对个体值进行估计. 6.k 是 χ2 的观测值,或者说 χ2 是一个随机变量,它在 a、b、c、 d 取不同的值时,χ2 可能不同,而 k 是取定一组数 a、b、c、d 后的 一个确定的值. 7.求线性回归方程之前应对数据进行线性相关分析,线性回归 问题思路一般不是很复杂,比较容易掌握,但运算量较大,需要计 算时仔细准确.

正 误 题 题 辨 例在 10 年期间,一城市居民的年收入与某种商品的销售额之间 的关系有如下数据:
1 2 3 4 5 6 7 8 9 10 第n年 城市居民 年收入 x 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0 (亿元) 某商品销 售额 Y 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 (万元)

求 Y 对 x 的回归直线方程. 点击 在求回归直线方程前应进行相关性检验,可以用散点图 进行直观验证,也可用相关系数进行检验,只有检验确认后,求出 的直线方程才有意义.

正解

10 10 2 2 -=37.97,y =39.1, x i =14663.67, y i =15857, x - x i= 1 i= 1 i= 1

?

10

?

?

i yi=15202.9.

? xiyi-10- - x y
i= 1

10

r=
10 2 2 ? xi -10- ?? y2-10- 2? x y i i= 1 i= 1

?

10

?



15202.9-10×37.97×39.1

?14663.67-10×37.972??15857-10×39.12? ≈0.952.

由 r>0.75 知,变量 y 与 x 之间具有线性相关关系, 即求回归直 线是有意义的.

?xiyi-10- - x y
i= 1

10

^= b

?x2-10-2 x i
i= 1

10

15202.9-10×37.97×39.1 = 14663.67-10×37.972

356.63 ≈1.447, 246.461 ^=--b -=39.1-1.447×37.97≈-15.843, a y ^x ^ 因此,所求的回归直线方程是y =1.447x-15.843. =


相关文章:
高三总复习变量间的相关关系、统计案例1
东北师大附中 2012-2013 高三数学(文理)第一轮复习导学案 056A 变量间的相关关系统计案例(学案)A 一、知识梳理:(必修 3 教材 84-93) 1.散点图:表示具有...
2016届高三数学一轮复习(知识点归纳与总结):变量间的相关关系与统计案例
2016届高三数学一轮复习(知识点归纳与总结):变量间的相关关系与统计案例_数学_...分析方法,三种题型都有可能出 现, 难度中档, 如 2012 年湖南 T4, 辽宁 T19...
2013高考数学(理)一轮复习教案:第十篇_统计、统计案例第3讲_变量间的相关关系与统计案例
2012大纲全国卷高考数学(文... 2012高考新课标理科数学... 2012高考全国卷...(理)一轮复习教案:第十篇_统计、统计案例第3讲_变量间的相关关系与统计案例...
2015高三数学一轮复习063变量间的相关关系与统计案例
2015高三数学一轮复习063变量间的相关关系与统计案例...(2012· 湖南)设某大学的女生体重 y(单位:kg)与...23×27×20×30 2 理科 男女 13 7 文科 10 20...
金版教程2012高考复习考点测试61变量间的相关关系与统计案例
搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS ...考点测试61变量间的相关关系与统计案例_高三数学_...2012高考一轮复习理科课... 62页 1下载券 2012届...
高三复习第三讲变量间的相关关系与统计案例
高三复习第三讲变量间的相关关系与统计案例_高三数学...[2012· 课标全国高考]在一组样本数据(x1,y1) ,...理科 文科 合计 13 10 23 男 7 20 27 女 20 ...
2015高考理科数学《变量间的相关关系、统计案例》练习题
搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS ...2015高考理科数学《变量间的相关关系统计案例》练习....1 8.8 2010 13 9.8 2011 13.3 10 2012 15 ...
2014高考数学一轮复习双基训练解析版:变量间的相关关系与统计案例
2012高考新课标理科数学... 2012高考全国卷(新...2014高考数学一轮复习双基训练解析版:变量间的相关关系...变量间的相关关系与统计案例变量间的相关关系与统计...
《三维设计》2016级数学一轮复习基础讲解变量间的相关关系统计案例
《三维设计》2016级数学一轮复习基础讲解变量间的相关关系统计案例_数学_高中教育_教育专区。《三维设计》2014 届高考数学一轮复习教学案+复习技法 变量间的相关关系...
更多相关标签: