当前位置:首页 >> 政史地 >>

第九章 第三节 变量间的相关关系与统计案例


第 九 章
统 计、 统 计 案 例、 算 法 初 步

第 三节
变量 间的 相关 关系 与统 计案 例

高考成功方案第一步

高考成功方案第二步

高考成功方案第三步

高考成功方案第四步

考纲点击 1.会作两个相关变量的数据的

散点图,会利用散点图认 识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的回归直线方程 系数公式建立回归直线方程.

返回

返回

1.下列关系中,是相关关系的为 ①学生的学习态度与学习成绩之间的关系;

(

)

②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系;

④家庭的经济条件与学生的学习成绩之间的关系.
A.①② C.②③ B.①③ D.②④

返回

解析: ①中学生的学习态度与学习成绩之间不是因果 关系,但具有相关性是相关关系.②教师的执教水平与

学生的学习成绩之间的关系是相关关系.③④都不具备
相关关系. 答案:A

返回

2.设有一个回归直线方程为=3-5x,变量x增加一个 单位时 ( )

A.y平均增加3个单位
B.y平均减少5个单位 C.y平均增加5个单位 D.y平均减少3个单位 解析:-5是斜率的估计值,说明x每增加一个单位

时,y平均减少5个单位. 答案:B

返回

3.对变量x、y有观测数据(xi,yi)(i=1,2,?,10),

得散点图1;对u、v有观测数据(ui,vi)(i=
1,2,?,10),得散点图2.由这两个散点图可以 判断 ( )

返回

A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关

C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v 负相关

返回

解析:由图1可知,各点整体呈递减趋势,x与y负相关,

由图2可知,各点整体呈递增趋势,u与v正相关.
答案:C

返回

4.关于分类变量X与Y的随机变量K2的观测值k,有下列 说法

①k越大,“X与Y有关系”的可信程度越小
②k越小,“X与Y有关系”的可信程度越小 ③k越接近于0,“X与Y无关”的可信程度越小 ④k越大,“X与Y无关”的可信程度越大. 其中正确的有________.

答案:②

返回

5.已知x、y的取值如下表: x y 0 2.2 1 4.3 3 4.8 4 6.7

^ 从所得的散点图分析,y 与 x 线性相关,且y =0.95x +a,则 a=________ 解析:因为 - =2, - =4.5,将(2,4.5)代入 ^ =0.95x+a可 x y y

得a=2.6.

答案:2.6

返回

1.两个变量的线性相关 (1)正相关: 在散点图中,点散布在从 左下角 到右上角 的区域,对于

两个变量的这种相关关系,我们将它称为正相关.

返回

(2)负相关:

在散点图中,点散布在从 左上角 到右下角 的区域,两
个变量的这种相关关系称为负相关. (3)线性相关关系、回归直线: 如果散点图中点的分布从整体上看大致在 一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做 回归直线.

返回

2.回归方程 (1)最小二乘法: 求回归直线使得样本数据的点到它的距离的平方和最小 的方法叫做最小二乘法.

返回

(2)回归方程: ^ 方程 ^ =b x+a 是两个具有线性相关关系的变量的一组数 y ^ ^ ^ 据(x1,y1),(x2,y2),?,(xn,yn)的回归方程,其中a ,b 是 待定参数.
? n n ? x y x y ? ?xi--??yi--? ?xiyi-n-- ? i= 1 i= 1 ? b = , ?^= n n ? 2 x x ? ? ?xi--? ?xi2-n-2 i= 1 i= 1 ? ? ?^=--b - ?a y ^ x

返回

3.残差分析 (1)残差:对于样本点(x1,y1),(x2,y2),?,(xn,yn),它们 的随机误差为ei=yi-bxi-a,i=1,2,?,n,其估计值为 ^ i=yi- ^ i=yi- ^ xi- ^ ,i=1,2,?,n, ^ i称为相应于点 e y b a e (xi,yi)的残差.

返回

^ ?yi-y i?2 ?
i=1

n

(2)相关指数R2=1- y ? ?yi--?2
i=1 n

R2越大,意味着残差平方

和 越小

,即模型的拟合效果 越好

.R2越小,残差平方

和 越大 ,即模型的拟合效果 越差 .在线性回归模型中,R2 表示解释变量对于预报变量变化的贡献率,R2越接近于1, 表示回归的效果 越好 .

返回

4.独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别, 像这类变量称为分类变量.

(2)列联表:列出两个分类变量的频数表,称为列联表.假
设有两个分类变量X和Y,它们的可能取值分别为{x1, x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为

返回

2×2列联表
y1 x1 x2 a c y2 b d 总计 a+b c+d

总计

a+c

b+d

a+b+c+d

n?ad-bc?2 K2= (其中n=a+b+c+d为样本容 ?a+b??a+c??b+d??c+d? 量),则利用独立性检验判断表来判断“X与Y的关系”.

返回

返回

[做一题] [例1] 下面是水稻产量与施化肥量的一组观测数据:

施化肥量

15

20
330

25
360

30
410

35
460

40
470

45
480

水稻产量 320

(1)将上述数据制成散点图; (2)你能从散点图中发现施化肥量与水稻产量近似成什么关 系吗?水稻产量会一直随施化肥量的增加而增长吗?

返回

[自主解答] (1)散点图如下:

返回

(2)从图中可以发现施化肥量与水稻产量具有线性相关关
系,当施化肥量由小到大变化时,水稻产量由小变大, 图中的数据点大致分布在一条直线的附近,因此施化肥 量和水稻产量近似成线性相关关系,但水稻产量只是在 一定范围内随着化肥施用量的增加而增长.

返回

[悟一法]

1.利用散点图判断两个变量是否有相关关系是比较简便
的方法.在散点图中如果所有的样本点都落在某一函 数的曲线上,就用该函数来描述变量之间的关系,即 变量之间具有函数关系.如果所有的样本点落在某一 函数的曲线附近,变量之间就有相关关系.如果所有

的样本点都落在某一直线附近,变量之间就有线性相
关关系.

返回

2.在作图时,由于存在误差,有时又很难说这些点是不 是分布在一条直线的附近,这时就很难判断两个变量 之间是否具有线性相关关系,此时就必须利用样本相

关系数对其进行相关性检验.

返回

[通一类]
1.(2011· 江西高考)变量X与Y相对应的一组数据为(10,1), (11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应 的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2), (13,1).r1表示变量Y与X之间的线性相关系数,r2表示 变量V与U之间的线性相关系数,则 A.r2<r1<0 B.0<r2<r1 ( )

C.r2<0<r1

D.r2=r1

返回

解析:对于变量Y与X而言,Y随X的增大而增大,故Y与 X正相关,即r1>0;对于变量V与U而言,V随U的增大而 减小,故V与U负相关,即r2<0,所以有r2<0<r1. 答案:C

返回

[做一题] [例2] (1)(2011· 山东高考)某产品的广告费用x与销售额y 的统计数据如下表: 广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 5 54

返回

^ ^ ^ ^ 根据上表可得回归方程y =b x+a 中的b 为9.4,据此模型预报 广告费用为6万元时销售额为 A.63.6万元 C.67.7万元 B.65.5万元 D.72.0万元 ( )

返回

(2)(2011· 广东高考)为了了解篮球爱好者小李的投篮命中
率与打篮球时间之间的关系,下表记录了小李某月1号 到5号每天打篮球时间x(单位:小时)与当天投篮命中率y 之间的关系: 时间x 命中率y 1 0.4 2 0.5 3 0.6 4 0.6 5 0.4

小李这5天的平均投篮命中率为________;用线性回归分 析的方法,预测小李该月6号打6小时篮球的投篮命中率 为________.

返回

[自主解答]

(1)样本中心点是(3.5,42),则 ^ = y - ^ x =42- a b

9.4×3.5=9.1, ^ ^ 所以回归直线方程是y =9.4x+9.1,把x=6代入得y =65.5.

返回

1 (2)这5天的平均命中率 y = 5 ×(0.4+0.5+0.6+0.6+0.4)= 0.5;而 x =3, ? (xi- x )(yi- y )=(-2)×(-0.1)+(-1)×0
i= 1 5

+0×0.1+1×0.1+2×(-0.1)=0.1,

? (xi- x ) =(-2) +(-1) +0 +1 +2 =10,于是 b =
2 2 2 2 2 2 i= 1

5

^

0.01, a = y - b x =0.47,∴ y =0.01x+0.47,令x=6,得 y =0.53.

^

^

^

^

[答案] (1)B

(2)0.5

0.53

返回

[悟一法] ^ ^ 1.求回归方程,关键在于正确求出系数a ,b 由于计算量较 大,所以计算时要仔细谨慎,分层进行,避免因计算产 生失误,特别注意,只有在散点图大体呈线性时,求出 的回归方程才有意义. 2.利用回归方程可以估计总体,它是回归方程所反映的规律 的延伸,可使我们对有线性相关关系的两个变量进行分 析和控制.

返回

[通一类] 2.某企业的某种产品产量与单位成本统计数据如下:

月份
产量(千件)

1
2

2
3

3
4

4
3

5
4

6
5

单位成本(元/件)
(1)试确定回归方程;

73

72

71

73

69

68

(2)指出产量每增加1 000件时,单位成本下降多少?
(3)假定产量为6 000件时,单位成本是多少?单位成本 为70元/件时,产量应为多少件?

返回

解:(1)设x表示每月产量(单位:千件),y 表示单位成本(单位:元/件),作散点 图.由图知y与x间呈线性相关关系,设线 ^ ^ ^ 性回归方程为y =b x+a . ^ 由公式可求得b ≈-1.818, ^=77.364, a ^ ∴回归方程为y =-1.818x+77.364.

返回

(2)由回归方程知,每增加1 000件产量,单位成本下降1.818元. ^ (3)当x=6时,y =-1.818×6+77.364=66.456; ^ 当y =70时,70=-1.818x+77.364, 得x≈4.051千件. ∴产量为6 000件时,单位成本是66.456元/件,单位成本是70元/ 件时,产量约为4 051件.

返回

[做一题] [例3] 某中学对高二甲、乙两个同类班级进行“加强?语文

阅读理解?训练对提高?数学应用题?得分率作用”的试验,其
中甲班为试验班(加强语文阅读理解训练),乙班为对比班 (常规教学,无额外训练),在试验前的测试中,甲、乙两班 学生在数学应用题上的得分率基本一致,试验结束后,统 计几次数学应用题测试的平均成绩(均取整数)如下表所示:

返回

60分

以下
甲班 3 (人数) 乙班 (人数) 4

61~70分 71~80分 81~90分 91~100分

6

11

18

12

8

13

15

10

返回

现规定平均成绩在80分以上(不含80分)的为优秀.

(1)试分别估计两个班级的优秀率;
(2)由以上统计数据填写下面2×2列联表,并问是否有75% 的把握认为“加强?语文阅读理解?训练对提高?数学应用 题?得分率”有帮助. 优秀人数 甲班 乙班 合计 非优秀人数 合计

返回

n?ad-bc?2 参考公式及数据:K2= . ?a+b??c+d??a+c??b+d?
P(χ2 ≥k0) k0 0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 0.005 0.001

6.635 7.879 10.828

返回

[自主解答] (1)由题意知,甲、乙两班均有学生50人, 30 甲班优秀人数为30人,优秀率为 =60%, 50 25 乙班优秀人数为25人,优秀率为 =50%, 50 所以甲、乙两班的优秀率分别为60%和50%.

返回

(2) 优秀人数 非优秀人数 合计 甲班 乙班 合计 30 25 55 20 25 45 50 50 100

100×?30×25-20×25?2 100 因为χ2= = ≈1.010, 99 50×50×55×45

所以由参考数据知,没有75%的把握认为“加强?语文阅
读理解?训练对提高?数学应用题?得分率”有帮助.

返回

[悟一法] 独立性检验的步骤: (1)根据样本数据制成2×2列联表. n?n11n22-n12n21?2 (2)根据公式χ2= 计算χ2的观测值. n1+n2+n+1n+2 (3)比较χ2与临界值的大小关系作统计推断.

返回

[通一类]

3.某地区甲校高二年级有1 100人,乙校高二年级有900
人,为了统计两个学校高二年级在学业水平考试中的 数学学科成绩,采用分层抽样的方法在两校共抽取了 200名学生的数学成绩,如下表:(已知本次测试合格 线是50分,两校合格率均为100%).

返回

甲校高二年级数学成绩: 分组 频数 [50,60) 10 [60,70) 25 [70,80) 35 [80,90) 30 [90,100] x

乙校高二年级数学成绩: 分组 频数 [50,60) 15 [60,70) 30 [70,80) 25 [80,90) y [90,100] 5

返回

(1)计算x,y的值,并分别估计以上两所学校数学成绩的平

均分(精确到1分);
(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根 据以上统计数据填写下面2×2列联表,并回答能否在犯 错误的概率不超过0.05的前提下认为“两个学校的数学成 绩有差异?”

返回

甲校

乙校

总计

优秀
非优秀 总计 附: P(χ2≥k0) k0 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879

n?ad-bc?2 K2= ?a+b??c+d??a+c??b+d?

返回

解:(1)依题意得甲校应抽取110人,乙校应抽取90人, 故x=10,y=15. 估计甲校数学成绩的平均分为 55×10+65×25+75×35+85×30+95×10 ≈75. 110 乙校数学成绩的平均分为 55×15+65×30+75×25+85×15+92×5 ≈71. 90

返回

(2)
甲校 乙校 总计

优秀
非优秀 总计

40
70 110

20
70 90

60
140 200

200×?40×70-20×70?2 χ2= ≈4.714 110×90×60×140

又因为4.714>3.841,故能在犯错误的概率不超过0.05的前 提下认为“两个学校的数学成绩有差异”.

返回

返回

[热点分析] 高考对本节内容的考查主要是回归直线分析和独立 性检验的统计分析方法,题型多为选择题或填空题.但 2011年安徽高考则以解答题的形式考查了回归分析问题,

是高考命题的一个新方向.

返回

[考题印证] (10分)(2011· 安徽高考) 某地最近十年粮食需求量逐年上升, 下表是部分统计数据: 年份 需求量(万吨) 2002 2004 2006 2008 2010 236 246 257 276 286

(1)利用所给数据求年需求量与年份之间的回归直线方程 ^ y =bx+a;

返回

(2)利用(1)中所求出的直线方程预测该地2012年的粮食需 求量.

[考题巧解]———————(一样的结果,更简洁的过程)
[巧思] 求回归直线方程的关键是利用最小二乘法确定a,

b的值,由于本题中x,y的数据较大,如果直接计算比较 麻烦且易出错,故可考虑对上述表格中的数据作“年份- 2006”“需求量-257”的数据处理后再求a,b的值,这样

会使计算方便且不易出错.

返回

[妙解](1)由所给数据看出,年需求量与年份之间是近似 直线上升,下面来求回归直线方程.为此对数据预处理

如下:
年份-2006 需求量-257 -4 -21 -2 -11

(2分)
0 0 2 19 4 29

返回

对预处理后的数据,容易算得 x =0,-=3.2,?(3分) y ^=?-4?×?-21?+?-2?×?-11?+2×19+4×29 b 42+22+22+42 260 = =6.5,? 40 ^= y -b x =3.2.? ^ a (6分) (7分)

返回

由上述计算结果,知所求回归直线方程为 ^-257=b (x-2 006)+a =6.5(x-2 006)+3.2, ^ ^ y ^ 即y =6.5(x-2 006)+260.2. ①? (8分)

( 2 )利用直线方程①,可预测2012年的粮食需求量为 6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万 吨)≈300(万吨).(未写近似值不扣分)? (10分)

返回

1.下列说法: ①将一组数据中的每个数据都加上或减去同一个常数 后,方差恒不变; ②设有一个回归方程 ^ =3-5x,变量x增加一个单位 y 时,y平均增加5个单位;

返回

^ ^ ^ ③线性回归方程y =b x+a 必过(-,-); x y ④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确 认这两个变量间有关系.其中错误的个数是 A.0 C.2 B.1 D.3 ( )

返回

本题可以参考独立性检验临界值表: P( ≥k) k 0.02 0.01 0.00 0.00 5 0 5 1

0.50 0.40 0.25 0.15 0.10 0.05

0.45 0.70 1.32 2.07 2.70 3.84 5.02 6.53 7.87 10.8
5 8 3 2 6 1 4 5 9 28

返回

解析:一组数据都加上或减去同一个常数,数据的平均数有 变化,方差不变(方差是反映数据的波动程度的量),①正 确;回归方程中x的系数具备直线斜率的功能,对于回归方 程 ^ =3-5x,当x增加一个单位时,y平均减少5个单位,② y 错误;由线性回归方程的定义知,线性回归方程 ^ = ^ x+ ^ y b a 必过点( - , - ),③正确;因为K2=13.079>10.828,故有 x y 99%的把握确认这两个变量有关系,④正确.

答案:B

返回

2.为了解儿子身高与其父亲身高的关系,随机抽取5对父
子的身高数据如下: 父亲身高x(cm) 174 176 175 176 176 176 177 178 177
( ^ B.y =x+1 ^ D.y =176 )

儿子身高Y(cm) 175

则Y对x的回归直线方程为 ^ A.y =x-1 ^=88+1x C.y 2

返回

^ ^ ^ 解析:法一:设 y 对 x 的回归直线方程为y =b x +a , ^=-2×?-1?+0×?-1?+0×0+0×1+2×1=1, 因为b 2 ?-2?2+22 ^=176-1×176=88,所以 y 对 x 的回归直线方程为 a 2 1 y=2x+88.

返回

-=174+176+176+176+178=176, 法二: x 5 -=175+175+176+177+177=176 y 5 且回归直线方程过样本中心(-,-)经验证知, x y ^=88+1x. y 2

答案:C

返回

3.某单位为了制定节能减排的目标,先调查了用电量Y
(单位:度)与气温x(单位:℃)之间的关系,随机统计 了某4天的用电量与当天气温,并制作了对照表: x Y 18 24 13 34 10 38 -1 64

^ 由表中数据,得回归直线方程y =-2x+a,当气温为 -5℃时,预测用电量约为________度.

返回

-=1×(18+13+10-1)=10, 解析: 气温的平均值 x 4 用电量 1 的平均值-=4×(24+34+38+64)=40, y 因为回归直线必经过点(-, ), x - 将其代入回归直线方程得: y ^ 40=-2×10+a,解得 a=60,故回归直线方程为y =-2x +60.当 x=-5 时,y=-2×(-5)+60=70.所以当气温为 -5℃时,预测用电量约为 70 度.

答案:70

返回

4.2011年3月,日本发生了9.0级地震,地震引发了海啸
及核泄漏.某国际组织用分层抽样的方法从心理专家、 核专家、地质专家三类专家中抽取若干人组成研究团队 赴日本工作,有关数据见表1(单位:人). 核专家为了检测当地动物受核辐射后对身体健康的影响, 随机选取了110只羊进行了检测,并将有关数据整理为 不完整的2×2列联表(表2).

返回

表1 相关人员数 心理专家 核专家 地质专家 24 48 72 表2 抽取人数 x y 6

高度辐射
身体健康 身体不健康 合计 30 B C

轻微辐射
A 10 D

合计
50 60 E

返回

附:临界值表 k P(χ2 ≥k) 2.072 0.15 2.706 0.10 3.841 5.024 6.635 7.879 10.828 0.05 0.025 0.010 0.005 0.001

n?ad-bc?2 参考公式:K2= ?a+b??c+d??a+c??b+d?

(1)求研究小组的总人数; (2)写出表2中A、B、C、D、E的值,并判断有多大的把 握认为羊受到高度辐射与身体不健康有关.

返回

解:(1)依题意知

72 48 24 =y=x, 6

解得y=4,x=2. 所以研究小组的总人数为2+4+6=12. (2)根据列联表特点得A=20,B=50,C=80,D=30,E =110. 110×?30×10-50×20?2 可求得χ2= ≈7.486>6.635. 50×60×80×30 由临界值表知,有99%的把握认为羊受到高度辐射与身体 不健康有关.

返回

点击下图进入

返回


相关文章:
第3讲 变量间的相关关系与统计案例
第九章 第三节 变量间的... 43页 免费如要投诉违规内容,请到百度文库投诉中心...第3讲【2013 年高考会这样考】 变量间的相关关系与统计案例 以选择题或填空题...
...作业:第九章 第四节变量间的相关关系与统计案例]
【全程复习方略】2014年人教A版数学理(广东用)课时作业:第九章 第四节变量间的相关关系与统计案例]_高中教育_教育专区。【全程复习方略】2014年人教A版数学理(广...
...第九章 第五节 变量间的相关关系、统计案例课时精练...
2015届高考数学总复习 第九章 第五节 变量间的相关关系统计案例课时精练 理_高考_高中教育_教育专区。第五节 变量间的相关关系统计案例 ) 1.下列两个变量之...
...第九章 第五节变量间的相关关系、统计案例 文
2015届高考数学总复习 基础知识名师讲义 第九章 第五节变量间的相关关系统计案例 文_高考_高中教育_教育专区。第五节 变量间的相关关系统计案例 1.会作两个...
...第9章 第4节 变量间的相关关系、统计案例 Word版含...
2014人教A版数学一轮复习指导活页作业 第9章 第4节 变量间的相关关系统计案例 Word版含解析_高中教育_教育专区。2014人教A版数学一轮复习指导活页作业 第9章 ...
...第九章 第五节 变量间的相关关系、统计案例 理
2015届高考数学总复习 基础知识名师讲义 第九章 第五节 变量间的相关关系统计案例 理_高考_高中教育_教育专区。第五节 变量间的相关关系统计案例 1.会作两...
...(知识点归纳与总结):变量间的相关关系与统计案例
2016届高三数学一轮复习(知识点归纳与总结):变量间的相关关系与统计案例_数学_高中教育_教育专区。第三节 变量间的相关关系与统计案例 [备考方向要明了] 考什么...
变量间的相关关系与统计案例练习
名师一号 高考总复习 模块新课标 新课标 A 版数学 第三节 变量间的相关关系与统计案例时间:45 分钟 分值:75 分 一、选择题(本大题共 6 小题,每小题 5 ...
...第九章 第五节变量间的相关关系、统计案例课时精练...
2015届高考数学总复习 第九章 第五节变量间的相关关系统计案例课时精练试题 文(含解析)_高考_高中教育_教育专区。第五节 题号 答案 1 2 变量间的相关关系、...
...)变量间的相关关系与统计案例 理 北师大版
第三节 变量间的相关关系与统计案例 1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数...
更多相关标签:
统计学第九章课后答案 | 统计学第六版第九章 | 统计学第九章答案 | 热力学统计物理第九章 | 勇士队第三节得分统计 | 统计学第九章 | 生活中的统计学案例 | 统计学案例分析 |