当前位置:首页 >> 数学 >>

3.1 回归分析(3)


3.1回归分析的基 本思想及其初步 应用(3)

比《数学3》中“回归”增加的内 容 选修2-3——统计案例 数学3——统计
1. 画散点图 2. 了解最小二乘法 的思想 3. 求回归直线方程 y=bx+a 4. 用回归直线方程 解决应用问题 5. 引入线性回归模型 y=bx+a+e 6. 了解模型中随机误差项e产 生的原因 7. 了解相关指数 R

2 和模型拟 合的效果之间的关系 8. 了解残差图的作用 9. 利用线性回归模型解决一类 非线性回归问题 10. 正确理解分析方法与结果

复习回顾
1、线性回归模型: y=bx+a+e, (3)

?

y=bx+a+e,
E(e)=0,D(e)=

? .
2

(4)

其中a和b为模型的未知参数,e称为随机误差。 2、数据点和它在回归直线上相应位置的差异(yi ? ? yi ) ? i =y ? ? 是随机误差的效应,称 e yi 为残差。 i 3、对每名女大学生计算这个差异,然后分别将所得 n 的值平方后加起来,用数学符号表示为: ( y ? ? y )2

?
i ?1

i

i

称为残差平方和,它代表了随机误差的效应。

4、两个指标: (1)类比样本方差估计总体方差的思想,可以用作 n 1 1 2 2 ?)(n ? 2) ? ? ? ? ?, b ? e Q(a ? n ? 2 i ?1 n?2 为 ? 2 的估计量, ? 2越小,预报精度越高。 (2)我们可以用相关指数R2来刻画回归的效果,其 计算公式是:
2 ? ? ( yi ? y i ) n 2 ? ? ( yi ? y) n

R ? 1?
2

?(y
i ?1

i ?1 n

?

i

? y)

2

?(y
i ?1

i ?1 n

i

? y)

2

R2 ?1,说明回归方程拟合的越好;R2?0,说明回归 方程拟合的越差。

5、残差分析与残差图的定义: 在研究两个变量间的关系时,首先要根据散点图 来粗略判断它们是否线性相关,是否可以用回归模 型来拟合数据。

? ? ? 然后,我们可以通过残差 e1 , e2 ,?, en 来判

断模型拟合的效果,判断原始数据中是否存在可 疑数据,这方面的分析工作称为残差分析。 我们可以利用图形来分析残差特性,作图时纵坐标 为残差,横坐标可以选为样本编号,或身高数据,或 体重估计值等,这样作出的图形称为残差图。

非线性回归问题

案例2

一只红铃虫的产卵数y和温度x有关。现 收集了7组观测数据列于表中:
温度xoC 产卵数y/个 21 7 23 11 25 21 27 24 29 66 32 115 35 325

( 1 )试建立产卵数 y 与温度x 之间的回归方程;并 预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了 产卵数的变化?

探索新知
选变量

一元线性模型
350 300 250

方案1

解:选取气温为解释变量x,产卵数 为预报变量y。

画散点图

200 150 100

选模型

50 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39

估计参数

假设线性回归方程为 :?=bx+a
由计算器得:线性回归方程为y=19.87x-463.73

分析和预测

相关指数R2=r2≈0.8642=0.7464

当x=28时,y =19.87×28-463.73≈ 93
所以,1次函数模型中温度解释了74.64%的产卵数变化。

93>66 ? 模型不好?

奇 怪 ?

合作探究
问题1

二次函数模型
方案2 选用y=bx2+a ,还是y=bx2+cx+a ? 如何求a、b ?
y=bx2+a 非线性关系 产卵数 变换 t=x2 y=bt+a 线性关系

问题2 问题3

400 300 200 100 0 -40 -30 -20

-10 0 -100 -200

10

20

30

气 温 40

方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度 温度的平方t 产卵数y/个 21 441 7 23 529 11 25 625 21 27 729 24 29 841 66 32 1024 115 35 1225 325

作散点图,并由计算器得: y 和 t 之间的线性回归方程为 y=0.367t-202.543,相关指数R2=0.802

将t=x2代入线性回归方程得: y=0.367x2 -202.543 当x=28时,y=0.367×282202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。

产卵数y/个 350 300 250 200 150 100 50 0 0 150 300 450 600 750 900 1050 1200 1350

t

合作探究
产卵数
450 400 350 300 250 200 150 100 50 0 -5 -50 0

指数函数模型

方案3

气 温

-10

5

10

15

20

25

30

35

40

问题1 问题2

如何选取指数函数的底?
非线性关系

y ? c1ec2 x

对数 变换

y=bx+a 线性关系

方案3解答 对数变换:在

ln y ? ln(c1ec2 x ) ? ln c1 ? ln ec2 x ? ln c1 ? c2 x ln e ? c2 x ? ln c1
令 z ? ln y, a ? ln c1 , b ? c2 ,则
就转换为z=bx+a.
温度xoC z=lny 产卵数y/个 21
1.946

y ? c1ec2 x 中两边取常用对数得 y ? c1ec2 x
29
4.190

23
2.398

25
3.045

27
3.178

32
4.745

35
5.784

7

11

21

24
z

66

115

325

由计算器得:z关于x的线性回归方程



? =0.272x-3.849 , y ? ?e z

0.272x-3.849

.

2.8 2.4 2 1.6 1.2 0.8 0.4 0 0 3

相关指数R2=0.98
当x=28oC 时,y ≈44 ,指数回归 模型中温度解释了98.5%的产卵数的 变化

x
6 9 12 15 18 21 24 27 30 33 36 39

最好的模型是哪个?

400 300

400 300 200 100 0
0 5 10 15 20 25 30 35 40

产卵数

产卵数

200 100 0 -100

450 400 350 300 250

产卵数

-40

-30

-20

-10 0 -100 -200

10

20

30

气 温 40
-10

200 150 100 50 0 -5 -50 0

气 温
5 10 15 20 25 30 35 40

线性模型

二次函数模型

指数函数模型

最好的模型是哪个?

函数模型 线性回归模型

相关指数R2 0.7464

比 一 比

二次函数模型
指数函数模型

0.80
0.98

回归分析(二)

? 由计算可得: y

(1)

? (2) ? 0.367 x2 ? 202.543. ? e0.272 x?3.849 , y

则回归方程的残差计算公式分别为:
(1) (1) 0.272 x ?3.849 ? ? ei ? yi ? yi ? yi ? e , i ? 1, 2,..., 7;

?i(2) ? yi ? y ?i(2) ? yi ? 0.367 x 2 ? 202.543, i ? 1, 2,..., 7. e
x y 21 7 0.557 23 11 -0.101 25 21 1.875 27 24 -8.950 29 66 9.230 32 115 -13.381 35 325 34.675

? (1) e (2) ? e

47.696

19.400

-5.832

-41.000 -40.104 -58.265

77.968

? (1) ? 1550.538, Q ? (2) ? 15448.431. Q
因此模型(1)的拟合效果远远优于模型(2)。

总 结
( x1 , y1 ),( x2 , y2 ),...,( xn , yn ), (1) (2) ? ? y ? f ( x , a ) 和 y ? g ( x, b), 两个含有未知参数的模型:
对于给定的样本点 其中a和b都是未知参数。拟合效果比较的步骤为: (1)分别建立对应于两个模型的回归方程
(1) ? ?) y ? f ( x, a

? 与y

(2)

(1) 2 ? (1) ? ( y ? y ? (2)分别计算两个回归方程的残差平方和 Q ? i i ) n i ?1 (2) (2) 2 ? ? (y ? y ? ); 与Q

?分别是参数a和b的估计值; ?),其中 a ?和 b ? g ( x, b n

?
i ?1

(3)若

(2) ?) 的好;反之, y ? y ? g ( x, b ? (1) ? f ( x, a ?) ?) 的好。 果不如 y ? (2) ? g ( x, b

(1) (2) ? ? Q ? Q ,则 y ? (1) ? f ( x, a ?)

i

i

的效果比
的效

练习: 为了研究某种细菌随时间 x 变化,繁殖的个数, 收集数据如下:
天 数 x/ 天
繁殖个数 y/个

1 6

2 12

3 25

4 49

5
95

6 190

(1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图; 繁殖个数 (2) 描述解释变量与预报变量 之间的关系; (3) 计算残差、相关指数R2.

解:(1)散点图如右所示
天数

(2)由散点图看出样本点分布在一条指数函数C y= eC2x 1 的周围,于是令Z=lny,则 x Z
1 1.79

2
2.48

3
3.22

4
3.89

5
4.55

6
5.25

0.69x ?1.112 ? ? y =e 由计数器算得 Z=0.69X ? 1.112 则有

( 3)

? y
y
n

6.06

12.09

24.09

48.04

95.77

190.9

6

12

25
n

49
2

95
n

190

2 2 ? ? e ? ( y ? y ) ? i ? i i ? 3.1643, i=1 i ?1

n

2 2 ( y ? y ) ? y ? ny ? 25553.3. ? i ? i i ?1 i=1

3.1643 ? R ? 1? ? 0.9999. 25553.3
2

即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.

练习

假设关于某设备的使用年限x和所支出的维修费用 y(万 元),有如下的统计资料。
使用年限x
维修费用y

2
2.2

3
3.8

4
5.5

5
6.5

6
7.0

若由资料知,y对x呈线性相关关系。试求: (1)线性回归方程

? ?a ? ? bx ? y

的回归系数

?; ?、b a

(2)求残差平方和;

(3)求相关系数

R;

2

(4)估计使用年限为10年时,维修费用是多少?

解: (1)由已知数据制成表格。

i
xi yi xi yi
xi2

1 2 2.2 4.4 4

2 3 3.8 11.4 9
5

3 4 5.5 22.0 16
5

4 5 6.5 32.5 25

5 6 7.0 42.0 36

合计 20 25 112.3 90

2 x x ? 4; y ? 5; ? i ? 90; ? xi yi ? 112.3. i ?1 i ?1

? ? 1.23, a 所以有 b ? ? 0.08.

? ? 1.23x ? 0.08. ?y


相关文章:
3.1 回归分析(1)
3​.​1​ ​回​归​分​析​(​1​) 暂无评价|0人阅读|0次下载|举报文档3.1 回归分析(1) 【学习目标】 1、会用最小二乘法准确计算...
3.1回归分析的思想及初步应用
§3.1 回归分析的基本思想及初步应用学习目标:通过典型案例的探究,进一步了解回归...?a 3.回归直线方程的求法:回归直线方程是: y ? ? bx ? n ? ( xi ? ...
第三章3.1回归分析的基本思想及其初步应用习题
3.1回归分析的基本思想及其初步应用习题_高二数学_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 第3.1回归分析的基本思想及其初步应用习题...
§3.1回归分析的基本思想,及其初步应用(一)
高二数学导学案 选修 2-2 编制人: 使用日期: 编号: 1 § 3.1 回归分析的...a 于是得到回归直线的方程为 (3)身高为 172cm 的女大学生,由回归方程可以...
应用回归分析_第3章课后习题参考答案
应用回归分析_第3章课后习题参考答案_理学_高等教育_教育专区。第3章 多元线性回归 思考与练习参考答案 3.1 见教材 P64-65 3.2 讨论样本容量 n 与自变量个数...
人教生版1高中数学3.1回归分析的基本思想及其初步应用(3)
双基再现 A 卷(课堂针对训练三) 3.1 回归分析的基本思想及其初步应用(3) 平方和为 1.★★如果散点图中所有的样本点均在同一 条直线上, 那么残差平方和与...
应用回归分析课后习题第3章11题
应用回归分析课后习题第3章11题_数学_自然科学_专业资料。第四版 应用回归分析...(9)求当 x01 =75, x02 =42, x03 =3.1 时的 y 置信区间,手工计算近似...
3.回归分析
3.1 回归分析 32页 免费 3回归分析 51页 免费 回归分析3 2页 1财富值 3_2_3_相关回归分析 76页 免费如要投诉违规内容,请到百度文库投诉中心;如要提出功能问...
应用回归分析第3章原数据
应用回归分析第3章原数据_数学_自然科学_专业资料。应用回归分析应用第3章原数据第3章例题 3.1(P64)表 3.1 地区北 天河山京津北西 x1 5562 x2 1102 x3 1286...
更多相关标签:
征途赌博分析器3.1 | jmeter3.1源码分析 | 3.1圆的教材分析 | jquery 3.1.1源码分析 | 走地大球分析系统v3.1 | 回归分析 | 多元回归分析 | spss回归分析 |