当前位置:首页 >> 电力/水利 >>

多元线性回归模型预测城市用水量


第 19卷 第 2 期 2007 年 6 月



里 木 大 学 学 报 Jou r al of T ari U n iversity n m

V o.l 19 N o 2 . Jun. 2007

文章编号: 1009- 0568( 2007) 02- 0040- 03

多元线性回归模型预测城市用水量
李林
( 塔里木大学农业工程学院, 新疆 阿拉尔
摘要 关键词

843300)

本文应用多 元回归的方法, 对城市用水量进行预测。采取 向前选择变 量法进行 优选, 得 到相对最 优的回 归预测 模型。 多元线性 回归模型; 城市用水量; 向前选择变量法; 预测 文献标识码: A

拟合情况良好, 可以用来预测城市用水量。 中图分类号: TV213. 4

The Application of the M ultiple L inear R egressions in Forecasting C ity W ater Consumption
L i L in ( Co llege of Agricu ltural Eng in eering, T ari University A lar X injiang 843300) m , ,
Abstrac t w ater use . K ey word s m ultiple linear reg ressions mode;l c ity w ate r consumption; forward se lection var iables fo recasting ; T h is artic le applied the M u ltip le L inear R egressions to forecast c ity w ate r consum ption. T hrough adopting fo r ard se lection w

va riab les, the re la tive opti a l regression m ode lw as ach ieved. T he fitting resu lt is good, and the m ode l can be used in forecasting urban m

1

引言 城市用水量的大小关系着城市的发展。如何比

( x i1, x i2, , x ip ; y i )

i= 1 2 , n , ,
0

假设这 n 组数据满足以下关系式: y i =
2

+

1

x i1 +

较准确地预测城市用水量, 是政府在城市发展过程 中必须解决的极为重要的问题。一般而言, 城市用 水量的预测可以采用综合指标法、 平均增长率法等 进行经验类推可以取得较好的研究结果。但是, 在 城市发展进程中, 由于受到一些变化因素的影响, 其 市场数据存在不规则的变化, 采用历史数据类推则 达不到理想的效果
[ 1]

x i2 +
0 0

+ + + +
0

p 1 1

x ip + x 11 + x 21 + M x n1 +
1

i 2 2

i= 1 2 , n , , x 12 + x 22 + x n2 + + + +
p p

( 1)
1 2

y1 = y2 = yn =

x 1p + x 2p + xnp +

( 2)
n

0

1

2

p

。本文采用多 元线性回归法

其中,

,

, ,

p

是 (p + 1) 个有待估 计的参
1

进行城市用水量预测, 可以对这种情况下的影响进 行补偿, 从而取得较好的预测结果。
[ 2]

数, 称为总体回归参数;
2

,

2

, ,

n

是 n 个相互独
2

立的随机变量, 其均值都为 0 方差为 ! , 即遵从同 , 一正态分布 N ( 0 ! ), 这就是多元线性回归的数学 , 模型。 此模型还可以写成矩阵形式, 记:

2

模型介绍

设有 n组观测数据, 分别为:

收稿日期: 2006- 11 - 24 基金项目: 塔里木大学校长基金硕士资助项目 ( 编号: TDZK SS05018 ) 作者简介: 李林 ( 1977 - ), 男, 讲师, 硕士, 主要从事水资源系统分析研究。 E- m ai: l ilis @ 126 com l j .

第 2期

李林: 多元线性回归模型预测城市用水量
N

41

y1 Y= y2 M Yn
0 n 1

1 X = 1 M 1

x 11 x 21 M x n1
1

x 1p x 2p M x np
n ( p+ 1)

式中: SSR = 由度等于 p; SSE =
N

!

( y i - y ) , 可解释的变异平方和, 自 ^

2

I= 1

!

( y i - y I ) , 残差平方和, 自由度为 ( n- p ^

2

I= 1

=

1

=
( p+ 1 ) 1

2

1)。 方程回归系数的检验用统计量 t来进行。
n 1

M
p

M
n

t=

bj ~ t( n - p - 1) S ( bj )

( 6)

则用矩阵表示的多元线性回归模型为 Y= X + ( 3) 式中: Y 为观测值向量; 是参数向量; X 为常数向量; 为随机误差向量。 采用最小二乘法估计总体参数
T T p

式中: b j 为最小二乘估计; s( bj ) 为样本估计量。

3

应用实例

影响城市用水量的因素很多, 例如人口、 经济、 工业、 供水能力、 人均日生活用水量、 固定资产值等 等。因此根据阿克苏统计年鉴 1999 ~ 2005的统计 = ( 0,
1

, ,

资料

[ 3~ 4]

) , 其估计量为 B = ( b0, b1, , bp ) , 总体参数的 BL S = (X X ) X Y
T -1 T

, 从中选取 8个影响因子, 见表 1 。其中: x1

最小二乘估计量 ( 4) 回归方程的显著性检验用 F 检验完成。 记 SSR /p F = ( 5) SSE /n - p - 1
人均 GDP (元 ) 6484 7239 8061 8669 9711 11030 12300 固定资产 投资 ( 万元 ) 72183 84297 127884 150219 150726 154365 170239 工业 个数 102 87 154 148 120 125 133

为 GDP ( 万元 ) , x2 为人均 GDP ( 万元 ), x3 为固定资 产投资 ( 万元 ) , x4 为 工 业 个数, x5 城市 人 口 ( 万 人 ) , x6 供水总量 ( 10 m /?) , x7 为人均日生活用
4 3 4 3

水量 ( l), y为水资源量 ( 10 m ) , 建立数学模型, 对阿克苏市的城市用水量进行预测。

表 1 城市 用水量及其影响因子的基本资料 GDP( 万元 ) 1999 2000 2001 2002 2003 2004 2005 329264 374962 428333 478919 550625 629609 708302 城市人口 (万人 ) 22. 09 22. 73 24. 20 25. 13 25. 65 26. 48 24. 13 供水总量 (万 m /a) 2512 2217 1748 1556 1556 1478 1396
2
3

人均日生活 用水量 ( l) 210. 15 212 8 . 150 9 . 158 6 . 154. 22 145. 75 130. 96

水资源量 (万 m 3 /a) 8105 8554 8913 9297 9631 9990 10351

3 1 全模型 . 首先, 以 x1 ~ x7 为全部自变量, 采用最小二乘 法拟合一个多元回归模型, 得 y 9978 331 + 0 008157x1 - 0 23269x2 + 0 ^= . . . . 000279x3 + 0 00004x4 + 0 000021x5 - 0 4704x6 + 1 . . . . 953828x7
表 2 t t检验值 显著水平 常量 - 1 995 . 0. 058 t1 1. 299 0. 206 t2 1 586 . 0 126 . t3 1. 571 0. 129

复测定系数 R = 0 98 . 对模型进行 F 检验: F = 9876 。查自由度为 ( 6 , 1)的 F 分布表, 有 F0. 05 = 233 99 F0. 01 = 5858. 99 F . , , > F0. 01, 说明线性回归方程显著。 对各参数进行检验, 结果见表 2。

自变量模型的检验结果 t4 1. 576 0. 128 t5 2. 389 0. 025 t6 1. 889 0. 178 t7 2 128 . 0 243 .

查表 t0, 1 ( 7) = 1 895, t0. 05 ( 7) = 2 3654 t0. 20 ( 7) . . ,

= 1 415 . 。从这个模型可以看出, F 检验通过, 但在 t

42



里 木









第 19卷

检验中有个别自变量对 y的解释作用不显著, 比如 t1 < t0. 2 ( 7)。因此, 可以考虑对自变量集合进行调 整。 3 2 向前选择变量法 . 此法在起始时, 模型中没有任何变量。然后分 别考虑 y与每一个自变量的一元线性回归模型。对 所有 p个模型进行 F 检验, 选择值最大者作为第一 个进入模型的自变量 ( 记为 x i1 )。 然后, 对剩下的 ( p- 1) 个变量分别进行偏 F 检 验 ( 即以 y与 x i1的模型为减模型, 以 y与 x i1以及另 一个 x j 自变量的模型为全模型 ) 。如果至少有一个 xi 通过了偏 F 检验, 选择 F j 值最大的作为第二个被 选的自变量, 进入模型 ( 记为 x i2 )。 继续上述步骤, 直到在模型之外的自变量均不 能通过偏 F检验, 算法终止。 首先, 计算水资源量与 7个潜在自变量之间的 相关关系, 见表 3 。选取相关系数最大的自变量首 先进入模型。
表 3 变量 y x1 x2 y 与 x1 ~ x2 的相关系 数表 x3 x4 x5 x6 x7

x1 首先进入模型: y 6653 26+ 0 005304x1 ^= . . 复测定系数 R = 0 989 F 检验值: F = 350 14 . , . t检验值: t0 = 43 42, t1 = 18 72 . . , 除 x1 外, 还有 4个潜在自变量在模型外。以 x1 与 y1 为减模型, 以 x1 与 y1 再和 x2, x3, x4, x5, x6, x7 中任意一个作为全模型, 依次进行偏 F 检验。在 通过 F 检验的变量中, 选择 F j 最大的进入模型。依 此类推, 直至筛选出影响水资源量变化的重要自变 量。最终模型为: y 10434 01+ 0 010601x1 - 0 38637x2 - 0 00595x3 ^= . . . . - 21. 3832x5 - 1 14018x6 + 2 149983x7 . . 对该模型, R = 0 997 F 检验值: F = 8745 . , 3 3 回归方程拟合质量检查 . 表 4给出了各样本点在 y上的原始取值, 再采 用回归方程后的拟合值 y 以及 y i 与 yi 之差 fi, 相对 ^, ^ 误差的均值为 ! 1。从表中与的比较可以看出, 采用 i= 向前选择变量法建立的多元线性回归模型对历史值 的预测效果还是比较让人满意, 从图 1也可以看出 这点。
n 2 2

0. 994 0. 989 0. 903 0. 264 0 584 - 0. 887- 0. 818 .

图 1 表 4 n 1 2 3 4 5 6 7 均值 多元线性回归方程的水资源量拟合质量 原始 yi (mm ) 8105 8554 8913 9297 9631 9990 10351 9263 拟合值 y( mm ) ^ 8105. 16 8554. 18 8913. 25 9297. 29 9631. 30 9990. 31 10351. 34 9263 261 . 绝对误 差 fi - 0. 16 - 0. 18 - 0. 25 - 0. 29 - 0. 30 - 0. 31 - 0. 34 - 0. 26 相对误 差
i

观测值与预测值的比较图

4

结论
影响城市用水量的因子有 7个, 应用数理统计

/%

0. 0019 0. 0021 0. 0028 0. 0031 0. 0031 0. 0032 0. 0033 0. 0027

中的多元线性回归原理, 采用向前选择变量法, 筛选 出影响城市用水量的显著自变量并建立数学模型, 并将预测值和观测值进行比较, 拟合情况良好, 可以 用来预测城市用水量。 ( 下转第 59页 )

第 2期

赵小亮等: 杜梨叶片中氨基酸及矿质元素含量的测定

59

的造血过程, 促进细胞内脂肪的氧化作用, 可防止动 脉粥样硬化, 锰缺乏时可引起生长迟缓、 骨质疏松和 运动失常等。铁是维持生命的主要物质, 是制造血 红素和肌血球素的主要物质, 是促进维生素 B 族代 谢的必要物质。可见, 杜梨叶片用作饮品具有一定 的应用开发价值。 致谢: 感谢新疆生产建设兵团塔里木盆地生物 资源保护利用重点实验室马玲老师、 白红进老师和 晋玉霞老师及新疆生产建设兵团塔里木盆地畜牧科 技重点实验室席琳乔老师在实验中提供帮助。

卫生出版社, 2003: 1766~ 1767 . [ 3] [ 4] [ 5] [ 6] 程奇, 吴翠云, 阿依买木. 不同 处理对梨 种子休 眠与萌 发的影响 [ J]. 塔里木大学学报, 2005, 17( 1): 28~ 30. 刘润 进, 袁 玉清, 祝军. 杜梨 幼 苗根 系 生 长状 况 观察 [ J]. 莱阳农学院学报, 1998, 15( 3): 180~ 183. 李银 芳, 黄 子蔚, 王东. 起苗 时 间对 杜 梨 生长 的 影响 [ J]. 干旱区研究, 2003, 21( 4): 300~ 302. Jo int FAO /W TO A d H oc Expert Comm ittee WHO T ech , R ep Ser NO. 522[M ] . FAO N utr ition M ee ting R ep. Ser . , , NO. 52, W orld H ea lth O rg an ization, G eneva FAO R o e ; m , 1973 523. . [ 7] 塞冬, 李树青, 敖拉哈, 等. 黄芪、 天麻延 缓衰老 的实验 及临床研究 [ J]. 锦州医学院学报, 1994, 15( 1): 9. [ 8] 赵 艳, 庄 晓 燕, 李淑 云, 等. 枸 杞 中微 量 元 素 的测 定 [ J]. 微量元素与健康研究, 2007, 24( 2): 21~ 22 .

参考文献 [ 1] [ 2] 刘孟军主编. 中国野生 果树 [ M ]. 北京 : 中 国农业 出版 社, 1999 216~ 217. : 李时珍著. 本草纲目 (校实本 ? 下册 ) [M ]. 北京: 人民

( 上接第 42页 )
参考文献 [ 1] [ 2] 张杰明. 试论用多元线性回 归法预测 城市用水量 [ J]. 城市公用事业 , 2004 18( 4) : 23~ 25. , 刘严. 多元线性回归的数学 模型 [ J] . 沈阳 工程学 院学 报, 2005 1( 2、 128~ 129. , 3): [ 4] [ 3] 阿克苏地区统计局编. 阿克苏 统计年鉴 2000, 2001~ 2 [M ] . 阿克苏地 区行署 办公 室, 阿克 苏地 区统 计局 编. 阿克 苏统计年鉴 2003, 2004, 2005[M ].

( 上接第 44页 )
参考文献 [ 1] M icroso ft W indow s Script Contro l? http: / /www. m i . croso ft . co /downloads /deta ils m . 2595 aspx ? fam ily id = 8C02 [ 3] D 7E31492 49E6 [ 2] M icro soft Exploring the M icroso ft Sc ript Contro l? ht . tp / /www. m icroso ft com /m ind /0799 / scr ipt/ scr ipt asp : . . . 李连营, 李清泉, 李汉武 等著. 基 于 M apX 的 G IS应用 开发 [M ] . 武汉大学出版社, 2003 15- 50. :

1426FEC693A C display lang = en#O verv iew. &


相关文章:
浅谈多元线性回归模型及其应用
多元线性回归模型的概念 多元线性回归模型是用两个或...城市经济以现代化的 大工业生产为主,而农村经济以...多元线性回归统计预测模... 2页 4下载券 多元线性...
用水量预测方法综述
建立的模型要根据历史数据 的变化进行修正,使模型始终处于最优状态。 城市用水量...常用水量预测方法与预测模型:多元线性回归分析法,回归分析预 测方法是通过回归...
SPSS多元线性回归分析实例操作步骤
SPSS 统计分析 多元线性回归分析方法操作与分析实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五 年以上平均年贷款利率和房屋空置率作为变量...
城市用水量预测与计算方法
(2)单位用地指标法:确定城市单位建设用地的用水量指标后,根据规划的城市用地 规模,推算出城市用水总量。这种方法具有较好的适应性。 (3)线性回归法。 ( ...
SPSS多元线性回归分析实例操作步骤
SPSS 统计分析 多元线性回归分析方法操作与分析实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五 年以上平均年贷款利率和房屋空置率作为变量...
多元线性回归及logistics回归模型在上海市房价预测中的...
多元线性回归及logistics回归模型在上海市房价预测中的分析与应用_教育学/心理学_...有的模型做出了比较好的预测。基于研究的理论和方法不 同及不同城市的具体情况...
用EVIEWS软件实现一元及多元线性回归分析预测法_图文
一坐城市的文化发展,绝对离不开实体书店。 第三章 回归分析预测方法多元线性回归 通过散点图 可以看出实测点 x2 的总体趋势是正相关的 趋势明显 x1 的总体趋势...
《基于数据挖掘的城市时用水量预测研究》——浙江省水...
《基于数据挖掘的城市用水量预测研究》——浙江省水利厅科技项目申请书_建筑/...多元 线性回归法、 时间序列法、 灰色预测法、 神经网络法多种算法进行用水量...
城市生活垃圾预测及管理模型
回归解得徐 州市年垃圾产量的多元线性回归模型;第三步,将所预测的徐州市未来十年影响 城市生活垃圾变化的因素代入回归模型, 预测出未来十年徐州市城市生活垃圾产 ...
上海房价影响因素多元线性回归分析
2009-2010 学年第一学期 2009- 上海房价影响因素多元线性回归分析【内容摘要】近几年,随着经济的不断发展尤其是上海等大城市的飞速发展,房价也一路飘升, 为了研究...
更多相关标签: