当前位置:首页 >> 电力/水利 >>

多元线性回归模型预测城市用水量


第 19卷 第 2 期 2007 年 6 月



里 木 大 学 学 报 Jou r al of T ari U n iversity n m

V o.l 19 N o 2 . Jun. 2007

文章编号: 1009- 0568( 2007) 02- 0040- 03

多元线性回归模型预测城市用水量
李林
( 塔里木大学农业工程学院, 新疆 阿拉尔
摘要 关键词

843300)

本文应用多 元回归的方法, 对城市用水量进行预测。采取 向前选择变 量法进行 优选, 得 到相对最 优的回 归预测 模型。 多元线性 回归模型; 城市用水量; 向前选择变量法; 预测 文献标识码: A

拟合情况良好, 可以用来预测城市用水量。 中图分类号: TV213. 4

The Application of the M ultiple L inear R egressions in Forecasting C ity W ater Consumption
L i L in ( Co llege of Agricu ltural Eng in eering, T ari University A lar X injiang 843300) m , ,
Abstrac t w ater use . K ey word s m ultiple linear reg ressions mode;l c ity w ate r consumption; forward se lection var iables fo recasting ; T h is artic le applied the M u ltip le L inear R egressions to forecast c ity w ate r consum ption. T hrough adopting fo r ard se lection w

va riab les, the re la tive opti a l regression m ode lw as ach ieved. T he fitting resu lt is good, and the m ode l can be used in forecasting urban m

1

引言 城市用水量的大小关系着城市的发展。如何比

( x i1, x i2, , x ip ; y i )

i= 1 2 , n , ,
0

假设这 n 组数据满足以下关系式: y i =
2

+

1

x i1 +

较准确地预测城市用水量, 是政府在城市发展过程 中必须解决的极为重要的问题。一般而言, 城市用 水量的预测可以采用综合指标法、 平均增长率法等 进行经验类推可以取得较好的研究结果。但是, 在 城市发展进程中, 由于受到一些变化因素的影响, 其 市场数据存在不规则的变化, 采用历史数据类推则 达不到理想的效果
[ 1]

x i2 +
0 0

+ + + +
0

p 1 1

x ip + x 11 + x 21 + M x n1 +
1

i 2 2

i= 1 2 , n , , x 12 + x 22 + x n2 + + + +
p p

( 1)
1 2

y1 = y2 = yn =

x 1p + x 2p + xnp +

( 2)
n

0

1

2

p

。本文采用多 元线性回归法

其中,

,

, ,

p

是 (p + 1) 个有待估 计的参
1

进行城市用水量预测, 可以对这种情况下的影响进 行补偿, 从而取得较好的预测结果。
[ 2]

数, 称为总体回归参数;
2

,

2

, ,

n

是 n 个相互独
2

立的随机变量, 其均值都为 0 方差为 ! , 即遵从同 , 一正态分布 N ( 0 ! ), 这就是多元线性回归的数学 , 模型。 此模型还可以写成矩阵形式, 记:

2

模型介绍

设有 n组观测数据, 分别为:

收稿日期: 2006- 11 - 24 基金项目: 塔里木大学校长基金硕士资助项目 ( 编号: TDZK SS05018 ) 作者简介: 李林 ( 1977 - ), 男, 讲师, 硕士, 主要从事水资源系统分析研究。 E- m ai: l ilis @ 126 com l j .

第 2期

李林: 多元线性回归模型预测城市用水量
N

41

y1 Y= y2 M Yn
0 n 1

1 X = 1 M 1

x 11 x 21 M x n1
1

x 1p x 2p M x np
n ( p+ 1)

式中: SSR = 由度等于 p; SSE =
N

!

( y i - y ) , 可解释的变异平方和, 自 ^

2

I= 1

!

( y i - y I ) , 残差平方和, 自由度为 ( n- p ^

2

I= 1

=

1

=
( p+ 1 ) 1

2

1)。 方程回归系数的检验用统计量 t来进行。
n 1

M
p

M
n

t=

bj ~ t( n - p - 1) S ( bj )

( 6)

则用矩阵表示的多元线性回归模型为 Y= X + ( 3) 式中: Y 为观测值向量; 是参数向量; X 为常数向量; 为随机误差向量。 采用最小二乘法估计总体参数
T T p

式中: b j 为最小二乘估计; s( bj ) 为样本估计量。

3

应用实例

影响城市用水量的因素很多, 例如人口、 经济、 工业、 供水能力、 人均日生活用水量、 固定资产值等 等。因此根据阿克苏统计年鉴 1999 ~ 2005的统计 = ( 0,
1

, ,

资料

[ 3~ 4]

) , 其估计量为 B = ( b0, b1, , bp ) , 总体参数的 BL S = (X X ) X Y
T -1 T

, 从中选取 8个影响因子, 见表 1 。其中: x1

最小二乘估计量 ( 4) 回归方程的显著性检验用 F 检验完成。 记 SSR /p F = ( 5) SSE /n - p - 1
人均 GDP (元 ) 6484 7239 8061 8669 9711 11030 12300 固定资产 投资 ( 万元 ) 72183 84297 127884 150219 150726 154365 170239 工业 个数 102 87 154 148 120 125 133

为 GDP ( 万元 ) , x2 为人均 GDP ( 万元 ), x3 为固定资 产投资 ( 万元 ) , x4 为 工 业 个数, x5 城市 人 口 ( 万 人 ) , x6 供水总量 ( 10 m /?) , x7 为人均日生活用
4 3 4 3

水量 ( l), y为水资源量 ( 10 m ) , 建立数学模型, 对阿克苏市的城市用水量进行预测。

表 1 城市 用水量及其影响因子的基本资料 GDP( 万元 ) 1999 2000 2001 2002 2003 2004 2005 329264 374962 428333 478919 550625 629609 708302 城市人口 (万人 ) 22. 09 22. 73 24. 20 25. 13 25. 65 26. 48 24. 13 供水总量 (万 m /a) 2512 2217 1748 1556 1556 1478 1396
2
3

人均日生活 用水量 ( l) 210. 15 212 8 . 150 9 . 158 6 . 154. 22 145. 75 130. 96

水资源量 (万 m 3 /a) 8105 8554 8913 9297 9631 9990 10351

3 1 全模型 . 首先, 以 x1 ~ x7 为全部自变量, 采用最小二乘 法拟合一个多元回归模型, 得 y 9978 331 + 0 008157x1 - 0 23269x2 + 0 ^= . . . . 000279x3 + 0 00004x4 + 0 000021x5 - 0 4704x6 + 1 . . . . 953828x7
表 2 t t检验值 显著水平 常量 - 1 995 . 0. 058 t1 1. 299 0. 206 t2 1 586 . 0 126 . t3 1. 571 0. 129

复测定系数 R = 0 98 . 对模型进行 F 检验: F = 9876 。查自由度为 ( 6 , 1)的 F 分布表, 有 F0. 05 = 233 99 F0. 01 = 5858. 99 F . , , > F0. 01, 说明线性回归方程显著。 对各参数进行检验, 结果见表 2。

自变量模型的检验结果 t4 1. 576 0. 128 t5 2. 389 0. 025 t6 1. 889 0. 178 t7 2 128 . 0 243 .

查表 t0, 1 ( 7) = 1 895, t0. 05 ( 7) = 2 3654 t0. 20 ( 7) . . ,

= 1 415 . 。从这个模型可以看出, F 检验通过, 但在 t

42



里 木









第 19卷

检验中有个别自变量对 y的解释作用不显著, 比如 t1 < t0. 2 ( 7)。因此, 可以考虑对自变量集合进行调 整。 3 2 向前选择变量法 . 此法在起始时, 模型中没有任何变量。然后分 别考虑 y与每一个自变量的一元线性回归模型。对 所有 p个模型进行 F 检验, 选择值最大者作为第一 个进入模型的自变量 ( 记为 x i1 )。 然后, 对剩下的 ( p- 1) 个变量分别进行偏 F 检 验 ( 即以 y与 x i1的模型为减模型, 以 y与 x i1以及另 一个 x j 自变量的模型为全模型 ) 。如果至少有一个 xi 通过了偏 F 检验, 选择 F j 值最大的作为第二个被 选的自变量, 进入模型 ( 记为 x i2 )。 继续上述步骤, 直到在模型之外的自变量均不 能通过偏 F检验, 算法终止。 首先, 计算水资源量与 7个潜在自变量之间的 相关关系, 见表 3 。选取相关系数最大的自变量首 先进入模型。
表 3 变量 y x1 x2 y 与 x1 ~ x2 的相关系 数表 x3 x4 x5 x6 x7

x1 首先进入模型: y 6653 26+ 0 005304x1 ^= . . 复测定系数 R = 0 989 F 检验值: F = 350 14 . , . t检验值: t0 = 43 42, t1 = 18 72 . . , 除 x1 外, 还有 4个潜在自变量在模型外。以 x1 与 y1 为减模型, 以 x1 与 y1 再和 x2, x3, x4, x5, x6, x7 中任意一个作为全模型, 依次进行偏 F 检验。在 通过 F 检验的变量中, 选择 F j 最大的进入模型。依 此类推, 直至筛选出影响水资源量变化的重要自变 量。最终模型为: y 10434 01+ 0 010601x1 - 0 38637x2 - 0 00595x3 ^= . . . . - 21. 3832x5 - 1 14018x6 + 2 149983x7 . . 对该模型, R = 0 997 F 检验值: F = 8745 . , 3 3 回归方程拟合质量检查 . 表 4给出了各样本点在 y上的原始取值, 再采 用回归方程后的拟合值 y 以及 y i 与 yi 之差 fi, 相对 ^, ^ 误差的均值为 ! 1。从表中与的比较可以看出, 采用 i= 向前选择变量法建立的多元线性回归模型对历史值 的预测效果还是比较让人满意, 从图 1也可以看出 这点。
n 2 2

0. 994 0. 989 0. 903 0. 264 0 584 - 0. 887- 0. 818 .

图 1 表 4 n 1 2 3 4 5 6 7 均值 多元线性回归方程的水资源量拟合质量 原始 yi (mm ) 8105 8554 8913 9297 9631 9990 10351 9263 拟合值 y( mm ) ^ 8105. 16 8554. 18 8913. 25 9297. 29 9631. 30 9990. 31 10351. 34 9263 261 . 绝对误 差 fi - 0. 16 - 0. 18 - 0. 25 - 0. 29 - 0. 30 - 0. 31 - 0. 34 - 0. 26 相对误 差
i

观测值与预测值的比较图

4

结论
影响城市用水量的因子有 7个, 应用数理统计

/%

0. 0019 0. 0021 0. 0028 0. 0031 0. 0031 0. 0032 0. 0033 0. 0027

中的多元线性回归原理, 采用向前选择变量法, 筛选 出影响城市用水量的显著自变量并建立数学模型, 并将预测值和观测值进行比较, 拟合情况良好, 可以 用来预测城市用水量。 ( 下转第 59页 )

第 2期

赵小亮等: 杜梨叶片中氨基酸及矿质元素含量的测定

59

的造血过程, 促进细胞内脂肪的氧化作用, 可防止动 脉粥样硬化, 锰缺乏时可引起生长迟缓、 骨质疏松和 运动失常等。铁是维持生命的主要物质, 是制造血 红素和肌血球素的主要物质, 是促进维生素 B 族代 谢的必要物质。可见, 杜梨叶片用作饮品具有一定 的应用开发价值。 致谢: 感谢新疆生产建设兵团塔里木盆地生物 资源保护利用重点实验室马玲老师、 白红进老师和 晋玉霞老师及新疆生产建设兵团塔里木盆地畜牧科 技重点实验室席琳乔老师在实验中提供帮助。

卫生出版社, 2003: 1766~ 1767 . [ 3] [ 4] [ 5] [ 6] 程奇, 吴翠云, 阿依买木. 不同 处理对梨 种子休 眠与萌 发的影响 [ J]. 塔里木大学学报, 2005, 17( 1): 28~ 30. 刘润 进, 袁 玉清, 祝军. 杜梨 幼 苗根 系 生 长状 况 观察 [ J]. 莱阳农学院学报, 1998, 15( 3): 180~ 183. 李银 芳, 黄 子蔚, 王东. 起苗 时 间对 杜 梨 生长 的 影响 [ J]. 干旱区研究, 2003, 21( 4): 300~ 302. Jo int FAO /W TO A d H oc Expert Comm ittee WHO T ech , R ep Ser NO. 522[M ] . FAO N utr ition M ee ting R ep. Ser . , , NO. 52, W orld H ea lth O rg an ization, G eneva FAO R o e ; m , 1973 523. . [ 7] 塞冬, 李树青, 敖拉哈, 等. 黄芪、 天麻延 缓衰老 的实验 及临床研究 [ J]. 锦州医学院学报, 1994, 15( 1): 9. [ 8] 赵 艳, 庄 晓 燕, 李淑 云, 等. 枸 杞 中微 量 元 素 的测 定 [ J]. 微量元素与健康研究, 2007, 24( 2): 21~ 22 .

参考文献 [ 1] [ 2] 刘孟军主编. 中国野生 果树 [ M ]. 北京 : 中 国农业 出版 社, 1999 216~ 217. : 李时珍著. 本草纲目 (校实本 ? 下册 ) [M ]. 北京: 人民

( 上接第 42页 )
参考文献 [ 1] [ 2] 张杰明. 试论用多元线性回 归法预测 城市用水量 [ J]. 城市公用事业 , 2004 18( 4) : 23~ 25. , 刘严. 多元线性回归的数学 模型 [ J] . 沈阳 工程学 院学 报, 2005 1( 2、 128~ 129. , 3): [ 4] [ 3] 阿克苏地区统计局编. 阿克苏 统计年鉴 2000, 2001~ 2 [M ] . 阿克苏地 区行署 办公 室, 阿克 苏地 区统 计局 编. 阿克 苏统计年鉴 2003, 2004, 2005[M ].

( 上接第 44页 )
参考文献 [ 1] M icroso ft W indow s Script Contro l? http: / /www. m i . croso ft . co /downloads /deta ils m . 2595 aspx ? fam ily id = 8C02 [ 3] D 7E31492 49E6 [ 2] M icro soft Exploring the M icroso ft Sc ript Contro l? ht . tp / /www. m icroso ft com /m ind /0799 / scr ipt/ scr ipt asp : . . . 李连营, 李清泉, 李汉武 等著. 基 于 M apX 的 G IS应用 开发 [M ] . 武汉大学出版社, 2003 15- 50. :

1426FEC693A C display lang = en#O verv iew. &


相关文章:
城市用水量预测模型(数学建模论文)
城市用水量预测模型(数学建模论文)_数学_自然科学_专业资料。数学建模论文 ...关键词:灰色系统理论 模糊线性回归 组合预测 matlab 问题分析该问题是根据日供水...
城市用水量预测与计算方法
(2)单位用地指标法:确定城市单位建设用地的用水量指标后,根据规划的城市用地 规模,推算出城市用水总量。这种方法具有较好的适应性。 (3)线性回归法。 ( ...
BP神经网络预测模型预测城市需水量
BP 神经网络预测模型预测城市水量摘要:城市用水的发展和变化是由经济发展、...城市工业发展水平等具有一定的非 线性因果关系传统的线性回归等预测方法一般难以...
用水量预测方法综述
建立的模型要根据历史数据 的变化进行修正,使模型始终处于最优状态。 城市用水量...常用水量预测方法与预测模型:多元线性回归分析法,回归分析预 测方法是通过回归...
城市自来水规划水量预测
影响城市用水的因素很多, 因此长期预测很难做到准确...,我公司经常使用的有以下几种: 1.平均增长率法。...一元一次线性回归预测法,公式的一般形式为:y=a+bx...
基于主成分回归模型的哈尔滨市用水量预测
多元线性回归模 型,对哈尔滨市的用水量进行预测,并且用 1998~2009 年的用水 数据对模型进行检验,结果表明所建立的模型回归效果较好,可以 用于对城市用水量预测...
数学建模城市供水量的预测
法建立城市供水模型和价 格预测模型,运用线性回归...我们考虑每年的用水量随着季节的变化而呈现出周期性...多元线性回归与灰色联合模型在湖泊水质预测中的应用[...
数学建模城市供水量预测问题及解答
进而在考虑温度影响下建立多元线性回归模型,将 气温因素对供水量的影响从总水量...日用 水量预测在各类城市用水预测中具有异常特殊的地位,它不仅能直接指导水厂的...
城市自来水规划水量预测_secret
预测的内容主要是规划年度的最高日用水量, 以确定给水 系统的城市自来水规划水量预测摘 要: (附线性回归预测法预测水量的计算程序)较为准确的预测规划水量,对城市...
更多相关标签:
多元线性回归预测模型 | 多元线性回归预测 | spss多元线性回归预测 | 多元线性回归预测例题 | 多元线性回归的预测 | 多元线性回归 | 多元线性回归模型 | 多元线性回归分析 |