当前位置:首页 >> 电力/水利 >>

粗糙集理论在电力系统数据挖掘中的应用研究


第 27 卷第 3 期 2006年6月

衡阳师范学院学报 Journal of Hengyang Normal U niversity

粗糙集理论在电力系统数据挖掘中的应用研究
旷海兰1 , 刘新华1 ,2 , 陈   1 , 蒋   1 中 涛
( 1. 衡阳师范学院 计算机系 , 湖南 衡阳   421008 ;

2. 武汉理工大学 信息工程学院 , 湖北 武汉   430070 )

摘   : 电力系统数据具有数据种类混杂 、数据质量差 、要求高 、实时性等特点 。在数据挖掘的诸多方法中 , 要 粗糙集理论对于处理复杂系统有明显的优势 , 研究粗糙集在电力系统数据挖掘中的应用 , 可以更加充分地利用 电力系统数据 , 揭示数据背后蕴含的原理 、规则 , 为解决电力系统中的许多问题找到更加合理的方法 。主要介 绍了粗糙集理论和电力系统数据挖掘的特点 , 论述了粗糙集在电力系统数据挖掘中的应用 。 关键词 : 粗糙集理论 , 数据挖掘 , 电力系统 中图分类号 : TP274 , TP18 文献标识码 : A 文章编号 : 1673 — 0313 (2006) 03 — 0070 — 03

0    引 言
数字电力系统是 21 世纪电力系统信息化的基本概念 , 它要求对实际电力系统进行自动化和智能化运行控制 、调 度 、仿真 、分析计算 、经营管理决策以及数据和信息的高 度网络化共享 [ 1 ] 。数字电力系统的提出是计算机技术和信 息技术迅速发展的必然 。电力系统中的数据种类多 , 分布 广泛 , 构成了一个极其庞大的信息存储体系 [2 ] 。然而 , 在 电力系统实际运行及规划管理中 , 人们通过这些数据所获 得的信息量仅仅是这些海量数据中所包含信息量的一部分 , 而隐藏在这些数据之后的更重要的信息 , 如关于这些数据 的特征描述及对其发展趋势的预测 , 这些信息是常规方法 无法获得的 , 但它们在决策生成的过程中却具有重要的参 考价值 。数据挖掘技术在电力系统中的应用越来越受到研 究者们的广泛关注 , 粗糙集对处理复杂系统和数据有明显 的优势 , 研究粗糙集理论在电力系统数据挖掘中的应用 , 对解决电力系统中的许多复杂问题具有重要的意义 。

1  数据挖掘与粗糙集理论
数据挖掘 ( Data Mining : DM) 是指从数据中提取隐含 在其中的人们事先未知的 、但又潜在有用的信息和知识 , 并将其表示成最终能被人理解的模式的高级过程 [ 3 ] 。DM 不但能够从大量不完全 、有噪声 、模糊 、随机的数据中学 收稿日期 : 2006 — — 03 20

习已有的知识 , 而且能够发现未知的新知识 , 得到的知识 是显式的 , 既能为人所理解 , 又便于存储和应用 , 因此一 开始就得到研究者们广泛的重视 , 是目前计算机领域和信 息决策领域最前沿的研究方向之一 。数据挖掘可应用于医 药 、金融 、情报 、法律 、国防 、教育 , 以及异常检测和诊 断中 , 常用的技术有统计方法 、神经网络 、遗传算法 、决 策树 、粗糙集 、模糊集等 。对于电力系统这样一个复杂的 大系统 , 数据挖掘技术正越来越被重视 , 并在负荷预测 、 故障诊断领域得到了成功应用 。 粗糙集 ( Rough Set s) 是 由波兰 数 学家 Pawlak Z. 于 1982 年提出的一种处理不确定性问题的新型数学工具 [4 ] 。 其主要研究内容是基于决策表的数据处理 , 包括 : 数据预处 理 , 即对有缺省值的决策表进行完备化和离散化 ; 在保持决 策表决策属性和条件属性之间的依赖关系不变的前提下对决 策表进行化简 ; 利用等价关系进行分类 ; 通过推理获取决策 规则等 。在数据挖掘的诸多方法中 , 粗糙集理论对于处理复 杂系统有比较明显的优势 , 具有以下优点 [5 ] : ① 仅利用数据 本身所提供的信息 , 不需要数据集合之外的任何先验知识 , 具有一定的客观性 。② 可以从不同的抽象层次来对数据进行 建模和分析 , 以更好地揭示数据间的依赖关系 , 发现数据间 的规律 。③ 基于集合理论 , 可以有效地分析和处理不精确 、 不完备和不一致数据 , 简化输入信息的表达空间 。 ④ 产生的 规则简洁准确 、易于验证 。⑤ 算法简单 , 易于操作 。

No . 3Vol. 27 J une 1 2 0 0 6

基金项目 : 湖南省教育厅青年基金资助项目 ( 05B055) ; 衡阳师范学院科研基金资助项目 ( 2005B11) 作者简介 : 旷海兰 (1976 - ) , 女 , 湖南衡阳人 , 衡阳师范学院计算机系讲师 , 硕士 , 研究方向 : 机器学习与数据挖掘 .

2006 年第 3 期

旷海兰等 : 粗糙集理论在电力系统数据挖掘中的应用研究

71  

2  电力系统数据挖掘
电力系统是一个非线性的互联大系统 , 在运行过程中 不断产生和积累大量的数据 。在电力系统中 , 应用数据挖 掘技术可以更加充分地利用这些运行数据 , 揭示电力系统 历年积累的数据背后蕴含的原理 、规则 , 找到解决问题的 更加合理的方法 , 同时还可以为决策提供更加有力的科学 依据 。当前 , 己有不少将数据挖掘技术应用于电力系统各 个领域的成功例子 。 (1) 预测未知情况 即利用计算机通过对电力系统历史数据的学习归纳 , 建预测模型 , 以此来预测未知的数据 。文献 [ 6 ] 利用数据挖 掘技术对历史数据进行分析 , 发掘出不同类型的突发事故 之间的统计性的区别及其特有的一些条件关系 , 以此来提 供对电力系统各种突发事故的区分 。文献 [ 7 ] 论述了利用神 经网络对某一特定地区电力负荷历史数据进行分析 , 在此 基础上得出对电力负荷走势的预测 。 ( 2) 状态分析与故障诊断 电力系统的运行状态通常被分为正常状态 、警戒状态 、 紧急状态和恢复状态 。如果电力系统当前的运行状态被确 定 , 电力系统操作员就可以此为据来执行一系列相应的操 作 。聚类算法可以用于进行状态分类 , 出可以对电力器件 运行状态进行分类 。文献 [ 8 ] 论述了用数据挖掘技术对变压 器中各种气体成分进行聚类分析 , 可以在预先不知道变压 器故障类型的情况下得出变压器中各种气体成分含量与故 障之间的直观联系 , 为专家们判断变压器故障类型提供了 十分有力的依据 。 ( 3) 电力系统的调度运行 调度运行部门在电力系统的运行中始终处于核心地位 。 它的任务就是实时处理来自系统的大量反馈信息 , 并依此 做出相应决策 。在进入电力市场机制运行后 , 调度中心在 保证系统的安全性和稳定性的基础上 , 还要考虑各种经济 问题 , 如各投资者的经济利益以及如何制定合理的电价 , 这将进一步增加调度运行的复杂性 。在这种情况下 , 数据 挖掘技术有助于调度运行部门制定相关决策 [ 9 ] 。 ( 4) 电力系统规划设计 要取得有效的系统规划结果 , 在进行规划设计时 , 必 须制定出保证系统安全稳定运行的规划策略 , 如确定相应 的临界运行参数和稳定域 , 确定保护和控制装置的参数 。 其数据的处理量是巨大的 , 利用数据挖掘技术在海量数据 中发现模型和数据间的关系 , 以此来制定系统正常情况下 的运行法则和发生故障时的应对策略 [9 ] 。 ( 5) 电力市场营销 在开放的电力市场中 , 供电方为节省营销成本获得更 多的利润 , 要通过收集 、加工和处理消费者的大量信息 , 对用户的行为分门别类 , 进而推断出消费群体下一步的消 费行为 。数据挖掘技术可以在保证系统安全稳定运行的前 提下 , 制定出有竞争力的供电策略 [ 10 ] 。

随着计算机技术和网络技术的飞速发展 , 以及我国国 民经济的发展 , 电力系统的数据越来越庞大 。电力系统数 据具有以下特点 [ 11 ] : ① 数据格式多样化 。在电力系统中 , 目前还没有制定出一个统一的数据存储和转换标准 , 从而 使数据格式各不相同 。 ② 数据种类繁多 。电力系统负荷预 测所需要的数据种类繁多 , 不仅有一般的整型 、实型等常 规数据 , 还有描述日期 、节假日类型的布尔型数据 。 ③ 数 据来源广泛 , 具有时变特性 。电力系统每时每刻都要产生 大量的负荷数据 , 数据更新比较快 , 包括当前和过去的数 据 , 这就要求我们可以对历史性的数据做透视分析 。 ④ 数 据具有不完整性 、含噪声和不一致性 。电力系统中有些工 程人员比较感兴趣的地方或缺少数据 、或这些数据包含噪 声 、或数据记录不一致 。
31 2   粗糙集理论在电力系统中的应用 粗糙集理论是处理不确定和不完备数据有效的数学工 具 , 特别适合处理复杂系统 。将粗糙集理论应用于电力系 统中 , 对提高电力系统数据挖掘的能力和效率具有重要的 意义 。 ( 1) 负荷预测

负荷预测是对电力市场需求的预测 , 在电力系统计划 与运行管理中 , 它决定了发电 、输电和电能分配等方面的 合理安排 , 对电力系统的安全经济运行与国民经济的发展 具有非常重要的影响 , 做好负荷预测是实现电力系统管理 现代化的重要手段 。利用数据挖掘技术可以从以前存储的 大量历史数据中发现潜在变化规律 , 以利于电力系统负荷 预测和制定电力市场中的电价策略 。当前许多预测模型都 是基于神经网络的 [12213 ] , 而影响电力系统负荷预测的许多 因素是不确定的 , 所以很多方法的预测结果相差较大 。将 基于粗糙集理论的数据挖掘方法应用于负荷预测中 , 可以 减少脏数据以及不完整数据对预测精度的影响 , 并通过约 简和重要性计算等方法找出对负荷影响最大的因素 , 减少 值的工作 。为了提高故障诊断的准确性和快速性 , 国内外 有关学者提出了 专家 系统 、人工 神经 网络 、遗传 算法和 Pet ri 网等方法 [14215 ] , 这些方法对送至控制中心的准确 、完 整的信号大都可以取得较为满意的结果 。但对在不完备信 号等复杂的故障诊断模式下造成的信号改变或丢失 , 则尚 无妥善的解决方法 。粗糙集理论适合于对不完备数据进行 处理 , 故将粗糙集理论与已有数据挖掘技术相结合应用于 复杂模式下的故障诊断 。并利用数据挖掘对电力系统故障 报告数据库进行 分析 , 以 形成相 应规 则 , 可以提 高决策 效率 。 ( 3) 系统状态分析 系统分类是数据挖掘技术应用于电力系统的一个重要 方面 。目前常用的电力系统状态分类方法主要是决策树方

预测时间 , 提高预测效率 。 ( 2) 故障诊断 电力系统在发生故障时 , 往往会产生大量的警报信号 , 从而给调度人员快速准确地人工识别故障信号造成一定的 困难 , 因此研究如何对这些信号进行快速 、准确地分析判 断并采取相应有效的措施成为一项极具现实意义和经济价

3  粗糙集理论在电力系统数据挖掘中的应用
31 1   电力系统数据的特点

72  

衡阳师范学院学报
3412356. 124.

2006 年第 27 卷

ing met hods , rough set t heo ry has it s advantage in dealing wit h complex system. The st udy of ro ugh set t heory and it s use in acters of ro ugh set s and it s applications in power system data mining are discussed. Key words : Rough set t heo ry ; data mining ; power system

power system data mining can efficiently imp rove t he use of power system data , find rules and t heories hide in data. The char2

法 。粗糙集理论可以根据不可区分关系对样本数据进行分 类 , 其分类过程不需要领域知识或其它额外的信息 , 将粗 糙集理论应用于电力系统状态分析和判断 , 可以具有较好 的客观性 。 31 3   主要优越性 与面向经典理论的电力系统分析方法相比 , 基于粗糙 集理论的数据挖掘方法在 3 个方面能体现出较高的优越性 : ① 更高的计算效率 。利用粗糙集可以屏蔽掉海量数据中的 冗余信息 , 提高电力系统数据挖掘的效率 ; ② 更客观的分 析 。由于粗糙集理论对数据进行分析不需要额外信息的特 点 , 可以使分析结果更具有客观性 , 为电力系统决策提供 更合理的支持 ; ③ 对不确定量和不完备数据的管理 。电力 系统中发生的某些事件 , 总是具有一定的不可预料性 , 其 记录的数据也往往不完整 , 利用粗糙集可以提高数据挖掘 技术对电力系统数据进行分析和管理的能力 。

[ 5 ] 旷海兰 , 罗可 , 王樱 . Rough set 理论在数据挖掘中的 [ 6 ] P. K. Kalra , R M Mathur. Investigations for developing chines and power systems , 1987 , 13 (4) : 2652274. knowledge ( 1) : 125. discovery and data mining , gies for info rmation overload , 1997 : 124. expert systems for power system control [J ]. Electric ma2 1998 , 6

[ 7 ] P Brierlev , B Battv. Neural data mining and modeling for elect ric load p rediction [ J ] . IEE colloquium o n

4  结束语

数字电力系统是 21 世纪电力系统发展的趋势 , 电力系 统数据量大 , 质量要求高 , 要求有有效的方法和技术对这 些数据进行处理和分析 。粗糙集理论是一种处理复杂系统 数据的有效工具 。本文论述了粗糙集理论在电力系统数据 挖掘中的应用和特点 , 对扩大粗糙集理论的应用范围 , 发 现隐藏在电力系统海量数据中的规则 , 提高电力系统信息 处理效率具有重要的意义 。 参考文献 :

[ 1 ] 卢强 . 数字电力系统 [J ] . 电力系统自动化 , 2000 , 24 [ 2 ] 数字电力系统 (DPS) —— — 新世纪电力系统科技发展 ( 9) : 124.

[ 3 ] Han J , Kamber M. 数据挖掘 : 概念与技术 [ M ] . 北

Abstract : The data in power system are demanding , real time , of poo r quality and have vario us forms. As one of t he data min2

[ 4 ] Pawlak Z. Rough Set s[J ] . Internatio nal Journal of In2 formatio n and Co mp uter Science , 1982 , 11 ( 5 ) :
1

The Application Study of Rough Set Theory in Power System Data Mining
KUA N G H ai2l an , L I U X i n2hua
1 ,2

方向 [ EB/ OL ] . [ 2005212220 ] http : / / www. eweek2
blog. com/ blog/ deng7101/ 14159. ht m.

京 : 机械工业出版社 , 2001.

, C H E N Z hon g , J I A N G T ao

( 1. Comp ute Science Depart ment , Henyang No rmal University , Henyang Hunan 421008 , China ;

2. College of Informatio n Engineering , Wuhan U niversity of Ttechnology , Wuhan Hubei 430070 , China)

[ 8 ] J A Steele , J R Mcdo nald , C D Arcy. Knowledge dis2 covery in databases : applicatio n in t he elect rical power [ 9 ] 于之虹 , 郭志忠 . 数据挖掘与电力系统 [J ] . 电网技 [ 10 ] 王彤承 . 数据挖掘在电力营销决策支持系统中的研究 [ 11 ] 许涛 , 贺仁睦 , 徐东杰 , 王鹏 . 数据挖掘与电力系统 [ 12 ] 李秋丹 , 迟忠先 , 王大公 . 基于数据挖掘技术的负荷 [ 13 ] 谢宏 , 等 . 基于粗糙集理论建立短期电力负荷神经网 [ 14 ] 束洪春 , 孙向飞 , 司大军 . 基于粗糙集理论的配电网 [ 15 ] Wang Dazhong , Xu Wen , Zhou Zecun , Chen Heng. engineering do main [ C ] . IEE colloquium o n IT st rate2

术 , 2001 , 25 ( 8) : 58262.
8452848. ( 10) : 73278. ( 5) : 3492353.
1

应用 [J ] . 衡阳师范学院学报 , 2005 , 26 (3) : 81284. 与应用 [ D ] . 石家庄 : 华北电力大学出版社 , 2003. 负荷预测 [J ] . 电力信息化 , 2004 , 2 (2) : 41243.
1

预测模型 [ J ] . 大 连 理 工 大 学 学 报 , 2003 , 43 ( 6) :

络预测模型 [J ]. 中国电机工程学报 , 2003 , 23 (11) :

故障 诊 断 研 究 [ J ] . 中 国 电 机 工 程 学 报 , 2001 , 21

tificial neural netwo rks in fault diagno sis of power

t ransfo rmer[J ] . Proceedings of t he CSEE , 1996 , 16

Application of f uzzy set s t heory , expert system and ar2


相关文章:
粗糙集
本文主要介绍了粗糙集理论的基本概念、研究对象,叙述了其在各领域 的应用发展...于达仁等针对粗糙集理论应用于电厂与电力系统数据挖掘中存在的连续属性离散化 问题...
电力数据挖掘在电网内部及各领域间的应用
结合电力行业可 获得的数据,分析数据挖掘在电力系统...在支撑智慧城市发 展过程中各行业的应用,为城市发展...粗糙集:粗 糙集理论认为知识是有粒度的, 利用相对...
粗糙集理论分析及其应用研究
的效果,对其在信息系统中 的应用具有一定的研究价值...3、粗糙集理论的知识约简及规则提取分析 在数据挖掘...电力系统分析等,其应用空间很广阔,是目前信息科学的...
基于粗糙集理论的数据挖掘技术在学生综合素质测评中的应用
基于粗糙集理论的数据挖掘技术在学生综合素质测评中的应用_冶金/矿山/地质_工程...数据挖掘与知识发现(讲稿... 246人阅读 17页 免费 粗糙集理论在电力系统数....
粗糙集理论在关系数据库中的应用
粗糙集理论在电力系统中的... 10页 1财富值 粗糙集理论及其应用 9页 5财富...到目前 为止,粗糙集理论已经广泛应用数据挖掘等计算机领域,工业控制的工业领域,...
基于数据挖掘的电力设备状态检修技术研究综述
模型与模糊系统辨 识方法,构造智能专家系统;研究中文文本挖掘的理论模型与实现...文献[4]中应用粗糙集数据挖掘方法对电力变压器油中溶解气体进行分析,为 电力...
数据挖掘研究及发展现状
数据挖掘研究及发展现状_计算机软件应用_IT/计算机...神经网络法是模拟生物神经系统的结构和功 能,是一...1.4 粗糙集法 粗糙集法也称粗糙集理论,是一种新的...
融合粗糙集和模糊聚类的量化数据知识发现方法(4)
基于知识的系统普遍推广应用的技术瓶颈,粗糙集理论是一种从历史数据中发现规则知...本文针对粗糙集应用于电厂与电力系统数据挖掘中存在的连续属性离散化问题,提出了...
数据挖掘研究现状及发展趋势_王惠中
软件首次引入了数据挖掘流概念,用 户可以在同一个工作流环境中清理数据、转换...将粗糙集和模糊集理论二者融合用于知识发 现;构造模糊系统辨识方法与模糊系统知识...
基于粗糙集的数据挖掘技术在电子商务中的应用
基于粗糙集的数据挖掘技术在电子商务中的应用 摘要 ...对于信息系统,大量的属性并不是具有等同地位 的,甚...粗糙集理论的特点 决策表是粗糙集理论最主要的研究...
更多相关标签: