当前位置:首页 >> 能源/化工 >>

数据挖掘中的聚类技术在学生成绩分析中的应用


数据挖掘中的聚类技术在学生成绩分析中的应用 [摘 要] 本文针对在大类招生背景下北京科技大学经济管理学院 2005 级学 生的考试成绩, 应用数据挖掘技术分析分专业前学生成绩与专业及分专业后课程 学习之间可能存在的潜在的联系。 首先进行数据预处理以保证数据挖掘结果的质 量和提高数据挖掘的效率; 然后根据分专业前的课程成绩对学生进行聚类,并分 析各类的成绩特征; 最后以信息管理与信

息系统专业为例,分析各类学生在分专 业后的优势课程和较弱课程。 [关键词]数据挖掘;聚类;学生成绩分析 doi:10.3969/j.issn.1673-0194.2009.15.014 1 引 言 本科按学科大类招生已在部分高校实施, 这些高校按一级或二级学科进行招 生,在经过约两年的统一基础培养后,由学生结合就业、兴趣等选择具体专业方 向,开始专业课程及实践课程的学习直至毕业[1] 。本文研究数据挖掘技术在大 类招生背景下学生成绩分析中的应用,数据来源于北京科技大学经济管理学院 2005 级学生前 5 个学期的成绩,其中前 4 个学期为分专业前的成绩,第 5 个学 期为分专业后的成绩。通过观察这些数据可以发现如下特点:①成绩分布在 0~100 之间,且各个分数段的密度不同,其中成绩取值在 70~90 分之间的比例非 常大;②分专业前的课程数量很多,且其中的某些课程与专业选择相关性很小; ③部分课程存在得分普遍较高或得分普遍较低的现象; ④分专业前的课程主要包 括:高等数学 I、概率与数理统计、外语 I、线性代数、计算机基础、会计学、 财政金融学、管理信息系统、马克思主义哲学、军事理论、体育 I 等 46 门课程; ⑤分专业后各专业课程不同。 为了保证数据挖掘结果的质量,提高数据挖掘的效 率,需要进行净化、集成、精简、应用变换等数据预处理。之后,再进行聚类及 进一步的分析。 2 数据预处理 2.1 数据净化 数据净化是清除数据源中不正确、 不完整等不能达到数据挖掘质量要求的数 据,从而提高数据的质量,得到更正确的数据挖掘结果。 在本研究所针对的学生成绩数据中,遇到的主要数据净化问题是空值问题。 对此,本研究采用了两种处理方式:若该学生有 3 门及以上课程成绩为空,则将 其作为异常点从数据中除去; 若该学生有 2 门及以下课程成绩为空,则取其所在 班级对应课程的平均成绩来替代空值。 其次, 对于重修课程,因为重修成绩代表着学生在该门课程学习中的最终表 现和知识掌握程度,所以都用重修成绩代替原有的成绩。 2.2 数据的集成 数据挖掘所应用的数据如果来自多个数据源,就需要进行数据的集成。数据 的集成是从不同的数据源选取所需的数据,进行统一存储,并消除其中的不一致 性。 由于获得 5 个学期学生成绩数据的时间不同, 各个学期的学生成绩数据在结 构上存在一定的差异,所以需要对这些成绩数据进行数据集成。 另外, 为了进一步分析具有不同成绩特点的学生在分专业后的优势课程和弱 势课程,利用 Excel 中提供的 QUARTILE(ARRAY,QUART)函数,针对分专业后 各门课程,计算该课程成绩的四分位点,以将学生成绩分成优、良、中、差 4 类。 2.3 数据的精简 数据精简是采用一定的方法对数据的规模进行缩减。 作为本研究数据源的学 生包括了一般统招生和体育特长生,由于体育特长生入学时专业已定,不参与大 类招生两年后的专业选择,在此将所有体育特长生的信息除去,并将退学、休学 的学生的信息除去,以缩减数据量,最终用于聚类的学生人数是 262 人。另外, 由于本研究的内容是专

相关文章:
聚类算法分析及其在学生成绩分中的应用
聚类算法分析及其在学生成绩分析中的应用 数学计算机科学学院 计算机科学与技术 陶...(300 字左右) 数据挖掘就是从大量的、 不完全的、 模糊的、 随机的数据中,...
数据仓库与数据挖掘技术在学生成绩管理中的应用
技术应用到教学管理中,依托数据仓库、数据挖掘等基本理论知识和关联规则、聚类分析等基本算法,运用 联机分析处理技术和决策树算法应用于所建立的学生成绩数据仓库中,对...
数据挖掘中的聚类分析方法
由此数据挖掘技术应运而生并得 以迅猛 数据挖掘中的聚类分析方法随着计算机应用的普及, 信息系统产生的数据量日益增大, 如何有效地利用巨量的原始 数据分析现状和...
数据挖掘中聚类分析综述
龙源期刊网 http://www.qikan.com.cn 数据挖掘中聚类分析综述 作者:张静 来源:《价值工程》2014 年第 15 期 摘要: 数据挖掘中的聚类技术是一种非监督分类技术...
数据挖掘中 常用 聚类分析的技术方法
数据挖掘中聚类分析的技术方法汤效琴 戴汝源 摘要:数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析数据挖掘 中的核心技术。本文对数据挖掘领域的聚类分析...
数据挖掘技术在高校学生成绩分析中的应用
龙源期刊网 http://www.qikan.com.cn 数据挖掘技术在高校学生成绩分析中的应用 作者:谢虹 张彦芳 来源:《科教导刊· 电子版》2014 年第 28 期 摘要 本文运用...
数据挖掘论文
2009481403** 数据挖掘技术在试卷分析中的应用数据挖掘(Data Mining ,DM)是 20...在此我基于聚类算法对学生的试卷成绩分析的问题进行一下研究。在高 校中, 考试...
数据挖掘中聚类分析的技术方法
数据挖掘中聚类分析的技术方法_计算机软件及应用_IT/计算机_专业资料。数据挖掘中聚类分析的技术方法汤效琴 戴汝源 摘要:数据挖掘是信息产业界近年来非常热门的研究...
数据挖掘:聚类分析及其应用
数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析数据挖掘中的核心技 术...改进层次方 法的聚类质量的一个有希望的方向是将层次聚类和其他聚类技术进行集成...
数据仓库技术在学生成绩管理中的应用 毕业论文
08数据挖掘技术在考试系... 53页 1下载券 聚类技术在学生成绩分析... 30页...数据仓库技术在学生成绩管理中的应用摘要:本文主要介绍了数据仓库、数据挖掘等基本...
更多相关标签:
数据挖掘聚类分析案例 | 数据挖掘 聚类 | 数据挖掘聚类算法 | 数据挖掘 分类 聚类 | 数据挖掘 聚类分析 | 数据挖掘聚类分析论文 | 文本挖掘 聚类 | 聚类挖掘 |