当前位置:首页 >> 能源/化工 >>

数据挖掘中的聚类技术在学生成绩分析中的应用


数据挖掘中的聚类技术在学生成绩分析中的应用 [摘 要] 本文针对在大类招生背景下北京科技大学经济管理学院 2005 级学 生的考试成绩, 应用数据挖掘技术分析分专业前学生成绩与专业及分专业后课程 学习之间可能存在的潜在的联系。 首先进行数据预处理以保证数据挖掘结果的质 量和提高数据挖掘的效率; 然后根据分专业前的课程成绩对学生进行聚类,并分 析各类的成绩特征; 最后以信息管理与信息系统专业为例,分析各类学生在分专 业后的优势课程和较弱课程。 [关键词]数据挖掘;聚类;学生成绩分析 doi:10.3969/j.issn.1673-0194.2009.15.014 1 引 言 本科按学科大类招生已在部分高校实施, 这些高校按一级或二级学科进行招 生,在经过约两年的统一基础培养后,由学生结合就业、兴趣等选择具体专业方 向,开始专业课程及实践课程的学习直至毕业[1] 。本文研究数据挖掘技术在大 类招生背景下学生成绩分析中的应用,数据来源于北京科技大学经济管理学院 2005 级学生前 5 个学期的成绩,其中前 4 个学期为分专业前的成绩,第 5 个学 期为分专业后的成绩。通过观察这些数据可以发现如下特点:①成绩分布在 0~100 之间,且各个分数段的密度不同,其中成绩取值在 70~90 分之间的比例非 常大;②分专业前的课程数量很多,且其中的某些课程与专业选择相关性很小; ③部分课程存在得分普遍较高或得分普遍较低的现象; ④分专业前的课程主要包 括:高等数学 I、概率与数理统计、外语 I、线性代数、计算机基础、会计学、 财政金融学、管理信息系统、马克思主义哲学、军事理论、体育 I 等 46 门课程; ⑤分专业后各专业课程不同。 为了保证数据挖掘结果的质量,提高数据挖掘的效 率,需要进行净化、集成、精简、应用变换等数据预处理。之后,再进行聚类及 进一步的分析。 2 数据预处理 2.1 数据净化 数据净化是清除数据源中不正确、 不完整等不能达到数据挖掘质量要求的数 据,从而提高数据的质量,得到更正确的数据挖掘结果。 在本研究所针对的学生成绩数据中,遇到的主要数据净化问题是空值问题。 对此,本研究采用了两种处理方式:若该学生有 3 门及以上课程成绩为空,则将 其作为异常点从数据中除去; 若该学生有 2 门及以下课程成绩为空,则取其所在 班级对应课程的平均成绩来替代空值。 其次, 对于重修课程,因为重修成绩代表着学生在该门课程学习中的最终表 现和知识掌握程度,所以都用重修成绩代替原有的成绩。 2.2 数据的集成 数据挖掘所应用的数据如果来自多个数据源,就需要进行数据的集成。数据 的集成是从不同的数据源选取所需的数据,进行统一存储,并消除其中的不一致 性。 由于获得 5 个学期学生成绩数据的时间不同, 各个学期的学生成绩数据在结 构上存在一定的差异,所以需要对这些成绩数据进行数据集成。 另外, 为了进一步分析具有不同成绩特点的学生在分专业后的优势课程和弱 势课程,利用 Excel 中提供的 QUARTILE(ARRAY,QUART)函数,针对分专业后 各门课程,计算该课程成绩的四分位点,以将学生成绩分成优、良、中、差 4 类。 2.3 数据的精简 数据精简是采用一定的方法对数据的规模进行缩减。 作为本研究数据源的学 生包括了一般统招生和体育特长生,由于体育特长生入学时专业已定,不参与大 类招生两年后的专业选择,在此将所有体育特长生的信息除去,并将退学、休学 的学生的信息除去,以缩减数据量,最终用于聚类的学生人数是 262 人。另外, 由于本研究的内容是专


相关文章:
基于数据挖掘技术的学生成绩分析系统
基于数据挖掘技术的学生成绩分析系统_工学_高等教育_...只有摒弃传统的流水线式培养模式,在高等院校中全面...聚类技术和相关编程技术完成了数据挖掘技术的学生成绩...
挖掘教育数据来分析学生成绩
通过教育数据挖掘分析学生成绩摘要: 高等教育机构的主要目的是向学生提供优质...通过这些技术,可以发现大量信息中的关联规则,对其分类和聚类。发现的 知识可以...
数据仓库技术在学生成绩管理中的应用 毕业论文
08数据挖掘技术在考试系... 53页 1下载券 聚类技术在学生成绩分析... 30页...数据仓库技术在学生成绩管理中的应用摘要:本文主要介绍了数据仓库、数据挖掘等基本...
基于SPSS的信息类大学生成绩的数据挖掘
目前数据挖掘技术在商业、金等方面都得到了广泛的应用,而在教育领域的应用较少,...本论文就是运 用数据挖掘中的聚类分析学生成绩的, 利用学生在分专业前的各主要...
学生成绩分析与管理系统的设计与实现
数据挖掘理论基础 上,研究了聚类分析的方法及在学生成绩评测中的应用,选取了...随着现代科学技术的发展,传统的教学管理已不能满足时代发展的要求,为了改变这 种...
数据挖掘中的聚类分析方法
由此数据挖掘技术应运而生并得 以迅猛 数据挖掘中的聚类分析方法随着计算机应用的普及, 信息系统产生的数据量日益增大, 如何有效地利用巨量的原始 数据分析现状和...
数据挖掘中 常用 聚类分析的技术方法
最后阐述了聚类分析在数据挖掘中的应用。 1 数据挖掘领域中聚类算法的分类 聚类...改 进层次方法的聚类质量的一个有希望的方向是将层次聚类和其他聚类技术进行集成...
数据挖掘在实际生活中的应用
因此,通过数据挖掘技术理性的分析学 生成绩等关键信息,提高教学质量与水平,是...聚类分析中的 k-means 算法在学生奖学金等级划分中的应用 k-means 算法是常见...
数据挖掘技术在英语网络学习平台中的应用分析
数据挖掘技术在英语网络学习平台中的应用分析_计算机软件及应用_IT/计算机_专业...将聚类类别数量设置为 6,并将学生水平测试的各部分成绩看做多个点,然后 以...
数据挖掘在高校教学管理中的应用
【关键词】教学管理;数据挖掘;关联规则;聚类;变化和...辅助 完成学生管理、成绩分析、培养方案制定、教学...本文将对数据挖掘技术在教学管理中的应用,进行概括和...
更多相关标签: