当前位置:首页 >> 能源/化工 >>

数据挖掘中的聚类技术在学生成绩分析中的应用


数据挖掘中的聚类技术在学生成绩分析中的应用 [摘 要] 本文针对在大类招生背景下北京科技大学经济管理学院 2005 级学 生的考试成绩, 应用数据挖掘技术分析分专业前学生成绩与专业及分专业后课程 学习之间可能存在的潜在的联系。 首先进行数据预处理以保证数据挖掘结果的质 量和提高数据挖掘的效率; 然后根据分专业前的课程成绩对学生进行聚类,并分 析各类的成绩特征; 最后以信息管理与信

息系统专业为例,分析各类学生在分专 业后的优势课程和较弱课程。 [关键词]数据挖掘;聚类;学生成绩分析 doi:10.3969/j.issn.1673-0194.2009.15.014 1 引 言 本科按学科大类招生已在部分高校实施, 这些高校按一级或二级学科进行招 生,在经过约两年的统一基础培养后,由学生结合就业、兴趣等选择具体专业方 向,开始专业课程及实践课程的学习直至毕业[1] 。本文研究数据挖掘技术在大 类招生背景下学生成绩分析中的应用,数据来源于北京科技大学经济管理学院 2005 级学生前 5 个学期的成绩,其中前 4 个学期为分专业前的成绩,第 5 个学 期为分专业后的成绩。通过观察这些数据可以发现如下特点:①成绩分布在 0~100 之间,且各个分数段的密度不同,其中成绩取值在 70~90 分之间的比例非 常大;②分专业前的课程数量很多,且其中的某些课程与专业选择相关性很小; ③部分课程存在得分普遍较高或得分普遍较低的现象; ④分专业前的课程主要包 括:高等数学 I、概率与数理统计、外语 I、线性代数、计算机基础、会计学、 财政金融学、管理信息系统、马克思主义哲学、军事理论、体育 I 等 46 门课程; ⑤分专业后各专业课程不同。 为了保证数据挖掘结果的质量,提高数据挖掘的效 率,需要进行净化、集成、精简、应用变换等数据预处理。之后,再进行聚类及 进一步的分析。 2 数据预处理 2.1 数据净化 数据净化是清除数据源中不正确、 不完整等不能达到数据挖掘质量要求的数 据,从而提高数据的质量,得到更正确的数据挖掘结果。 在本研究所针对的学生成绩数据中,遇到的主要数据净化问题是空值问题。 对此,本研究采用了两种处理方式:若该学生有 3 门及以上课程成绩为空,则将 其作为异常点从数据中除去; 若该学生有 2 门及以下课程成绩为空,则取其所在 班级对应课程的平均成绩来替代空值。 其次, 对于重修课程,因为重修成绩代表着学生在该门课程学习中的最终表 现和知识掌握程度,所以都用重修成绩代替原有的成绩。 2.2 数据的集成 数据挖掘所应用的数据如果来自多个数据源,就需要进行数据的集成。数据 的集成是从不同的数据源选取所需的数据,进行统一存储,并消除其中的不一致 性。 由于获得 5 个学期学生成绩数据的时间不同, 各个学期的学生成绩数据在结 构上存在一定的差异,所以需要对这些成绩数据进行数据集成。 另外, 为了进一步分析具有不同成绩特点的学生在分专业后的优势课程和弱 势课程,利用 Excel 中提供的 QUARTILE(ARRAY,QUART)函数,针对分专业后 各门课程,计算该课程成绩的四分位点,以将学生成绩分成优、良、中、差 4 类。 2.3 数据的精简 数据精简是采用一定的方法对数据的规模进行缩减。 作为本研究数据源的学 生包括了一般统招生和体育特长生,由于体育特长生入学时专业已定,不参与大 类招生两年后的专业选择,在此将所有体育特长生的信息除去,并将退学、休学 的学生的信息除去,以缩减数据量,最终用于聚类的学生人数是 262 人。另外, 由于本研究的内容是专

相关文章:
聚类算法分析及其在学生成绩分中的应用
聚类算法分析及其在学生成绩分析中的应用 数学计算机科学学院 计算机科学与技术 陶...(300 字左右) 数据挖掘就是从大量的、 不完全的、 模糊的、 随机的数据中,...
聚类技术在学生成绩分析中的应用
陕西理工学院毕业设计 聚类技术在学生成绩分析中的应用【摘要】数据挖掘技术是信息技术研究的热点问题之一。目前数据挖掘技术在商业、金融业等方面都得到了广泛的应用,...
利用K-means聚类分析技术分析学生成绩
利用K-means 聚类分析技术分析学生成绩 摘要:数据挖掘是在海量的数据中寻找模式或规则的过程。数据聚类则是数据挖掘中的一项重要技术, 就是将数据对象划分到不同的...
数据挖掘中的聚类分析方法
由此数据挖掘技术应运而生并得 以迅猛 数据挖掘中的聚类分析方法随着计算机应用的普及, 信息系统产生的数据量日益增大, 如何有效地利用巨量的原始 数据分析现状和...
数据挖掘中聚类分析综述
龙源期刊网 http://www.qikan.com.cn 数据挖掘中聚类分析综述 作者:张静 来源:《价值工程》2014 年第 15 期 摘要: 数据挖掘中的聚类技术是一种非监督分类技术...
聚类分析在学生成绩管理系统中的应用(罗文彪、吴旭冉、夏强、纪稳)
聚类分析在学生成绩管理系统中的应用(罗文彪、吴旭冉、夏强、纪稳)_互联网_IT...年代中期兴起的数据挖掘技术中获得,从而找到影响学生学习成绩的真 实原因,制定...
数据挖掘论文(聚类分析及其应用)
数据挖掘论文(聚类分析及其应用)_经济学_高等教育_教育...对数据对象进行分类,把一组数据对象分到不同簇中。...[6]高凤荣.个性化推荐系统关键技术研究[D].人民...
数据挖掘技术在高校课程成绩分析中的应用研究
所以 , 本文把数据挖掘技术中的 粗糙 集方法引入到学生课程成绩分析中 , 探索...最近序列分析、单变量分析、多变 量分析、时间序列分析、最近邻算法和聚类分析等...
数据挖掘中 常用 聚类分析的技术方法
最后阐述了聚类分析在数据挖掘中的应用。 1 数据挖掘领域中聚类算法的分类 聚类...改 进层次方法的聚类质量的一个有希望的方向是将层次聚类和其他聚类技术进行集成...
更多相关标签:
数据挖掘聚类分析案例 | 数据挖掘聚类算法 | 数据挖掘 聚类 | 数据挖掘 聚类分析 | 聚类挖掘 | 数据挖掘聚类分析论文 | 文本挖掘 文本聚类 | 数据挖掘 分类 聚类 |