随着教育的发展,在日常教学工作中会产生大量教学数据和教学资料,这些数据对教师教学工作至关重要,需要进行妥善管理与储存,本文对数据挖掘技术在教学中的应用进行研究。
《现代教育技术》核心教育期刊,创刊于1991年,由教育部主管,清华大学主办,为中国教育技术协会会刊。本刊刊名由清华大学胡东成教授题字。2001年获正式刊号,对外公开发行之际,著名教育家顾明远教授率先为本刊题词:“开展教育技术研究,促进教育现代化”。
随着信息技术在高校管理中的应用,日常使用中教学管理系统会遗留下海量的数据,这些数据已经形成一个关于教学信息的数据库。在现代化建设的的条件下,如果对这些海量数据进行分析和挖掘,就可以发现对教务管理、学生管理当中有规律并具有指导意义的信息。
利用数据挖掘技术,针对现在学分制的高校教务管理系统进行改革和创新,先将数据挖掘的概念引入到教务管理系统的使用中,分析了其实现的可行性。针对教务管理系统中的高校统考课程成绩这一项数据进行整理和建模。
一、引言
数据挖掘作为一种工具,将其应用于高校的教学管理工作,可以帮助管理者从以往的数据中发现隐藏的规律或模式,为决策提供信息支持,从而不断提高教学管理质量,促进教育管理的进一步改革、完善和发展,从而提高管理的科学性、针对性和高效率。不管是国内还是国外,越来越多的高校利用数据挖掘等等技术进行决策系统的构建,为更高的决策提供数据基础。
二、数据仓库和数据挖掘的定义
数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。数据仓库不仅仅是是一个简单的数据集合,还是一个决策系统,它将相关联的的数据重新组织,并且为其找出一定的规律,从而对以后的数据进行预测,以供最终用户直接完成对数据的查询、分析与决策[1][2]。这些元素被收集在模型下,例如:
预测:估计销售量、预测服务器负载或服务器停机时间;
风险和概率:选择目标邮递的最佳客户、确定风险方案的可能保本点、将概率分配给诊断或其他结果;
建议:确定哪些产品有可能一起销售并生成建议;
查找序列:分析购物车中的客户选择,并预测接下来可能发生的事件;
分组:将客户或事件划分到相关的项目分类,分析和预测相关性。
目前,常用的数据挖掘分析方法有:关联规则分析、聚类分析、分类分析、特征、变化和偏差分析、web页挖掘等几种[3]。
三、数据挖掘在教务管理中的应用
随着时代的发展,对学生的要求也越来越趋向于个性化、多元化。学生可以自主选择自己感兴趣的课程,感兴趣的老师。这样就导致学校在定制人才培养方案的时候出现的盲区。或者我们可以通过调查问卷的方式提取学生的个人特征、学习情况和兴趣爱好。并对学校的教学计划、课程设置以及资源分配进行统筹。这样的方式会耗费大量的时间和精力,并有在这样的过程中,也会因为收调查的人群不同而得到不一样的结果。针对这种部分代表全部的方式,得到的结果也会有所误差。利用信息化的教务管理系统,我们在正常使用下就已经留下了学生信息、课程设置、成绩等等的大量信息。
在教务管理中运用不同的数据挖掘方法可以挖掘出相关的有价值的信息知识。按照不同的关联规则,对数据的分类也是不一样的,从而反应出的映射类别也是不一样的。选择合适的方法能够优化速度,更准确的预测,为决策提供更为精确的数据。按照不同的关联规则提取数据,并用对提取数据进行分析[4]。
例如存在A+B—C的规则。那么根据学生的A行为和B行为就可以推出可能要发生的C行为,这样就可以及时制定策略去鼓励或遏制C行为的产生。以A学生和B学生在一起的行为来说,推导出A和B在一起是起着积极作用还是负面的影响,进而可以选定学生之间的关联,促进学生之间的互助行为。通过这样的规律就可以更好的在学校内使用互帮互助的学生集合。并且利用分类规则对于学生的分类和判断,可以对于不同的学生采用不同的教学方法和教学课程,可以进一步实施分层次教学,提高教学质量。另外,利用数据挖掘技术挖掘教务管理系统中积累的有用信息,可以使学校的相关院系针对人才培养方案,进行课程的调节。通过选课率、通过率及相关信息,鼓励和引导学生选择互补的课程,这有利于学生整体素质的提高,也有利于教学资源的合理分配。
四、模型的建立
大部分的学校选用学分制的教务系统,采取分专业、分班教学的方式来测量学生的学习情况,在繁杂的的教务系统中,以统考课程成绩作为数据仓库的基础数据,利用数据挖掘的相关方法对学生的成绩进行分析和归类,并对课程的选择进行预测,更好的为学校制定人才培养方案提供基础数据和预测数据。进一步的为学校的管理者提供决策支持,更好的、更准确的制定学校的发展方案。于此同时也可以为学校提高教学质量、优化教学资源提供可靠的数据依据。
首先,在基于B/S的三层体系结构中,表示层、中间层、数据层被分割成三个相对独立的单元。利用数据仓库的三层体系结构,搭建属于高校统考课程成绩数据仓库的应用模型的体系[5]。
其中,这三层结构由五部分组成,如图4-1所示。
其中,五个部分分别是:
(1)数据源,包含着以后分析所需要的所有基础数据。例如学生基本信息、试卷信息、题型信息、课程信息、教师信息等。
(2)ETL阶段,即数据的抽取、转换、装载和刷新,数据的来自于不用的数据源,在不同的数据源中的信息表述也不尽相同,这些数据在抽取的过程中需要进行过滤,得到质量高的信息,并针对不同表述的数据转换成同种的格式,方便后面数据的刷新,并装载到另一层的数据仓库中。
(3)中心数据仓库,即高校统考课程成绩数据仓库。这个中心数据仓库内存放的是经过清洗和转换以后的数据,在经过进一步加工以后存储于多维数据库中,学生可以利用数据的分析进行课程的选择,从而达到决策支持的效果。
(4)OLAP服务层,利用OLAP技术或是DM技术对统考成绩数据仓库中的数据进行查询访问,得到辅助决策信息。
(5)信息展示层,利用数据分析工具得到的知识通过各种可视化的信息展示技术,比如有图标、文本、视频、声音等方法将分析结果更加直观和全面的展示给用户。
其中题型难度表,分数表,考试状态信息表作为表述的元素。
在教务系统中,针对课程成绩某一功能,利用数据挖掘技术,将其应用于某个课程成绩中,将学生成绩数据进行清洗、转换、加载,完成数据的汇总。并使用OLAP技术对学生成绩进行全方位、多角度的分析,例如:学生的总结性评估、学生的个性特征等等,通过这些信息更好的完善学习方法,提高学习的成效。准确判断学生合作学习和解决问题的能力,洞察学生的学习动态。
五、结语
利用数据挖掘技术,能帮助大学管理人员更好地分析数据,从而将潜藏的、有用的信息和知识,从大量的数据中提取出来。为后面的决策优化速度和准确性等。数据挖掘在教务系统中的运用,也需要通过慢慢的研究来进行进一步的提高。
参考文献
[1]JiaweiHAN,MiehelineKamber.数据挖掘慨念与技术[J].范明,孟小峰,译.北京:机械工业出版社,2004:l-160.
[2]DavidHand,HeikkiMannila,PadhraicSmvth.数据挖掘原理[J].张银奎,廖丽,宋俊等,译.北京:机械工业出版社,2003.
[3]刘红岩,陈剑,陈国青著.数据挖掘中的数据分类算法综述[J].清华大学学报汨然科学版,2002,1.
[4][美]融chardJ.Roeger.数据挖掘教程[M].北京:清华大学出版社,2003.
[5]余英泽.一种新型数据分析技术——数据挖掘口].计算机与现代化,2000(1).