公务员期刊网 精选范文 数据挖掘课程范文

数据挖掘课程精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数据挖掘课程主题范文,仅供参考,欢迎阅读并收藏。

数据挖掘课程

第1篇:数据挖掘课程范文

在传统教育中,教师通过与学生面对面的交流,获得学生学习行为的表现信息,较为容易掌握学生的学习情况和课程教学效果,但随着现代教育技术的发展,网络学习方式的普及,以及学生学习行为的变化,研究网络课程的教学方法受到了越来越多的关注。本文以Moodle网络课程管理系统为研究基础,分析并提出有针对性的数据挖掘方法构架,以达到对课程建设情况和学生学习情况的跟踪分析,为教师改进教学策略、提高网络课程教学质量提供有力支持及方法借鉴。

【关键词】 网络课程;数据挖掘;挖掘模式

【中图分类号】 G40-034 【文献标识码】 A 【文章编号】 1009―458x(2014)09―0068―04

一、引言

随着互联网以及移动设备的迅速普及,人们使用网络的时长在不断增加,通过网络进行学习的需求及能力也在迅速提高。据美国Ambient Insight研究报告指出,2009年美国中学以后的教育机构中,有44%的学生通过网络进行课程学习,预计到2018年,美国通过网络学习的学生人数将超过面授学生的总人数。在韩国,78%的高校都提供网络教学(Allen et al. 2008)。在中国,教育部于2011年10月启动了国家开放课程建设工作,教育部《教育信息化十年发展规划》(2011-2020年)中也明确提出了“推动信息技术与高等教育融合,创新人才培养模式”的要求,融合的关键就是要选择有效的网络教学模式,因此,对网络教学的质量和有效性研究正被人们所关注。

本文以Moodle网络课程平台为基础,分析并提出有针对性的数据挖掘方法构架,以达到对课程建设情况和学生学习应用情况的跟踪分析,为教师改进教学策略、提高网络课程教学质量提供有力支持。

二、选择Moodle网络课程平台的理由

之所以选择Moodle课程管理系统建设网络课程平台,是由于Moodle课程管理系统是一个开源免费软件,更主要的是其模块化的设计非常易于课程的创建,能使课程教师摆脱课程网站建设的技术屏障,还可以使教师从课程内容的设计者转变为教学资源与活动的组织者。[1]

在国外Moodle系统的应用得到了迅速推广。有数据显示,使用Moodle的国家和地区有200多个,注册使用机构有67,000多所,注册用户数量达5,800万,运行课程有600多万门。注册用户最多的前五位国家分别是美国、西班牙、巴西、英国和德国。[2]

三、教师所关注问题调查

根据教育部颁布的《CELTS-31教育资源建设技术规范》,将教育资源建设分为素材、课程、评价和资源管理系统开发四个层次。其中素材与课程是网络教育资源建设的基础,评价和资源管理系统则分别是确保质量与实现资源建设的工具与手段。[3]对于建设网络课程的教师需要了解它的使用情况,从而分析课程结构是否合理,调整课程内容的分布情况,优化网络课程的设计,提高教学效果。

为了解教师使用网络课程的期待值和目的性,我们采取目的抽样和随机抽样相结合的方式,样本来自笔者所在的三个教师专用QQ群人员。调查问卷设计从了解教师对网络课程的需求、认识、应用三个主要层面展开,具体的问卷内容为四个部份:了解参与问卷教师的基本情况;了解教师对网络技术应用的需求情况;了解教师对网络课程的认识及使用困难所在;了解教师希望网络课程能帮助解决教学中的哪些问题。问卷在公共专业问卷调查网站(问卷星)上,一周后回收有效问卷159份。数据分析基本报告可见链接:http:///report/3234099.aspx。

笔者所在院校为云南普通高校,与问卷的地图分布情况相吻合,应该更能代表云南普通高校的普遍情况(见图1)。

图1 问卷来源地理分布比率图

问卷中有96.61%的教师认为应该在教学中整合网络技术,有38.98%的教师因为技术应用能力的不足,不够明确如何使用网络技术(见图2),这说明我们建设网络课程应该选择如同Moodle这样简单易用的课程管理系统。

对于建设网络课程,教师关注度较高的前4个方面是:学生学习过程参与的情况、网络资源的使用情况、学生在线学习时间以及学生参与讨论的频度情况(见图3)。

图2 教师对网络技术与教学融合的意见

图3 教师关注信息统计

四、网络课程数据挖掘模式构架

数据挖掘技术是获取相关信息的有效技术手段。对于教师所关心的几个方面内容,这里提供几种可借鉴的方法:

1. 学生学习过程分析

美国教育评价专家斯克里文(G F. Scriven)在1967年所著的《评价方法论》中,提出形成性评价是为正在进行的教育活动提供反馈信息,以提高正在进行的教育活动质量的评价,是一种对学习进程的动态评价。教师和学生可以依据获取的反馈信息了解学习状态,及时调整教学或学习。[4]

在Moodle平台中具备学生学习进展跟踪功能。

方法一:通过设置“课程进度跟踪”,了解学生各项学习活动的完成情况。

如图4所示,进入课程,在“课程管理”/“课程进度跟踪”进行跟踪条件设置,然后再选择“课程管理”/“报表”/“课程进度”,就会显示选修该门课程的所有学生的各项学习活动的完成情况。

图4 课程进度跟踪设置

方法二:分析学生各项学习活动的参与度。

通过选择“课程管理”/“报表”/“课程成员”,可以详细地显示各项课程活动学生的参与情况,以及参与的次数,更清楚地分析学生的学习努力程度。如图5所示,列出了数据库原理及应用这门课程的“第一部分测验”活动、每个学生参与的次数。

方法三:采用数据挖掘手段,了解学生的学习风格。

此方法要求具备一定的数据挖掘知识及应用能力。通过Mysql系统提取Moodle后台数据库(\server\mysql\data\mysql)进行关联规则分析。

关联规则数据挖掘,可以发现学生学习行为之间的关系,通过对学生的某两类网络学习行为之间取值关系进行分析就可以得出它们之间的关联性,进而预测学生将要进行的下一个行为,从而挖掘网络学生学习行为之间的关系,使得学生学习风格显性化。[5]

2. 课程资源利用情况分析

课程资源建设是影响网络教学应用质量的重要因素。甘振韬等通过SQL Server的Analysis Services 工具,对网络课程的资源配置情况,包括资源配置指数和访问量进行分析。[6]

Moodle平台能很直观地呈现课程各项资源的访问情况。

方法:选择“课程管理”/“报表”/“课程活动”,课程设计的各项活动被访问量被详细统计出,如图6所示,教师可以清楚了解课程资源的利用率情况,分析学生的学习喜好,适当调整各活动资源的配比。

图6 课程资源访问情况

3. 学生在线学习时间分析

对于某门课程,通过分析学生的日志,可以掌握学生的在线学习时间,以及学习时段的分布情况。

方法:点击“课程管理”/“报表”/“日志”,其中可以设定查看所有成员或是某一个成员、所有活动或是某一项活动,以及所有日期或是某一天,学生的在线学习情况。如图7所示。

图7 学生日志

4. 学生参与讨论的频度分析

学生参与课程讨论的频度,可以反映学生的学习主动性,教师通过观察可以即时进行有针对性的教学干预。

方法:选择“课程管理”/“报表”/“课程成员”,如图8所示,学生参与“课程聊吧”活动的情况。

图8 学生参与讨论活动的频度

5. 学习成绩分析

学生的最终学习情况需要一个成绩评定,Moodle平台的设计理念中非常强调过程性评价,它能够记录学生学习过程中的各项活动成绩,包括师生、生生相互评价的成绩,汇总成学生的最终成绩。

方法一:查看教学活动的单项成绩情况。

直接使用Moodle平台所提供的课程管理功能,点击“课程管理”/“成绩”选项,打开成绩管理菜单,再选择“类别和项”下的“简略视图”(如图9),可以查看教学活动过程各项汇总成绩。并可以设置学习过程中各部分占总成绩的比率。

方法二:对测验试题结构分析。

在Moodle中若选择测验,则出现“测验管理”,再选择“测验管理”/“统计”,可以得到本次测验的统计分析报告。包括此测验的标准偏差、测验的分数分布偏度、分数的分布峰度等。还有此测验试题的结构分析结果,包括容易度指数、试题的标准偏差等(如图10),能让教师科学地调整测验的结构组成,试题的难易程度和分数的布局等。

图10 测验试题结构

方法三:在成绩管理菜单下选择“导出”为Excel、OpenDocument电子表格或其它文档,再进行统计分析。

6. 群组分析(分组)

学生分组开展学习,可以促进学生的集体意识及合作能力的培养,但如何分组?各分组成员真的能很好地协作吗?这需要教师特别注意,需要考虑如何分组才能更好地激发学生的学习积极性。

方法一:选择“课程管理”/“用户”/“小组”,可以自主创建小组,也可以用“自动创建小组”方式创建,如图11所示,就是以自动方式创建的小组,其中还可以指定小组数量或是每个小组成员数。这种方式设置的小组较为随机,如果希望分组能考虑成员的凝聚性可以选择方法二进行。

方法二:应用社会网络分析软件,如UCINET等,可以开展学习社群的关系距离及中心性分析,以及小团体分析等分析。通过收集学生在讨论区或是聊天室中的问答的关系情况获得分析数据。对于社会网络结构的特征分析可以辅助判断师生交互网络发展的成熟程度。

五、小结

本文基于Moodle网络课程管理系统,介绍了教师关心的几个方面的数据分析方法,为想要分析自己网络课程使用情况的教师提供方法借鉴,从而教师能够更好地调整网络课程的内容组成、结构布局,以及教学方法策略的调整。同时,本研究也适当突破Moodle网络课程平台,提供了在其它网络课程平台中进行数据挖掘分析的方法和思路。通过几个方面数据分析方法的整合,目的是提供一种进行网络课程数据挖掘模式架构的研究。今后,研究还应深入底层数据的分析,提供更具通用性的网络课程数据挖掘模式方法。

[参考文献]

[1] 黎加厚. 信息化课程设计――Moodle 信息化学习环境创设[M]. 上海:华东师范大学出版社,2007.

[2] 张伟远,段承贵. 网络教学平台发展的全球合作和共建共享[J]. 中国远程教育,2012,(10):32-36.

[3] 邓康桥. workflow技术在网络课程开发管理系统中的应用研究[J].中国远程教育,2013,(4):63-68.

[4] 刘纳. 基于数据挖掘技术的网络学习形成性评价研究[D]. 上海:华东师范大学,2012.

[5] 李素珍. 基于网络学习行为分析的网络学习风格与学习偏好挖掘模型研究[D]. 武汉:华中师范大学,2009.

[6] 甘振韬,梅文,郭玉军. 数据挖掘技术在网络课程资源配置中的研究[J]. 中国医学教育技术,2012,26(6):635-638.

第2篇:数据挖掘课程范文

关键词: 数据挖掘; 课程内容体系; IT专业; 教学效果

中图分类号:G642 文献标志码:A 文章编号:1006-8228(2014)11-65-02

Course construction of data mining course for IT specialty in application-oriented university

Li Zhong, Li Shanshan

(Institute of Disaster Prevention, Sanhe, Hebei 065201, China)

Abstract: Aiming at the content differences of data mining course in the application-oriented university, the training objectives and requirement for different specialty are analyzed. The content system and hours arrangements of data mining courses for IT specialty starting are given from the three major functions of data mining. Based on the last two years' student teaching effectiveness of data mining courses, it is concluded that combining theoretical and experimental training content settings with appropriate teaching methods can improve learning interest, stimulate learning enthusiasm, improve operating ability and achieve training objectives.

Key words: data mining; course content system; IT specialty; teaching effectiveness

0 引言

毋庸置疑,我们正处在信息时代。根据国际互联网管理机构2012年的数据,每天全球互联网流量累计达1EB(即10亿GB),这意味着每天产生的信息量可以刻满1.88亿张DVD光盘[1]。要想在如此浩瀚的数字海洋里寻找有用的信息,简直是大海捞针!因此数据挖掘技术应运而生。大概十几年前,微软创始人比尔・盖茨就预言,数据挖掘技术将是未来计算机发展的重要方向之一,事实也的确如此。

数据挖掘技术诞生于20世纪80年代末,是统计学和计算机科学的交叉学科,涉及数据库技术、统计学、机器学习、神经网络、模式识别、知识发现、专家系统、信息检索、高性能计算、可视化以及面向对象程序设计等若干学科知识,在商业、金融、保险、体育、勘探、生物技术等领域获得广泛应用。也正因为该课程涉及的内容宽泛,要求知识面宽广、数学基础扎实等,前几年主要在研究生阶段开设。但是随着信息技术的快速发展,本科生能力要求提高,知识传授的重心下移,很多高校已在本科阶段开设数据挖掘课程,以提高大学生解决实际问题的能力,进而为课程设计和毕业设计打下必要的基础[2]。

1 国内高校本科数据挖掘课程开设现状

通过院校实地交流,结合网络搜索,我们已经收集了十几所高校的数据挖掘课程教学大纲,开设专业包含有计算机类专业、经济统计类专业、电气自动化类专业、生物技术专业等,各专业根据自己的人才培养目标制订教学大纲、教学计划、考试大纲等,其内容存在很大差异。其中985、211高校主要以英语授课,采用国外原版教材,课程内容涉及算法、编程较多;而一般院校多采用中文教材,根据专业不同,内容也有很大差异。

经济统计类专业开设数据挖掘课程,要求学生了解什么是数据挖掘,以及如何用数据挖掘来解决实际问题,了解如何通过几种数据挖掘技术建立数学模型,了解主流数据挖掘系统的特点,能够安装、使用,要求能够熟练使用典型的挖掘工具对实际数据进行分析,具备从数据资源提取信息与知识并进行辅助决策的基本能力。

自动化专业开设数据挖掘课程,要求学生了解数据挖掘概念、原理、过程,学会利用数据挖掘技术处理问题,了解有关数据挖掘算法原理,熟练运用数据挖掘技术建立数学模型,要求能够熟练使用数据挖掘软件解决问题。

第3篇:数据挖掘课程范文

Abstract: The characteristic of data mining technology course and the problems in the course teaching were analyzed. Based on them, some countermeasures were proposed to improve the effect of course teaching of data mining technology.

关键词: 数据挖掘技术;课程;教学

Key words: data mining technology;course;teaching

中图分类号:G642.0 文献标识码:A 文章编号:1006-4311(2011)25-0155-01

0 引言

数据挖掘技术是电子商务专业的一门重要专业课程,它是信息化时代对信息与数据管理的必然要求。一方面,在生产、生活和商业活动中,我们产生了海量的数据,这些数据有着不同的表现形式,如最常见的超市记录单、各种各样的公司或商业数据库,还包括音频、视频等;另一方面,我们需要从这些数据中寻求规律,对数据进行“挖掘”,使数据发挥更大的作用[1]。数据挖掘正是从大量的数据中提取出隐含的、以前不为人所知的、可信而有效的知识[2]。数据挖掘技术教学的目的就是要使学生掌握典型的数据挖掘技术,并能够运用数据挖掘技术解决实际问题,为今后运用数据挖掘技术解决实际问题打下扎实的基础。

1 数据挖掘技术课程特点

数据挖掘技术具有自己独特的课程特点:

1.1 新颖性 1995年,在加拿大召开了第一届知识发现和数据挖掘国际学术会议(International Conference on Knowledge Discovery and Data Mining),由于把数据库中的数据形象地比喻为“矿床”,“数据挖掘”一词很快流传开来[3]。数据挖掘的发展仅有10余年的时间,数据挖掘技术课程是一门新兴学科。

1.2 内容广 数据挖掘包括关联规则挖掘、分类规则挖掘、特征规则挖掘、时序规则挖掘、偏差规则挖掘、聚类规则挖掘和预测这七大任务,相应的,每种任务都有自己专门的挖掘技术[4],如关联规则挖掘的典型技术为Apriori算法及其衍生技术,分类规则挖掘的典型技术为ID3或C4.5决策树算法及其改进算法等。

1.3 有深度 数据挖掘技术作为一门计算机与数据处理相结合的新兴学科,具有一定的难度。其中的任何一个技术都可以独立成篇,如粗糙集分类算法自原理至实例推广就是一门单独的课程;作为数据处理的重要内容,聚类算法同样可以独立成籍。

1.4 交叉性 诚如前面所述,数据挖掘技术有着广泛的支撑背景,既包括信息论方法和集合论方法等归纳学习类技术,又包括神经网络方法、遗传算法方法、蚁群算法等仿生物技术,还包括成熟的统计分析技术和模糊数学技术,此外还有公式发现类技术和可视化技术等。可以这样说,数据挖掘总是在广泛吸取其他各门学科的先进技术,并加以转化、发展的。

2 数据挖掘技术教学过程存在的问题剖析

数据挖掘技术作为一门新学科、新课程,发展迅速,但是其缺点也是不言而喻的,主要包括:

2.1 课程教材不统一 目前,数据挖掘技术的教材层出不穷,这些教材尽管总体涵盖内容相近,均自成体系,但是有的细节却并不一致,如多数教材主张采用E-R图进行数据仓库(数据挖掘通常总是与数据仓库连接在一起的)设计,但也有教材持反驳态度[3];对数据仓库系统的体系结构说法也不尽一致,不同的教材给出不同的体系结构,有的甚至将数据结构等同于体系结构[5]。这主要是由于学科和课程的新颖性导致的,使得教材的编写多带有研究探索的性质,未能达成统一。

2.2 教学重点不统一 教材的不统一和学时的不统一(如有的院校是36课时,有的是48课时)导致教学重点也不统一,有的考虑到学生掌握知识的浅显性,将重点放在统计分析技术,而对神经网络技术和遗传算法技术等相对较难的技术一笔带过;有的则考虑到体系的完整性,对所有数据挖掘技术等同对待,均匀笔墨。

2.3 教学方式不统一 数据挖掘技术是一门实验技术较强的课程,但是有的教师在安排授课时,仅设置理论课时,没有实验课时;有的教师则将课程直接放在实验室来上,偏重于对学生实验技巧的掌握。当然,更多的是将实验课时与理论课时交错进行的。对实验安排的处理也不尽相同,有的分组进行,有的则由学生独立完成。

3 提高数据挖掘技术课程效果的对策建议

3.1 精心编排课程讲义 课程教材是授课的首要基础,一本好的教材不仅便于教师的备课、授课,更有利于学生的理解。当然,教材与课时、教学大纲有着密切关系,教师在选择教材时应充分考虑学生的学科基础、授课课时数、教学大纲规定的培养目标等各种因素,从大量层出不穷的教材中选择最理想的教材,适当的时候也可根据相关教材,整理一份恰当的讲义教材,组织学生使用。

3.2 合理安排教学内容 数据挖掘技术的教学内容应考到学科体系的完整性,既要为学生打牢理论基础,又要突出学生实践能力的培养。因此要以“掌握理论、强化应用、突出能力”作为数据挖掘技术课程的培养目标,通过精选具有充分代表性、源于实际问题的典型例题与案例,使它们能基本覆盖在实际中最常见的数据挖掘问题,在讲解这些从实践中抽取并经过精心改造和设计的例题和案例的过程中,逐步地建立起学生应该掌握的数据挖掘技术理论框架。

4 结束语

数据挖掘技术教学具有十分重要的现实意义,通过科学讲述数据挖掘技术,有助于培养学生对理论知识的现实应用转化能力,培养学生从现实世界出发提出问题、分析问题和解决问题的能力。数据挖掘技术的教学应以培养学生能力为主线,精心组织教学内容,有效采用多种方式,增进学生对知识的理解与掌握,显著提高教学效果与质量。

参考文献:

[1]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大学出版社,2006.

[2]Jiawei Han,Micheline Kamber著.范明,孟小峰译.数据挖掘:概念与技术[M].北京:机械工业出版社,2007.

[3]周根贵.数据仓库与数据挖掘[M].杭州:浙江大学出版社,2004.

第4篇:数据挖掘课程范文

【关键词】客户关系管理;数据挖掘;流程;模型

随着市场经济的发展,企业将面临强大的竞争压力,企业的产品越来越趋向于同质化,仅仅依靠产品本身很难在日趋激烈的竞争中取胜,所以愈来愈多的先进企业将重点从以产品为中心向以客户为中心的新型商业模式转移,客户关系管理(CRM)也就应运而生。客户关系管理(Customer Relationship Management)简称CRM,是由美国的Gartner Group me公司于1999年首先提出的。CRM是一种以客户为中心的经营策略,它以信息技术为手段,并对工作流程进行重组,以赋予企业更完善的客户交流能力,最大化客户的收益率。CRM就是企业为了保持竞争力,采取的面向客户、客户驱动和以客户为中心的发展策略。而企业在与客户交互过程中积累下来的各种客户数据恰恰是反映客户特征和需求的最佳载体。当今许多企业的数据库或数据仓库中都搜集和存储了大量关于客户的宝贵数据,这些数据涵盖了从客户基本数据、购买记录及客户反馈的个个环节。充分利用这些数据,深入分析、挖掘隐含在这些数据中的有用信息,将有助于企业更好地管理客户关系,实现CRM的功能和目标。然而,由于缺乏在大量数据中发现深层次信息的能力,许多企业对于这些数据的利用还只是停留在基础层的浏览、检索、查询和应用层的继承、组合、整理等方面,而无法将这些数据转化为更加有用的知识。因此,如何更加有效地管理企业数据库中快速增长的海量数据,将数据资源的利用提高到知识创新的高级阶段,已经成为企业当前需要迫切解决的问题,数据挖掘(Data Mining简称DM)技术的运用就可以帮助企业很好地解决这个问题。

一、数据挖掘的流程

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的和有用的信息和知识的过程,它可以按照企业既定的业务目标自动地从数据库中提取出用以辅助企业决策的相关模式。数据挖掘的流程图如下:

图1中各步骤(1)确定业务对象。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有一盲目性,是不会成功的。(2)数据准备。一是数据的选择。搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。二是数据的预处理。研究数据的质量,为进一步的分析做准备。并确定将要进行的挖掘操作的类型。三是数据的转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。(3)数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。(4)结果分析。解释并评估结果,其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。(5)知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。

二、数据挖掘流程的模型

数据挖掘业内,公认的两大模型是SAS的SEMMA和包括SPSS在内的行业协会提出的CRISP-DM。SEMMA强调的是应用的方法;CRISP-DM则从方法学的角度强调实施数据挖掘项目的方法和步骤。CRISP-DM是站在高处,在讲一个总体大方向;而SEMMA在说具体应该如何着手。

1.SEMMA。(1)Sample──数据取样。当进行数据挖掘时,首先要从企业大量数据中取出一个与企业要探索问题相关的样板数据子集。通过数据取样,要把好数据的质量关,一定要保证取样数据的代表性、真实性、完整性和有效性,这样才能通过此后的分析研究得出反映本质规律性的结果。根据具体的需求,可以创建训练集、测试集和效验集。(2)Explore──数据特征探索、分析和预处理。当用户拿到了一个样本数据集后,它是否达到用户原来设想的要求,有没有什么明显的规律和趋势,有没有出现用户所从未设想过的数据状态,各因素之间有什么相关性,可区分成怎样一些类别,这些都是首先要探索的内容。(3)Modify──数据调整和技术选择。在问题进一步明确化的基础上,用户可以按照问题的具体要求来审视数据集,看它是否适应企业问题的需要。针对问题的需要,可能要对数据进行增删,也可能按照用户对整个数据挖掘过程的新认识,组合或者生成一些新的变量,以体现对状态的有效描述。(4)Model──模型的研发和知识的发现。数理统计方法是数据挖掘工作中最常用的主流技术手段。应用SAS提供的多种分析工具不仅能揭示企业已有数据间的新关系、隐藏着的规律性,而且能预测事件的发展趋势。用户采用哪一种模型,主要取决于数据集的特征和用户要实现的目标。另一方面,数据挖掘是一个反复的不断深化的实践过程,用户可在实践中选出最适合的模型。(5)Assess──模型和知识的综合解释和评价。经过以上五个步骤,用户将会得出一系列的分析结果、模式或模型,常常是对目标问题多侧面的描述。这时,就要能很好地综合这些规律性,为企业提供合理的决策支持信息。

2.CRISP-DM。(1)业务理解(Business Understanding)。最初的阶段集中在理解项目目标和从业务的角度理解需求,同时将这个知识转化为数据挖掘问题的定义和完成目标的初步计划。(2)数据理解(Data Understanding)。数据理解阶段从初始的数据收集开始,通过一些活动的处理,目的是熟悉数据,识别数据的质量问题,首次发现数据的内部属性,或是探测引起兴趣的子集去形成隐含信息的假设。(3)数据准备(Data

Preparation)。数据准备阶段包括从未处理数据中构造最终数据集的所有活动。这些数据将是模型工具的输入值。这个阶段的任务有个能执行多次,没有任何规定的顺序。任务包括表、记录和属性的选择,以及为模型工具转换和清洗数据。(4)建模(Modeling)。在这个阶段,可以选择和应用不同的模型技术,模型参数被调整到最佳的数值。一般,有些技术可以解决一类相同的数据挖掘问题。有些技术在数据形成上有特殊要求,因此需要经常跳回到数据准备阶段。(5)评估(Evaluation)。在开始最后部署模型之前,重要的事情是彻底地评估模型,检查构造模型的步骤,确保模型可以完成业务目标。此阶段的关键目的是确定是否有重要业务问题没有被充分的考虑。在这个阶段结束后,一个数据挖掘结果使用的决定必须达成。(6)部署(Deployment)。通常,模型的创建不是项目的结束。模型的作用是从数据中找到知识,获得的知识需要便于用户使用的方式重新组织和展现。根据需求,这个阶段可以产生简单的报告,或实现一个比较复杂的、可重复的数据挖掘过程。

参考文献

[1]Margaret H.Dunham.数据挖掘教程[M].清华大学出版社,2005

[2]魏兵.数据挖掘技术在客户关系管理中的应用研究[D].南京理工大学硕士.2005

[3]章兢,张小刚.数据挖掘算法及其工程应用[M].机械工业出版社,2006(6):56~73

[4]赵闪.数据挖掘在客户关系管理中的应用研究[D].广东工业大学硕士学位论文.2007

[5]邵兵家,于同奎.客户关系管理一理论与实践[M].清华大学出版社,2004

[6]贾月娥.客户关系管理趋势谈[J].管理信息化.2003

第5篇:数据挖掘课程范文

关键词:数据挖掘;教务管理;决策支持

中图分类号:G647 文献标志码:A 文章编号:1674-9324(2014)13-0010-03

近年来,随着高等学校扩招以及计算机在管理中的普及应用,学校教学管理系统积累了大量的数据。目前,这些数据只是用于简单的成绩分析,并未能充分用于规律分析和处理,未在学校管理和决策起到应有的作用。因此,利用数据挖掘技术对学生成绩数据进行深层次分析,找出其中各种潜在模式及影响因素,将对学生选修课个性化管理、课程设置、教学计划制订和教学实践有重要的指导作用[1-3]。本文针对高等院校教学管理系统普遍存在的问题,提出了将数据挖掘技术应用到本科生成绩管理、分析和实践,通过从学生成绩数据中挖掘潜在的、有用的信息,目标是为教学管理者提供决策,为学生选课提供支持。

一、数据挖掘的概念

1989年,在第11界国际人工智能的专题研讨会上,学者们提出了基于挖掘的知识发现(KDD)概念。1995年在美国计算机年会上,一些学者开始把数据挖掘视为数据库知识发现的一个基本步骤或把两者视为进义词讨论[4,5]。所谓数据挖掘(Data Mining),就是从大量、不完全、随机的实际应用数据中,提取隐含的、未知的、具有潜在应用价值的信息和知识的过程。其主要特征表现为:数据源必须是真实的、大量的;挖掘加工出用户感兴趣的知识;形成的知识要可接受、可理解、可运用。通过数据挖掘,可以帮助决策者寻找规律,发现被忽略的要素,预测趋势,并用于决策。数据挖掘是对数据内在和本质的高度抽象与概括,是对数据从感性认识到理性认识的升华。数据挖掘又被称为知识发现(Knowledge Discovery,KD),因此许多知识发现中的算法,如人工智能,也常常被使用于数据挖掘过程中。数据挖掘一般以下7个步骤:(1)数据清理:消除噪声和不一致数据。(2)数据集成:可以把多种数据源组合在一起,将数据结果放在数据仓库中。(3)数据选择:从数据库中提取与分析任务相关的数据。(4)数据变换:通过汇总或聚集操作把数据变换或统一成适合挖掘的形式。(5)数据挖掘:使用智能方法提取数据模式。(6)模式评估:根据用户某兴趣度度量,识别表示知识的真正有趣的模式。(7)知识表示:实用可视化和知识表示及技术向用户提供挖掘的有用知识。

二、数据挖掘技术在本科教学管理中的应用

大学本科教学管理,一般涉及了学生成绩管理、选课管理、学生评教等几部分内容,其实质上也是一个数据分析、加工利用和决策管理的过程。因此,利用上述数据挖掘的方法,对大学本科教学管理数据进行深层次的分析,可以将人们对数据的应用从低层的数据查询提升到决策支持、信息预测,在教学管理的诸多方面发挥着重要作用。

1.本科生成绩的挖掘加工。学生成绩是评价教学质量的重要依据,也是评价学生对所学知识掌握程度的重要标志,在高等教育质量评价中居于重要位置。所以通过对学生的成绩进行分析和挖掘,可以为教学管理者提供改善教学条件,加强教学管理,深化教学改革,提高教学质量等方面的重要依据。利用数据挖掘技术,通过不同范围、不同角度分析学生的成绩和分布规律,挖掘影响学生成绩的因素。主要包括:①统计分析各门课程成绩分布,包括最高分、最低分、及格率等;分析各门成绩之间的关系。②按班级分析学生成绩分布,以及影响班级成绩的因素。生成各年级成绩分布情况排名,年级成绩分布曲线。③不同任课教师给予的学生平均成绩;学生成绩与教师学历、职称,教学经验之间的关系。④各生源地成绩分布,生源地与学生成绩间的关系。利用关联分析或分类分析,可以发现一些普遍性的现象。如通过分析学生的成绩,可能发现“高等数学”成绩好的学生,其在计算机语言类课程的成绩也好。但这种分析,也可能导致对暂时不具有普遍性课程的忽略。

2.学生选课信息的挖掘分析。选课就是学生利用计算机软件选择自己所上的课程。选课数据中可能隐藏着对教学管理具有重要的参考价值,数据挖掘技术可以用来找出这些隐藏在数据背后的信息和知识。主要可从以下几个方面进行分析挖掘:分析各门课的课程归属和所占学分,确定学生选课时对不同课程归属课的学分多少的考虑;分析各门课的选课人数,确定课程的欢迎程度;分析各门课选课率,了解学生对目前课程安排中的满意程度;分析某门课程的选课学生情况,了解选择当前课程的学生的专业情况;分析各门课程的任课教师情况,了解任课教师的实际情况和综合能力。具体的挖掘步骤可按如下进行:①首先要对选课的原始数据进行预处理,把其原始数据采样后转换成适合数据挖掘的数据。由数据收集阶段得到的数据可能有一定的“污染”,表现在数据可能存在自身的不一致性,或者有缺失数据的存在等,因此要进行抽样与清理。在处理的过程中,要明晰数据的上下结构和面向对象,为数据挖掘作好准备。②完成数据的预处理之后,确定参与挖掘的数据表,在教务选课系统中学生选课表是基本事实表,课程信息表、学生信息表和教师信息表可作为维表。③最后将预处理之后的数据进行状态运行,在此基础上选择合适的数据挖掘算法进行数据挖掘。数据挖掘通过汇总或聚集操作将数据变换或统一成适合挖掘的形式,可单独利用也可综合利用各种数据挖掘方法对数据进行分析,挖掘用户所需要的各种规则、趋势、类别、模型等。挖掘的最终结果可以用可视化的图形方式表现出来。根据挖掘的结果,得出选课背后隐藏的各种数据信息,如某些专业的学生喜欢选某位老师所开设的相关课程,部分学生总是选择学分较多的有更多上机机会的课程等等。

3.学生评教信息挖掘分析。合理评价教学的技术水平是衡量一个学校教育质量的重要标准。教学评价就是根据教学目标和教学计划的要求,系统全面地收集数据,对教学过程中的教学活动以及教学成果给予判断的过程。评教内容一般包括对学生“学”的评价和对教师“教”的评价。下面以学生综合测评指标和学生评教指标为例,将关联规则和粗糙集理论应用于评价系统,通过对各指标的排序、约简等,在一定程度上对评价指标优化,讨论把数据挖掘技术引入学生评教指标优化和信息分析。另一方面,评定学生的学习行为,既可对学生起到信息反馈和激发学习动机的作用,又是检查课程计划、教学程序以至教学目的的手段。同时,考查学生个别差异,便于因材施教的途径。评价要遵循“评价内容要全面、评价方式要多元化、多次化、注重自评与互评的有机结合”的原则。利用数据挖掘工具对学生的学习成绩数据库、行为记录数据库、奖励处罚数据库等进行分析处理,可以及时得到学生的评价结果,对学生出现的不良学习行为进行及时指正。同时,还能够克服教师主观评价的不公正、不客观的弱点,减轻教师的工作量。另外,将关联规则运用于教学评价数据中,可以探讨教学效果的好坏与教师年龄、职称之间的关系、学生各项素质指标之间的关系等,用来及时地对教师的教学和专业发展以及学生的学习和个性发展提供指导,这是非常有意义的。

4.教师信息的挖掘分析。教师信息是本科教学管理中的重要方面,如使教学评价过程科学化,增强教学工作的预测功能和评价功能,为教学的客观决策和客观评价教师、了解教师的教学质量提供了一种比较合理的管理依据。主要包括:①教师个人信息:包括教师学历情况、职称情况、科研情况、研究方向、级别、工作经历等各种信息,可运用关联规则方法对教学评价结果和教师个人信息一起进行挖掘,从而得出影响教学结果的潜在的教师个人信息的部分情况。②教师素质:包括教师的思想政治素质、道德素质、文化素质、智能素质、心理素质、身体素质、外在素质等七个方面,通过数据挖掘技术在学生成绩或者相应的调查信息的挖掘,看出哪些因素对教学方面有较大影响,切实加强教师在哪些素质方面的培养和提高,从而有利于教学管理方法的制定和实施。③教师绩效:包括教师的工作业绩、工作态度、工作技能等方面的综合考核。应用数据挖掘技术,可以从教学评价数据中进行数据挖掘,查询教学效果与教师的工作态度、工作技能等的各种关联,找到教师的教学效果与教师绩效的关系问题,合理调配一门课程的上课老师,使学生能够较好地保持良好的学习状态,从而为教学部门提供了决策支持信息。

我国高校的教学管理长期沿用经验管理模式,往往难以避免管理滞后的弊端,尤其是近年来随着教学管理中产生的数据急剧增加以及对信息量的更高要求,把数据挖掘技术应用到教学管理系统中,必将为各教学管理部门的决策提供切实可行的依据,可以促进教育管理的进一步改革、完善和发展。对数据挖掘工具的有效利用,能够客观地反映教学系统中存在的问题,为实现高校的教学改革,将来在激烈的竞争中掌握主动,从而提高管理的科学性、针对性和高效率。

参考文献:

[1]梁循.数据挖掘算法与应用[M].北京:北京大学出版社,2006.

[2]刘晓霞.数据挖掘技术在高校教学中的应用[J].现代计算机,2008,(285):115-116.

[3]张玉林.数据挖掘技术在教学过程中的指导作用[J].西安通信学院学报,2006,(02):38-40.

[4]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大学出版社,2006.

第6篇:数据挖掘课程范文

关键词:数据挖掘;信息处理;教学管理

中图分类号:G434 文献标识码:A

Application Analysis of Data Mining Technology in Teaching Management

DONG Jun-kai

(Yanshan University, Hebei Qinhuangdao 066004)

Key words:data mining;information processing;teaching management

随着信息技术在高校管理中的普及,在教学管理中积累了海量的各种数据。这些与教学相关的数据已经形成一个完整的信息数据库。在当今信息化条件下,对这些数据进行处理、分析和挖掘,目的是想发现对学校教学管理、学生管理等各个方面有作用的指导信息。这些知识可以辅助学校管理者决策,提高学校的综合实力,同时也可以为学校提高教学质量,优化教学资源提供可靠的数据依据[1]。

数据挖掘(Data Mining ,DM) 是一个多学科交叉融合而形成的新兴学科,已经被广泛应用于社会阶层各个行业的多个方面。DM已经在许多领域取得令人满意的应用效果。在教育方面,随着数据信息的不断增长,把数据挖掘技术应用到高校管理当中,可以促进教育体制的完善、发展以及必要的改革。DM技术能客观地反映高校管理中存在的一些问题,为制定学校的方针政策提供重要依据。随着教育信息化进程的推进,将数据挖掘技术应用于教育中,从大量的教育数据中发现隐藏的、有用的知识来指导教育、发展教育,成为当今势在必行的重要的研究课题[2]。

1 数据挖掘技术

数据挖掘(DM, Data Mining) 就是从大量的、不完全、有噪声的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识(模型或规则)的过程,是一类深层次的数据分析方法。它是一门交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。将数据挖掘技术应用于教学评价无疑是非常有益的,它可以全面地分析教学评价结果与各种因素之间隐藏的内在联系。

随着数据挖掘技术的成熟及应用领域的不断扩展,许多高校研究人员已开始研究将数据挖掘技术应用于高校教学管理中,这对提高学校的管理水平起到了很好的作用。利用数据挖掘技术可以从教学管理的各个层面,精确地展现目前存在的许多潜在的有用的各种信息。通过把数据挖掘技术引入到教学管理中,可以找出教学管理中存在的潜在因素,从而制定对应的措施,进一步引导学生学习积极性,最终提高教学质量,增强教学效果。

2 数据挖掘技术在教学中的应用

数据挖掘可以看成是一种决策支持过程,是深层次的数据信息分析方法,把数据挖掘技术应用于高校信息管理

是非常有帮助的,可以全面地分析各种因素之间隐藏的内在联系。数据挖掘技术在教学管理的各个方面都有典型的应用,如学生信息、教师信息方面等,其中最常见的是在教学质量评价结果和成绩分析中的应用。考虑到数据挖掘在教学质量评价结果和成绩分析这方面的论文已经非常广泛,因此这里只给出其他方面的应用。

2.1对教师方面信息的挖掘

数据挖掘技术应用于教学管理中,对教学水平的提高有着积极作用。如使教学评价过程科学化,增强教学工作的预测功能和评价功能,为教学的客观决策和客观评价教师、了解教师的教学质量提供了一种比较合理的管理依据,为教师教学质量的提高提出了一种新的分析思路和研究方法[3]。

(1)课堂教学信息:课堂教学是评价教师教学水平的重要依据。通过对教师的教学风格、教学方法、教学内容、讲授思路、教学态度、教学过程、教学互动、教学效果等情况进行全面的监督调查,收集各种数据信息,从而得出教师在课堂上的各种教学能力方面的具体情况。在此信息基础上,进行数据挖掘,找出各个方面影响学生学习成绩高低的潜在规则,进行总结提高,找出其中存在的问题,切实提高教师的教学能力。在教学过程中,教师采用多种教学方法来完成自己的教学任务:比如传统法、讨论法、实验法、多媒体辅助法、参观法、调查法、实习法、提问法等。据此可以用数据挖掘的方法来挖掘数据库中的数据,判定下一步我们应采取什么样的教学方法,以满足实际教学的需要。在网上进行问卷调查,从每个学生对教学方法的评价以及不同的教学方法得出的教学成绩来进行分析,来判断这些教学方法适合哪一类学生或哪门课程。

(2)教师个人信息:包括教师学历情况、职称情况、科研情况、研究方向、级别、工作经历等各种信息,可运用关联规则方法对教学评价结果和教师个人信息一起进行挖掘,从而得出影响教学结果的潜在的教师个人信息的部分情况。

(3)教师的素质方面:教师所具备的基本素质是实施教育教学的基础。包括教师的思想政治素质、道德素质、文化素质、智能素质、心理素质、身体素质、外在素质等七个方面,其实这些方面可以通过数据挖掘技术在学生成绩或者相应的调查信息的挖掘,看出哪些因素对教学方面有较大影响,切实加强教师在哪些素质方面的培养和提高,从而有利于教学管理方法的制定和实施。

(4)教师绩效方面:包括教师的工作业绩、工作态度、工作技能等方面的综合考核。可以说教师的绩效直接影响到教学管理的各个方面,如教师工作量的计算、教师的评价结果等等。应用数据挖掘技术,可以从教学评价数据中进行数据挖掘,查询教学效果与教师的工作态度、工作技能等的各种关联,找到教师的教学效果与教师绩效的关系问题,合理调配一门课程的上课老师,使学生能够较好地保持良好的学习状态,从而为教学部门提供了决策支持信息,促使更好地开展教学工作,提高教学质量[4]。

2.2对学生方面信息的挖掘

对学生的素质培养一直是高校发展的重点,学生学习质量的好坏、综合素质的高低决定了学校的办学定位和发展目标,也为学生的人生选择、自我发展起到了决定性作用。所以高校在扩招的同时要努力提高教学质量和管理水平,为学生的学习质量改善、综合素质的提高提供保证[5]。

(1)学生的课堂行为表现:认知能力,是否能够保证理解和掌握教师的所教授的内容;人际交往,课堂上教师、学生之间交流、提问气氛是否活跃;学习态度,学生对教学中的各种问题是否积极参与、是否认真完成课题作业;情绪表现,学生能否进行顺利地学习。通过对学生课堂行为表现与对应的学生成绩之间的数据挖掘并结合实践证明,学生在课堂上的表现状态对学习效果有至关重要的影响。

(2)学生的作业情况:学生完成作业情况和成绩,从而可以考查平时学习情况。通过对平时学习信息的数据挖掘,通常可以得出最终的学习情况。其实,各个学校的教学管理应该加大对学生的作业要求。

(3)学生的考试情况:考试是对教和学效果的检验,是教学中必不可少的环节之一。试题难度、考试信度、考试状态等。如果将数据挖掘中的关联规则应用于试卷分析数据库中,然后根据学生得分情况分析出每道题的难易度、区分度、相关度等指标,教师就能够对试题的质量作出比较准确的评价,进而可以用来检查自己的教学情况及学生的掌握情况,并为今后的教学提供指导。

(4)学生的行为和奖惩情况:可以观察学生在学习和生活中的和方面信息。这个侧面也能从一定程度上反映学生的学习情况,但是这个方面往往集中反映学校的整体教学效果。如利用学生信息中的数据,采用朴素贝叶斯分类的方法,对学生信息数据,如不同课程性质课程的平均成绩、社会实践能力、获奖情况、社会工作情况等进行分类与预测。从结果看来,朴素贝叶斯在学生信息分类预测中取得了很好的效果,这样也就促进了高校的教学管理、人才培养等各方面的发展。

(5)学生个人信息:利用数据挖掘技术,比如可以对学生访问情况进行分析,跟踪、了解学生出勤情况。还可对学生年龄、性别等个人情况进行分析,了解学生的组成、结构,为合理地安排课程设置提供依据。通过对学生考试情况的分析,并结合出勤情况,可作为考查学生学习的情况,为合理地评估学生综合素质提供依据。对于挖掘出来的规则信息可以利用可视化技术,以图表或曲线等形式提供给教师,以使教师能充分利用学生的问题资源,从而提高教学质量。

(6)学生学习特征:学生特征包括两个方面:一是学习准备,一是学习风格。学习准备包括初始能力和一般特征两个方面。学生的初始能力是指学生在学习某一特定的课程内容时,已经具备的有关知识与技能的基础,以及他们对这些学习内容的认识和态度。学习风格包括学习者的生理特征、心理特征和社会特征三个方面。学生的学习风格与学习活动有着密切的关系。对学生感知不同事物、并对不同事物做出反应这两方面产生影响的所有心理特征构成了学习风格[6]。利用数据挖掘功能分析学生特征,并在此基础上组织学习内容、明确学习目标、确定教学策略、选择教学辅助媒体,为学生创造出一个适合其内部条件的外部学习环境,使有效学习发生在每个学生的身上。通过数据挖掘技术,把不同学习者的学习特征存入数据库,教师可以通过它及时地了解学习者的需求、兴趣爱好、个性差异等信息,并以此为依据为不同学习者提供动态的学习内容、相应的导航机制、推荐个性化的学习材料等服务,真正的实现因材施教。

(7)学生学习情况:学习评价是教育工作者的重要职责之一。评定学生的学习行为,既对学生起到信息反馈和激发学习动机的作用,又是检查课程计划、教学程序以至教学目的的手段,也是考查学生个别差异,便于因材施教的途径。对学生学习行为和综合素质进行评价,一般采用模糊论中的模糊综合评判及模糊聚类的方法,对评价结果采用了对定性和定量指标加权平均算出综合素质评价得分并排名的方法,而且由于学生综合素质的评价指标是动态变化的,可以考虑选用动态聚类法对评判结果进行动态聚类分析。

2.3对选课数据的信息挖掘

学生通过网络选择自己所上的课程,选课数据背后可能隐藏着许多尚不被我们所知的重要信息,这些信息对教学管理具有重要的参考价值,而数据挖掘技术可以用来找出这些隐藏在数据背后的信息和知识的技术[7]。

在选课数据分析上,主要考虑以下几个方面:分析各门课的选课数目,确定课程的欢迎程度;分析各门课的课程归属和选课学分,确定学生选课时对不同课程归属课的学分多少的考虑;分析各门课选课率,了解学生对目前课程安排中的满意程度;分析选课学生的情况,了解选择当前课程的学生的专业情况;分析任课教师情况,了解任课教师的实际情况和综合能力。

首先要对选课的原始数据进行预处理,把其原始数据采样后转换成适合数据挖掘的数据。在处理的过程中,要明晰数据的上下结构和面向对象,为数据挖掘作好准备。完成数据的预处理之后,确定参与挖掘的数据表,在选课系统中学生选课表是基本事实表,学生信息表、教师信息表和课程信息表可作为周围的维表。最后将预处理之后的数据进行状态运行,在此基础上选择数据挖掘算法FP-growth进行数据挖掘。挖掘的最终结果可以用可视化的图形方式表现出来。根据挖掘的结果,得出选课背后隐藏的各种数据信息,如某些专业的学生喜欢选某位老师所开设的相关课程,部分学生总是选择学分较多的有更多上机机会的课程等等。

根据数据挖掘的分析结果,了解实际的情况,在此基础上就进一步加强教学管理,合理设置各种课程和提高教

学质量,最终让学生学习到更有用的知识和技能。

3 结束语

随着信息量的急剧增长和对信息提取的更高要求,现在我们很难再依照传统方法在海量数据中寻找决策的依据,这就必须借助数据挖掘法发掘数据中隐藏的规律或模式,为决策提供更有效的支持。数据挖掘能够为教学改革提供有效的理论与实践决策依据,在分析影响高校教学管理的各个层面中具有较好的作用。

在教学管理中,把常用的数据挖掘技术应用在教师信息、学生信息、选课信息等各个方面,每一种应用都和具体的挖掘情况相结合,根据实际情况,采用适当的挖掘方法,确实发掘数据中隐藏的内在联系。结合学校的实际情况,采用合理的挖掘步骤,将挖掘后的结果分析应用到实际中,找出影响教学的关键因素,提高教学管理水平,使教师和学校教育决策者洞悉教学中存在的问题。

参考文献:

[1]刘晓霞.数据挖掘技术在高校教学中的应用[J].现代计算机,2008,(285):115-116.

[2]杨永斌.数据挖掘技术在教育中的应用研究[J].计算机科学,2006,33(12):284-286.

[3]邱燕玲.数据挖掘在教学测评中的应用分析[J].科技资讯,2007,(07):131-132.

[4]杨金凡.数据挖掘在教学评价中的应用[J].电脑开发与应用,2007,20(4):77-79.

[5]骆毓燕,张霞,白云.基于朴素贝叶斯的学生信息分类预测研究[J].高等教育与学术研究,2008,(3):65-70.

第7篇:数据挖掘课程范文

关键词:高职教育;个性化学习;数据挖掘;商业智能

中图分类号:TP311.13

作为我国高等教育一支重要生力军――高等职业教育近几年来的发展可谓迅猛,无论是学校数还是学生人数,高职专科的规模已是我国高等教育的半壁江山。高职教育对人才的培养目标是为国家和地方经济的发展输送适应生产、建设服务等一线急需的应用型高素质人才,《国务院关于大力发展职业教育的决定》中就提出了“坚持以就业为导向,深化职业教育教学改革”,要求加强职业院校对学生实践能力和职业技能的培养。

1 现状

目前,高职学生在学校完成系统的课程学习依然是高职教育教学的主要方式,在此过程中,由于学生个体特性、就业意向、专业方向等各种因素的影响,获取的知识无论从方式方法、内容结构,还是真正掌握的程度来说都因人而异,而这其中有相当大的部分是学生主动性选择的结果;此外,在高职教育教学改革的尝试中,大类招生、拓展专业等多项措施在很多职业院校中已然试行,这就给予学生更多的自和选择的机会。

然而,在自主选择的过程中,由于没有一个可参照的、适合自己的挑选标准,高职学生进行各项选择时在很大程度上有着“扎堆随大流”、“哪个课能混好过”的心理,这就导致主动选择的课程,其学习过程并不顺畅、学习效果也不理想,没有提升自身知识结构的质量。这种高职教育中教与学环节的脱节会对高职学生的能力培养产生有着不可忽视的影响。

2 研究思路

随着教育信息化的深入发展,先进的信息技术手段在教育教学的方方面面都得以有效利用,这也为学生综合能力培养的探索与尝试提供了新的途径,数据挖掘技术就是其中很重要的一种。数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在此过程中,数据源必须是真实的、大量的、含噪声的,而从中发现的是用户所感兴趣的知识内容,这些知识应该是可以接受和理解、并且能加以进一步运用的。

数据挖掘技术之所以在教育行业有更为广泛、实际的应用,这是由于各个学校都会有自己的一整套数据库系统,用于记录学生的学籍信息、课程教学过程等历史数据,这样,就可以尝试运用先进的数据挖掘技术和智能分析工具,通过对高职教育研究和教学过程中积累的海量数据进行采集分类、挖掘和分析,从多角度、多层次出发,构建识别个体特点、知识构成和获取方式等要素之间关联模式的数据模型。数据挖掘是一门交叉学科,其理论和方法有很多,包括K-最近邻分类器、判别分析、人工神经网络和分类树等,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这里就是要将数据挖掘方法与高职教育教学研究相结合,设计实际的分析应用系统,具体来说:

(1)数据挖掘技术面向高职教育这一特定领域中的主体――高职学生,针对专门的指标,包括个体特性、专业要求、就业意向等,着眼于课程这个知识载体,对它们之间的关系进行深层次、智能化的挖掘、分析;

(2)数据挖掘的应用会具体到建模、变量筛选和导入等方面,而不只是一些抽象的挖掘算法的研究;

(3)数据分析采用先进的商业智能工具,同样,数据的展现手段基于平台,具有开放化、模块化、网络化特点。

3 系统框架

系统定位于个性化学习分析,其框架结构参见图1,主要由数据集成、数据建模、数据分析及展现等部分构成。具体来说,数据集成模块完成定义数据结构、装载、清洗、合并数据的功能;数据建模是指建立数据分析OLAP及数据挖掘模型;数据分析旨在分析和比较各种不同算法得出的结果,寻找最为匹配的算法,而数据展现的作用是根据分析结构灵活创建数据报告。

图1 系统框架结构

在此架构下,各个子系统的功能如下所述:

(1)数据集成。分析和归纳课程教学过程中产生的系列数据,根据其特征和行为设计及定义便于分析和挖掘的数据结构,然后并进行数据集成。数据集成的工作包括从异构数据源获取数据,将其进行清洗、转换、合并,然后加载到数据仓储中。数据集成执行的时间、相互的顺序、成败对将来的分析结果的有效性则至关重要。

(2)数据建模。典型的数据挖掘工具将在构建了数据仓库后进行分析并生成结果,一些工具也可以使用关系型数据进行分析,数据分析的结果独立于数据仓库中使用的数据。数据挖掘核心的部分就是选择挖掘算法并建立数据模型,这样就可以根据学生个体信息、学生成绩等数据之间的关系将这些学生划分成分析有意义的组群并预测他们的行为;当把这些组发送回分析过程时,数据挖掘引擎允许分析人员和用户根据这些簇进行划分和细化。

(3)数据分析与展示。以学生个体信息和课程数据为输入,利用所筛选出的最佳建模方法,逐步提出一个可实现个性化学习分析的数据模型,以衡量及提高模型预测的准确度。将分析结果以特定的客户端或Web方式进行展现,以建立的分析结果展示平台,具有高度的开放性、通用性和可扩展性。通过建模创建了正确的模型,数据挖掘的重点就从分析转到结果上,数据报告的展现方式有多种,可通过专业的报告工具,也可自行编写Web网站进行。

4 结束语

在高职教育教学研究中运用先进的数据挖掘技术手段,针对各项课程教学、学生管理数据进行深度挖掘、分析,研究个性化学习模式,为学生的自我学习规划提供具体化、智能化分析结果以供参照,在此情况下,先进技术手段的支持,对教与学都有着不可忽视的影响。同时,也为人才培养的探索与尝试提供新途径。

参考文献:

[1]赵云鹏,石丽,刘莹.基于数据挖掘的高校规模分析及应用研究.第九届全国信息获取与处理学术会议论文集[C].2011.

[2].数据挖掘在高职院校教学管理中的应用[J].清远职业技术学院学报,2010(12).

[3]干娟.基于决策树算法的学生综合测评系统的设计[J].安徽电子信息职业技术学院学报,2011(04).

第8篇:数据挖掘课程范文

摘要:基于现代计算机技术的快速发展,网络技术和高等院校教育教学系统实现了有机整合,并且促进了教育教学与组织管理等多种活动的信息化发展,一定程度上提高了教育教学质量以及效率,构建了全新的教育教学管理模式。在此背景下,教育教学数字化发展速度也不断加快,信息量增长速度加快,对于信息提取的要求也随之提高。所以,在大量数据当中获取重要的信息也逐渐成为高等院校教育教学决策的重要依据。基于此,文章将高校教育教学作为研究重点,阐述了数据挖掘技术的具体应用,以供参考。

关键词:高校教育教学;数据挖掘技术;运用

一、数据挖掘概述

所谓的数据挖掘,具体指的就是在海量且模糊随机数据当中提取出隐含其中,同时具有潜在价值的信息与知识过程。将数据挖掘技术应用在教育教学当中,可以对海量数据予以深入挖掘与分析,进而获得数据当中所隐含的潜在信息内容,更好地为高校教育教学管理人员决策提供有力支持[1]。

二、高校教育教学管理中的数据挖掘技术应用

2.1在教学质量提升方面的应用

高等院校为了更好地提高教学管理的质量,教务管理部门会在学期期末测评学员领导与任课教师的教学思想、态度以及教学方法等,并且根据最终的评分结果来明确教师的教学质量。然而,受评价人员对标准理解以及把握程度的影响,学生评价仍存在随意性特征。

在这种情况下,导致评分结果很难对教学效果进行真实地反映,因而也影响了教学质量的评估。

但是,将数据挖掘技术应用在教学质量评估方面,通过对关联规则算法的合理运用,可以将教学质量评价当中的不同指标权重系数进行设定,并通过Apriori的算法来扫描数据集,在数据挖掘的作用下,获取学历、年龄以及职称三者之间存在的联系,同样也可以获得教学质量和方法的关系[2]。

为此,高校教务管理部门就可以将获得的规律应用在教学管理实践当中,合理地设置督学小组并制定出听课制度,将教学课堂教学的质量真实且客观地反映出来,实现高校教学水平的全面提升。

2.2课程体系结构的有效完善

高等院校教育体系当中的专业建设作用十分重要,所以,必须要具备高质量的课程体系结构设置。在对学生成绩数据库以及毕业生去向数据库等多种数据信息进行数据挖掘以后,可以通过对关联分析与序列模式的分析和探究,获得数据与数据间存在的相关性。

其中,课程间的关系和先后顺序亦或是课程和课程体系结构之间的关系等等。在此基础上,保证学习高级课程前事先学习先行课程。以计算机专业《数据结构》为例,在教学中将《C语言》作为重要的先行课程,以保证学生在学习《数据结构》内容的时候可以具备良好语言基础,更深入地理解并灵活地应用数据结构当中的算法。

而在完成《数据结构》学习以后,应根据学生就业走向和市场的实际需求来确定是否安排《JAVA语言程序设计》课程教学。这样一来,学生的学习成绩实现了有效地提高,更利于学生未来就业。除此之外,对内容重复的课程进行有效地压缩,将落后的课程内容适当地删除,与专业特点相结合。

由此可见,将数据挖掘技术应用在高校教学中,对于专业建设以及课程改革决策具有积极的作用。

三、网络教学中的数据挖掘技术应用

在网络教学中应用数据挖掘技术,可以从Web文件以及Web活动当中选择出用户较为感兴趣的有价值模式以及信息,这就是所谓的Web挖掘[3]。因为接受教育对象在多个方面都存在差异,具体表现在个人学习目标、学习能力与知识基础的差异等。为此,网络教学也必须要能够适应个性化的学习需求。可以把不同用户学习状况与轨迹详细记录并存放至数据库当中,通过对WEB挖掘技术的合理运用,在序列模式挖掘的作用下合理地分类文档,以保证学生信息检索速度的提高。

另外,也可以根据学生访问浏览的数据挖掘并分析,针对访问的数据展开聚类分析,以保证更好地了解学生感兴趣的内容,并为其推送相关内容。与此同时,可以在相关联的页面当中合理地设置超链接,对网站结构予以有效地改善,确保页面间的链接与用户访问的习惯更吻合。

结束语:

总而言之,在高校教育教学中合理地运用数据挖掘技术可以在大量数据信息当中处理并提取出更具价值的信息内容,促进高等院校教育教学管理工作的正常开展,特别是评估与决策方面,数据挖掘技术的作用更为明显。

除此之外,该技术也可以应用在网络教学当中,使得网络教学资源配置更加合理,在教育教学中充分发挥自身的效用。上文针对数据挖掘技术在高校教育教学中的实际应用展开了相关性地研究和分析,主要的目的就是为了更好地帮助高校进行决策,为学生提供更为理想的学习环境,在提高学生学习兴趣的基础上,增强高校教育教学的质量与效率。

参考文献

[1]侯锟.数据挖掘技术在高校教育教学中的应用[J].吉林省教育学院学报(下旬),2012,28(7):51-52.

第9篇:数据挖掘课程范文

【关键词】数据挖掘教学质量教学评价

随着高职教育的快速发展,高职院校的教学质量的自我评价已经成为学校科学管理的重要保障。教育部为了确保高校的教育质量,于2003年确立了5年一轮的评估制度。各高职院校在推进教育评估工作的同时,积极地组织自评,建立健全了全院教职工共同参与的教学质量内部自我评估机制。而建立健全高职院校教学质量评价系统是提高教师教学质量的重要途径,也是提高教学管理水平的迫切需要。数据挖掘是从大量的数据中提取知识的有效技术,不仅可以实现教学评教数据的知识挖掘。这些知识可以为学校提高教学质量,同时也可以辅助学校管理者决策,为进一步优化教学资源提供可靠的数据依据。

一、教学质量评价的作用

高职院校的教学质量是高等职业教育的生命线,教学质量的评价作为提高教学质量的手段被摆到了越来越重要的位置,而教师在教育工作中担负着沟通教与学的桥梁作用,其工作质量的好与坏会直接影响到教育质量的好坏。在教学管理中,对高职教师进行教学质量测评,是教学活动中提高教学质量的一个重要环节,也是教学管理的核心。教学质量测评在教学过程中发挥着诸多作用,具体表现在以下几个方面:

1、通过教学质量测评,进一步加强人才培养工作的宏观管理与指导,推动学校自觉地按照教育规律不断明确办学指导思想、坚持教育创新、深化教学改革、加强教学基本建设、强化教学管理、全面提高教育质量。

2、教学质量评价能够从整体上对教学活动进行调控,以确保教学活动能够按照预定目标进行,并且能最终达到该目标。

二、数据挖掘概述

1、数据挖掘的定义

简单的说,数据挖掘(Data Mining)就是从大量的、随机的实际应用数据中,提取或挖掘隐含在其中的、人们事先不知道的、但又有用的知识的过程。数据挖掘涉及多学科技术的集成,包括了数据库和数据仓库、机器学习、统计学、人工智能、神经网络、信息检索、模式识别等多个领域的理论和方法。与数据挖掘相近的同义词有知识提取、数据捕捞、数据融合、数据分析、决策支持和从数据中挖掘知识等。

2、数据挖掘的方法

数据挖掘源于多个学科,受多个学科影响,数据挖掘的核心技术融合了数据库、机器学习、统计学、人工智能等多个学科领域的理论和方法,数据挖掘利用的技术越多,得出结果的精确性就会越高。目前数据挖掘方法很多,比较典型的有关联分析、序列模式分析、分类分析、聚类分析等。

(1)关联分析

所谓关联分析,也就是利用关联规则进行数据挖掘,通过关联规则挖掘,可以发现那些隐藏在海量数据间的相互关系,发现那些潜在的、隐含在数据记录中的有用信息。利用关联规则进行数据挖掘是由Rakesh Apwal等人首先提出的。

(2)序列模式分析

序列模式分析,侧重分析数据间的前后序列关系,它能发现数据库中“在一段时间内,先进行了一活动后,又接着进行了另一项活动”之类的知识。

(4)聚类分析

聚类分析是统计学中的一种研究方法,主要研究”物以类聚”的问题,它是把物理或抽象的集合分割为多个类的过程,使得同一类中的对象具有高度的相似性,而不同类之间对象的差别较明显。与分类分析不同,在聚类分析中,预先不知道记录数据中分类信息,并且目标数据分成几类也不知道,需要依据某种度量标准,合理地划分记录数据到各个簇中。聚类分析的方法很多,具体可以分为系统聚类法、模糊聚类法、基于密度的方法等。

三、教学质量评价存在的问题

现在的教学质量评价中尚存在着一些新的问题。像许多高职院校一样,我院在多年来的教学、管理和教学质量评价工作积累了大量的数据,但目前对这些海量数据的研究处理还仅停留在初级的数据备份、查询及简单基本的统计阶段,使得这些数据不能发挥其应有的价值。如何更有效地利用大这些大量的数据记录信息理性探析并指导高职院校教师更好的教学已变得非常重要。

四、数据挖掘技术在教学评价中的应用

1、基于数据挖掘的教学评价流程

(1)确定挖掘对象。源数据库存储了来自教务系统不同模块的数据,主要有教师基本信息、课程基本信息、评价基本信息等,这些都是评价数据分析的基础。清晰定义问题,认清数据挖掘的目的,是数据挖掘的关键一步,挖掘的最后结果是不可预测的,但是要探索的问题一般是可以预见的。

(2)数据的采集。教师需要在教学过程中,主要收集教学数据信息,有些信息需要可以直接获得,有的信息需要进行调查获得。此项工作繁琐,耗时,工作量大。

(3)数据的预处理。数据的预处理主要包括数据集成、选择、转换等过程。此过程的实施是针对算法而准备的,不同的算法一般需要不同的分析数据模型。

(4)数据分析。进行数据分析,首先要选择合适的挖掘算法,目的是为了建立一个分析数据模型,并使用合适的软件实现这一算法,继而对所转换的数据进行挖掘。

(5)结果分析与表示。根据用户的不同,对分析结果库中的数据进行分析,把具有价值信息提取出来,以文字、图形等形式反馈给最终用户。例如教师可利用所得的信息改进教学策略,指导进一步的教学。

2、数据挖掘在高职院校教学评价中的作用

在高职院校的教学工作中,有许多教师根据教学需要,往往每位教师所教的课程不止一门,在整个教学质量评价活动中,评价某位教师的授课质量不能仅限于某个班级、某一学期、某一门课程成绩排名,而是由我们事先设定好的挖掘模型从其开始授课时起,对其在各个学期、不同的班级及不同课程的平均成绩进行数据挖掘,客观得出该教师的总体教学效果。

总之,我院拥有信息量庞大的历届教学评价数据和人事信息数据,现在我们很难再依照传统方法在海量数据中寻找决策的依据,数据挖掘作为一种工具,其技术日趋成熟,我们将数据挖掘技术应用于教学评价中,可以借助它去发掘数据中隐藏的规律或模式,为建立教学评价模型提供了捷径,为决策提供科学的依据。

注:河北省教育学会“十二五”规划课题(XHX NO,12550038)

参考文献: