公务员期刊网 精选范文 数据分析课程范文

数据分析课程精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数据分析课程主题范文,仅供参考,欢迎阅读并收藏。

数据分析课程

第1篇:数据分析课程范文

关键词 情境认知 数据分析 教学探究 分析方法

中图分类号:G424 文献标识码:A

在传统的数据分析教学研究中,人们总是试图走通两条道路,一条是做好理论假设,带着理论去研究实践;另一条是从大量的实践研究中提升理论。结果往往是走第一条路的研究者将实践“形式化”、“刻板化”;而走第二条路的研究者则往往将教育研究“简约化”,从一线实践中获得的丰富经验非但没有上升到理论,反而在理论“提升”的过程中将大量的“经验”过滤掉了。数据分析课程教学是建立在数学学科基础上的,整个教学过程就是学生在一个“宏情境”中,独立地识别问题、提出问题、解决真实与复杂的数学问题的全过程。无论是教师在课堂中的角色、课堂中教学策略的运用、数学学习与其它学科的整合,还是学生所要解决问题设计的层次性,都具有较强的科学性和目的性。情境认知学习理论是20 世纪80年代中后期形成的重要的学习理论,上世纪90年代之后,情境认知理论开始渗透到教育研究的各个领域。情境认知学习理论认为,学习的实质是个体参与实践并与他人、环境等相互作用的过程,是个体形成实践活动的能力、提高社会水平的过程。①国内外学者对情境认知与学习的教学模式的研究硕果累累,可对在数据分析课程中运用的研究目前作者没有看到相关的文献。基于数据分析课堂教学的本质特点,我们的课堂教学研究如何做?如何使情境认知学习的教学模式研究真正走进数据分析课程教学?围绕这些问题,笔者从下面五个方面来探究数据分析的教学过程。

1 选取经典案例,引起学生对数据来源与背景分析的重视

数据不等于数字,数据是具有内涵的数字,它隐含着人们事先不知道但又有用的信息。作为一个数据分析学习者,解决问题的时候必须考虑数据的来源与背景,下面的故事充分说明了数据来源的重要性(读者.2005.22)。一天,乔治在删除垃圾电子邮件时发现了一个标题:惊人的足球杯预测。他好奇地打开了它:亲爱的球迷,我们的统计学家已经设计出了准确预测足球比赛的方法,今晚英国足球杯第三场比赛是考文垂队对谢菲尔队,我们以0.95的概率预测考文垂队获胜。乔治看后一笑。晚上考文垂队果然获胜。三周后乔治又收到了那人的邮件:上次我们成功地预测了考文垂队获胜,今天考文垂队要和米德尔斯堡队相遇了,我们以0.95的概率预测米德尔斯堡队获胜。考文垂队强于对手,那天晚上却发挥不好,双方打成平手,但在加时赛上米德尔斯堡队奇迹般地获胜了,乔治心中一震。一周后,那人的电子邮件预测米德尔斯堡队将败给特伦米尔队,结果果然如此。接下来的四分之一决赛前,那人的邮件预测特伦米尔队胜陶顿亨队,结果也是如此,四次预测都成功了,乔治大吃一惊。乔治再次收到电子邮件:现在你大概知道了我们的确能够预测比赛的结果,实际上我们买断了一位统计学家的研究专利,能够以0.95的概率预测足球比赛的正确结果。今晚的半决赛中,我们以0.95的概率预测阿森那队打败伊普斯维尔队。晚上阿森那队在比分落后的情况下分歧直追,最终获胜。第二天,电子邮件又来了:我们已经五次预测成功,现在希望和你做一笔交易,你支付200磅,把一个月内所关心的比赛和球队告诉我们,我们将以0.95的概率为你预测胜负。200磅不是小数目,但是如果能预知结果,就可以从彩票商手中赚回20万。乔治心中盘算:如果发邮件的人只是猜测胜负,则5次都猜对的概率仅为2-5 = 0.0313,于是以0.9687的概率否定他是在猜测,于是支付了200磅。实际上这些骗子先发出8000封电子邮件,一半预测甲胜,一半预测乙胜,于是有4000人得到正确的预测,第二次只给上次得到成功预测的4000人的发电子邮件,依次类推,五次预测以后得到8000/25 = 32人,如果这250人中有100人付钱,就可以骗到20000磅,乔治就是其中一个。

关于美国选举的例子:谁会在1936选举中获胜,兰登还是罗斯福?《文学文摘》送出一千万份问卷(返回二百四十万份)后,预测兰登会赢;而盖洛普只问了五千人说罗斯福会赢。最后罗斯福和盖洛普赢了,《文学文摘》倒闭了。为什么出现这样的结果,究其根源在于数据的来源。通过类似这些情境的设置,使学生意识到要想准确地进行数据分析,必须重视数据的来源与背景。②

2 讲解各种数据分析方法时要提供丰富的有意义的情境

学习的情境对提高知识的迁移非常重要,研究表明:复合而丰富的学习情境更有利于学习迁移的产生。在单一情境中被传授的知识与在复合情境中被传授的知识相比不利于产生灵活迁移。在复合情境中,学生更有可能去概括方法的相关特征,形成对知识更灵活的表征。然而当一个问题是在复合的情境中讲授,并带有演示其广泛应用的例子时,人们就更有可能分离出方法的相关特征,并形成知识的灵活表征。③比如在讲解主成分分析时可以举例:如何理解不同机构得出的大学排名结果?如何对学生成绩进行综合评价?如何理解各地的经济排名等等。从而引申出主成分分析是在降维的思想下产生的处理高维数据的统计方法。通过构造原变量的适当的线性组合提取不同信息,主成分分析着眼于考虑变量的“分散性”信息。再比如,在讲解判别分析时可以举例:信用问题中,如何根据公司的财务和商业资料来判断一个公司的信用等级?工业中,如何根据产品的一些测量指标判别产品的质量等级?经济学中,如何根据人均国民收入判断一个国家的经济发展程度?医学诊断中,如何根据病人的化验结果和病情征兆判断病人患哪种疾病?气象学中,如何根据已有的气象资料判断未来的天气情况?地质勘探中,如何根据地质结构、化探和物探的各项指标来判断该地的矿物类型等等。从而引申出判别分析处理的问题往往包含较大量的数据资料,且其数量指标往往是多元的。判别分析是一种有效的多元数据分析方法,它能科学地判断样品的类型,在纷繁的数据中揭示内在的规律,使人们对所研究的问题做出正确的判断。④在生产、科研和日常生活中,我们经常会遇到各种各样的问题,这为各种数据分析方法提供了丰富的情境,在课堂教学中要加强情境的供应。

3 理论方法的讲解要与情境认知有机结合起来

理论与应用并重,既要重视理论方法,也要重视应用模型解决实际问题。如何由情境问题恰当地归纳出数据分析的理论方法,再将数据分析方法正确地应用到实际中,是我们教学中必须高度重视的问题。对于理论方法,重点是思路,同时要注意各种分析方法的相互关系及综合运用。比如相关分析和回归分析是研究现象之间相关关系的两种基本方法。所谓相关分析,就是用一个指标来表明现象间关系相互依存的密切程度,相关是解决客观事物或现象相互关系密切程度的问题,回归则是用函数的形式表示出因果关系。在医学上,许多现象之间都存在着相互联系,例如身高与体重、体温与脉搏、年龄与血压、钉螺与血吸虫感染等。而有些事物的关系是互为因果的,如上述钉螺是因,感染血吸虫是果;但有时因果不清,只是伴随关系。例如父母的兄弟,兄高,弟也可能高,但不能说兄是因、弟是果,这里不是因果关系,而可能与社会条件、家庭经济、营养、遗传等因素有关。

4 将情境认知教学模式运用到软件教学中去

数据分析这门课程除了要让学生掌握必要的理论知识外,还要培养他们运用相关软件在计算机上进行统计分析的能力。数据分析涉及大量数据的处理工作,需要借助统计软件完成,学软件的最好方式是在使用中学。2013年10月我院学生赴上海参加了“2013年中国高校SAS数据分析大赛”上海赛区的初赛,这次比赛充分带动了学生学习的积极性,比赛所起到的推动作用远远高于一般实验所起的作用,所以我们通过缩减验证性实验次数,增加综合性实验次数,给学生一些与实际生活密切相关的问题,让学生自己去面对问题,包括数据搜集、数据处理、数据分析、图表分析、问题结论分析等内容,进行实验教学改革。实验结束后通过班级比赛、院系比赛、学校比赛、全国比赛层层选拔的方式,激励学生学习及检查学生学习的效果,使学生意识到自己的不足,查漏补缺,从而带动学生学习的积极性。通过这种教与练相结合的方式,学生不仅能较好地掌握各种数据分析方法的分析过程,加深对基本理论的理解,还增强了学习的兴趣、信心和分析解决问题的能力。

5 将情境认知教学贯穿于输出结果的分析与解释中

情境认知教学模式要求学生在教师的指导下,通过自己的努力发现问题、分析问题和解决问题,这个过程不仅是知识的运用, 更主要的是能力的培养, 要学会分析问题的思路和解决问题的方法。学生在教学过程中的角色也要从听话转变为对话,这种转变对于学生探究意识和创新能力的培养是非常有利的。在数据分析课程中,理论知识的传授和实验能力的培养归根到底都是为了解决实际问题,各种软件输出的结果只能是数字或图表,要想解决实际问题,学生必须对输出结果进行分析、解释,因此必须培养学生合理解释所得到结果的能力。为了培养学生的这种能力,教学中我们经常组织学生进行讨论,比如在对主成分分析的结果进行解释时,首先从学生关心的问题开始,让他们对输出结果进行讨论,在引起学生兴趣的同时加强输出结果模式的解释,在其间采用引导、启发的教学方式让学生的思考逐步向准确答案靠近,然后逐步转向理论化的问题。通过课堂讨论不仅可以调动学生的思维,活跃课堂气氛,而且可以在潜移默化中培养学生对所得数据结果进行合理解释的能力。⑤

情境认知教学模式对培养学生的综合能力、形成理论与实践相结合的知识结构具有非常重要的作用。因此在数据分析课程的教学中要充分运用情境认知教学模式,在真实、互动的情境中学习,必定比传统的课堂教学来得生动有趣,而且能灵活应用。

注释

①③王文静.基于情境认知与学习的教学模式研究[D].华东师范大学,2002.

② 黄奇杰,蔡罕.社会调查方法概论[M].杭州:浙江大学出版社,2007.8.

第2篇:数据分析课程范文

关键词:创新实践课程;项目驱动;大数据

中图分类号:G642 文献标志码:A 文章编号:1673-8454(2017)04-0022-03 一、引言

随着高等学校工科教学改革的深入,各大高校高度重视培养学生的创新意识和创新能力。创新实践课程是顺应当前高等工程教育改革与发展所提出的一门新型课程,关注于训练学生的科学和创新思维,增强解决工程实际问题的能力。

全国各大高校针对不同的专业,开设了多门创新实践课程[1][2][3]。不同于传统课程,它具有形式灵活、小班化教学等特点,要根据实际需求灵活设置授课内容。为了加强学生的创新精神和实践能力,提高人才培养质量,杭州电子科技大学在计算机专业面向大二学生开设了创新实践课程。任课教师根据自身的学科背景,基于社会热点需求问题,申报课程要完成的课题内容,再通过师生间的双向选择,组建授课班级。

随着大数据时代的到来,大数据产业发展对培养高层次的数据科学人才提出了新的需求[4]。在未来3-5年内,我国数据分析师的缺口将达100万人左右[5]。但是,目前国内高校对数据型人才的培养规模和质量还远远达不到要求。本文研究了在创新实践课的教学过程中,以培养大数据可视分析人才为目的,探讨如何设置理论授课与项目实践环节,通过解决实际问题,提高学生的创新意识和创新能力。

二、 创新实践课题的选择

大数据可视化与可视分析是大数据分析中重要的组成部分,通过有机融合人的智能与计算机的处理能力,帮助人们洞悉大数据背后的知识与智慧,已经成为数据分析和科学决策的有效手段。基于个人的专业背景和研究方向,笔者选定以大数据可视分析作为创新实践课题,主要基于如下考虑:

(1)对于本科学生来说,可视分析中采用直观的图形化表示、所见即所得的交互方法,更容易激发他们的学习兴趣,不会觉得枯燥难懂。

(2)该课题与社会热点紧密结合,社会对该类人才需求较大。学生若能掌握并运用相关知识来解决实际问题,对更好地就业有很大帮助。

(3)数据分析与实际项目紧密结合,而寻找数据内部蕴含的特征又具有未知性,需要学生具有创新意识和探索精神,正好和创新实践课程的设置宗旨不谋而合。 三、课程教学内容与实践形式设置

与传统的仅采用理论教学的授课模式不同,笔者将创新实践课程划分为理论授课和项目化实践两个部分。首先讲解基础理论,让学生了解课程目的及课程实施过程。然后通过项目化的课程设计培养学生工程意识,提高综合运用知识来解决实际应用问题的能力。

1.理论授课内容

理论授课是让学生了解和熟悉课题的前提。基于可视化分析大稻莸母鞲霾街瑁细分授课内容,将数据分析过程拆解并贯穿于整个教学中,为解决实际问题提供理论保证。

具体来说,包括如下几个方面:(a)大数据的概念:包括大数据出现的历史;大数据的特征;大数据与其他学科的关联;大数据时代面临的挑战等。(b)数据可视分析的案例介绍:介绍数据可视分析成功用于解决实际问题的典型案例,从案例的实际需求出发,通过描述案例的主要目的和设计思想,介绍案例采用的具体方法,指出完成过程中遇到的关键问题,帮助学生理解课程学习的价值所在。(c)数据可视分析所要掌握的关键技术:包括数据存储和管理技术,数据可视化展示语言、人机交互技术等。

由于课程学时所限,在授课过程中,需要不断引导学生利用课外时间,进一步学习和巩固相关编程技术,为实施项目化的课程设计打好基础。

2.以项目为驱动的实践环节实施

在理论授课的基础上,实践环节是培养学生创新能力最重要的步骤。只有让学生在参与完成某一具体任务的过程中,才能深化其对数据可视分析流程的理解,主动学习相关知识,提高动手能力,不断地探索并解决未知的问题。

在实践阶段,纳入项目化的教学模式,将学生组成创新研究小组,通过“分组――选题――制定和实施方案――撰写分析报告”的实践过程,鼓励学生开展自主式、探索式、合作研究式的学习,促进知识的迁移和科学思维的养成,同时培养学生的团队协作精神。

具体来说,分为如下几个步骤:

1)合理进行人员分组。一个复杂的数据分析任务要求学生以团队合作的形式来完成,让学生根据各自的技术优势,合理分组,每个小组选出一个小组长,组员通过分工与合作实现既定目标。

2)选取有价值的分析任务。以“交通大数据可视分析”为主要目标,通过小组讨论拟定感兴趣的分析子任务,由教师进行内容把关。要求所选取的项目任务具有一定的复杂度和综合度,可以从数据分类、趋势预测、历史规律挖掘等方面着手,明确要研究的主要问题和预期的分析目标。

3)制定和实施分析方案。要求学生设计详细的实施方案,考虑方案的可行性和合理性,主要包括:分析目的及内容,方法及步骤,计划进度安排,如何分工等。在该过程中,教师指导学生检索和阅读科学文献,一起讨论采用何种技术或方法分析数据,引导学生逐步实现项目任务。在学生碰到问题和困难时,鼓励其通过自主学习所需知识、与小组成员讨论,与指导老师探讨来解决问题。

4)完成分析报告。以小组为单位,完成分析报告,阐述分析任务的执行流程,人员分工情况,给出分析结果,并讨论分析方法是否合理及未来的改进建议。

5)课程考核。课程考核结合教师评价(50%)、小组间互评(30%)、组内自评(20%)多种方式综合给出课程分数。

在以项目为驱动的实践过程中,教师的任务从“传授知识为中心”逐渐向“引导学生探索知识,有体系、有目的地应用知识”转变,学生成为了学习的主体和发展者,极大地调动了学生的积极性和参与度,培养了学生的团队协作精神和创新能力。

四、教学效果及存在问题分析

本课程自开课以来,取得了一定的教学效果。授课班级共有14人,其中有2位学生在老师的指导下将项目的实施成果,整理成在计算机相关的学术会议上,有1位学生申请了发明专利。

为了更好地收集大多数学生的反馈意见,在课程结束后,让学生投票选择自己在哪方面的能力有所提高,并撰写一份学习心得。投票结果为:编程能力(11票);团队协作能力(9票);创新和探索能力(8票);自主学习新知识的能力(13票);完成实际工程的能力(10票)。从结果中发现,大多数学生认为通过课程学习能提高自己多方面的能力,包括自学、编程和工程实践能力。部分学生认为提高了自己的创新和探索能力、团队协作能力,这部分学生相对基础较好,能够针对分析任务得出自己的结论。而其他有些学生基础知识储备不足,还处于不断学习编程技术的阶段,因此对问题的探索不够深入。

图1和图2分别为从学习心得中提取的中英文词云。从图1中发现,大多数学生描述了对数据可视化的学习,掌握了“技术”,得到了“信息”和“知识”,其他关键词包括“分析”,“学会”,“理解”,“实现”,“任务”等。从图2中可以看出学生实现项目时所采用的主要技术,这表明学生在上课过程中,根据实际需求自学了解决问题所用到的相关技术。下面摘取了部分学生的心得。学生1:“通过课程学习,我意识到事情有很多方法去解决,一个方法不通,还有其他的解决方法”;学生2:“集体的力量是无穷的,好的队友是成功的一半,和大家一起做事情,能从别人身上学到自己没有的”;学生3:“在这门课程上学到的东西比其他任何课程都要多,更有用”;学生4:“在后半学期,经过老师的提点,自己慢慢摸索,再加上同学的帮助,一个个任务难题渐渐被解决,我也逐渐有了继续探索的动力。”从上述反馈来看,正是通过项目化的实践,潜移默化地提高了学生的自主学习能力和探索未知的精神,培养了学生的综合能力。

但是作为一门新型课程,课程在实施过程中遇到了一些问题,具体表现为:

(1)由于不同W生的学习效率与动手编程能力存在差异,因此部分学生进展较快,能针对项目制定方案,设计新的可视化表示来展示数据特征,探索数据规律。而部分学生始终处于编程技术的学习阶段,影响到课程完成质量。

(2)本课程面向大二学生,虽然数据可视分析入门较快,但解决实际问题时涉及多种专业技术的学习与应用,部分学生感觉到知识储备不足,项目实践有难度。

因此在今后的教学过程中,应事先做好摸底调研工作,针对不同学生进行层次化教学,同时要进一步研究如何更好地激发学生的学习热情,鼓励他们在遇到困难时勇于克服困难。

五、结语

随着高校工科教育改革的深入进行,创新实践类课程对传统的理论教学进行了很好的补充。课程对培养学生创新意识、解决实际工程问题能力起到积极作用。本文针对作者所承担的计算机专业的创新实践课程,围绕数据可视分析人才培养展开,深入研究了课程理论教学内容的设置、项目化实践的实施模式,同时也分析了目前课程取得的效果和存在的问题。由于该门课程开设时间较短,还处于探索阶段,接下来要进一步完善目前的理论教学体系,研究层次化的教学方案,通过总结经验,应用于新一轮的教学。

参考文献:

[1]黄雪梅.围绕机电实验平台的创新实践课程[J]. 实验室研究与探索,2011,30(3):140-144.

[2]陈妙,陈敏,余日安,等. 公共卫生创新实践课程的构建及作用探讨[J]. 基础医学教育, 2014(12):1031-1033.

[3]汪东风,林洪,曾明滂,等.创新实践课程的实施步骤[J]. 实验室研究与探索, 2009,28(3):107-109.

第3篇:数据分析课程范文

关键词:Access数据库;考试质量分析系统;数据表

中图分类号:TP319 文献标识码:A 文章编号:16727800(2013)003010602

0 引言

考试质量分析系统主要用于班级的课程考试质量分析,由系统分析而得出的结果反馈到任课教师及教学主管部门,作为改进教学方法、提高学生学习成效的重要依据,从而改进课程教学质量。同时,应用过程所产生的数据也可以作为其它教学质量分析系统的基础数据。

1 考察指标设置及系统功能

考试质量分析系统所设置的考察指标应当能正确地反映班级本次考试的实际情况及质量状况,因而设置的主要考察指标为:考试人数、最高分、最低分、平均分、及格率,还有卷面各分数段成绩人数分布状况及比率等。因此,考试质量分析系统应具备的主要功能及完成的任务如下: ①输入各学生的成绩,统计考试人数,筛选出最高分及最低分,计算平均分和及格率;②按分数段分类统计人数,计算出各分数段人数的百分比;③写出评语。

构建考试质量分析系统的重要一点就是要做到:只需一次输入学生的成绩,其它所有数据均由电脑计算完成。

根据上面的各项要求编制考试质量分析报告如表1所示。

本系统的数据量不大,而由于Access数据库系统具有界面友好易操作、开发成本低廉、面向对象的开发环境集成各种向导和生成器工具且功能强大、工作效率高、支持ODBC(开发数据库互连)等一系列优点,故本系统使用Access数据库系统开发。

2 基本数据表设定

根据考察指标的设置以及对系统主要功能的分析,本系统的数据库结构设计采用两个数据表:主表――考试质量分析,副表――成绩,分别如表2、表3所示。

3 系统构建及功能实现

(1)建立“成绩输入窗口”,将其与“成绩”数据表联系,使用“成绩输入窗口”输入学生考试成绩(图1)。

(2)使用选择查询的方法,从“成绩”数据表中筛选出最高分、最低分、平均分、及格率、90~100分、80~89分、70~79分、60~69分、45~59分、45分以下的人数(图2),并计算出各分数段人数比率等各项数值(图3),然后使用“追加查询”(图4)及宏(图5),将数值填充到主表“考试质量分析”的相应单元格中。以上仅是简略分析,大量的建立查询、建立并使用宏将各查询链接启动的工作,限于篇幅,不再详述。

(3)建立系统的主窗口,如图6所示,窗口与主表“考试质量分析”相联系,上面设有各功能按钮,并使用宏将各相应功能赋予各按钮。

4 系统运行

本系统设置了两种输入方式:“手动输入” 和 “导入外部数据”方式,本系统运行时要首先选择输入方式,若选择“手动输入”方式,则在系统的主窗口中单击“输入成绩”按钮,在弹出的“成绩输入窗口”输入成绩,输入完毕,返回主窗口,然后单击主窗口上的“数据刷新”按钮,各项数据即通过后台的查询及宏的运行,填充到主窗口上的各单元格中。主窗口上的“打印”按钮已设置了宏,单击“打印”按钮即可启动打印机得出结果。因为在主表“考试质量分析”的相应字段设置“显示控件 行来源类型”中,使用了“组合框 值列表”方式,或使用了“组合框表/查询” 方式,预先输入了各课程名称、班级名称、任课教师字段的值,所以在主窗口的课程名称、班级名称、任课教师等字段值的输入中,使用下拉方式选择即可。

5 结语

本系统界面友好、操作方便,设置了两种输入方式: “手动输入” 和“导入外部数据”方式,“手动输入”方式上面已做了介绍,“导入外部数据”方式,主要是利用数据库系统的导入外部数据技术,导入Excel电子表格等形式的数据,限于篇幅,不再介绍。本系统只使用查询及宏即可完成复杂的数据处理及各种链接功能,未使用到VBA,方便设计及检查且只需一次输入考试成绩分数,即可得出所需的全部数据,方便快捷。经本系统处理后的数据结果能较好地反映考试的质量状况。另外,利用数据库技术亦可以将数据导出为Excel电子表格形式,供其它软件使用。

参考文献:

\[1\] 肖瑛,周琦.考试制度在高校人才培养系统中的地位――高校教学改革的理论前提研究\[J\].湘潭大学社会科学学报,2003(6).

第4篇:数据分析课程范文

关键词: “数据结构与算法分析” 课程群 分层实践 分段管控 

课程群是对教学计划中有相互影响、互动、有序、相互间可构成完整的教学内容体系的相关几门课程组成一个课程间相互连接、相互配合、相互照应的课程群体[1]。2014年提出建设程序开发类课程群,包括C语言程序设计、C++程序设计、数据结构与算法分析、JAVA程序设计、web程序设计、组件开发技术、软件设计模式七门课程。其中“数据结构与算法分析”课程在整个课程群具有承上启下、举足轻重的地位,决定程序开发类课程群的成效。 

一、“数据结构与算法分析”课程的现状 

1.课程理论性强,难度大。 

调研发现:非计算机专业近80%的学生都感觉课程难,即使计算机专业的有近50%的学生,感觉该课程难学,这种畏惧思想影响学习兴趣。 

2.先导课程掌握不扎实,课程推进困难。 

教学计划中C++程序设计、实践和该课程分别安排在第2和第3个学期。暑假将两门课割裂了,造成是否介绍先导课的困境。 

3.学生动手水平参差不齐,单一的实践安排难以满足不同的需求。 

目前,课程的实践安排对所有的学生相同,对于动手强的学生可能在寝室就完成题目,而对编程能力不强的学生可能根本不知该如何下手,久而久之学生就失去开发热情。 

4.课程管控不足,课程考核不能反映学生的真实水平。 

目前课程的评定以卷面成绩为主,实践证明有些学生根本不会写代码但他却能拿到很高的分数。 

二、教学改革措施 

1.课程群中相关课程开课时间的精细化安排。 

(1)开课时间安排。 

C++程序设计包括64上课课时和16实践课时,将C++课程实践调整到第3学期第1周上,而数据结构与算法分析课程从第2周以后开始上,这样就将两门课紧密地衔接起来。这种一门课程一分为二的方法促进了C++课程,同时也保证“数据结构与算法分析”课程的顺利进行。 

(2)教学内容及学时分配。 

为呼应课程群中的后续课程,该课程内容是贯穿程序设计、软件设计模式的思想和观点。该课程采用面向对象和抽象数据类型观点介绍数据结构,集中体现分解、抽象和信息隐蔽的基本原则,抽象数据类型是中枢,展示信息结构转换的三个重要阶段:数学模型、抽象数据类型、数据结构与算法。其理论教学环节的安排为:数据结构的基本概念(2),表、栈和队列(6),树(8),散列(4),优先队列(7),排序(12),不相交集(4),图论算法(7),算法设计技巧(4),摊还分析(4),高级数据结构(6);课内实践的安排:栈和队列(2),表达式树(2),散列、优先队列(2),排序(2),不相交集(2),深度优先搜索应用(2),贪心、分治算法(2),AA树、treap数(2)。 

2.课堂教学模式改革 

(1)注重启发式教学,建立自主学习、合作学习相结合的教学模式。 

为强调思维训练,采用讲、做穿插的授课方式,教师采用示例案例授课时学生采用自主学习模式,是教-做-答疑的互动、有反馈方式。它强调教中实践、实践中思考、交流中提升;自主学习完后各小组通过“以强带弱、以老带新”的方式合作完成综合实践作业。 

具体讲解时,(1)首先引入案例,然后给出C++实现的方法,最后详细展开相应数据结构及操作实现;(2)一题多解、一题多语,如对同一问题采用不同的数据结构实现方法,对比讲解,多语言实现为拓展作业;(3)难点分散,如将栈与非递归处理技术分别在栈、二叉树非递归算法、快速排序与归并排序的非递归算法等多处讲解;(4)图示讲解和动画展示相结合。 

(2)标准化教学与微课程教学模式相结合。 

为了确保课程的可持续发展,课程采用项目组集体备课、集体讨论、分头准备的方式。课程组骨干教师经过多次讨论后修订了课程教学大纲,形成了标准教案、PPT及算法演示视频。为充分利用学生的课余时间,采用课程微课程化,微课视频一般10分钟左右[2],选择与生活比较贴近的数据结构(比如栈、队列等)和基础实践内容微课化。 

3.项目驱动的分层实践教学模式研究。 

教育心理学家发现:学习是累积性的,较复杂、较高级的学习是建立在基础性的学习基础之上的[3]。因此,课程的实践教学以贯穿课程群的项目进行驱动,提出“注重基础、综合应用、提高创新”的三层次实验教学模式,以基础、设计、综合三个方面的实践能力培养为中心,全方位地培养学生的动手能力和创新能力。 

基础类实践通常是对教材上所涉及的数据结构及相关操作进行上机验证,要求学生掌握相关数据结构,提高学生的软件设计规范化能力。这类实践通常在介绍完相关知识后以课程作业的方式发放,要求学生在规定时间内完成,教师以晚自习的形式进行个别指导;设计类实践要求学生对给定的题目进行数据结构的设计及算法实现,题目是从贯穿课程群中的项目案例中切割出来的。实践中我们鼓励学生一题多解,并分析不同解的时、空代价。这类实验通常是课程内实验题目,要求每个学生独自完成,教师全程指导、重点考核;综合类实践是对C++实践课程中学生已完成题目的重新设计,以小组为完成单位,人员分组原则上是C++实践的人员分组。该类实践培养学生分析、设计实际项目的能力和创新能力。教师对有强烈要求的学生通过答疑的方式进行指导。各小组完成后需要进行结题答辩,答辩中教师会对完成情况进行评价,从而引出后续课程。 

4.课程考核与过程控制。 

我们采用分段控制的多元化实践考核方式:期末机考30%+基础实践20%(程序代码+报告+随机面试)+设计实践40%(课前准备材料+完成代码+报告)+综合实践10%(报告+答辩)。考核方式强调对课程的过程监控,基础实践的每一次完成情况能够给教师提供重点监控的学生名单,通过晚自习的重点指导确保学生弄懂相关知识点、顺利进行实践课任务,为保证设计实践课的完成质量,要求学生在课前精心准备并提交准备材料。综合实践强调以强带弱,最后通过总结引出下一门课程,从而保持学生长久的学习动力。 

三、结语 

数据结构与算法设计是程序开发类课程群中最重要的一门课程,其成败直接决定整个课程群的成败。在不影响其他课程下的课程群开课时间微调保证课程的顺利进行;创新的教学课堂模式激发学生自主式、探索式学习;项目驱动的实践模式将课程群中的课程更紧密地结合起来;分层的实践教学满足不同层次学生的需求;教学过程的管控进一步确保教学的顺利推进。该课程改革对课程群中其他课程改革有积极的作用。 

参考文献: 

[1]马赛,李方能,吴正国,卜乐平.《信号与系统》课程群的建设与教学改革探索[J].高等教育研究学报,2010.3. 

[2]梁乐明,曹俏俏,张宝辉.微课程设计模式研究—基于国内外微课程的对比分析[J].开放教育研究,2013,19(1). 

[3]哈斯.《数据结构》课程中使用逐步演示法进行算法教学的实验研究[D].呼和浩特:内蒙古师范大学,2007. 

第5篇:数据分析课程范文

关键词:可疑值;3s法;Dixon法;Grubbs法

在水质分析时,异常值可能是因为各种随机误差的影响,也有可能因为其他因素。对可疑值的处理,可通过一些方法进行统计检测。本文列出了三种方法,下面对这三种方法分别做出讨论。

1 拉依达法

由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。

适用条件:当测量数据较多时,且成正态分布时可选用此方法。

检验方法:检测公式|x-xd|>3S (1)

x:样本平均数xd:可疑数据S:样本标准偏差,若xd满足(1)式,则为离群值,应舍去。

取3S的理由:根据随机变量的正态分布规律,在多次试验中,测量值落在xd-3S与xd+3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。

另外,当测量值与平均值之差大于2倍标准偏差(即|x-xd|>2S)时,则该测量值应保留,但需存疑。

方法优点:拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n

2 Dixon法

适用条件:用于一组测量值的一致性检验和剔除离群值,本法中最小可疑值和最大可疑值进行检验的公式因样本的容量(n)不同而异。

检验方法:(1)将一组数据从小大大排列为X1,X2,X3,…,Xn,X1和Xn分别为最小和最大可疑值;(2)按下表1求Q值。(3)通过显著性水平以及n值,查出Q值。若Q≤Q0.05,则可疑值为正常值;若Q0.05Q0.01,则可疑值为离群值。

方法优点:相对比较严密,对一组数据中只有一个可疑值存在时较为适用。

注意问题:用该方法剔除一个可疑值时,若剩余数据还有可疑值存在,经过检验又被剔除,则说明该方法对此组数据检验存在误差,不能再使用此方法,可使用Grubbs法。

表1 Dixon检验法计算公式和临界值Qn表样本数n 统计计算公式 显著性水平(α)

检验最小异常值 检验最大异常值 0.10 0.05 0.01

3 Q Q 0.886 0.941 0.988

4 0.679 0.765 0.889

5 0.557 0.642 0.780

6 0.482 0.560 0.698

7 0.434 0.507 0.637

8 Q Q 0.579 0.554 0.683

9 0.441 0.512 0.635

10 0.409 0.447 0.597

11 Q Q 0.517 0.576 0.679

12 0.490 0.546 0.642

13 0.467 0.521 0.615

14 Q Q 0.492 0.546 0.641

15 0.472 0.525 0.616

20 0.401 0.450 0.535

25 0.360 0.406 0.489

3 Grubbs法

使用条件:用于多组测量值均值的一致性和剔除多组测量值中的离群均值,也可以用于检验一组测量值的一致性和剔除一组测量值中的离群值。

检测方法:对L组测量值,将每组n个测量值的均值记为x1

计算所有均值的总均值,标准偏差

若可疑值为最小值x1,则T=,若可疑值为最大值为x1,则T=。根据T值和L值对比临界值表: 若T≤T0.05,为正常均值;若T0.05

表2 Grubbs检验临界值(Ta)表

L 显著性水平α L 显著性水平α L 显著性水平α

0.05 0.01 0.05 0.01 0.05 0.01

3 1.153 1.115 11 2.234 2.485 19 2.532 2.854

4 1.463 1.492 12 2.258 2.050 20 2.557 2.884

5 1.672 1.749 13 2.331 2.607 21 2.580 2.912

6 1.822 1.944 14 2.371 2.695 22 2.603 2.939

7 1.938 2.097 15 2.409 2.705 23 2.624 2.963

8 2.032 2.221 16 2.443 2.747 24 2.644 2.987

9 2.110 2.322 17 2.475 2.785 25 2.663 3.009

10 2.176 2.410 18 2.504 2.821

方法优点:较Dixon法更为严密,能对一组数据中多个可疑值进行检测,可进行多次可疑数据的剔除,提高数据处理的准确度。

注意问题:当可疑数据有两个或两个以上时,且均匀分布在同一侧(即为x1,x2或xL-1,xL) 此时在检测时,要先检测靠近的可疑值(即为x2或xL-1),然后通过计算T= 来检验x2是否舍去,若x2离群,则x1必然离群,应当注意的是此时总均值=,不包括x2。同理检验xL-1,即T=,此时=,然后对照T值表,检验xL-1是否离群,若xL-1离群,则xL必然离群。当可疑数据在总均值两侧时,要先检验离均值远的可以数据,若剔除了一个数据,在检验下一个时,此时总均值的求解为剩余L-1个均值的算术平均值。

通过这三种方法,我们可以在水质分析数据处理过程中提高我们检测结果的准确度,从而相对客观的反映水质情况,为水质鉴定,水污染防治提供可信资料。

参考文献

[1] 奚旦立,孙裕生,刘秀英.环境监测[M].北京:高等教育出版社,2010.

[2] 刘国华,吕晓柯,石晨,刘晓蕾,王鹏.初速数据判别方法研究[J].火炮发射与控制学报, 2013(3):01-0008-03.

第6篇:数据分析课程范文

 

与此相适应,会计信息管理专业的人才培养课程体系体现为会计学基础课程、数据分析技术课程以及决策能力提升课程等三个层次。

 

0 引 言

 

2012年以来,铺天盖地的大数据进入了我们的视线,各种流行书籍,各大网站、媒体都在谈论大数据,一时间成为这个时代最热门的话题。同时,这也引起了我们的关注。我们说,大数据,不单纯是数据规模上的大,还在多样性、速度、精确性上都有突破性增长。更重要的是,这种数据的潜在价值也是旧有数据难以企及的。我们这里暂且不论如何驾驭大数据以及有什么样的技术要求,它给我们的一点重要启示就是要注重数据分析的重要性。在此背景下,深圳信息职业技术学院会计信息管理专业积极探索满足新形势下人才需求的培养模式,使人才更好地满足当前企业的实际需要。

 

1 大数据时代背景引发对人才需求的变革

 

可以说,在未来的竞争领域,“占领市场必须先占有数据”,也就是要做到基于信息的决策——“用数据说话,做理性决策”,即进行数据分析。数据分析是从海量的数据中提取和挖掘出对企业有价值的规律和趋势,为企业的决策提供支持,这些支持体现在四个方面:①行为预见镜——帮助企业识别机会、规避风险;②问题良药——帮助企业诊断问题、亡羊补牢;③跟踪检测——帮助企业评估效果,提升效益;④引力动力器——帮助企业提高效率,加强管理。

 

不可否认,个别公司的决策人具有超人的战略眼光以及敏锐的洞察力,单靠直觉也能给公司带来巨大价值。那么究竟靠数据分析的决策能否优于直觉决策,我们这里也要靠数据说话。有学者比较了组织中用直觉决策以及用数据分析决策的可能性,研究发现,业绩优秀的组织更多地倾向于采用分析决策,尤其是在财务管理、运营、战略等方面。因此,可以推断,用数据分析决策比直觉决策能给企业带来更大的价值。与此同时,根据智联招聘网站显示,短短两年时间,珠三角地区数据分析人才需求已接近了需求量旺盛的传统会计专业。可见,越来越多的公司需要能够对公司财务等相关信息数据进行处理、加工、分析以为公司管理层决策提供信息支持的人才。

 

可以说,传统会计专业注重会计核算,即财务报表编制的整个流程及环节的掌握,而会计信息管理专业更注重对财务报表数据以及其他有用信息数据的再加工、处理、分析及呈报,以满足管理层经营决策的需要。 可以说,不同的社会发展阶段和发展水平要求有不同的专业设置及专业培养目标与之适应。从会计电算化到会计信息管理背后的推动力是时代的变革引发的对人才的需求。

 

然而,从当前会计信息管理专业的建设情况来看,多数院校存在培养目标不清晰、没有明确的专业定位、与会计电算化等专业没有明显区分以及缺乏明确的专业核心课程等突出问题,尤其是对会计信息管理专业名称中“信息”二字究竟如何体现没有清晰的把握和界定。 因此,会计信息管理专业的人才培养模式亟需变革。

 

2 大数据时代背景下会计信息管理人才工作岗位及能力分析

 

深圳信息职业技术学院2012年成功申报会计信息管理新专业,并于2013年下半年开始首届招生。与此同时,会计信息管理的专业定位、培养目标、课程体系也成为摆在专业任课教师面前的重大课题。近几年来,全体专任教师围绕会计信息管理专业建设展开了一系列的咨询、调研、走访,并定期进行讨论、交流,扎扎实实了解实际中的人才需求,实现专业人才供给与人才需求无缝对接。到目前,初步形成了具有专业特色的会计信息管理专业建设思路与方法。

 

首先,会计信息管理专业人才就业岗位主要集中在账务处理、管理会计、财务数据分析、预算管理、成本管理、资金管理及内部控制等方面。具体工作任务体现在:会计核算,纳税申报,管理会计,财务数据处理、加工、分析及呈报,以及预算、成本、资金管理等。

 

其次,在新形势下会计信息管理人才的工作岗位领域,会计信息管理专业人才应具备如下三方面能力:

 

①会计核算能力,指的是熟悉并掌握会计信息生成系统,运用财务信息对企业经营活动进行评价;②数据分析能力,指的是掌握一定的数据分析方法,运用Excel、数据库等现代信息技术手段对数据进行采集、处理、分析及呈现;③辅助决策能力,指的是能够依据相应的数据分析结果,为公司日常财务等管理决策提供支持。

 

3 大数据时代背景下会计信息管理人才培养目标

 

在当前互联网时代及大数据时代,对财务人才的要求,已经不局限于传统账务处理,更倾向于对决策相关信息数据的处理和分析。“占领市场必须先占领数据”,公司财务和经营决策的制定更多的是基于信息的决策,即“用数据说话,做理性决策”,而数据分析即是从海量的数据中提取和挖掘出对企业有价值的规律和趋势,为企业的决策提供支持。因此,在新形势下,会计信息管理专业的人才培养目标可以确定为数据分析引领财务决策信息化。

 

为了实现这一培养目标,需要三个层面的支撑体系,即基于财务会计、强化数据分析、服务管理决策。

 

4 大数据时代背景下会计信息管理人才培养课程体系

 

在以数据分析引领财务决策信息化的人才培养目标指引下,我们初步形成了如下三个层次的课程体系。

 

(1)会计学基础课程:会计信息管理源于会计,不能脱离财务会计,仍然要以财务会计为基础。专业学生要了解财务报表的生成过程及会计账务处理流程、能够对一般企业常见经济业务进行会计处理、进行企业纳税申报等。

 

这方面课程主要有:会计学原理、财务会计、纳税实务。(2)数据分析技术课程:对信息的把握体现在两个层面,其一是与企业信息化相适应的一般管理软件、财务软件的使用及熟练操作以及简单维护,能够作为关键人物辅助中小企业实现财务信息化;另一层面通过对数据的采集、整理、分析报告,满足管理层基于信息的决策以及决策的科学化。数据的来源可以来自公司内部的管理信息系统,根据需要也可以来自企业外部的国家经济产业政策、行业市场信息等。

 

其中,对数据的分析能力又从两方面进行培养,一方面是分析思维方式的培养,这是起主导作用的层面;另一方面是分析工具运用的培养,信息化时代,数据量的加大要求借助于一定的分析工具才能实现数据分析。企业信息化实施及数据分析方面的主要课程有:财务报表分析、财经数据分析、应用统计学、数据库原理及应用、数据处理软件应用、商务智能等。

 

(3)决策能力提升课程:新形势下财务人员面对和服务的更多是企业的管理层和决策层,会计信息管理专业学生要清楚公司管理层和决策层需要哪方面的决策信息支持,并通过数据分析方法进行提供,同时给出合理化建议。这方面课程主要有:管理会计、财务管理、成本管理等。

 

具体课程名称及课程目标见表2。

 

其中,财经数据分析课程能够使学生掌握系统的数据分析方法,包括数据收集、数据处理、数据分析、数据展现及报告撰写各环节的基本理论及操作技能,同时熟练地运用数据分析的思想和方法分析企业的财务数据,为管理层决策提供信息支持。数据分析软件应用课程能够让学生熟练运用Excel等常见数据分析工具、软件进行数据录入、数据整理和数据分析的方法和技巧,培养学生操作Excel等数据分析软件的基本技能。商务智能(含数据挖掘)课程依托商务智能平台,从商务智能概念、商务智能结构、多维数据集内容、数据挖掘、交付等主要内容,使学生在了解如何运用商务智能的工具、架构以及规则的基础上,分析企业数据,为企业管理层提供信息化决策支持系统。

 

5 结 语

 

不同的社会发展阶段和发展水平要求有不同的专业设置及专业培养目标与之适应。从会计电算化到会计信息管理背后的推动力是时代的变革引发的对人才的需求。大数据时代下会计信息管理人才培养目标为数据分析引领财务决策信息化。 相应课程体系为财务会计基础课程、数据分析技术课程、决策能力提升课程。我们共同期待,会计信息管理人才将通过数据分析对企业财务等管理决策带来价值增值。

第7篇:数据分析课程范文

关键词: 实验教学改革 经管类 大数据

实验教学是培养经管类专业学生实践能力的重要手段。经济管理类专业学生不仅要熟练地掌握理论知识,更要具备较强的实践能力,特别是大数据时代的到来,强调以数据为基础进行研究,并快速做出决策[1],不仅对掌握大数据思维和技术的人才需求量扩大,而且对经管类专业人才培养提出了新的要求[2],因此在大数据背景下应充分认识实验教学对经管类专业学生实践技能的重要性,科学全面地构建面向数据分析和管理的实验教学体系,以适应大数据背景下经管类专业人才的培养需求。

大数据扩宽了信息的来源,提高了信息获得的速度,分析对象从传统的结构化数据过渡到非结构化数据,因此对经管人才需要更全面地掌握大数据思维方式和分析流程。对工商管理、企业管理专业而言,需要其更注重利用多种类型的企业运作的数据,通过对其进行整理分析,帮助企业进行业务流程改革,提升企业运营效率,提高经济效益[3]。对于电子商务、市场营销专业而言,应学会利用大数据技术探索新商业模型,分析营销网络,评估投资风险及创新服务模式[4]。而对于和大数据技术紧密相关的信息管理专业来说,需要更全面地从数据采集、分析到数据挖掘多个方面转变传统的数据分析思维,以适应大数据环境下知识管理与智能决策的需要[5]。

1.实验目的不合理,实验设计不当。

目前,对于经管理类专业的大数据实验教学体系还处于基本概念阶段,与科研前沿脱节,实验目标大多只要学生掌握数据采集、统计分析等基本概念和方法,就学会对给定的数据进行分析。但是在大数据环境下,数据分析和挖掘需要针对结构化数据、非结构化数据等用创新性的思维方式解释分析结果,并用于智能辅助决策及知识发现。因此,大数据实验课程应与时俱进地适应大数据的要求,开展多样化、启发式的实验项目,不仅让学生掌握如何收集信息和整理信息,还要解释隐藏在数据背后的潜在规律。

2.实验教学方法和手段陈旧。

传统实验课是学生按照老师的要求和给定的数据,学习各种数据分析方法。实验内容设计单一,没有针对不同知识结构的学生开展有针对性的实验训练项目,学生学习积极性不高。因此,在大数据实验教学中,要以培养学生创新实践能力为主要目标,在教师的帮助下,通过团队协作、自主设计完成。同时,分层次制定针对不同知识结构背景的实验项目,便于学生根据自身的特长和能力自主选择实验项目。

由此可以看出,传统的实验教学已不能满足大数据背景下的经管类专业人才对数据分析和处理的新需求,在实验教学方式、实验教学内容等多方进行创新和改革,才能培养出顺应时代背景的优秀经管类人才。

在大数据背景下,经管类人才应该具备:发现问题的能力,收集整理数据和信息的能力及理解分析数据的能力。对此,我们从教学方式、课程体系、技能与经验三方面入手,开展实验教学改革,以适应大数据时代对于经管人才培养的要求。

3.创新实验教学方式。

大数据时代,书本和课堂不是获取信息的唯一选择,网络资源、各种移动端应用程序等方式都扩展了学生获取信息的方式,在这种情况下,实验教学不仅需要让学生掌握如何搜集、整理数据的技术,还要培养学生观察、分析问题的能力,从而真正调动学生的学习积极性。例如可以提供多种获取大样本数据的渠道,学生组队进行数据分析和挖掘,设计算法,进行相关分析直到最后撰写出分析报告,整个流程全部由学生独立完成。

4.完善大数据实验课程体系的构建。

对于经管类专业的学生而言,实验目的主要是让他们掌握数据分析的主要流程、主要算法的基本原理,具备大数据应用的初步能力。另外,考虑到不同专业的学生知识结构不同,我们构建多层次的经管类大数据实验课程、基础实验,以验证和演示实验为主,强调掌握数据分析工具和分析算法,理解数据分析基本流程。专业实验,以简单设计性实验为主,强调利用现有的数据分析工具,较完整地体验从数据采集、数据整理、数据分析到数据挖掘的全过程,并编写简单的数据分析代码。综合性实验,采用自助式、合作式模式,让学生自己动手收集数据,团队合作分析问题,在实验教师的指导下,综合运用各种数据分析工具,自主设计算法,进行相关分析,直到最后分析报告,初步具备大数据的应用能力。

5.培养专业技能和增加实践活动。

积极开展大数据应用相关的实践活动,提供多种形式让学生参与大数据的实践环节,在提高专业水平的同时,提高实践操作能力。合理利用现有慕课、微课等在在线课程作为实体课堂的有益补充,引导学生深入学数据技术。另外,积极联系软件企业提供各种实习途径和岗位,让学生真正参与与大数据的各种项目开发,强化课堂的理论知识,丰富实践经验,提高专业级技能,有效地提高学生的数据分析能力和数据挖掘能力。

大数据作为近年来的热点研究问题,已经广泛应用于经管类学科当中。经管类专业学生只有更好地掌握并懂得如何利用大数据,才能在大数据时代拥有更多的优势。因此,本文从教学方式、课程体系、技能与经验进行创新,提出切实可行的改革措施,以更好地培养经管类学生的数据分析的专业能力,适应大数据环境下知识管理与智能决策的需要。

参考文献:

[1]祝智庭,沈德梅.基于大数据的教育技术研究新范式[J].电化教育研究,2013(10):5-13.

[2]朱怀庆.大数据时代对本科经管类统计学教学的影响及对策[J].高等教育研究,2014(9):35-37.

[3]李永,刘玉红.大数据时代大学生学习模式转变研究[J].长春工业大学学报(高教研究版),2014,35(4):38-41,100.

[4]邵举平,沈敏燕,樊星.大数据时代背景下地方高校研究生教育教学模式改革研究[J].《鲁东大学学报》,2015,32(4):82-85.

第8篇:数据分析课程范文

关键词:大数据;复合人才;教学内容;实践形式;校企合作

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)45-0201-03

一、引言

随着计算机软硬件技术的快速发展,计算技术已从传统的PC平台计算模式发展到嵌入式计算、移动计算、并行计算和服务计算等多种计算系统并存及融合的计算模式,处理的对象也呈现出网络化、多媒体化、大数据化和智能化需求的特征,而物联网、移动互联网的快速发展促进了这一趋势,从而迎来了大数据时代的到来。大数据是继云计算、物联网之后兴起的又一新兴发展方向,被学术界、工业界乃至政府机构密切关注和广泛研究。

大数据又称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极的目的的资讯。在维克托・迈尔・舍恩伯格及肯尼斯・库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。一般说来,大数据具有4V的特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

二、大数据时代对人才的要求

从广义上讲,大数据人才就是具备大数据处理能力的科学家和工程师。目前,国际上开设了大量的数据科学方面的课程、数据科学学位计划以及数据科学短期培训班。从国际上设置的培养计划来看,大数据人才应该系统地掌握数据分析相关的技能,主要包括数学、统计学、数据分析、商业分析和自然语言处理等,具有较宽的知识面,具有独立获取知识的能力,具有较强的实践能力、创新意识和团队合作意识。具体来说,大数据人才首先应具备获取大数据的能力,例如能根据任务的具体要求,综合利用各种计算机手段和知识,收集整理海量数据并加以存储,为支撑相关的决策和行为做好数据准备。其次,应具备分析大数据的能力,对于经过预处理的各类数据,能够根据具体的需求,进行选择、转换、加载,采用有效方法和模型对数据进行分析,并形成分析报告,为实际问题提供决策依据。最后,应具备良好的团队合作精神,大数据时代下的数据分析任务通常无法依赖个人能力来完成,需要在团队制度的约束下,与他人一同携手、互相鼓励、分工合作来实现既定目标,因此具备较强的责任心与团队合作精神也是大数据从业人员必备的基本条件。

三、大数据人才培养的探索

大数据产业的发展,对大数据人才提出了新的需求,国内各高校在积极进行大数据学术研究的同时,也开始考虑将大数据相关课程纳入培养体系,以满足社会对大数据人才的需求。以下结合作者在数据库及分布式技术系列课程中的教学经验,以及大数据分析与处理方面的实践经验,探讨大数据系列课程教学内容和实践形式的设置。

在教学内容的设置上,大数据系列课程建议可分为理论教学和技术教学两个方面,因为理论是大数据认知的必经途径,也是被广泛认同和传播的基线;而技术是大数据价值体现的手段和前进的基石。在理论方面,讲授的理论内容可涵盖如下几点:

(1)大数据概念:大数据概念出现的历史,关于大数据定义的各种流派以及说明,大数据的四个特征,大数据与云计算、物联网的关系,大数据与大规模数据、海量数据的差别。这个部分主要突出“大数据”概念中应包含的“对数据对象的处理行为”。

(2)典型的大数据应用实例:精选有新意的大数据分析典型案例,可帮助学生更清晰的理解大数据的概念和含义,这样的案例如:美国梅西百货的实时定价机制(根据需求和库存的情况对多达7300万种货品进行实时调价)、百度搜索的实时热点排行榜(以数亿网民的搜索行为作为数据基础,建立权威的关键词排行榜与分类热点)、沃尔玛的搜索引擎Polaris(利用语义数据进行文本分析、机器学习和同义词挖掘使得在线购物的完成率提升了10%~15%)、谷歌流感趋势工具(通过跟踪搜索词相关数据来判断全美地区的流感情况)等。在教学过程中,教师应注意将授课的重点放在系统化的开发步骤和关键性问题的求解上,介绍案例的设计思想、主要方法和应用过程等。

(3)大数据关键技术与挑战:介绍大数据时代面临的新挑战,包括大数据集成(数据异构性和数据质量问题)、大数据分析(数据形式多样化、数据处理的实时性、索引结构的复杂性等)、大数据隐私问题(隐私保护和数据分析的矛盾)、大数据能耗问题(低功耗硬件的设计)、大数据处理与硬件的协同、大数据管理易用性问题以及性能测试基准。

(4)大数据存储和管理技术:介绍如何把采集到的大数据存储起来,建立相应的数据库,并进行管理和调用。主要内容包括:分布式文件系统(HDFS)、去冗余及高效低成本的大数据存储技术、新型数据库技术(键值数据库、列存数据库、图存数据库以及文档数据库等)、异构数据融合技术、分布式非关系型大数据管理与处理技术、大数据索引技术和大数据移动、备份、复制等技术。

(5)大数据分析及挖掘技术:介绍从大量数据中寻找其规律的技术,通常由数据准备、规律寻找和规律表示3个阶段组成。数据准备是从上述大数据中心存储的数据中选取所需数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含规律找出来;规律表示则是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。

在技术方面,可考虑分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程,具体可包括以下几点:

(1)NoSQL技术:NoSQL产生的背景、NoSQL现状、NoSQL数据库与关系数据库的比较、聚合数据模型、分布式模型、数据一致性、典型的NoSQL数据库分类、NoSQL数据库开源软件。

(2)MapReduce:MapReduce模型概述、编程模型:Map和Reduce函数、MapReduce工作流程、并行计算的实现、实例、Yarn等

(3)Hadoop分布式文件系统:Hadoop出现的背景、Hadoop的功能与作用、为什么不用关系型数据库管理系统、Hadoop的优点、Hadoop的应用现状和发展趋势、Hadoop项目及其结构、Hadoop的体系结构、Hadoop与分布式开发、Hadoop应用案例、Hadoop平台上的海量数据排序。

(4)还可进一步包括数据流的管理与挖掘、云数据库、图数据库等。

由于大数据系列课程所涉及的技术具有很强的应用背景和实践意义,因此应摒弃传统教学模式中“重理论、轻实践”的思想,在掌握大数据相关的理论知识和技术知识之后,还需重点培养学生的综合实践能力,以满足社会就业的需要。为此,应设立一定的大数据技术实践课程内容,帮助学生从知识型向能力型转变。结合上一节分析的大数据时代对人才的具体要求,建议按以下流程设置实践环节的内容:

(1)分组。如前所述,大数据时代下的数据分析任务通常需要以团队的形式来完成,因此首先要求学生根据自身情况,结合各自的技术优势,合理进行分组。

(2)选题。在具体选题上,可使用校企合作的具体项目或以Apache Hadoop、MongoDB、Dremel、Gephi等一系列的开源大数据分析软件作为实践平台,以Kaggle为数据科学平台来进行选题。

(3)明确需求并撰写大数据分析任务书。明确选定的题目范围内,数据分析要研究的主要问题和预期的分析目标。只有明确了数据分析的目标,才能正确地制定数据收集方案,即收集哪些数据,采用怎样的方式收集等,进而为数据分析做好准备。

(4)数据收集及预处理。由于大数据分析最终的结果与其获取的数据质量紧密相关,因此收集的数据是否真正符合数据分析的目标是必须注意的重要问题。该步骤要求学生从分析目标出发,从浩瀚的数据中正确的收集高质量且服务于既定分析目标的数据,然后对数据进行必要的加工整理,包括填写空缺值、平滑噪声数据、识别和删除孤立点、解决不一致性、规范化(消除冗余属性)和聚集(数据汇总)等。

(5)探索性数据分析。由于大数据分析的数据量通常达到PB甚至YB级以上,因此希望直接选定一个分析模型是不现实的,而且面对高维海量数据,也很难直接看出数据的规律。在这个步骤中,应指导学生通过基本描述统计量的计算、基本统计图形的绘制、用各种形式的方程拟合等手段,计算某些特征量等方法探索规律性的可能形式,帮助学生快速掌握数据的分布特征,这是进一步深入分析和建模的基础。

(6)模型选定分析。在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。有时选择几种统计分析方法对数据进行探索性的反复分析也是极为重要的。每一种统计分析方法都有自己的特点和局限,因此,一般需要选择几种方法反复印证分析,仅依据一种分析方法的结果就断然下结论是不科学的。

(7)模型的验证及分析报告。指导学生对选择的数据分析模型及结果进行分析,可使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。观察模型提供决策的信息是否充分、可信,所发挥的作用是否与期望值一致,数据分析方法是否合理,是否将风险控制在可接受的范围。

以上这种项目式实践形式的优势是:在学生参与完成某一具体的大数据分析任务过程中,通过主动地学习来自主地进行知识的建构,让学生经历项目开发的整个过程,从中去发现和掌握相关知识,达到既能熟悉大数据分析过程,又完成了经验的积累,还能实现学习知识、培养能力的目的。在这里,教师不再是知识的传授者,而是项目活动的组织者和咨询者。

四、校企合作推动人才培养

一方面,大数据的核心业务必然是一种扎根于特定行业,综合运用已有的存储、分析、挖掘、展现技术,根据用户需求并融入行业特色技术模型的一站式大数据平台业务。另一方面,对于企业来说,各类业务产生的数据为数据分析创造了非常好的基础条件。大数据解决方案是有价值的,但是苦于找不到既懂数据分析技术,又懂得业务的专业人才。由此可见,既懂得相关技术,又谙熟企业业务的复合型人才才是企业部署大数据应用最迫切需要的人才。因此,企业可以与学校联合培养自己所需要的大数据人才,这种方式有两方面的优势:一是大数据技能训练的对象,即大量的数据,只有企业才具备;二是在企业的支持下,学校也能通过针对性的实践训练来培养学生的大数据处理技能。

大数据时代下的校企合作的形式多种多样,可通过联合办学、联合制定人才培养方案、合作开发课程和教学内容、设置实训项目、教学管理和共建“双师”结构教学团队等形式展开。

五、结语

第9篇:数据分析课程范文

2数据分析观念由《小学数学课程标准(实验稿)》中的“统计观念”改造而来。《小学数学课程标准(实验稿)》中的“统计观念”强调的是从统计的角度思考问题,认识统计对决策的作用,能对数据处理的结果进行合理的质疑等。《小学数学课程标准(正式版)》将其修改为“数据分析观念”,就是希望改变过去这一概念含义较“泛”,体现统计与概率的本质意义不够鲜明的弱点,而将该部分内容聚焦于“数据分析”。数据分析观念是学生在有关数据的活动过程中建立起来的对数据的某种“领悟”,由数据作出推测的意识,以及对于其独特的思维方法和应用价值的体会和认识。《小学数学课程标准(正式版)》对于数据分析观念一是过程性(或活动性)要求:让学生经历调查研究,收集、处理数据的过程,通过数据分析作出判断,并体会数据中蕴涵着信息;二是方法性要求:了解对于同样的数据可以有多种分析方法,需要根据问题背景选择合适的数据分析方法;三是体验性要求:通过数据分析体验随机性。

3运算能力是《小学数学课程标准(正式版)》增加的核心概念。运算是数学的重要内容,在义务教育阶段数学课程的各个学段中,运算都占很大的比重。学生在学习数学的过程中要花费较多的时间和精力,学习和掌握各种运算的知识及技能,并发展运算能力。运算的正确、有据、合理、简捷是运算能力的主要特征。运算能力并非一种单一的、孤立的数学能力,而是运算技能与逻辑思维等有机地整合。在实施运算分析和解决问题的过程中,要力求做到善于分析和运算条件,探究运算方向,选择运算方法,设计运算程序,使运算符合算理,合理简捷。总之,运算能力不仅是一种数学的操作能力,更是一种数学的思维能力。

4《小学数学课程标准(正式版)》提出的推理能力与过去相比,有这样一些特点:一是进一步指明了推理在数学学习中的重要意义。《小学数学课程标准(正式版)》指出“:推理是数学的基本思维方式,也是人们学习和生活中经常使用的思维方式。”它对教学的启示是,不仅要引导学生认识到推理是数学的重要基础之一,它与人们的生活息息相关,更重要的是要逐步培养学生运用推理进行思维的方式,二是基于数学推理的特点,突出了合情推理与演绎推理这条主线,指出在数学思维和问题解决的过程中,两种推理功能不同,相辅相成——合情推理用于探索思路,发现结论;演绎推理用于证明结论。三是强调推理能力的培养“应贯穿于整个数学学习过程中”,应当贯穿于整个数学课程的各个学习内容,贯穿于数学课堂教学的各种活动过程,贯穿于整个数学学习的环节,贯穿于三个学段,合理安排,循序渐进,协调发展。