前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的excel数据分析主题范文,仅供参考,欢迎阅读并收藏。
关键词:数据分析;excel和SPSS应用;输入处理;描述统计
一、Excel在数据分析中的简单应用
(一)Excel在数据输入处理的应用
Excel大多数情况下是用“列表格式”存储数据,将书面数据信息输入到计算机很多情况下须手工完成,但有时也可根据数据本身的规律性或借助Excel的某些功能来提取数据。
例如,将xx大学2011级学生考研信息录入到Excel的表格中,有姓名,序号,性别,学号,班级,身份证号等几项数据。
其中,姓名、学号、身份证号、性别手工输入;序号利用Excel本身定义的拖动复制功能输入;出生日期的输入可以利用文本截取函数从身份证号中分别提取,并用日期函数结合成出生日期。
(二)Excel在数据审核处理中的应用
数据本身要求符合一定的逻辑,但在手工输入过程中难免出现错误。在输入的同时让计算机自动识别不合逻辑之处并给出提示,有助于及时判断输入数据是否有误。
(三)Excel在数据描述统计的应用
Excel在计算平均数、方差(标准差)、众数、中位数时分别利用公式“AVERAGE”、“VAR”(STDEV)、“MODE”、“MEDIAN”,并选择选择需要求解的范围即可得出最终结果。例如,对“学业成绩A”计算均值。
利用公式“AVERAGE”,选择需要求解平均数的范围C5:C38,计算出最后结果78.16118。
二、SPSS在数据分析中的简单应用
(一)SPSS在数据输入处理的应用
用SPSS统计软件进行数据输入可以通过直接输入和间接导入两种方式读取数据。SPSS可以导入不同类型文件的数据,如xls、dat、inc、csv等。
(二)SPSS在数据筛选排序中的应用
利用SPSS选择“数据”―“选择个案”,进行条件的筛选。SPSS的数据排序是对数据窗口中的数据按照某个或几个指定变量的变量值升序或降序重新排列。以排序变量的多少分为“单值排序”、“多重排序”。
(三)SPSS在数据描述统计的应用
SPSS在计算平均数、众数、中位数时可通过“分析”―“描述统计”―“概率”菜单下进行依次选择求解。也可以同时求解出均值、众数、中位数。并可以利用“描述数据”功能求出所研究数据的方差(标准差)。
三、Excel与SPSS比较分析
Excel与SPSS在进行统计数据分析中都有各自的特点,具有分析如下:
其一,Excel在数据输入分析中应用较简便,不需对有关数据进行额外的变量设置,但处理较多大数据操作比较困难;SPSS相对专业性较强,对大数据的处理步骤和结果都较为详细,但在数据变量设置方面不太简便。
其二,Excel在数据分析中最为基础且易掌握,图形工具强大,但不适宜大型统计分析;SPSS为较为专业的统计应用软件,对于大型数据的统计应用较多但对于图形工具不太全面。
其三,就统计学原理所涉及的统计方法而言,Excel没有直接提供包括箱线图、相关系数的p-值、方差分析中的多重比较、非参数检验方法、质量控制图等方法,而SPSS功能比较完善。
其四,大部分情况下Excel的计算结果都是可靠的,但在一些极端情况下Excel的计算程序不够稳定和准确,有些自动功能可能会导致意想不到地结果。相比之下,SPSS计算结果比较准确,适用于学术研究。
其五,SPSS的数据编辑窗口与Excel类似且可定义数据的属性,但其数据管理功能相对较弱如只允许同时打开一个数据文件,这对有些分析工作来说可能不够方便。
四、结论
不敢预测也不可能断言,在未来的统计学理论研究中统计软件处理会占据统治地位,但是统计软件处理数据越来越渗透到经济学研究中,特别是数据分析方面,并且发挥着越来越重要的作用已成为事实。而且还应当说,统计学学不仅应用了统计软件,如Excel和SPSS,而且还会不断地应用着统计软件发展的最新的成果。因为统计软件的不断发展也在致力于解决能够描述复杂现象的数据现象。当然,虽然统计软件是统计学中必不可少的应用,但是统计软件在统计学中只是作为一种工具被用来考虑或研究基本现象或行为背后的规律。作为工具和方法必须在理论的合理框架中才能真正发挥其应有的作用而不能替代真正经济数据的发展,否则会出现因噎废食。我们从另一个角度上看,这反过来也推动了Excle和SPSS等有关统计软件的发展,为其的发展提供了源源不断的动力。在未来的数据分析领域中,我们要好好地运用这一重要工具进行更加精确、更为深入的研究,科学地融合统计软件与统计数据研究,推动共同进步发展。
参考文献:
[1] 安维默.用Excel管理和分析数据[M].人民邮电出版社.2003:25-26
【关键词】考试;MS Excel;成绩分析;试卷质量分析
【中图分类号】G40-057 【文献标识码】B 【论文编号】1009―8097(2010)10―0135―03
引言
考试是教育活动中评价教学质量,衡量教学效果,鉴别人才素质的重要手段之一。所有的教学都是用不同的考试手段来检测和监控教育质量、规范和引导教师的教学行为,并督促学生积极努力的学习。对于考试的准确定位和恰当使用成为现代教育的一个重要问题。在现今情况,各类各级学校的绝大多数考试的结果大都是以分数成绩的形式给出,成绩的评定和使用显得尤为重要。对学生的成绩进行分析评估,为引导教学工作和提高学生成绩提供了重要的依据。
在教学过程中将会产生大量的成绩数据,对其进行人工分析是非常困难的,而且较易受到教师主观因素的影响。随着信息技术的发展并且引入到教育领域[1],利用信息技术对学生的学习成绩进行分析处理将变得可行[2]和简单,目前大多数教师对信息技术的利用仅仅停留在数据的存储和查询上,并没有对数据进一步的统计分析。
使用信息技术对成绩进行有效的统计分析,可以更好发挥考试对教学效果的反馈作用,同时也可以对试卷质量进行评估,辅助指导教师的命题。目前市面上流行着很多专业的统计分析软件比如SPSS[3]、SAS[4]等,但是这些软件价格昂贵、操作复杂,并不适合普通教师使用。MS Excel[5]作为最普及的办公软件,完全可以实现成绩分析和试卷质量分析的功能。
一 MS Excel介绍
MS Excel是美国微软公司的Microsoft Office System办公软件包中的一个重要组件。它集数据管理、数理统计、绘图与一体,既具备存储功能,又可以完成多种表格与图表的设计。同时MS Excel内置了数百个函数,能够完成绝大多数复杂的数据运算和统计分析,精度能达到专业统计分析软件。使用Excel的内置功能可以进行各种数据的处理、统计分析和辅助决策操作。本文使用MS Excel版本为2003版。
二 某英语成绩分析实例
出于教学本身考虑,对学生成绩的统计分析包括最高分最低分、及格率、集中量分析和差异量分析等。
本文以兰州理工大学在2009年5月组织的一次四级模拟考试的部分成绩为样本进行分析,样本数目为925,参考学生分别来自不同院系不同年级。
1 成绩表的建立
我们在Excel中建立成绩表来存储学生成绩。表格存储了学生院系名称、年级、学生姓名、学号、总分和各小题得分。本次模拟试卷由四大部分组成,分别是听力部分、阅读部分、写作部分和综合测试部分,其中听力部分和阅读部分为客观题目,写作部分和综合测试部分为主观题目。
2 初步分析
对成绩的初步统计,是指从整体上对成绩进行分析。包括将成绩按照分数段统计出每个分数段的人数和比例,以及最高分、最低分和整体分布情况等[6]。
在Excel中可以非常简单地对分数段人数和所占比例进行统计。使用内置COUNTIF函数可以计算出所处相应分数段的人数,再除以总参考人数即可得出相应分数段所占比例。
同时Excel提供的图表功能可将工作表中的数据用图形表示出来,使得数据更加直观、易于阅读和评价。如图1所示,本文以三维饼状图的形式表示了不同分数段及所占比例,非常的直观。根据不同的习惯和用途,用户还可以自行选择以柱状图、条形图等图表样式表示。
3 统计量分析[7]
初步的分析只是对成绩进行简单分析,还需要更深入地对成绩进行统计学分析,计算一些能够反映数据分布特征和规律的某些具有代表性的数值,也就是统计量。在数据分析中常用的描述数据特征的统计量主要有描述数据分布的集中趋势的度量和数据分布的分散程度的度量。
分数分布的集中量数主要用来反映该组分数集中趋势的统计量,一般使用均值和中位数来表示。
均值是一组数据的算术平均值,在成绩分析中,它可以反映一个群体对知识的掌握状况。在Excel中,提供了求均值的函数AVERAGE可以直接对分数求均值。由于我们分析的实例缺考人数较多(接近10%),直接使用AVERAGE函数求得的均值不能真实反映实际参加考试学生的知识水平。因此,我们通过Excel提供的其它函数来解决这一问题,SUMIF函数用来按条件对指定区域求和,COUNTIF可以按条件统计指定区域数目。利用SUMIF(总分,”>0”)/COUNTIF(总分,”>0”)可以计算参加考试的学生成绩的平均值。
均值容易受到极端值(极大值或者极小值)的影响,因此在描述一组数据的集中量分布时,一般还要使用到受极端值影响较小的中位数。中位数是指将数据排序后,位置在最中间的数值,在Excel中,提供了直接求取指定区域中位数的函数MEDIAN。
差异量数是用来描述一组学生分数散布状况的量数,差异量数反映的是学生分数的分布范围的大小和波动情况,一般使用标准差作为差异量数。同时使用集中量数和差异量数才能较全面对一组学生成绩进行全面的分析描述。
标准差也称均方差,是各数据偏离平均数的距离的平均数,它是方差的算术平方根。标准差反映的是一个数据集的离散程度。标准差越大,表明这组成绩的偏离平均数的程度越大,标准差越小,这组数据偏离平均数的程度越小,即分布的差异越小。Excel提供了用来估算样本标准差的函数STDEV。
我们对实例使用的四级成绩数据进行统计量分析截图如图2所示。可以看到本次四级模拟成绩的平均分数为379.08,低于总成绩的60%。教学实践表明,如果平均分低于总分的60%,则说明试卷较难或者学生水平较低,在60%到80%之间,说明学生整体水平基本合格,80%以上则说明试卷较易或者学生整体水平较高。本次四级模拟的总成绩为710,平均分是低于总成绩的60%(426),说明参考学生的水平较低,应加强英语学习,同时本次试卷略偏难。
在差异量数计算中我们可以看到,本次考试成绩的标准差为59.16,数值较大,说明参考学生之间的差异性较大,即学生成绩的两极分化较为严重。
三 试卷质量分析
试卷质量分析是分析考试可靠性、有效性的基本方法,是促进考试工作,提高试卷和试卷编制质量的基础,是反馈教学信息,改进考试工作的有效途径。试卷的质量标准为准确可靠、切实有效、难易适当和鉴别能力强,一般用信度、效度、难度和区分度等度量值来描述试卷的质量[7],我们同样可以借助Excel工具对试卷的质量进行定量分析。
1 信度分析
考试信度是反映考试可靠性的重要指标,即检验能否真实反映学生水平程度的数量化指标,它描述的是考试的误差的大小。在教育统计学领域,最常用的求解考试信度的方法是 x系数法。
其中,分子 表示的是每一大题得分的方差,分母 代表是试卷总分的方差,n代表的是试卷的大题数目。我们在Excel中计算了示例使用的某大学四级模拟考试的信度。考试信度 的计算使用到Excel内置的计算方差的函数VAR。使用该函数可以方便地计算试卷总分的方差和每一大题的方差。实践表明,对于正规的大型考试其信度一般要求在0.9以上。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
2 效度分析
效度是衡量试卷质量的另一个度量,效度描述的是试卷考试结果的有效性或正确性,效度较高的试卷能够较准确地测出学生掌握知识情况的真实程度。
效度是测量学上的定义,确定效度一般是通过计算两门性质相近的学科成绩的相关系数或者同一学科两次考试成绩的有效性,由于本文中实例只是单次单科考试,因此不对试卷效度进行演示分析。
3 难度分析
难度就是试卷的难易程度,有多种方法对试卷难度进行评定,基于我们示例所用数据考生人数较多,本文使用分组平均分系数来描述试卷难度。首先将学生的成绩由高到低排序,然后把成绩最高的27%的学生定义为高分组,把成绩最低的27%定义为低分组,分组平均分难度系数的公式为:
其中 为高分组的平均分数, 为低分组的平均分数,W则为试卷的总分。
平均分难度系数的计算在Excel非常的简单,仅仅涉及到简单的排序和求平均值运算。
试卷的难度系数根据考试的目的而定,一般来说,难度系数在0.7以上的为较易试卷,在0.4和0.7之间的为中等难度,在0.4以下则为较难题。
4 区分度分析
区分度是指试卷对不同水平的学生加以区别的能力,又称为鉴别力。具有良好区分度的试卷,实际水平高的学生应该得到高分,水平低的学生应得低分。
区分度的计算取决与试卷的类型,对于客观题的区分度计算公式为:
其中Di为第i题的区分度,Wi为第i题的分数。
由于分数表录入了每一小题的分数,Excel对试卷区分度的计算也非常的简单和方便。一般认为区分度在0.4以上的试题为去区分性优良题,在0.3和0.39之间的试题为区分性良好题,位于0.2和0.29之间的为一般题,0.2以下的为劣等题。
5 实例分析
我们在Excel中对兰州理工大学四级模拟试卷进行度量计算,分析试卷的质量,在Excel中的结果截图为图4所示:
从图中可以看到,试卷的可信度偏低,难度适中、略难,区分度较差,这份试卷的质量一般,应注意调整试卷结构。
四 结语
本文利用MS Excel软件对学生成绩进行统计分析,同时对试卷质量在信度、效度、难度和区分度四个方面进行了分析评估。MS Excel软件普及性较高,简单易用,使广大教师在进行分数统计、试卷分析时更为高效、便捷。
参考文献
[1] Mark Warschauera and Deborah Healya. Computers and language
learning:an overview[J].Language Teaching,2009,(12):57-71.
[2] 李竹宁.试卷质量的统计分析与评价[J].教学与管理, 2006,(12):60-62.
[3] [OL].
[4] [OL].
[5] Excel2003/2007公式与函数的使用艺术[M].北京:中国铁道出版社,2009.
[6] 宋.基于数据挖掘技术的学生成绩分析[D].重庆:重庆师范大学,2009.
[7] 于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,1999
【关键词】Excel;高级应用;数据管理与分析
1.前言
Excel作为微软公司出品的Office系列办公软件中的组件之一,近年来成为日常生活中使用频率最高的数据处理软件,它的魅力在于不仅可以制作外观简洁漂亮的表格和图片,还可以在数据的管理和分析等方面具备强大的功能。与像Access这样专业的数据库软件相比,尽管Excel看起来简单,但是如果能够根据用户的不同需求,深入挖掘它的数据管理与分析功能,充分发挥其数据处理的优势,就可以体验到Excel在实际应用中的巨大魅力。
2.几种常用功能的高级应用
2.1 “排序”功能的高级应用
在Excel实际操作中,“排序”是常用的一项功能,最常用的排序就是使用工具栏中的“排序”选项进行排序。一般地,Excel会按照当前字段内容进行升序或者降序排练,但是我们通常会忽略到如果当前字段内容是中文汉字时,排序默认为以字母为基准,也就是按照当前内容拼音的首字母在英文字母中的出现顺序进行排列。如果我们想以笔画作为排列基准时,可以按照“数据”“排序”操作命令打开“排序”对话框,然后单击对话框左下角“选项”按钮,得到排序选项对话框如图1所示,在该对话框中选取“方式”选项下的“笔画排序”。
图1 排序选项对话框
若遇到笔画相同的情况,Excel会根据内码顺序进行排序操作。在此需要强调一点,在“排序选项”对话框中选择了排序方式后,工具栏中的顺序按钮将会一直按照此方式进行排序操作,若需要回到默认时,还需要在图1所示对话框中进行设置选项。
2.2 “高级筛选”功能的高级应用
在Ecxel实际操作中,“筛选”功能是在处理较复杂数据的情况下常用的功能。尽管普通的“自动筛选”操作简单,但是当面临更具体详细的条件来筛选数据时,就需要启用“高级筛选”功能。“自动筛选”受到对一个字段最多可以设定两个条件进行设置等限制,但这些都可以在“高级筛选”功能中得到解决。“高级筛选”功能是在某一个单元格内记录筛选条件,然后根据这些条件筛选出符合条件的记录。如果初次使用“高级筛选”功能可能会感觉到表达式的书写比较麻烦,但掌握习惯之后就可以很快速地在复杂数据中进行筛选操作。
筛选条件的编写需要遵循最基本的规则:编写作为字段的对象名称,并且需要将筛选条件编写在其下方的单元格中。筛选条件的表达式可以使用运算符与字符串、万用字符等的组合。如下面1所示筛选条件的示例。
2.3 “VBA存储”功能的高级应用
在利用Excel进行数据管理与分析的应用中常常要用VBA存储功能来转存筛选出的数据。通常我们需要将筛选出来的数据复制到其他的位置,而未被筛选出来的数据将会自动排除在被复制的范围之外。一般地我们会将筛选出的范围认定为“可见数据库”来进行复制,例如:
Set myNeed=Range(“B1”).CurrentRegion
myNeed.AutoFilter Field:=7,Criterial:=”一班”
以第7个字段为基础进行筛选操作
myNeed.SpecialCells(xlCellType Visible).Copy
仅仅复制可见单元格
按照刚刚提到的特性,也可以将代码改为下列形式,所得结果都是相同的:
Set myRng=Range(“B1”).CurrentRegion
myNeed.AutoFilter Field:=7,Criterial:=”一班”
myNeed.Copy
这样我们就可以只复制筛选出来的显示范围
在此需要强调,在Excel中使用“隐藏”选项而隐藏的列和因为筛选而成为隐藏的列其操作方式是不相同的。如果使用了“隐藏”选项的单元格范围,复制操作就会连同处于隐藏状态的单元格一起复制。但是如果筛选过程中出现了有隐藏的行列,并且在其中输入了函数的情况,在复制操作时就必须要选择“看得见的单元格”来进行处理。若在实际操作中没有办法根据需要处理数据时,就要留意是否由两种不同隐藏状态造成的。
2.4 “蒙特卡洛”功能的高级应用
蒙特卡洛作为模拟随机现象的一种数学方法,它的基本思路是用一个随机过程去模拟另外一个相同概率的随机过程,也就是用这一事件是否发生来判断另一事件是否发生的过程。现实生活中的随机过程,很多问题采用解析法进行求解非常困难,但采用蒙特卡洛方法进行模拟则较为简单,首先建立随机过程概率模型,该模型的参数等于问题的解,然后对该随机过程概率模型进行观察抽样试验,计算这些参数的某一统计特性,最后根据这些统计特征求出参数的近似解。
基本操作主要有以下5步:
1)依据实际问题,建立相应的随机过程概率模型,要求所求参数的解应该是所建立模型的数学期望;
2)依据问题特点和计算的需要,采取直接模拟的方法或者降低方差的方法,来提高计算效率,降低运算时间;
3)确定伪随机数的产生方法,调用随机数发生器产生满足要求的随机数;
4)使用Excel软件中的数据分析功能,根据所求参数的统计特征,计算其统计近似值及方差;
5)将数据输入到Excel软件中,采用数据分析模块来模拟计算。
比如,设某个航空导弹射击飞机的命中概率为0.78,现在对来袭飞机发射3颗导弹,请判断射击效果。针对这个问题,我们都知道每次发射一颗导弹能否命中来袭飞机是一个随机事件,并且已知命中概率为0.78,那么我们就可以模拟这个作战过程,可以通过调用随机数来确定作战的结果。在Excel实际操作中,可以直接调用“RAND”函数来模拟产生0到1之间均匀分布的随机数,若产生的随机生小于或者等于0.78,我们就认为导弹命中来袭飞机,若随机数大于0.78则认为没有命中来袭飞机。如果我们在Excel软件中进行多次重复模拟,统计意义上的平均结果肯定接近于0.78。
发射三颗导弹,可以产生3个随机数,调用“RAND”函数得出的模拟结果如表2所示。
根据模拟结果可知,第2、3发命中来袭飞机,第1发没有命中,因此这一组3发的命中概率约为0.667。在此需要说明每一次试验都是独立的和随机的,并且还要避免重复。选择模拟次数N也是一个非常重要的问题,一般情况认为模拟次数N应该足够大,只有这样才可以得出一条更加光滑的概率分布图。
3.小结
只有不断深入挖掘Excel软件的功能,探索其在数据管理和分析方面的高级应用,其实在像Access这样专业数据库软件中的常用功能都可以由Excel来实现,尤其是如果能够继续深入探究采用VBA和Excel结合起来模仿数据库应用程序。在运用Excel软件进行蒙特卡洛模拟时既可以免去繁复的公式推导过程,又可以避免复杂程序的编写,同时在产生伪随机数和计算结果分析方面都非常方面。
作为一款卓越的数据处理软件,Excel软件拥有强大的数据管理和分析工具,不仅仅表现在“排序”、“高级筛选”、“VBA存储”和“蒙特卡洛”等功能上,还有如单变量求解工具、模拟运算表和规划求解工具等。但是,大部分用户对于这些管理和分析工具了解的太少,不能熟练运用一些具体操作。如果掌握了这些方法和技巧,并在实际情况下灵活运用这些数据管理和分析工具就能够轻松解决很多复杂的问题。
参考文献:
[1]陈邓安,丛中旖,王子明.在效能分析中应用Excel数据分析模块进行蒙特卡罗模拟[J].科学技术与工程,2012(2).
[2]刘平.Excel在办公中的高级应用初探[J].电脑知识与技术,2010(27).
[3]周红晓.Excel数据有效性高级应用探讨[J].福建电脑,2009(10).
随着科学的进步以及不断发展,导致现代社会信息化水平日益提高,大数据时代应运而生。在信息化水平不断提高的背景下,审计人员如何利用一些必要的计算机技术来分析被审计数据,从中发现审计线索以确定审计重点、范围,这将成为开展审计工作的前提条件。而当前,审计人员采取的数据工具以Excel与SQL Server为主,本文就将针对这两种工具与R语言之间进行比较研究,并以此探究R在实际审计工作开展的可行性。
二、R语言简介
R语言是S语言的一种实现。S语言同C语言一样,只是一个标准,而围绕它有很多实现。S语言的最初实现版是S-PLUS,但S-PLUS作为一款商业软件,价格十分昂贵,其受众面较窄。后新西兰奥克兰大学的Ross Ihaka与Robert Gentleman共同开发出S语言的另一种实现-R语言。R是一个免费开源、能够自由有效地用于统计计算和绘图的语言和环境,在UNIX、Windows以及Mac OS系统中均可以运行,它提供了广泛的统计分析和绘图技术,包括回归分析、时间序列、分类和聚类等建模方法。
R是一套完整的数据处理、计算和制图软件系统,拥有一套开源的数据分析解决方案,由一个庞大而活跃的全球性社区维护。与其说R是一种统计软件,还不如说R是一统计分析与计算的环境,因为R不仅提供若干统计程序,而且还可进行统计分析,只需使用者指定数据库和若干参数即可。R的思想是:它可以提供一些集成的统计工具,更重要的是,它还可以提供各种数学计算、统计计算的函数,从而令使用者能够灵活地进行数据分析,甚至创造出符合需要的新的统计计算方法。
三、R与当前审计方法比较分析
(一)利用Excel分析
Excel作为我们生活中常用的数据统计、分析工具,早在中学时期便为我们所接触、熟知,Excel能被审计人员广泛接受,一方面与其高被使用频率以及在使用者心中根深蒂固的地位相关,另一方面与其易操作的特点、能够满足大部分数据分析要求的功能密不可分。Excel在审计人员进行非大数据分析工作时,不失为首选工具,能够帮助审计人员高效快速地分析数据并以此发现审计线索,但日前,伴随着大数据时代的进入,数据量大且结构复杂,Excel可能并不能很好地协助进行审计工作,将其与R进行比较,可发现存在以下两方面的不同,同时,这也直接反映了R的优势。
1.Excel所能处理的数据数量受限。Excel满足于非大量数据分析要求,对于海量数据的处理、计算、统计等分析过程可能并不能应用自如。本部分仅针对该公立医院2015年的部分数据进行分析,尚可满足数据分析需求,在针对该公立医院多年的药品数据进行分析时,运算速度较慢,同时会出现软件闪退及程序停滞无法运转的情况,而现今已进入大数据时代,数据数量不断增加及其繁复程度不断提高,这必将为分析数据的工具提出更高要求。而R作为大数据统计软件,能够实现大量数据分析,同时,只要下载安装合适的程序包(关于R中的包将在本文第3部分详细介绍),便能读取包括Excel、SPSS、SAS、Stata等甚至从网页中抓取的数据,基本没有R不能读取的数据形式,完全满足国家审计人员实际大数据审计工作开展的需要。
2.Excel可视化功能有限。Excel中对分析结果进行图表展示的能力有限,以常规的折线图、柱状图、饼图等图形形式居多;此外,难以将大量分析结果在一张图形中进行展示,同时对于大量数据展现的观赏性不强,难以为审计人员分析决策提供帮助。而R是现今最受欢迎的数据分析和可视化平台之一,基于R语言可制作多种精美的图形,允许众多分析结果以代表各自的图形形态在一张图中进行展示,可方便审计人员对分析结果进行宏观观察、分析。
(二)通过SQL语句查询分析
SQL查询是SQL最常用的功能,被广泛应用于目前审计机关针对特定条件、事项进行的查询分析,通过编写简单的SQL查询语句来询问特定的问题,之后数据库通过执行这个查询便可提供回答这个问题的数据信息。SQL的易理解、易操作、易上手等特点成为目前国家审计机关人员重点培训的使用工具之一。但将应用SQL语句进行查询分析与基于R语言进行统计分析过程进行比较,R语言仍具备两点优势:
1.R语言分析数据的功能更为强大。众所周知,SQL语句作为结构化查询语言,在数据查询方面具备强大的功能,优势明显,但在数据挖掘层面,比如进行聚类、回归建模分析等应用时,SQL可能并不如R语言使用得心应手;同时,面对一些高级查询,可能需要通过编写连串的、大量的SQL语句,而R自带多种函数及功能强大的程序包,涵盖统计学、生物学、数学等多个领域,而R又作为免费开源软件,使用者还在不断创建新的包来更新丰富R的使用功能,通过简单的几步函数运行便可实现多种统计需求;除此之外,R语言是用来进行统计分析和绘图的一种语言,除了自身包括强大功能的函数及多种程序包能够满足审计人员进行多种统计分析的要求之外,还可以作为一种可视化语言,能够将分析结果以各种精美的图形展现以帮助分析决策。而进入大数据时代,软件的数据可视化能力至关重要。
2.R语言的应用范围更广。SQL侧重应用于数据库软件,能够方便使用者作相关查询分析,而R作为大数据统计工具,广泛应用于数据分析、数据挖掘等诸多方面,是目前最受欢迎的数据分析和可视化平台之一,其包含的众多具备不同功能的函数、程序包,可满足数据分析人员众多需求。
关键词:Excel;财务管理;应用
一、Excel概述
Excel是微软公司开发的办公软件Office的组件之一,是一种功能强大的电子表格软件。它拥有强大的计算、分析、传递和共享功能,可以将复杂的数据转化成可用的信息。
Excel处理数据的一般有以下几种方法:
1.利用工作表进行数据整理:Excel能通过表格的形式将数据记录并加以整理,使数据更加清晰直观,更易转换成有用的信息。对表格进行增删、排序、筛选等操作,能快速地帮助用户从海量的数据中搜索出需要的数据,减少干扰信息,提高工作效率。
2.利用函数进行计算分析:Excel给用户提供了大量的内置函数,基本能满足一般用户的需求,用户也可以根据需要自定义函数。函数实质是预定义的公式,不仅能简化计算过程,而且能提高数据处理的准确性。
3.利用图表进行决策分析:Excel提供了绘制图表的功能,把表、图、文三者相结合,直观形象地传达信息。Excel提供了多种图表类型,用户能够迅速创建满足各种需求的图表,进而分析决策。
4.利用多样的分析工具进行数据分析:Excel支持数学模型,具有数据分析和预测功能。Excel提供了多样的分析工具,包括模拟分析,规划分析,创建方案等,还有一些高级分析工具能帮助用户进行更深入的数据分析,帮助用户简化工作,优化决策。
二、Excel在财务管理中存在的必要性
随着世界经济的发展,整体的理财环境日益复杂,财务管理工作中应用了大量复杂的数学公式,传统的手工计算已经无法满足财务管理工作的需求。在这种情况下,各种财务软件应运而生,给财务人员带来许多便捷,但由于软件本身的局限性也给企业带了一定的烦恼,如通用性差、功能不全、成本昂贵等。相反,Excel却能克服这些弊端,从中脱颖而出,帮助财务人员更高效地开展工作。
Excel与其他财务软件的相比存在的优势:
1.功能灵活:财务软件能实现的功能都是开发人员预先设置好的,不能随意改动;Excel的使用更灵活方便,财务人员能自定义函数、调整表格格式、设置数字格式等。
2.流通性强:目前还没有一款财务软件能满足所有企业的需求;Excel不用考虑企业的规模及所在行业的特征,是应用最广泛的办公软件之一,适用于各个领域的企业。
3.适用对象广:财务软件只能适用于财务工作,不能用于其他层面的工作;Excel既可以用于财务管理工作,也可以用于非财务管理方面。
4.对接度高:财务软件各模块功能不匹配,也难以与其他软件对接;Excel能与大多数的数据库对接,可以导入多种来源的数据,各工作簿之间也可以进行数据操作。
5.可移植性高:财务软件对计算机系统、硬件和数据库有一定的要求,;Excel几乎能安装在任何一台计算机上。
6.成本低:财务软件购置成本高,后期维护和培训费贵;Excel取得成本低,使用方便,简单易学,大大降低了企业的成本压力。
由此可见,Excel在财务管理工作中的地位是其他软件无法取代的,应用于财务管理是十分有必要的。
三、Excel在财务管理中的应用案例
1.固定资产折旧函数的应用
案例1:某企业购置了一项价值为1000元的固定资产,使用年限为3年,净残值为100元。要求计算在直线折旧法、双倍余额递减法和年数总和法下各年的折旧额。
(1)直线折旧法:SLN函数的功能是返回固定资产的每期线性折旧费,语法为“=SLN(cost,salvage,life)”。每年计提的折旧费用为:SLN(1000,100,3)=300元。
(2)双倍余额递减法:DDB函数的功能是使用双倍余额递减法或其他指定方法,计算一项资产的给定期间内的折旧值,语法为“=DDB(cost,salvage,life,period,factor)”。第1年折旧费:DDB(1000,100,3,1,2)=666.67元;第2年折旧费:DDB(1000,100,3,2,2)=222.22元;第3年折旧费:DDB(1000,100,3,3,2)=11.11元。
(3)年底芎头ǎSYD函数的功能是返回某项资产按年限总和折旧法计算的某期折旧额,语法为“=SYD(cost,salvage,life,per)”。第1年折旧费:SYD(1000,100,3,1)=450元;第2年折旧费:SYD(1000,100,3,2)=300元;第3年折旧费:SYD(1000,100,3,3)=150元。
在上述案例中,利用Excel的内置函数就能快速高效地计算各年的折旧额。同样也可以利用其它财务函数来计算分析货币资金的时间价值、固定资产更新决策,证券投资等。
2.图表功能在财务管理中的应用
案例2:某公司生产一种零部件,已知产量与成本总额的关系,如图1所示。要求确定成本总额与产量之间的函数式。
分析:在本案例中,从图形直接反映出成本总额与产量之间是非线性关系。在这种情况下,要通过计算来确定成本总额与产量之间的关系,运算量庞大,过程繁琐。此时,可以利用Excel中图形功能来进一步确定它们之间的函数式。
在图形中选取成本总额数据系列,单击右键,执行【添加趋势线】命令,可以直接在图形上得到成本总额(y)与产量(x)的函数式:y=0.52x2+38.25x+150000。
3.数据分析工具在财务管理中的应用
案例3:在案例2中已知成本总额(y)与产量(x)的关系为y=0.52x2+38.25x+15000,假设产品单价为820元,要求确定最高利润及其对应的产量。
分析:通过公式可以确定利润(z)与产销(x)之间的函数式:z=820x-(0.52x2+38.25x+150000),若通过手工计算这个一元二次方程,过程较复杂,因此可以借助Excel数据分析中的规划求解工具来快速得出结论。
在此案例中,需要执行【数据】菜单下的【规划求解】命令,依次输入参数,如图2所示:设置目标为因变量(z);可变单元格为自变量(x);由于一元二次方程可能有一正一负两个解,需要再加上约束条件x>=0。点击【求解】,得出结论:当产量(x)为752件时,利润(z)达到了最大值14318.97元。
四、结束语
从上述的案例中我们可以看出,运用Excel的函数、图表分析、数据分析工具能帮助财务人员大大减少运算量,提高工作效率,提升信息处理的准确性和时效性,充分体现了Excel在财务管理工作中的地位。
Excel在企业财务管理中的应用还远远没开发完,财务管理工作者应该加强对Excel的认识和学习,来挖掘其更深的潜能,使复杂和枯燥的财务工作变得得心应手,进而提高财务管理水平,促进企业经济发展。
参考文献:
[1]韩良智.Excel在财务管理中的应用第三版[M].清华大学出版社,2015.
[2]陈筱青.Excel在财务管理工作中的应用[J].重庆三峡学院学报,2015.
[3]孙丽霞.Excel在财务管理中的应用[J].合作经济与科技,2015.
[关键词]专业硕士 数理统计 教学案例 EXCEL
[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2013)08-0053-02
一、专业硕士教育在我国研究生教育中的地位和作用
学术型硕士教育以培养教学和科研人才为主,而专业硕士学位教育与学术型研究生不同,是以职业需求为目标,以实际应用为导向,以综合素养和应用知识与能力的提高为核心。为尽快培养大批具有创新能力、创业能力和实践能力的高层次专门人才,我国自2009年起扩大了招收以应届本科毕业生为主的全日制硕士专业学位范围,并且在今后一个时期专业学位研究生教育将是国家大力扶持和积极引导的发展重点。
二、数理统计在专业硕士教育培养中的特点
数理统计作为高校研究生解决工程问题的一种计算工具,学会整理统计已成为工科学生必须具备的基本素质。数理统计学在数据挖掘、机器学习、经济管理、可靠性工程、人文社会、教育与心理学、人口学等若干领域中有着广泛应用。然而,传统的数理统计课程教学重在内容的介绍、理论的推导、定理的证明,使得学生对该课程产生枯燥、难学、无用的感觉,最后是厌学的状态。案例教学是一种理论联系实际、融知识传授、能力培养、素质教育于一体的教学方法。通过案例把学生引导到实际问题中,在分析与讨论的基础上,提出解决问题的途径和基本方法。案例教学能让学生产生解决实际问题的成就感,大大提高学生的学习兴趣,并让数学课变得好玩、好学、有用。
三、EXCEL在数理统计教学中的作用
由于当代社会正处于“信息爆炸”的时代,承载信息的数据动辄成千上万,因此,面对一个实际问题,即使有丰富的数理统计知识,如果没有计算能力,也无法进行统计分析。幸运的是,随着计算机技术的发展,大多数的统计计算都能通过统计分析软件加以完成。数理统计课程案例教学在教学形式上灵活多样,能充分利用统计软件、教学软件等多媒体教学工具,以增强学生的兴趣和爱好,提高学习积极性。
在现有的统计软件中,EXCEL软件被广大的统计工作者和非统计工作者使用,由于其具有的普遍性、操作方便、易学、易用的特点成为众多非统计专业学生进行统计分析的首选。[4,5]它提供了从函数、分析工具库、加载宏到数据透视表和数据透视图的多种数据分析方法。Excel为用户提供了一组数据分析工具,如方差分析、描述统计、直方图、回归、抽样、假设检验等,能较快完成表的制作、统计、分析以及数据的处理,具有较强的分析能力。在使用时只需为每一个分析工具提供必要的数据和参数,该工具便会使用相应的函数,计算并显示相应的结果。在设计数理统计学教学内容时,依据Excel的各种数据分析功能可方便地将相应的Excel软件具体操作步骤设计到各章节的教学内容中。
四、EXCEL在专业硕士数理统计课程案例教学中的应用
案例教学法主要采用对话式、讨论式和启发式的方法进行教学,是在教师指导下,组织案例,把学生引导到实际问题中去,进行学习、研究、通过分析、讨论找到解决问题的方法。案例是一个实际情况的描述,它一般要涉及一个决策问题。教学案例是适应教学目标的需要,围绕一个或几个问题,在对实际调查后所作的客观书面的描述,用以提高学生思考问题、分析问题和解决问题的能力。在教学中使用案例教学法来阐述基本概念、基本理论,讲解统计方法,将理论教学与实际案例结合起来,使课堂讲解生动,能激发学生的学习兴趣,提高教学效果。
在数理统计案例教学过程中,通过作图散点图对数据产生基本认识,使学生掌握对数据特征的初步判断,通过描述性统计分析让学生对数据进行基本的统计分析,通过回归分析实现预测和控制,是教师进行案例教学的几个关键知识点。下面我们以具体例子来演示在专业硕士数理统计课程案例教学中如何使用EXCEL。
某大型牙膏制造企业为了更好地拓展产品市场、有效地管理生产数量,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与广告投入之间的关系,从而预测出在不同广告费用下的销售量。为此,销售部门的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量和广告投入费用,数据如下表所示:
(一)用EXCEL作散点图
散点图的画法:将广告费用和销售量输入到OFFICE 2007版本的EXCEL数据框中,选中所有数据和数据名称,点击“插入-图表-散点图-仅带数据标记的散点图”,进行适当格式调整,即可生成散点图1:
(二)用EXCEL进行描述性统计分析
对EXCEL2007软件,通过加载宏,启用公式分析工具箱。在EXCEL2007中选中所有销售量数据,点击:“数据-数据分析-描述统计”,在描述统计框的输入区域确定分析数据的范围,选中“汇总统计”复选按钮,然后确定,即可得描述性统计数据分析结果,如:平均值:8.383,标准差:0.124,中位数:8.390,众数:8.750,标准差:0.681,方差:0.464等。
(三)用EXCEL进行回归分析
为了预测在不同广告投入下牙膏的销售量,可以对销售量进行回归分析。其中,选择广告投入为自变量,销售量为因变量。
在EXCEL中,将广告投入数据放入第一列,牙膏销售量放入第二列,点击“数据-数据分析-回归”,在“Y值输入区域”输入“$B$1:$B$30”,在“X值输入区域”输入“$A$1:$A$30”,选中“残差图”复选按钮,点“确定”进行回归分析,可得回归统计结果,回归模型的方差分析,回归系数的估计,残差图等。结果如图2所示:
五、结论
本文通过EXCEL软件在数理统计课程案例教学中的灵活应用,能够让教师形象、直观地向学生演示如何进行统计分析,把分析问题、建模和求解问题融为一体,使学生掌握对统计理论的学习,统计方法的应用,实现学以致用的目的。
[ 参 考 文 献 ]
[1] 教育部教研[2009]1号:关于做好全日制硕士专业学位研究生培养工作的若干意见[C].
[2] 张志红,潘紫微.产学研合作培养模式的探索[J].高等工程教育研究,2011,(4):132-136.
[3] 毕淑娟,张俊超.《概率论与数理统计》课程案例教学法探析[J].继续教育研究,2012,(2):154-156.
大部分学生已基本掌握Excel的操作,在复习课中难免会失去对所要学习的知识的新奇感和兴趣,也容易高估自己。因此,在这堂课中设计一个合理的任务是非常必要的。
本节课的任务设计旨在激发学生的学习热情,让学生在合作完成任务的过程中复习知识。
教学目标
知识与技能:复习巩固Excel基本操作,熟练使用该工具软件加工信息,提高数据分析能力。
过程与方法:通过招聘会前的热身运动和招聘会中各环节的实施来提高学生综合运用Excel软件的能力。
情感、态度与价值观:通过对作品的创意设计,增强审美观;通过小组合作,培养团队协作精神。
教学重难点
重点:进一步掌握Excel的基本操作技巧和数据分析能力。
难点:在解决实际问题的过程中选择和应用Excel操作方法。
教学设计思路
为了让学生有复习的内驱力,笔者在显性的任务中设计出隐形的教学目的,通过分组竞争、小组合作的“招聘会”形式组织课堂。具体环节如下:
创设情境(旨在引出任务)热身运动(旨在回顾知识)争分夺秒(旨在突破易错点)创意设计(旨在分析数据、美化表格)成果展示(旨在归纳知识点)活动感言(旨在反馈课堂效果,评价学生的知识掌握情况)。
如何能够在分组竞争、小组合作中有序地开展这场“招聘会”是这节课的关键。
教学过程
1. 创设情境,任务引出
(1)情境描述:校园Excel义工招聘会。
(2)招聘要求:招聘一个团队,有扎实的个人技能、审美观和团队协作意识。
师生互动,了解招聘需求。
设计意图:创设情境使学生自然产生需求,激发他们的角望和自我表现欲望。
2. 热身运动,知识回顾
教师出示任务:招聘会正式开始前,请学生们进入“准备室”文件夹进行热身练习,按下面要求补充完成“高中生在校消费情况调查表.xls”(下面简称消费表)并自动阅卷。
(1)把序号这一列的数据格式设置成为:001,002,003……
(2)在工作表sheet2中筛选出性别为“男”且每月消费总计高于500元的记录。
(3)在D23:F23区域中计算各消费点每人平均每月消费。
(4)用公式法(每月食堂消费/每月消费总计)计算食堂消费比例。
(5)以每月消费总计为主要关键字对表格进行降序排列。
(6)以A24:F24为数据区域,创建一个“各消费点平均每月消费比例”的图表。
要求:①选择你认为最合适的一种图表类型。②将图表放在工作表Sheet3中的B2:F10区域内。
学生操作。
设计意图:一周只有两节信息技术课,学生对知识点遗忘率高,一上课让学生练练手,起到很好的温习效果,为下个环节做好铺垫。
3.争分夺秒,易错点突破
招聘会正式开始,第一环节:“争分夺秒”。
将学生分为四人一组。
说明规则:本环节题型为纠错题,素材源于热身运动的“高中生在校消费情况调查表.xls”。在教师操作之后学生抢答。抢答正确则该小组得10分,不正确则得2分。本小组成员之间可以相互讨论。
展示题目,记录得分。
纠错题1:某生“对本表中以每月消费总计为主要关键字进行降序排列”时出现了排序警告,请分析原因,并演示正确操作。(该题考查排序时数据区域的选择。)
纠错题2:某生在“计算各消费点平均每人每月消费数额,并保留两位小数”操作后发现显示有误,请分析原因,演示正确操作。(该题主要考查单元格格式设置和学生的应变能力。)
纠错题3:在工作表sheet1中用公式法(每月食堂消费/每月消费总计)计算食堂消费比例。(教师故意运用相对地址输入公式,考查相对地址和绝对地址知识点。)
纠错题4:在本工作表中创建一个以E8:G8,E29:G29为数据区域的“各消费点平均每人每月消费”的图表。图表类型:饼图。图表标题:“各消费点平均每人每月消费表”。(说明:教师操作时故意选错数据区域和忘记设置图表标题,主要考查不相邻数据区域选择方法和图表修改方法。)
设计意图:(1)通过抢答形式进行易错题演示以便更好地调动学生积极性,提高所有学生的注意力。(2)以纠错的形式加深学生对易错点的印象,以达到突破易错点的目的。
4.创意设计,数据分析
招聘会第二环节:“我的创意我做主”。
教师用PPT展示任务一:请各小组分析消费表:总体消费水平偏高的学生主要把钱花在哪一个消费点(满分20分)。任务二:请充分发挥自己的想象力,结合任务一中数据分析的结果美化表格,并把最终作品存放到学校FTP中名为“创意作品”的共享文件夹内(满分20分)。
各小组推选一名操作手,其他学生一起出谋划策。
美化提示:可以根据本小组数据分析结果适当删除不需要的行和列;设置标题格式、表格内字体大小和颜色、表格列宽、行高、边框;可以通过设置不同的底纹颜色来显示不同学生的消费水平,是“红牌罚下”、“黄牌警告”,还是“正常范畴”。
设计意图:数据分析是一个难点,采用团队协作方式,希望能通过集体智慧迸发出灵感。由于每位学生的审美观不同,所以对美化图表这一块不提出具体要求。但从课堂上学生的反应来看,若什么要求都没有了,学生反而会觉得无从下手,于是我在这里增加了美化提示。
5.成果展示,归纳知识点
教师统计得分,为优胜团队颁发聘书。
优胜作品展示:教师和学生一起分析优胜作品中用到了哪些Excel操作,总结归纳Excel知识点。
6.招聘会感言,课堂效果反馈
请学生在任务单中发表对本次招聘会的感言并上交。
设计意图:设计招聘会的学生感言,反馈学生知识掌握的情况。
教学反思
本节课是笔者进行教学尝试后多次备课整合的结果。
起初,笔者在“争分夺秒”环节中设计了较多的Excel操作题,但只是个别抢答成功的学生上台演示,存在学生参与操作面不大的弊端,于是笔者尝试删除这个环节,用传统的全体学生练习来替代,但也发现虽然学生参与面大了,关注度却明显降低,同时很难让学生攻破易错点。于是,最终笔者在“争分夺秒”环节之前增加了“热身运动”,让全体学生参与完成基本的Excel操作,把“争分夺秒”环节改成纠错题类型的抢答环节,专攻易错点。
复习课本身就是查漏补缺的过程,只有清楚学生对知识掌握的程度才能更好地安排下一阶段的教学任务。于是,笔者在经过多次思考和尝试之后增加了“活动感言”这个环节,以完成对学生学习情况的反馈。
谈到谁是Qlik最大的竞争对手,主管东亚、南亚和北亚区业务的Qlik副总裁Terry Smagh的回答有些出人意料:“我们最大的竞争对手是Excel,此外还包括SAP、Oracle等传统可视化方案提供商。”Qlik之所以视Excel为最大威胁,一个重要原因是,目前Excel在全球拥有2.65亿用户。大多数用户还在用一些传统的甚至手工的方式对数据进行处理。这就是Qlik要努力改变的现状。
针对多种数据来源
Gartner的统计数据显示,传统的商业智能(BI)软件从采购到部署、上线,通常要两年时间,而这是一个现代化企业所无法忍受的。Qlik的产品从购买到部署完成通常只要5个月。“简单易用是Qlik产品的最大优势。无论是业务人员、IT人员、专业的数据分析人员,或者是数据科学家,在使用Qlik的产品时都可以轻松上手。而一些传统的数据处理工具,只有数据专家或懂代码的专业技术人才能使用。”Terry Smagh表示。
可视化分析主要应用于海量数据关联分析。由于涉及的信息比较分散,数据结构有可能不统一,而且通常以人工分析为主,再加上分析过程的非结构性和不确定性,所以普通的数据分析系统不易形成固定的分析流程或模式,很难将数据调入应用系统中进行分析挖掘。而功能强大的可视化数据分析平台,可以辅助人工操作,将数据进行关联分析,并做出完整的分析图表。图表中包含所有事件的相关信息,也能完整展示数据分析的过程和数据链走向。同时,这些分析图表也可通过另存为其他格式,供相关人员调阅。
大数据处理通常包括数据的采集、整理、存储、分析和挖掘、展示等多个环节。可视化是大数据分析的重要环节之一,因为它可能以更直观的图形、表格、地图等方式展现数据。
“可视化分析并不是简单地将单一来源的数据用非常漂亮的图表展现出来,而是对不同来源的数据,比如财务数据、销售数据、人力资源数据、商业分析数据等进行分析,形成企业自己的洞见,然后再通过直观、形象的方式把它呈现出来。这才是真正的可视化。”Terry Smagh告诉记者。
早在2009年,Qlik就已经进入中国市场,目前拥有大量客户,比如联想、苏泊尔等。“中国客户对可视化分析、云服务、数据可控等有很强烈的需求。现在对我们来说,最大的挑战在于时间紧迫。我们要以更快的速度、更全面的产品和服务满足中国不同行业客户快速增长的需求。”Terry Smagh表示。
用户要对大数据有正确的理解。大数据是用钱买不来的。一个企业如果想充分利用大数据,那么可以从一个细分的应用开始,逐渐扩展,慢慢了解和掌握数据的属性。这时,用户就需要一个平台化的工具。
可视化分析并不难
Qlik提供了一个统一的大数据可视化平台,在此之上提供四方面的服务,包括自助服务式的数据虚拟化、引导式的数据分析、汇报和告警、嵌入式的数据分析。从具体的Qlik产品体系来看,最基础的是Qlik Analytics Platform,它提供关联引擎、API、工具箱等;在Qlik Analytics Platform平台之上,Qlik提供多样化的产品和功能,主要包括Qlik Sense、QlikView、Qlik Cloud和QlikView NPrinting等,对数据进行访问、管控、分析,并提供相关的增值服务。
Qlik崇尚一个简单的理念:用户如果能更多地进行业务分析,就能从数据中获得更多的价值。商业智能、大数据分析可以充分利用企业中所有人的智慧,实现业务系统的最优化,并挖掘出更多的数据价值。为此,Qlik提供了多样化的、快捷的工具,帮助企业中的每个人以自助服务的方式完成数据可视化分析,从而降低大数据分析的门槛。
在近日举行的媒体见面会上,Qlik的技术人员现场为记者演示了其可视化分析产品的应用。Qlik的技术人员将某一数据来源的数据以鼠标拖拽的方式拉入到Qlik Sense中,就可以轻松建立图表,并可对具体的数据进行查询。这些数据和图表还可在具有权限的人员中分享。
无论数据来自哪里,Excel或数据仓库;无论数据的类型如何,是结构化数据或非结构化数据,Qlik的产品都可以处理并进行数据关联,还可以通过API与第三方平台进行连接。举例来说,香港一家知名的甜品店在当地有80家分店,它想通过大数据分析了解在某个特定时间段产品的销售情况。这家甜品店就采用了Qlik的工具,对天气数据等进行分析,然后据此调整产品的生产,在促进销售的同时降低供应链的成本。“在这个案例中,我们就通过API接口将第三方数据平台上的非结构化数据整合到Qlik的可视化分析平台上,满足了客户的需求。”Terry Smagh补充说。
许多厂商可以提供可视化工具,但是它们的重点基本放在如何让用户更容易地使用这些工具,而没有注意如何在后台实现管理和控制。Terry Smagh表示,除了方便用户进行可视化分析以外,Qlik还能提供协作、数据管控等方面的功能。
Qlik的软件销售模式非常独特,个人用户可以免费下载Qlik的可化分析产品,其功能不会因为产品是免费的而被削减。企业中5个以内的用户,也可以免费使用Qlik cloud,将可视化分析工作放到云中完成。如果企业将Qlik的产品用于商业化目的,那么Qlik将视使用的规模进行收费。
现在入云并不晚
今年6月,Qlik在收购DataMarket之后了一系列Qlik Cloud产品,主要包括Qlik DataMarket、Qlik Sense Cloud、Qlik Sense Charts等。这被认为是Qlik正式进军云计算的开始。Qlik现在才进入云计算领域是不是有些晚?
Terry Smagh表示,现在正是数据企业进入云计算市场的最佳时机。云计算的概念于2000年左右出现,那时整个业界还没有为云的落地做好准备。最近几年,云计算市场的快速发展带动了数据量的增加,而数据增长带来的数据访问、存储和管理方面的挑战是企业难以应对的。云是传统IT基础设施的自然延伸,它降低了IT基础架构的成本,提高了系统扩展的灵活性。借助云基础架构,人们可以更好地访问、存储、管理和分析数据。“在云平台上,我们要做的工作是保证数据访问和使用的安全,提高数据管理的效率。云对于大数据来说是一个辅的工具。”
在网上审计中,基础性中间表的作用不言而喻,在实际工作中,它也是广大审计人员用得最多的,审计人员在基础性中间表的基础上按各自需求建立分析性中间表,进行审计核实。
在审计项目中,审计人员通常需要结合被审计单位的经济业务类别来创建审计中间表,并且需要准确地表达出所代表的经济业务类别的信息,因此审计中间表体现了很强的业务特征,其设计和区分的标准就是经济业务类别。在建立审计中间表前,应首先确定被审计单位的各种业务类别,并根据每一业务类别,从基础数据中选择出与该业务类别相关的数据表。
通过掌握被审计单位提供的数据字典,了解基础数据中各表中存储数据的内容、各字段的含义以及各表之间的关联关系,然后从与某业务类别相关的基础数据表中选择反映该业务类别主要信息的字段,组织这些字段,设计出所属该业务类别的主表;根据主表中各字段的内容,如果某一字段所包含的内容需要有一些附加信息对其加以说明,则从与该业务类别相关的基础数据表中选择反映这些附加信息的字段,组织这些字段,设计出所属该业务类别的附表,对主表加以补充说明;根据该业务类别的主表和附表中各字段的内容,如果某一字段所包含的内容是代码,则根据代码的含义及其层次结构,设计出代码表。此外,在基础数据当中可能一些表和某项具体业务的联系不是十分紧密,通常筛选有关字段,设计出补充表。应注意的是,设计审计中间表的结构时,一定要经过审计组的充分讨论,特别是要听取一些业务精通、审计经验丰富的审计人员的建议,并对结果进行书面记录,使建立的审计中间表能够充分体现业务特征、体现审计目标,并且方便审计人员使用。
根据设计的审计中间表的结构,以及通过被审计单位提供的数据字典,了解建立审计中间表所需的基础数据表之间的关系,然后通过编写SQL语句将所需要的基础数据表进行关联、选取所需字段并设置有关筛选条件,生成符合审计需要的审计中间表。审计人员编写的SQL语言主要通过使用SELECT语句,通过选取字段、联接有关基础数据表,并利用INTO子句保存查询结果,最终生成审计中间表。另外,由于在建立审计中间表的过程中,可能因为操作失误,将应选择的字段而没有被选择,或者将应去除的字段而没有被去除;还有可能因联接、筛选条件或有关逻辑表达式设置的不正确,造成审计中间表的结果偏差。为避免上述情况或其它原因造成审计中间表的结果不正确,需对结果进行验证。
我们认为,计算机人员和业务人员共同配合,发挥计算机人员操作熟练、业务人员明白钩稽关系的特长,结合会计报表数据、财务数据凭证库、财务数据余额库等,生成高质量的基础中间表。
二、审前调查做好数据分析报告
数据分析报告,指记录审计组分析被审计单位电子数据过程和结果的文书。数据分析报告的撰写是审计工作的一部分,数据分析大量使用复算、分析性复合等审计方法;数据分析和数据分析报告的撰写过程也是一个审计项目组织和管理的过程,贯穿整个审计过程。在计算机审计的今天,能否利用好被审计单位的电子数据进行分析,撰写出高质量的数据分析报告,是关系审计工作质量和成果的重要因素。
(一)撰写数据分析报告前的准备工作
数据分析报告的系统分析和类别分析一般应在审前调查阶段完成。审计人员通过数据分析来把握被审计单位的总体情况,从而把握和锁定需重点审计的内容和范围。在进行数据分析之前,必须做好充分的准备工作:
第一,整理好规范的审计中间表。
审计中间表是面向审计分析的数据存储模式,它是将转换、清理、验证后的源数据按照提高审计分析效率、实现审计目的的要求进一步选择、整合而形成的数据集合。审计中间表是数据分析的基础。在系统分析和类别分析过程中需要的审计中间表主要包括:
1、按被审计单位的会计报表数据整理而成的会计报表中间表;
2、按被审计单位财务数据整理而成的凭证中间表;
3、按被审计单位财务数据整理而成的余额中间表;
4、按被审计单位财务数据整理而成的明细科目中间表;
5、按被审计单位业务数据整理而成的与被审计单位收入或成本的主要项目相关联的业务中间表;
6、利用其他与被审计单位有关的数据整理而成的审计中间表。
第二,数据分析报告的分配与审计分工紧密结合。
网上审计中数据分析以及数据分析报告的撰写过程也是审计项目组织和管理的过程,因此数据分析工作的分配应紧密地与审计分工相结合。系统分析主要是基于会计报表层次的分析,一般由审计项目主审完成,便于主审系统、完整地了解被审计单位,把握全局;类别分析主要是基于业务类别或者会计科目层次的分析,一般按照审前调查分工(或者审计分工),将类别分析分解,与审前调查(或者审计)任务一并分配给每一位审计人员,使计算机审计中的数据分析和审计实施紧密结合,避免脱节现象,更好的发挥数据分析的作用。
第三,准备好分析工具。
工欲善其事,必先利其器。要想做好数据分析,写出高质量的数据分析报告,功能强大的分析工具必不可少。现在审计过程中使用的最多的分析工具主要有:EXCEL、SQL Server分析服务器或其他审计软件等。
1、SQL Server分析服务器
随着被审计单位信息化程度越来越高,ERP在被审计单位广泛采用,因此被审计单位财务和业务电子数据将存储于大型数据库中,数据量极其庞大。在计算机审计环境下,审计人员所取得的主要审计资料就是被审计单位的电子数据,因此强大的数据库工具SQL Server分析服务器成了审计人员实施计算机审计的有力工具。
2、EXCEL电子表格
在进行系统分析时,一般以被审计单位会计报表为分析对象,大部分会计报表软件均可以将报表转换成EXCEL电子表格,因此EXCEL这种为审计人员所熟悉的、操作灵活的工具在系统分析中广泛采用。
3、其他审计软件
(二)系统分析的对象、方法和内容
系统分析主要用于把握总体,一般应由审计项目主审完成,这样便于主审把握被审计单位财务状况、经营成果和现金流量等方面的总体情况,为审计和审计调点的确定以及审计分工提供依据。
系统分析的对象主要是被审计单位的会计报表。
系统分析的方法主要有:结构分析、趋势分析和指标分析等。
结构分析主要是通过计算各个组成部分占总体的比重来揭示总体的结构关系和各个构成项目的相对重要程度,从而确定重点构成项目,提示进一步分析的方向;趋势分析法是指将被审计单位若干期相关数据进行比较和分析,从中找出规律或发现异常变动的方法;而指标分析则是通过各项指标的计算,全面系统的了解被审计单位的财务状况、经营成果和现金流量等。
系统分析的内容主要有:被审计单位的资产结构分析、资产趋势分析、负债结构分析、负债趋势分析、所有者权益结构分析、所有者权益趋势分析、企业盈利能力指标分析、企业偿债能力指标分析、企业流动性指标分析等。
(三)类别分析的对象、方法和内容
类别分析主要用于锁定重点,应按照审计分工,将类别分析分配给每一位审计人员,使数据分析与审计实施紧密结合。
类别分析的对象主要是根据被审计单位的凭证中间表和余额中间表建立起来的多维数据集以及主要业务系统数据。
类别分析的主要方法有:结构分析、趋势分析、配比分析等。
配比分析是指审计人员将相互关联的会计科目或事项的相应数据放在一起进行趋势分析,从中找出趋势不一致的情况。
类别分析的主要内容有:系统分析结果中需重点关注的部分;主要会计科目的结构分析和趋势分析,会计科目的选取因具体单位的不同而不同,一般应选取在资产、负债或所有者权益中所占比重较大的科目,或者根据审计经验判断容易出现问题的科目(往来科目、长短期投资等);相关联科目的配比分析,例如将长短期借款与财务费用、固定资产与累计折旧、配比分析;业务数据与财务相关数据的配比分析等。