公务员期刊网 精选范文 统计学的标准差范文

统计学的标准差精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的统计学的标准差主题范文,仅供参考,欢迎阅读并收藏。

统计学的标准差

第1篇:统计学的标准差范文

选股不如选时,可见股市中买入股票时间的重要性。要选择买入股票的时间就必须准确的把握股票运行的趋势,尤其是中长期趋势。虽然目前常采用一些股票技术分析方法对股票的趋势进行预测,但是这些方法也常被庄家采用,通过人为的做市成为迷惑投资者的工具,从而导致有些技术分析方法的效果往往适得其反。因此,寻找一些新的分析方法往往会取得较好的效果。文章在高中数学知识的基础上引入加权标准差方法,通过对权值的修正达到预测股市趋势的目的。

股市技术分析方法概述

股市的分析通常包括基本面分析和技术分析方法。股市基本面分析是从国家的政策和公司的发展等角度对股市运行的趋势进行预测。投资者通过深入分析这些基本面信息能有效的把握股市的长期趋势并选择相应的股票买入和卖出。股市技术分析则是以股票价格作为主要研究对象,以预测股价波动趋势为主要目的,通过数学中的统计学理论计算和分析相应的股市评测指标并通过这些指标及其相应的图表对股市及其单个的股票价格趋势进行预测的方法。投资者通过对股市进行深入的技术分析能较有效的确定股市的趋势以及买入和卖出股票的时间。股市技术分析的重点是分析股票的价格、成交量、时间以及股票价格波动的幅度。 股市技术分析中最经典的方法是道氏理论、江恩理论和波浪理论。

道氏理论最初由美国人查尔斯・道提出,通过实践的检验它成为预测市场趋势的晴雨表,同时成为股市技术分析方法的开创者。道氏理论是一种技术理论,它是根据价格模式的研究,推测未来价格行为的一种方法。道氏理论认为股票会随市场的趋势同向变化以反映市场趋势和状况。股票的变化表现为三种趋势:主要趋势、中期趋势及短期趋势[1]。由于其对股市运用趋势良好的把握,因此,今天道氏理论仍然运用在股市分析中。道氏理论由于认为对数据的统计与前期数据存在较大的偏差才能对趋势的变化进行确定,因而其预测的结果存在滞后性。

江恩理论最初由投资大师威廉・江恩提出,它通过对数学、几何学、宗教、天文学的综合运用,建立起独特分析方法和测市理论并结合其在股票和期货市场上的骄人成绩和宝贵经验总结而来。江恩理论主要包括江恩时间法则,江恩价格法则和江恩线等。江恩理论认为股票、期货市场里也存在着宇宙中的自然规则,市场的价格运行趋势不是杂乱的,而是可通过数学方法预测的。它的实质就是在看似无序的市场中建立严格的交易秩序,并以此来发现何时价格会发生回调和将回调到什么价位[2]。

美国证券分析家拉尔夫・.纳尔逊・.艾略特通过对股市指标描述的技术图形的分析发现股市存在13种形态和波浪,并认为其在股市上会重复出现,以此为依据通过技术图形中波浪数量和结构的研究实现对股市运行趋势的预测。他认为股市运行的过程呈现一种周期性的变化,每一周期包含5个上升浪和3个下跌浪。艾略特波浪理论认为股市运行的周期有长短之分,长的达到上百年,短的仅仅以小时计,同时其将股市运行的周期按时间长短分为九大类,九大类结构中不论周期的长短每一周期均由8个波浪构成。

目前的股市技术分析方法被大多数投资者采用,成为买入和卖出股票的重要参考依据。但一旦大多数投资者都采用这些相同的方法时,结果往往适得其反。并且机构投资者往往通过这些技术分析方法逆向操作,迷惑和欺骗投资者。因此,如果避开这些传统的方法分析股市的趋势效果往往更好。

标准差

标准差是整个测量数据标准值与其平均数离差平方的算术平均数的平方根。它反映的是测量的数据中偏离平均值的个体多少的离散程度。标准差越大说明数据偏离平均值越多。标准差越大也可以认为数据越不稳定。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接均值。

基于标准差的股市趋势分析

标准差表示的是数据集中的个体偏离标准差的多少,标准差越大说明偏离平均值的数据越多。当股市发生趋势性变化时,将有越来越多的指标所代表的数据偏离原来数据集合的平均值,因此,采用标准差能对股市趋势进行预测。在采用标准差预测股市趋势前有两个问题要解决。首先,股市每一天的指标数据对预测股市的贡献是不一样的,越是近期的指标数据越能代表当时股市的趋势。其次,指标数据尤其是股票的价格包括每天的最高价,最低价,开盘价和收盘价庄家是可以操纵的,如果直接拿来分析结果往往会存在较大的误差。与股价相比成交量往往更接近真实的情况,因此要结合成交量来分析股价。第一个问题可以对指标数据施以权重来解决,根据指标数据不同的时间给予不同的权重,越是近期的数据权重越大,从而能对趋势的预测有指引作用。股市中的各种价格常常带有欺骗性,因此可以把成交量作为权重计算一个带有权重的价格,为更加真实的反映实际情况,每天成交量的计算时间不可太长,如可取10分钟,15分钟,30分钟等。

采用标准差的股市趋势分析方法具体步骤如下:

(1)设10分钟内的某股票成交的最高价为 ,成交的最低价为 ,则认为这10分钟内股票的价格为 。

设这1 0分钟内的该股票成交量 为,则这10分钟内该股票的价格为

(2)设该股票全天成交量为M,以10分钟为一个时间段全天的交易分为p个时间段,该股票全天的价格为 ,则

(3)对N天的股票价格进行分析,设每天股票价格的权重为 ,越是近期的价格权重的值越大,N天的股票平均价格为μ,则该股票的标准差为σ

(4)对股市中股票的标准差进行分析,确定标准差σ的阈值,当标准差σ超过阈值时可确定股票的趋势正发生变化。

实验分析

为确定本方法的有效性,本文采用了深万科股票作为研究对象,时间区间为2015年11月至2016年8月,下图1为深万科的股价走势,图2为万科股票日标准差。

从图2看出当股价日标准差数值发生突变时对应的股价这时刚好发生趋势性改变,两者的变化是同步的,没有滞后效应,因此,采用标准差的方法预测股价的走势具有可行性。

第2篇:统计学的标准差范文

【关键词】统计学原理;应用

一、《统计学原理》简介

《统计学原理》是一门集搜集、整理和分析统计数据于一身的方法论科学,它主要用来研究数据的内在数量的规律性。进行统计分析的基础是获得统计的数据,而数据的收集与分析之间有一个必不可少的环节就是对统计数据的整理,统计学的核心内容就是统计数据的分析。

《统计学原理》的基础是统计学科在各个领域中的普遍应用,它的出发点是要解决实际的问题,统计方法论的实际效用是它的侧重点,把定量分析与定性分析有机的结合起来。它把理论和实践相联系,这样对学生在实际工作中的实际操作能力有促进作用。

《统计学原理》主要包括:统计学的研究对象和方法、统计学的基本范畴、统计调查的意义、统计调查的方法、统计整理的内容、统计分组、统计分布、统计表、总量指标、相对指标、变异指标、综合指标的应用、样本和总体、抽样估计的方法、假设检验方法、相关图表和相关系数、回归分析、综合指数和平均指数、指数数列等等。

二、《统计学原理》与计算机科学相结合的必然趋势

在科技高速发展的现今社会,信息化是主要的趋势,自然而然信息化的需求也就越来越突出,对于人们来说,通常都要对大量的数据进行收集,并且还要对所收集的数据进行仔细的分析,分析过后还要对一些有价值的数据进行提取,提取过后再做出正确的决策。《统计学原理》就是一门对怎样合理的进行数据收集、整理以及分析并进行研究的学科,在人们制定一些决策时,都要把它作为主要的依据。那么,对于现代统计方法来说,它和现代信息处理技术是分不开的,随着计算机运行能力的不断提高,对于大规模统计调查的数据的处理来说,就会显得更加的精确以及方便快捷。所以,《统计学原理》越来越不可能脱离计算机技术,当然,计算机技术的应用的深入,也同样不能离开《统计学原理》的发展以及完善。对计算机技术进行充分利用,并通过计算机软件将统计方法中比较复杂的计算构成进行简便化,统计输出的结果就一目了然了,这样,统计方法的普及就会显得非常容易了。所以,在对这门学科进行学习时,不但要把统计方法学好,还要会对商品化统计软件进行充分的利用,对计算机信息系统开发的一些基本思想以及计算机基本程序的设计要进行掌握,除此之外,还要学会通过编程来把具体单位的统计模型进行实现,从而把统计决策支持系统建立起来。

总的来说,把《统计学原理》和计算机以及信息相结合起来这是一个时展的产物,是一个必然的趋势。只有正确的把《统计学原理》与计算机有机结合起来,才能使统计摆脱传统的复杂计算,从而变得越来越简便,越来越科学化。

三、《统计学原理》在教学过程中的应用--以相关系数的计算为例

(一)利用基本公式计算相关系数促进理解推导过程

对于相关系数的基本公式来说,就是要把方差标准化消除具体单位,从而转化为统一量纲的相对数,这样,对不同单位的资料进行对比就方便了许多。在利用基本公式计算相关系数时,需要对两个变量的标准分进行计算,手工计算繁琐费事,在excel中可以轻松实现。

那么,在Excel中能够实现数据标准化的就是STANDARDIZE函数,它是返回平均值是mean,标准差是standard-dev的分布的正态化数值,计算标准分是以平均数和标准差为基础的。对于STANDARDIZE函数来说,它需要对平均数和标准差进行输入,可以利用AVERAGE函数来对平均数进行求解,求标准差是用STDEVP来实现的。下面以某省近几年的城镇居民家庭可支配收入和消费性支出为例,来对操作过程进行演示。在Excel表格中点B10单元格,输入AVERAGE(B3:B9),这样就求出了可支配收入的平均数为9966。点B11,输入STDEVP(B3:B9),这样就求出了标准差为2404。选择与原始数据同样数目的单元格(D3:D9),用STANDARDIZE函数,根据具体要求对参数进行输入,x输入(B3:B9),mean参数就是要求输入平均数,直接点击B10引用即可,standar_dev参数是要求输入标准差,则点击B11进行引用。按F2进行数组操作,然后按shift+ctrl+enter,就对可支配收入进行了标准化,数据显示在(D3:D9)。对消费性支出做同样的操作,在(E3:E9)输出标准化数据。对两个变量进行标准化后,需要计算两个变量标准分的乘积。选择F3单元格,输入“=D3*E3”,点击回车键就得到了第一个乘积,然后下拉单元格并进行复制,就在(F3:F9)得到了所有的乘积。最后对这些乘积的平均数进行计算,选择F10,利用AVERAGE函数求出平均数为0.999615,这个就是遵循基本公式,按照步骤求出的积差相关系数r。

按照上面的这些步骤对相关系数进行求解后,为保险起见,最好利用excel中的其他方法再次计算相关系数,是各种方法进行相互的验证,这样也方便对各种计算公式的推导过程进行理解。可以直接在工具菜单下的数据分析功能中选择相关系数项进行计算,这种方法也就是大多数统计实验课程采用的方法。excel中的correl函数是直接利用计算相关系数,而与correl函数不同的是,pearson函数直接用简捷公式求相关系数。这三种计算方法与上面利用基本公式的计算出的结果是相同的。

在利用实际数据计算相关系数之前,要先让学生对经济学中消费和收入的相关理论进行回顾;计算后再加以总结,宏观经济学认为消费支出与可支配收入存在函数关系,上面的计算的相关系数近似等于1,这就说明了两者存在线形相关的密切程度是十分大的,也就是对这一理论的成立进行了证明。这一步骤有助于引导学生利用统计学验证经济理论,也对统计学的实用性进行了充分的证明。

(二)验证回归直线斜率与相关系数的关系促进理解几何意义

对可支配收入和消费性支出两个变量的原始数据进行标准化,这样就得到两组消除了量纲的数据,那么根据这两组数据来画出最优拟合直线,那么,表示相关系数的就是直线的斜率,这也就是相关系数的几何意义。回归直线可以按照最小二乘法,通过原始数据来得出,直线斜率b就表示了消费性支出随支配性支出的变化程度。相关系数r作为标准化数据的斜率,只要乘以一个数字就可以还原为原始数据的斜率b。我们同样可以用excel函数SLOPE来对两个斜率进行求解,然后加以验证。对于上面的计算,我们还可以继续,就是点击G3,输入函数SLOPE(E3:E9,D3:D9),得到标准化数据的斜率0.999615,这得到的就是相关系数。点击G4,输入函数SLOPE(C3:C9,B3:B9),得到原始数据的斜率0.617952,此斜率表示可支配性收入每增加一元则消费性支出就增加0.62元。在G5输入“=C11/B11”,得到的数值0.61819。可以在G7单元格输入“=G3*G5”验证b和r之间的推算关系是成立的。

四、结语

总之,学习《统计学原理》不单单能使人们的思维方式从主观向客观进行改变,而且对于提高人的综合分析能力也有十分重要的帮助,并且具体行为也能变得客观正确。所以,对于人们来说,学好这门课程是十分重要的,只有学好了这门课程,才能在众多领域进行更好更正确的应用。

参考文献

[1]高敏雪.经济社会统计[J].中国人民大学出版社,2005

第3篇:统计学的标准差范文

关键词:替米沙坦 高血压 变异性 氢氯噻嗪

中图分类号:R544.1 文献标识码:A 文章编号:1672-3791(2015)03(b)-0232-01

高血压属于很多心脑血管疾病的一个重要原因以及一个非常重要的危险因素,在高血压患者血压升高的过程中,也升高了有关方面的血压变异性特点,而变异发生的程度和心脑血管疾病发生的概率有着一定的相关联系。所以说对于高血压患者进行血压降低的时候,也应当注重进行血压变异性的降低。替米沙坦氢氯噻嗪胶囊可以说是一种复方制剂,也是一种对于高血压来说非常有效的药物,其联合用药的过程中能够产生与剂量有着明显关系的作用,而且没有比较大的不良反应。在2012年6月~2013年6月之间,该研究者通过有关资料观察了替米沙坦氢氯噻嗪对于血压变异性所产生的一系列的影响,现报道如下。

1 资料与方法

1.1 临床资料

对于门诊原发性的高血压患者资料进行收集,都符合有关防治指南之中的收缩压标准以及舒张压标准。在排除继发性高血压、严重心脑血管病、甲状腺功能亢进以及恶性肿瘤等疾病之后。一切患者都停止服用药物,并在接受洗脱之后进入到试验当中。实验有着相应的入选标准。

其中有158位病人纳入到了研究的过程中,包括93位男性,65位女性,年龄在42~70岁之间,这些人都经过了相应的安慰药治疗,也就是洗脱的过程,在之前通过血压监测仪对于其血压进行检测,并依照夜间收缩率的下降进行分配。

1.2 治疗方法

所有患者都进行ABPM治疗,在进行洗脱阶段之后,清晨空腹进行替米沙坦氢氯噻嗪胶囊的服用,如果说DBP的含量小于某种标准的话,则维持原剂量,不然的话则增加一倍剂量,服药时间一共有8周左右。

1.3 观察指标

对于全部患者的性别、年龄以及吸烟、冠心病、糖尿病等病史进行一定的了解,并对一切患者进行生物化学常规检查,对于空腹血糖以及肾功能和肝功能等方面进行一系列的检查,并对于数据进行记录。

在治疗前后进行ABPM的检测:患者全部不准喝酒,每天吸烟的数量控制在5支以内,每天服用的食盐少于6g,对于脂肪摄入进行控制。在治疗之前以及之后8周的时间之中进行ABPM的检测,并采用美国的进口血压监测仪进行动态的监测。监测方法为,在患者左上臂处绑上袖带,以24小时为周期进行检测,白天每半小时进行一次测量,有效检测次数应当占据测试次数的80%以上,如果说指标超越某个值的话,也就判定为无效数据,需要重新进行测量,统计项目是:第一,在24小时之内的平均舒张压以及收缩压;第二,在白天平均的收缩压和舒张压;第三,在夜间平均的收缩压以及舒张压;第四,在24小时内收缩压以及舒张压的标准差;第五,在白天收缩压以及舒张压的标准差;第六,在夜晚收缩压以及舒张压的标准差。依照上述时段的参数能够得到很多重要的信息内容。

1.4 统计方法

利用正规的统计软件展开相应的数据分析,所有的数据表示方法都是比较规范的,在组间进行的比较都采用t进行检验,两组治疗前后利用配对t展开相应的检验,其数据有着相应的统计学意义。

2 结果

2.1 比较两组患者全身因素

相对于勺形高血压组来说,另一组的患者有着较高的缺血性脑血管病以及冠心病的历史,但是高血压的疾病历程相对来说比较长,不过在吸烟以及糖尿病史等方面来说,两组之间的差异并不具有统计学方面的意义,对于一些数据分析来看,两组之间的血脂以及血糖水平也没有相应的统计学意义。

2.2 比较两组患者血压变异性

相对于非勺形高血压组来说,另一组在治疗前24小时,白天以及夜间DBP以及SBP的标准差都出现了降低的情况。相对于治疗之前来说,两组治疗之后24小时,白天以及夜间的DBP以及SBP标准差出现降低,不过两组之间的差异并不具有统计学方面的意义。

3 讨论

在这些年来,国内外对于流行病学的研究以及讨论结果表示,高血压患者之中,心脑血管疾病发展以及发生的一项非常重要的因素就是血压的变异性,其所具有的预测作用比平均血压要大得多。血压变异性指的就是在某个时间段之内,血压展开波动的范围,反映了血压跟随血管的节律以及反应性展开的变化,通常有一定的表示方法,也是在均值之外一个独立的指标。所以说,治疗高血压,并不需要将24小时之内的血压值降低,还应当在这段时间之中,平稳持久的进行降低,这样一来才可以更好地防止高血压伤害心脏和大脑等器官,并且能够进一步减少心脑血管事件的出现,避免给人体造成各种各样的危害或者说其他方面的危险情况。

参考文献

第4篇:统计学的标准差范文

一、平均分数体现整体水平

1、某班某学科的平均分数

x1=

2、求N个班某学科的平均分数应“加权”

x=

其中x表示加权平均数,ki表示第i班总人数,xi表第i班平均分数。

二、标准差反映平衡程度

除了解体现整体水平的平均分数外,还应了解每个人的分数离班平均分数的偏差大小。因此可以利用数理统计中的标准差计算公式

δ=

(其中x为卷面分数,x为平均分数,N为全班总人数)。例如,甲乙两班同一科的平均分数都是81.5分,标准差依次为9.2和10.3,从而知甲班比乙班要稳定些,发展平衡些。

三、“标准分”取代卷面分来评估每个学生学习成绩的总体水平

在评先、评优和奖学金中,常要比较学生成绩的优劣。例如:某班数学卷面平均分数为:x1=69.4,标准差为δ1=8.5。语文卷面平均分数为:x2=87.6,标准差为δ2=10.5。学生张某数学60分,语文94分。王某数学83分,语文68分,按传统的方法认为:张总分154比王151分多,因此张优先于王。这种评估是不合理的,原因是各科之间的卷面分数的参照点(零点)与单位都不同,不能相加求和来互相比较。

在现代的体育统计和有关统计文献中,都采用“标准分”(符号意义同上),即学生的成绩与班平均分之差比标准差。这样能统一尺度,具有合理的可比性。如张和王的成绩可以合理的评估如下(表1):

表1

(注:习惯用正分,故一般取T=10Z+50,T分大约在20至80之间。它是把Z分扩大10倍,又往后平移50,消除了负数。)结果张两科总标准分95次于王97.3,与卷面分数结论相反,标准分反映学生在全体考分中的相对位置,故又称相对分。至于不同班级、不同学科的总分,由于试卷有难易之分等因素,更应采用标准分。

四、考试分数合理分布的评估依据

怎样评价一班的考试分数的分布是否合理,依据是什么?以前有关文献都认为:卷面分X是正态随机变量X~N(x,δ2),标准分Z服从标准正态分布Z~N(0,1)。但都没有加以论证或进行实际的统计分析。因此有些提法不尽妥当:因为样本平均分数x与样本标准差δ均为统计量,是随机变量,而正态分布的两个参数都是常数;如果X是随机变量,X~N(μ,δ12),X1,X2,∧XN是来自总体X的样本,则x是μ的无偏估计。δ是δ1的极大似然估计,一般地其观察值x≠μ,δ≠δ1,所以X~N(x,δ2)的提法不妥。而且也推不出Z~N(0,1)(证略)。

但是,通过多年来对我校各个教学环节情况比较正常的教学班的考试分数的统计分析发现标准分Z是近似服从标准正态分布的(有文献曾认为或假设Z近似地服从标准正态分布的说法)。由数理统计学可知:随机过程可以用族中的典型样本函数来表征。因此我们可以把Z近似地看作服从标准正态分布的随机变量,从而以标准正态分布作为评估学生考试分数合理分布的依据,根据“3δ”原则换算出标准分的合理分布评估依据:分段比例和累计比例。

(1)分段比例:

T≤20的比例为0.0013

40<T≤60的比例为0.6826

30<T≤70的比例为0.9544

20<T≤80的比例为0.9974

T>80的比例为0.0013

(2)累计比例:

T≤30的比例为0.0228

T≤40的比例为0.1587

T≤50的比例为0.5000

T≤60的比例为0.8413

T≤70的比例为0.9772

T≤80的比例为0.9987

记:│(取T≤20的人数/总人数)-0.0013│=A1

│(取T>80的人数/总人数)-0.0013│=A2

│(取40<T≤80的人数/总人数)-0.6826│=A3

│(取30<T≤70的人数/总人数)-0.9544│=A4

│(取20<T≤80的人数/总人数)-0.9774│=A5

则ΣAi=A1+A2+A3+A4+A5的值越小说明说明分布越合理。并在记分册中增加“平均分”,“标准差”,“标准分T”三栏,以方便教学管理部门进行评估。

五、统计分析实例

以我校2005级会计一班数学成绩为例见表得知(见表2,表3),是基本符合标准正态分布的。同时发现,越是成绩好的学生,各科卷面总分和标准总分排名基本相同,且各科成绩越平衡;越是各科成绩不平衡的,卷面总分与标准总分排名就相差较大(如第3,24,26学号),由此说明由标准分来评估学生学习成绩的总体水平是合理的科学的。

六、总结

通过以上讨论和计算,可以得出以下结论:

1、在没转换成标准分之前,各科的分数是不能比较的。

2、用原始分高出平均分多少来衡量各科,也是很不科学的。

3、一旦转换成标准分,不但上述比较变得科学易行,而且各次考试之间也是应该比较的。如Z后次–Z前次=进步幅度。

4、平均分反映整体水平;标准差反映班级整体发展平衡程度;标准分反映学生个体各科发展的平衡程度。

4、分段比例和累计比例是学生成绩合理分布的评估依据。

5、统计数据与理论数据之差A1,A2,A3,A4,A5之和ΣAi是刻划合理分布程度的依据。

6、任何一次大型考试,不但要公布“平均分”,而且要公布“标准差”。这两个参数都是十分重要的。这样,各校,各班,个人在这个大系统中的地位都可以很容易的算出。

第5篇:统计学的标准差范文

关键词:正态分布 综合测评 标准分

1 引言

如何对学生进行综合测评,一直是教育界研究的课题。目前在大学里,需要对学生进行综合测评以决定学生的综合排名,进而决定了学生的奖学金分配。综合测评的依据自然是学生各门课程的分数。一般来说,通过测验所直接得到的分数,叫原始分数。由于各个测验的难度不同,各原始分数的价值也不相同,不同测验的原始分数不能进行直接比较。因为仅从个别学生的原始分数,我们无法了解他学习成绩的好坏,知识能力的高低,也无法与其他学生相互比较。为了使原始分数本身具有意义,使不同测验的原始分数可以相互比较,就必须把它们转换成导出分数。所谓导出分数就是经过统计处理过的,具有一定参照点和单位的、可以比较的分数。在教育测验中常用的导出分数有百分等级分数和标准分数。

大量研究表明,凡符合教学规律的考试。其总体成绩应服从或接近服从正态分布,即成绩呈现中间多、两头少的态势。根据这一特点,许多教育工作者也对此进行了很多有益的尝试,提出了许多有用的方法。文献[3]给出了一种给出了一种修正成绩为正态分布的一种算法。笔者认为,虽然该方法对成绩的修正没有改变学生的排名顺序,但是这样的修正至少改变了老师原始打分的初衷。况且对于样本量不是很大的情况,这样的修改也不是很合理的。文献[4,5]则是给出了学生考试成绩分布的拟合,不同的班级的成绩有不同的拟合参数。他们的方法对成绩分析是有益的,但是对于成绩的综合评价没有给出相应的方法。我们在原始分数正态分布假设基础上,采用了把原始分数转换为标准分的方法。并以此为基础,在EXECEL环境下实现了各门课的原始分向标准分的转换,并对综合成绩进行了测评。我们认为该方法的可操作性强,转换理论可信[1],对于多门课程的综合测评有着很大借鉴意义。

2 转换原理

定义1 设原始分数ξ~ N (μ,σ2) ,其中μ是数学期望,它刻画了ξ的统计平均值,σ2 是方差,它刻画了ξ取值关于其数学期望的偏离程度,则称ξ的标准化。

(1)

以这个为标准分数。其中,μ为平均分,σ为标准差。此时有η~ N (0,1)。

实质上标准分数是以平均分数为参照点,以标准差为统一单位的导出分数。这里既考虑了每门学科不同分值与其各自平均分数的差异,又用其标准差作为统一单位。故用标准分数来衡量学生成绩的相对地位是科学的,具有可比性。由于η的数学期望E (η) =0,方差D(η) =1,每门学科之标准分数的数学期望和方差都一样,表明各门课程所处的相对地位是平行的,因而可对标准分数用代数方法处理,得出科学的结论。标准分数是原始分数的线性变换,对于原始分数在整体中所处的位置具有“保序性”。根据正态分布N (μ,σ2 ) 所具有的“3σ原则”性质,标准分数η满足P ( - 3

定义2在教育统计学中,若记X 为应试者在被试科目中的原始分数,X为该被试科目原始分数的平均分数,S 为该科目试卷的标准差,则称标准分数:

(2)

由上式可见,标准分数是一个以平均值为参照点,以标准差为单位,测量原始分数与其平均分数的距离的量数,可以表示一个原始分数在团体中所处的相对位置。不管原始分数的平均分、标准差如何,相同的标准分表示在分布中处于同样的相对位置。

平均分数和标准差的计算公式如下:

(3)

(4)

另外,为了使标准分更符合我们平时的记分习惯,可将标准分Z转化为另一种标准分T。考虑到Z 分数会出现负值以及常带有多位小数这些不自然的情况,为了消除负值,并尽可能使标准分数与原始分数相近,特对标准分数Z 进行线性变换T=αZ+β,这里取α=10、β=50,其计算公式是:

T = 10Z+50(5)

3 应用与分析

由于整个转换工作比较简单,在EXECEL中简单完成这些操作时可行的。表1给出了1个班级1门课程的分数转换求解的过程。

表1 EXECEL计算标准分示意图

表2 综合测评原始分和标准分的排名对比

在表1中,“A1:A31”给出的是学生姓名;“B2:B31”给出的是课程的原始分;“B32”给出的是原始平均分,由公式“=AVERAGE(B2:B31)”求得;“C2:C31”是个原始分与平均分的差的平方,其中“C2”由公式“=(B2-B$32)^2”求得,其他“C3:C31”求法类似;“C33”给出的是标准差,可以由公式“=SQRT(AVERAGE(C2:C31))”求得;“D2:D31”给出的是标准分Z,其中“D2”由公式“=(B2-B$32)/C$33”求出,其他“D3:D31”求法类似;“E2:E31”给出的是另一种标准分T,其中“E2”由公式“=10*D2+50”求出,其他“E3:E31”求法类似。

表2给出的是5门课30位同学的原始总分和标准分的对比。

从表2中可以看出,综合测评情况下标准分的排名与原始分排名发生了一些变化。究其原因就是强调了各门课程的相对地位是平行性。例如,原排名第2的“学生11”原总分422,现在却排在第4,而原排名第3的“学生15”总分同样是422,现在排在第2。我们可以看到,“学生15”的各门课成绩是:“95、90、93、76、68”,而“学生11”的各门课成绩为“82、80、82、82、96”。相比之下,尽管两个学生的总分相同,但前者有3门课处于90以上,后者只有1门90以上,所以现在的排名应该更加合理。

4 结论

本文给出一种利用正态分布规律对每门课的成绩进行标准化处理得到标准分,进而求得标准分总分的方法。从理论和实际效果分析看,这种方法得到的结果比原始分数更加公正合理。当然,教育评价的公平公正总是相对的,绝对公正也是难以做到的。本文给出的只是向着更加公正所做的一种尝试而已。

本文的方法也存在一些缺陷,还可以作进一步的扩展与修正。例如,没有考虑各门课程之间差别,也没有考虑成绩处于60分以下时不仅分数低,还有“不及格”这个特殊因素对总评价的影响等。

参考文献:

[1]刘新平,刘存侠.教育统计与测评导论[M].科学出版社,2003.177-190.

[2]谷存昌,池自英.学生成绩分布规律问题研究[J].安阳工学院学报.2010,(4):88-90.

[3]郑月锋,邢春波.修正成绩为正态分布的一种新算法,统计与决策[J].2008,(13):142-144.

第6篇:统计学的标准差范文

【摘要】 目的:测定冠心病患者与健康对照者血浆中MBL含量,分析其变化情况,从固有免疫的角度探讨冠心病的可能致病机制。方法:采集100例冠心病(CHD)患者空腹静脉血,健康对照者60例,采用ELISA法对血浆中MBL含量进行检测。结果:100例冠心病人血浆MBL含量的平均值为3900μg/L,标准差为3209;60例健康对照组血浆MBL含量的平均值为2056μg/L,标准差为1824。冠心病组血浆MBL含量高于健康对照组,经t检验,t=4071,P<001,差别有统计学意义。结论:冠心病组血浆MBL水平高于健康对照组,二者均值比较差别有统计学意义,血浆MBL参与了冠心病的发生、发展过程。

【关键词】 冠心病;MBL;ELISA;含量

【ABSTRACT】 Objective:The main purpose of this study is to measure the MBL level in plasma with coronary heart disease and try to analyze the possible mechanism of CHDs development from the view of innate immune.Methods:100 blood samples of CHD patients and 60 that of health controls were collected and tested by ELISA.Results:The plasma level of MBL were 3900μg/L, SD 3209 in cases, while 2056μg/L,SD 1824 in controls. The plasma level of MBL in cases is higher than that of controls (t=4071, P<001).Conclusion:The plasma level of MBL is higher in CHD patients than that in controls.

【KEY WORDS】 CHD; MBL;ELISA;Plasma level

冠心病(coronary heart disease,CHD)是一种严重危害人类健康的疾病,其发病率和死亡率居首位,尤其在发达国家更为严重,而在我国也呈逐年上升趋势[1]。其病因和发病机制尚未完全阐明,近年来,冠心病发病的炎症学说越来越得到重视[2],对一些炎性因子和急性期蛋白的研究也越来越深入。甘露聚糖结合凝集素(mannan binding lectin,MBL)是一种兼有调理素和直接激活补体功能的免疫分子,参与构成抗感染的第一道防线[3]。国外有些学者报道MBL与动脉粥样硬化发生、发展有关[4~7],但国内尚无报道,因此本研究主要测定冠心病患者血浆中MBL含量,并对其变化进行分析,从天然免疫的角度探讨冠心病的可能致病机制,为其辅助诊断和治疗提供资料。

1 材料与方法

11 实验材料

主要设备:低温冰柜(thermo,美国);酶标仪(Star fax 2100,美国);普通高速离心机(TGL168,上海)

主要试剂:MBL ELISA试剂盒(北京现代高达生物技术有限责任公司)

12 实验方法

121 标本的收集:空腹静脉血标本用EDTAK2抗凝管(2ml)收集。

冠心病(CHD)组:共100例,为河北北方学院附属第一医院20049~200510月住院的冠心病患者,男51例,女49例;年龄45~70岁,平均(6041±9443)岁。病例均经心电图、心肌酶谱和临床症状等综合诊断,符合WHO冠心病诊断标准。

健康对照组:60例,为来院进行健康体检者,男性32例,女28例,年龄43~71岁,平均(6027±7198)岁,病例无冠心病症状、体征,超声心动图及心电图均正常。冠心病组与健康对照组组间年龄无统计学差异。

122 标本的处理

取1ml全血放入15ml离心管中,5000转/min离心5min,分离血浆,-86℃保存,供测定血浆MBL含量。

123 血浆中MBL含量测定

按MBL ELISA试剂盒说明书,基本操作如下:

标本及试剂准备:冠心病、健康对照血浆标本从低温冰柜(-86℃)中取出,溶解并恢复至室温,离心(3500转/min 5min)。取上清2μl,用标本稀释液对标本进行200倍稀释(加入398μl标本稀释液[PBS+005%BSA]),混匀。所有实验用试剂均在室温平衡后使用。

操作步骤:

①取100μl稀释标本加入酶标板中,同时做对照,第一孔加100μl稀释液作空白,第二孔向后依次加含MBL不同浓度(0,1,2,5,10,25,50,100ng/ml)的标准液各100μl,标准孔均作复空;

②置37℃水浴1h;

③将板中的液体弃去,每孔加入150μl洗板液进行清洗,室温静置3min,弃去洗板液,反复3遍;

④清洗后,每孔加入100μl酶标记的MBL抗体,37℃ 1h,使酶标抗体与标本充分结合。

⑤清洗,操作同③ ;

⑥清洗后,每孔加入底物A、B各50μl,室温避光15min。每孔加入终止液50μl,轻轻混匀20s;

⑦用酶标仪比色 测定波长为450nm,参考波长为620nm。在20min内完成。

2 结果

用SPSS 130软件进行统计分析,冠心病组、健康对照组血浆MBL含量的比较,采用两样本均数比较的t检验。

100例冠心病人血浆MBL含量的平均值为3900μg/L,标准差为3209;60例健康对照组血浆MBL含量的平均值为2056μg/L,标准差为1824。冠心病组血浆MBL含量高于健康对照组,经t检验,t=4071,P<001,差别有统计学意义,见表1。表1 冠心病组与对照组MBL含量水平比较

3 讨论

人类血清MBL浓度主要受结构基因外显子1密码子点突变的影响和启动子区多态性的调控[8~11]。国外已有一些MBL基因与冠心病的相关性研究[4~6],但对血浆MBL浓度与冠心病的相关性研究很少,只有冰岛的一份前瞻性研究报告[7]:高浓度的血浆MBL者,尤其是糖尿病病人、高血脂、血沉升高人群患心肌梗死的概率较低,提示MBL可能与清除动脉粥样硬化因素有关。雷克雅未克Landspitali大学的瓦尔迪马森(Helgi Valdimarsson)和同事分析了当地的研究资料,共纳入了1967年以后的近2万参试者。在对其中987名70岁参试者的横断面研究中,作者发现,MBL水平高(>1000mg/L)与水平低相比,心肌梗塞风险下降36%(P<0001)。为证实此结论,研究者对另一个有1309名中年人的人群进行了前瞻性分析。结果发现MBL水平高和心肌梗塞风险减弱有关联的迹象,但不如前一横断面分析中的那样强烈,对总人群、吸烟者或高血压病人也没达到统计学意义。但这次分析证实,高水平MBL对糖尿病人(P=002)或高胆固醇血症病人(P=0004)与心肌梗塞风险大为减小有关。鉴于上述在糖尿病人中的结论“测量MBL可用于心性风险的辅助评估,也可能帮助评估预防治疗的需要”,本研究发现,100例冠心病人血浆MBL含量的平均值为3900μg/L;60例健康对照组血浆MBL含量的平均值为2056μg/L。经t检验,t=4071,P<001,二者均值比较差别有统计学意义,说明血浆MBL可能参与冠心病的发生、发展,但具体作用及机制还有待进一步研究。

参考文献

1 杨功焕,王俊芳,万霞,等.影响中国人群疾病死亡因素的定量分析[J].中华流行病学杂志,2005,26(12):934938

2 Gran K.Inflammation,Atherosclerosis,and Coronary Artery DiseaseN[J].Engl J Med,2005,352:16851695

3 Takahashi K,Ezekowitz RA. The role of the mannose binding lectin in innate immunity[J].Clin Infect Dis,2005,41(7):440444

4 Aittoniemi J,Fan YM,Laaksonen R,et al.The effect of mannanbinding lectin variant alleles on coronary artery reactivity in healthy young men[J].Int J Cardiol.,2004,97(2):317318

5 Robert A,Hegele C.Mannosebinding Lectin Gene Variation and Cardiovascular Disease in Canadian Inuit[J].Clin Chem,1999,45:1283

6 Fiane AE,Ueland T,Simonsen S,et al.Low mannosebinding lectin and increased complement activation correlate to allograft vasculopathy,ischaemia,and rejection after human heart transplantation[J].Eur Heart J,2005,26(16):16601665

7 Saedis S,Oskar O O,Thor A,et al.Mannan binding lectin as an adjunct to risk assessment for myocardial infarction in inpiduals with enhanced risk[J].J Exp Med,2005,201:117125

8 贾天军,李萍,张庶民,等.汉、蒙古族人MBL基因ExonI 54位密码子点突变频率及其血浆含量相关性研究[J].中华微生物学和免疫学杂志,2004,24(2):115119

9 Kilpatrick DC.Mannanbinding lectin and its role in innate immunity[J].Transfus Med,2002,12(6):335352

第7篇:统计学的标准差范文

针对“生物统计学”课程的特点和现状,近年来,我们在教学过程中,围绕教学内容、教学方法、课程建设、考核方式等多方面进行了实践和探索,取得了较为理想的效果。

1.合理编排教学内容,提高教学效率。我校本科教学计划调整后,“生物统计学”课程安排在第三学期,周学时为2,共36学时。学生在之前已学习了“高等数学”等公共课程,“植物学”、“动物学”等专业基础课程,与本学期同时学习的还有“生物化学”。为适应生命科学的发展和对生物学人才的培养,我们按照“强化基础、突出重点、注重应用、通俗易懂”的原则合理设计安排教学内容[1]。在课堂讲授时,我们尽可能把抽象的统计学原理与生命科学的前沿或学生们感兴趣的事例进行结合,并引导学生从专业知识的角度对统计分析的结果做出科学的判断和合理的解释,这样一方面使学生感受到生物统计学与生命科学的各专业都是紧密联系的,另一方面学到的统计分析方法和试验设计原则也可以指导学生后续专业课程的学习。作为应用性极强的课程,我们在课堂授课时一般不过多讨论数学原理,而主要偏重于统计原理的介绍和具体分析方法的应用。在有限的课堂教学时数内,对涉及到的数理统计知识多是“拿来主义”,对于一些公式,通常只进行概念上的介绍和公式上的简单推导,对有些较复杂的统计公式则只给出公式,并不要求学生掌握具体的推算过程,其目的是让学生对统计学原理和统计分析方法有较全面的了解。在章节内容上,根据具体情况进行适当删减,做到重点突出、主次分明。比如讲授方差分析一章时,以单因素数据资料的分析为例,重点介绍方差分析的基本原理、数学模型和分析步骤,对于二因素数据资料的分析则启发学生根据其基本原理和数学模型进行推理,多因素数据资料的方差分析则只介绍基本原理,其目的是培养学生对所学理论知识的应用能力,实现以素质教育为基础,以能力培养为本位的教学理念。

2.灵活运用多种教学方法。在教学过程中,我们根据教学内容,采用多种教学方法并重,对学生“授之以渔”而不是“授之以鱼”[3],充分调动学生学习的积极性和主动性,使教学相融。问题导入法。在课堂讲授时,我们注重问题的创设。提供氛围,启发学生发现问题并思考如何解决问题[4],使学生成为学习的主人,教师则成为学生的协作者。例如,在方差分析一章讲述时,以单因素数据资料为例[1],让学生思考如何进行多组平均数之间的比较。有的学生会提出,可以采用之前学习过的两个样本平均数假设检验的分析方法对多组数据进行两两的比较,而这又引发了一些新的问题。如何解决这些问题呢?这时,我们引导启发学生将所有的数据资料作为一个整体来考虑,将数据的总变异按照其变异来源剖分成处理引发的变异(组间变异)和试验误差引发的变异(组内变异),并利用反映变异特性的方差这一统计量来表示组间变异和组内变异的大小,进而采用检验对其二者的差异进行显著性检验,由此和学生共同推导出方差分析的基本思想和分析步骤。这样,既让学生理解了方差分析的原理和应用,也培养了学生分析问题和解决问题的能力。对比法。“生物统计学”中有很多概念都是成对出现的,其相应的公式也有着许多形式上的共同点,这就为我们进行对比法讲解提供了很好的素材。例如标准差与标准误、直线回归系数与直线相关系数、样本平均数假设检验的检验及检验等[1]。对比法讲授,既可以帮助学生记忆公式,也便于学生更好地理解公式的含义和具体应用,做到举一反三。演绎法。“生物统计学”中有很多公式是前后联系的,存在公式的变形,运用演绎法教学可以让学生更好地理解公式的来源和内涵。例如变量的标准化公式,对于服从正态分布的变量进行标准化转换的公式(u=x-μxσx)是核心,在理解这个公式含义的基础上,对于各统计数(平均数、平均数差数、频率、频率差数、成对数据差数等)进行标准化转换的公式自然也就推导出来了,从而避免了对这些公式的死记硬背。板书与多媒体课件并行。随着电子技术、计算机技术和网络技术的发展,在教学实践中多采用多媒体课件进行授课。多体媒体课件集文字、公式编辑、图形、色彩、动画于一体,既可以插入图片和例证,也可以实现公式推导的逐步展现,图文并茂,色彩丰富,省去了板书所占的时间,可以在有限的课堂教学时间内增加教学内容,增强师生之间的互动[4]。同时,传统的板书不能完全放弃,在讲授过程中,适时穿插板书内容,可以帮助学生更好地联系已学知识。因此,在教学过程中,我们以多媒体教学为主,板书为辅,注重将这两种教学方法进行有机的结合。

3.加强实验教学,注重理论与实践的结合。“生物统计学”是一门应用学科。我们在理论教学的同时,安排了18个学时的实验课,主要目的是让学生将课堂理论知识加以应用并学会常用统计学软件的使用。生物统计学实验课在生命科学学院信息学实验室利用电子教室系统进行,教师在主控机上边讲解边操作,学生可以在自己的计算机上观察到具体的执行过程,之后可以自己进行相应的操作,然后以电子文档的形式提交实验课作业。通过实验课教学,一方面使理论知识密切联系实践,真正提高了学生的应用能力;另一方面增强了学生的兴趣,在实验课中学生不仅巩固了统计分析知识,而且利用计算机来分析数据也为相关专业课实验数据的分析奠定了基础。在运用计算机统计软件进行数据分析时,学生们也深刻意识到,尽管统计学软件功能强大,但必须对相关的统计学知识有一定的认知和理解,才能更好地使用这些软件,由此也进一步激发了学生课堂学习的动力。

4.课程资源的立体化建设。在教学过程中,我们注重加强课程资源的立体化建设。以教材为中心,我们编写了与科学出版社《生物统计学》(第四版)配套的《生物统计学学习指导》,对每一章的内容都配套了目的要求、内容提要、难点评析、例题解析、习题解答和自我测验[5],以供学生在课下进行学习和知识的扩充。同时,“生物统计学”是河南师范大学校级网络课程,学生可以通过浏览网页进行课程内容学习。在网络课程中,每章均示出了重点、难点,便于学生自学或复习掌握;同时,网络课程中丰富生动的图表资料及实例分析也有助于学生对知识点的理解。

第8篇:统计学的标准差范文

[关键词]生物统计学;本科教学;Excel软件;统计功能

[中图分类号] G642 [文献标识码] A [文章编号] 2095-3437(2017)03-0066-03

统计学是生物学领域进行科学研究不可或缺的工具,目前大多数高校已把生物统计学列为生物学相关专业的必修课。通过该课程的学习,有利于培养学生正确分析试验数据的能力,对于进一步学习专业课程和日后进行科研也有着非常重要的作用。近年来,统计分析软件的应用越来越普及,应用统计软件来辅助生物统计学的理论教学变得尤为重要。[1][2]

Excel作为常用办公软件,除具备较强的图表和计算功能外,还提供了大量的统计函数和数据分析工具。利用Excel的统计功能,可快速、简便地进行描述性统计、t检验、方差分析、回归、相关等多种统计分析,从而为生物统计学的教学提供了极大便利,强化了教学效果。Excel的统计功能虽不如SPSS、SAS等专业统计软件强大,但具有易学易用的优势,适用于统计学的初学者,可基本满足本科生的教学需要。[3][4]

一、Excel统计函数简介

(一)统计函数的插入

Excel软件提供了丰富的数学和统计函数,将这些函数结合起来应用,可显示出Excel的统计分析功能。[3][4]在Excel 2003菜单中的“插入”项,选择“函数”。或在2007及以上版本中,在“公式”菜单项选“插入函数”命令,之后在“选择类别”栏选择“统计”,即显示大量统计函数。

(二)常用统计函数介绍

1.统计学参数或特征数的计算

数据的标准差、平均数等特征数均可由统计函数计算得到。反映集中性的函数包括AVERAGE(均值)、GEOMEAN(几何平均数)、HARMEAN(调和平均数)、MEDIAN(中位数)等;反映离散性的函数有:DEVSQ(离差平方和)、STDEV(样本标准差)、VAR(样本方差)、KURT(峰度系担┑取

2.数据分类

FREQUENCY函数可对大量数据进行分类和统计,表达式为:FREQUENCY(Data array,Bins array)。该函数为数组公式形式,运行显示出一个分组的频数后,还需选中所有结果的显示区域,按F2键,再按“Ctrl+Shift+En?鄄ter”组合键,方可求出所有分组的频数。[5]FREQUENCY的操作步骤因分类资料的性状而有所差异。A. 质量性状资料:在函数对话框中,“Data array”一栏输入分类数据所在的单元格地址,“Bins array”一栏输入分类标志值所在单元格。B. 数量性状资料:确定好分类的组数、组距和组限后,将各组的上限按升序输入工作表,在“Data array”和“Bins array”分别输入相应的单元格地址。

例:现有350名学生的英语成绩,需按优秀、良好、一般和不及格进行分类,并统计各等级人数。考试成绩为数量性状资料,首先按升序将各组上限按升序输入工作表(60、74、90)形成一列,插入FREQUENCY函数,在“Data array”输入成绩所在单元格区域,在“Bins array”输入各上限所在的单元格区域,确认后即可计算出不及格的人数(

3.概率函数

概率函数可直接计算出给定参数条件下各理论分布的概率值(P)。[6]常用函数有BINOMDIST(二项分布)、POISSON(泊松分布)、NORMDIST(正态分布)、NORMSDIST(标准正态分布)、TDIST(t分布),FDIST(F分布)等。

例如,BINOMDIST函数的功能为计算给定参数条件下二项分布的概率值。函数表达式:BINOMDIST(number_s,trials,probability_s,cumulative),其中num?鄄ber_s为试验成功的次数,trials为独立试验的次数,prob?鄄ability_s为试验成功的概率;cumulative为一逻辑值,用于确定函数的形式,取值为1和0。Cumulative如果取1,结果显示至多n次成功的概率;如为0,则返回恰好为n次成功的概率。

4.t 检验

TTEST函数功能为返回t检验的概率,以此来判断假设检验的显著性。函数表达式:TTEST(array1,array2,tails,type),其中array1为第一组数据所在的单元格区域,array2为第二组数据的区域,tails为分布曲线的尾数(双尾或单尾),type表示t检验的类型。函数运行后得到t检验的概率值(P),如P

5.相关和回归系数计算

CORREL函数功能为计算两变量间的相关系数,以此来判断两变量间的相关程度和性质,表达式为COR?鄄REL(array1,array2),array1和array2代表进行相关分析的两组数据。利用INTERCEPT和SLOPE两函数可计算线性回归系数,函数表达式分别为INTERCEPT(known_x′?鄄s,known_y′s),SLOPE(known_x′s,known_y′s),其中known_x′s、known_y′s为自变量和因变量的数据集合。INTERCEPT函数可计算线性回归的截距(a),SLOPE函数可计算线性回归的斜率(b),从而得到线性回归方程:=a+bx。

二、数据分析工具的应用

(一)分析工具库加载

Excel的分析工具库具有较强的统计分析功能,但此功能通常未默认安装,需加载后使用。

1.在Excel 2003中,在“工具”菜单中单击“加载宏”,在弹出对话框中选中“分析工具库”即可,之后“工具”菜单中即出现“数据分析”条目。

2.在Excel 2007或更高版本中,单击左上角的“Office按钮”,选择“Excel 选项”,在弹出对话框中单击“加载项”,然后在“管理”栏中选择“Excel加载项”,单击“转到”,最后在“加载宏”窗口中选中“分析工具库”,之后在“数据”菜单中即出现“数据分析”条目。

(二)常用统计方法介绍

分析工具库包括描述性统计、t检验、方差分析、回归、相关、F检验等多种统计方法。[3][5]每次使用时,按照各统计方法的格式要求输入原始数据,单击“数据分析”选项,在弹出对话框中选择所需统计方法即可。

1.数据分类

将各组的分类标志值(质量性状资料)或上限值(数量性状资料)输入工作表,在“数据分析”中选择“直方图”;弹出对话框后,在“输入区域”选择分类数据的单元格地址,“接收区域”选择分类标志所在的单元格,运行即可。

2.描述统计

输入数据资料,在“数据分析”中选择“描述统计”,运行后即可得到最小值、最大值、平均数、标准差、方差、峰度、偏度等常用统计量。

3.t检验

t检验包括平均值的成对二样本分析,双样本等方差假设,双样本异方差假设检验。如进行平均值的成对二样本分析,弹出对话框后,分别在“变量1区域”、“变量2区域”输入两组数据所在的单元格地址,之后在“输出区域”选择某空白区域,确定即可。运行结果包括平均数、t值、df、单尾和双尾概率(P)、临界t值等信息。若P

如进行成组设计的两样本均值检验,需先进行F检验:双样本等方差假设,判断两样本所在总体方差是否同质。步骤:分别在变量1、变量2输出区域选择相应单元格区域,运行结果包括方差、F值、单尾概率(P)、临界F值等。如P

4.方差分析

方差分析包括单因素、无重复双因素、有重复双因素三种类型。如进行单因素方差分析,弹出对话框中,在输入区域、分组方式、输出区域分别输入相应信息后,单击“确定”即可。输出结果包括平方和(SS)、df(自由度)、MS(均方)、F值、F crit(F临界值)、P值等信息(表1)。如P>0.05(或F

5.回归与相关分析

线性回归分析:在“数据分析” 菜单选择“回归”, 在弹出对话框中输入Y值、X值、置信度、输出区域等信息后,运行即可得到回归截距(Intercept,a)和回归系数(b)(表2),从而写出回归方程。根据回归系数的t检验结果或方差分析的F检验结果,可判断两个变量间的线性回归关系是否有效。[7]由表2可知,a(Intercept)=-1.382,b=5.503,回归方程为:=5.503x-1.382。由回归系数的t检验可知,P=0.00004

三、结语

Excel软件提供的统计功能基本涵盖了统计学的教学内容,且对于生物统计学的初学者而言,具有易学易用的优势,可作为本科教学的有效辅助工具。在每章理论知识讲解完毕,应紧接着介绍Excel的统计功能、操作步骤和结果解释,把课程理论教学、实际案例分析和软件应用有机结合,可取得较好的教学效果。教学实践表明,运用Excel的统计功能来辅助理论教学,不仅能够加深学生对统计学原理的理解,还可以提高学生运用理论知识来分析数据的能力,从而使得生物统计学的学习变得轻松。在今后的生物统计学教学实践中,应紧密加强Excel软件应用与理论教学的融合,并考虑将 SPSS等专业软件逐步引入教学中,以期进一步提升学生分析处理复杂数据、解决实际问题的能力。

[ 参 考 文 献 ]

[1] 张丹,吕海燕,张幸果,等.应用Excel软件有效提高《生物统计学》课程的教学效果[J].河北农业科学,2012(8):93-95,99.

[2] 魏兴民,任真,代婷.Excel在中医药统计学教学中的应用[J].高等数学研究,2013(1):93-95.

[3] 张联锋,蒋敏杰,张鹏龙,等.Excel统计分析与应用[M].北京:电子工业出版社,2011.

[4] 杨景峰.EXCEL的计算功能在生物统计学教学中的应用[J].内蒙古民族大学学报(自然科学),2012(6):738-741.

[5] 王锟.Excel 在统计学中的应用[J].湖南科技学院学报,2013(12):9-11.

第9篇:统计学的标准差范文

《财富》世界500强排行榜被誉为“终极榜单”,由《财富》杂志每年一次。2014年,世界500强的入围门槛再次提高5亿美元,达到237亿美元;财富中文网于北京时间2014年7月7日晚与全球同步了最新的《财富》世界500强排行版,零售业老大沃尔玛重回榜首。中国上榜公司数量创记录的达到了100家。然而我国上榜的公司的平均实力与美国等同是GDP大国的发达国家的上榜公司的平均实力有没有差距呢?我国上榜企业与美国的先进企业的发展中有没有平均水平和稳定程度的差异?本文将对这几个问题进行探讨。

二、方法选择

本文选用非参数统计方法进行分析。非参数统计是统计学的一个重要分支,它与总体究竟是怎样的分布几乎没有什么关系,仅需要一些非常一般性的假设,因为假设各国公司的年营业收入服从正态分布并不严格,用一般的参数统计方法,如t―检验,F―检验等可能会引起误差。因此选择用非参数统计方法。

三、世界500强企业发展水平的统计描述

2014年世界500强企业中,中国的上榜企业为100家,美国为128家,中国上榜企业中排名在300―400名之间的企业最多,达到了35家。而美国上榜企业在0―100名这个区间的最多,占上榜企业总数的25%,为32家。从我国上榜企业的排名相对靠后,而美国上榜企业的排名相对靠前。

从平均数上看,我国上榜企业的营业收入和利润都低于500强企业的平均水平,而美国则高于500强企业的平均水平。

从标准差来看,中美上榜企业营业收入的标准差均高于500强企业,说明我国与美国上榜的企业之间的营业收入差异较大。我国上榜企业利润的标准差低于500强企业,而美国则高于。这样的对比表明,我国100家上榜企业间利润的差异较小,小于世界500强的平均水平。美国128家上榜企业间利润的差异较大。

四、中国和美国上榜企业的比较分析

(一)两样本位置参数Mann―Whitney检验法下中国与美国公司的年营业收入比较分析

原假设:中国和美国两国进入世界500强的公司年营业收入没有差异。

备择假设:美国进入世界500强的公司年营业收入比中国的高。

在excel中通过随机数表,抽取10个美国公司和10个中国公司,R软件运行得到的结果如下:

Wilcoxon rank sum test

data:sr.usa and sr.china

W=51,p-value=0.6607

alternative hypothesis:true location shift is not equal to 0

p=0.6607>0.05,表明没有充分的理由拒绝原假设,即表明中国和美国两国进入世界500强的公司年营业收入没有显著差异。

(二)两样本尺度参数―Mood检验法下的美国和中国公司年营业收入分散程度的比较分析。

原假设:美国公司之间年营业收入分散程度与中国的分散程度一样大;

备择假设:美国公司之间年营业收入分散程度比中国的分散程度小。

由于位置参数检验中,美国和中国位置参数相等,因此在尺度参数检验中我们可以使用Mood方差检验。Mood检验结果显示P=0.036

(三)两样本位置参数Mann―Whitney检验法下中国与美国公司的利润比较分析

原假设:中国和美国两国进入世界500强的公司利润没有差异。

备择假设:美国进入世界500强的公司利润比中国的高。

在excel中通过随机数表,抽取10个美国公司和10个中国公司,R软件运行得到的结果如下所示:

Wilcoxon rank sum test

data:lr.usa and lr.china

W=90,p-value=0.001505

alternative hypothesis:true location shift is not equal to 0

p=0.001505

(四)两样本尺度参数的秩检验方法下的美国和中国公司利润分散程度的比较分析

原假设:美国公司之间年营业收入分散程度与中国的分散程度一样大;

备择假设:美国公司之间年营业收入分散程度比中国的分散程度小。

由于位置参数检验中,美国和中国位置参数相等,因此在尺度参数检验中我们可以使用Mood方差检验。Mood检验结果显示P=0.44>0.05,没有充分的理由拒绝原假设,表明美国公司利润的分散程度与中国的分散程度没有显著差异。

五、结论和建议

(一)结论

在营业收入方面,美国和中国上榜企业年营业收入的平均水平没有显著差异,但是两国营业收入的分散程度存在显著差异,美国上榜企业营业收入的分散程度小于中国。

在利润方面,美国和中国上榜企业利润的平均水平存在显著差异,美国企业利润高于中国,但两国利润的分散程度没有显著差异。