公务员期刊网 精选范文 统计学变量的分类范文

统计学变量的分类精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的统计学变量的分类主题范文,仅供参考,欢迎阅读并收藏。

统计学变量的分类

第1篇:统计学变量的分类范文

【摘要】 目的: 介绍应用多重对应分析方法实现对大样本分类变量之间的相关性分析,旨在对大样本疾病信息采集资料的临床和基础科研工作者提供可借鉴的统计学分析方法。方法:应用SPSS11.5统计分析软件中Data Reduction菜单的Optimal Scaling过程对大样本分类变量进行多重对应分析,以研究它们之间的联系。结果:慢性胃炎的4种病理组织诊断与8种中医证型有一定的相关性,这对慢性胃炎的临床诊断及治疗具有指导意义,为慢性胃炎中医证候规范化研究提供一定的思路。结论:对于中医研究中常见的无序多分类或二分类变量,要同时研究它们之间的联系,用多重对应分析在结果的直观性和可解释性方面优于对数线性模型。SPSS11.5统计分析软件易于实现多个变量间的多重对应分析。

【关键词】 多重对应分析; 相关性分析; 大样本; 分类变量

长期以来,中医的辨证分型纷繁多样,难以统一,同时病理组织检查是许多疾病诊断及治疗的重要依据。如何理清中医证型和病理诊断之间关系是许多临床和基础科研工作者遇到的难题。本研究介绍应用多重对应分析方法实现对中医大样本证型与病理诊断的相关性分析,以期为疾病的临床诊断和治疗提供参考依据和帮助,为中医证候的规范化研究提供一定的思路,为大样本疾病信息资料的临床和基础科研工作者提供可借鉴的统计学分析方法。

1 资料及方法

1.1 资料来源

本研究资料来源于上海市重点学科(第三期) 中医诊断学建设项目(编号:S30302)。为2001年3月~2008年3月上海中医药大学附属龙华医院、曙光医院、岳阳医院及上海市第八人民医院消化科门诊且经内窥镜及病理组织学检查确诊为慢性胃炎的患者1068例。以调查表的形式获得包括基本情况、胃镜及病理组织学诊断、中医主症、食欲食量、全身情况、舌脉象、其他情况等7个部分的内容,共80个变量。所有变量经过命名及量化处理,有程度差异的变量分别赋值1、2、3、4,以示轻重程度从无到重度。对于难以分清程度差异的变量根据有无分别赋值1、0。本研究借用其中病理诊断与中医主要证型的部分实验数据。

1.2 统计学方法

调查表所得数据采用EipData3.1软件进行数据管理,双遍录入和核对,建立相关数据库。应用SPSS11.5统计分析软件中Data Reduction菜单的Optimal Scaling过程对中医主要证型与病理诊断结果进行多重对应分析,以研究它们之间的联系。

2 分析步骤及结果

其分析步骤如下:

Analyze"Data Reduction"Optimal Scaling

Define

Variables框:HP、肠化生、病理萎缩、慢性炎症

选中以上4个变量:Define Range

Maximum框:4 Continue 取值范围在1~4之间

Variables框:主证

选中以上变量:Define Range

Maximum框:8 Continue 取值范围在1~8之间

OK

结果见图1。

HP感染慢性胃炎患者中医证型以脾胃湿热证多见,依次可见肝胃郁热、脾胃气虚等证,与脾胃虚寒证无明显关联。慢性炎症类胃炎患者中医证型以湿浊中阻证多见,次之可见脾虚湿阻证、脾胃气虚证、肝气郁结证,较少出现脾胃虚寒证。萎缩性胃炎患者中医证型以虚证为主,以脾胃气虚证多见,次见脾胃虚寒证,较少出现湿浊中阻、脾胃湿热等实证。肠化生类胃炎患者中医证型以肝胃郁热、湿浊中阻证多见,次之见肝气郁结、脾胃气虚等证。

图1 分析结果

3 讨论

本研究采用大样本的临床病例资料,经统计学多重对应分析方法分析显示,中医证型与西医病理组织诊断间有一定的相关性,这有助于了解疾病不同病情阶段的中西医诊断之间的内在相关性,有利于用辨证与辨病相结合的方式为疾病的临床诊断和治疗提供依据和帮助。如对于无明显临床症状的患者,可以以病理组织的不同特点及舌脉象特征作为中医辨证论治的依据;对于病理组织检查尚未明确的患者,可以结合中医的辨证结果及其他检查初步制定诊疗方案。也可为中西医结合探讨该疾病的病因病机及证治规律寻求理论及临床实践中的结合点,同时为疾病的中医证候客观化研究提供一定的思路和方法。

中医领域的研究很多变量多为无序多分类或二分类变量,同时研究它们之间的联系可用的方法有对数线性模型和多重对应分析两种,从结果的直观性和可解释性上讲,多重对应分析要更好些。多重对应分析是多维图示分析技术的一种,是了解多维数据间联系的一种强有力的方法,该分析方法既有频数的分析,也有各变量间的关系图示。其分析结果主要采用反映变量间相互关系的对应分析图来表示。该图形中的每个散点代表了某个变量的一个水平,有较紧密关系的水平其散点将紧密地靠近一起,从而在结果的解释上非常的直观。在解释该图形时遵从的原则是:落在由原点(0,0)出发接近相同方位及图形相同区域的同一变量的不同类别具有类似的性质;落在原点出发接近相同方向及图形相同区域的不同变量的类别间可能有联系。SPSS11.5统计分析软件易于实现多个变量间的多重对应分析。但在变量较多时可能会掩盖真实联系,同时使得图形一片混乱,难以看清(根据此次实际操作经验,每次最多选入的变量不能超过13个,否则真的是一片混乱,无法处理了)。此时需要用户根据经验和分析结果进行耐心的筛选,以得到最优结果。这对使用者的分析水平和职业道德都是一个严峻的考验。

【参考文献】

第2篇:统计学变量的分类范文

【摘要】

目的:提出一种基于改良马氏深度函数的多变量参考值范围统计学建立方法,并以此为基础探讨统计深度函数在解决多变量参考值范围问题方面的实际应用价值. 方法:采用计算机模拟试验和实际数据分析相结合的方式,从参考值范围几何特征、参考值范围合法性与有效性等方面对新的和现有的几种多变量参考值范围建立方法进行比较分析. 结果:改良马氏深度法建立的二元参考值范围具有典型的中心椭圆特征,对于多元正态分布资料,改良马氏深度法与正态分布法一致性在98.5%以上,实例数据分析结果显示改良马氏深度法建立的参考值范围大小比多元正态分布法更接近理论水平. 结论:改良马氏深度法在参考值范围几何特征方面符合要求,在合法性及有效性方面优于现有的成熟方法,可以作为多变量参考值范围的有效统计学建立方法.

【关键词】 参考值 计算机模拟试验 深度函数 统计学方法

0引言

医学多变量参考值范围统计学建立方法是困扰医学统计工作者的重要问题之一. 目前的多变量参考值范围多采用多次重复使用单变量参考区间的方法,但此方法的主要问题之一是无法处理变量间相关性的影响. 针对多元正态分布资料,多元正态分布法仍是最有效的方法[1],而近年来有关学者提出的多指标百分位数法[2]和全息元法[3]等在探索针对其它类型资料的多变量参考值范围建立方法方面做出了有益的尝试.

统计深度函数是针对多元数据的基于空间排列的一种顺序统计量,具有明显的非参数特性,可作为医学多变量参考值范围统计学方法的一种选择. 为探讨统计深度函数在多变量参考值范围统计学方法上的应用价值,本研究提出一种基于改良马氏深度函数的多变量参考值范围统计学建立方法,并通过模拟试验和实例数据分析探讨该方法的实际应用价值.

1材料和方法

1.1材料本研究实例数据资料来源于2001年某省健康青年体检数据. 其中包含3453例受测者,全部为男性,年龄14.5~29.5平均(18.41±1.01)岁. 数据包括血压、体型和体能等三类多元指标. 其中血压指标包括收缩压和舒张压2个变量;体型指标包括身高、坐高、肩宽、体质量、胸围、腰围、臀围等7个变量;体能指标包括肺活量、立定跳远距离、俯卧撑次数以及仰卧起坐次数等4个变量.

1.2方法

1.2.1改良马氏深度函数方法设计统计深度函数用以计算多元数据基于空间排列的秩次以及各种顺序统计量[4]. 本研究以马氏深度函数[4]为基础,经过适当的改良后,将其应用于多变量参考值范围统计学建立方法. 其改良方法如下.

从提高马氏深度函数稳健性考虑,对其进行以下操作:在进行空间排列顺序计算前,先对原始变量进行标准化,使各变量具有相同的变异程度;以中位数向量为位置参数;以Spearman秩相关矩阵为变异矩阵. 改良马氏深度函数可表达为式(1)的形式.

MDS(x,F)=[1+(xs-Mds)′R-1s(xs-Mds)]-1(1)

其中,xs表示各分量经标准化后的数据向量,Mds表示各分量经标准化后的中位数向量,Rs表示原始样本数据的Spearman秩相关矩阵.

改良马氏深度法建立多变量参考值范围的主要操作步骤如下: ①应用改良马氏深度函数将多元数据类型的参考样本转化为统计深度指标,实现多元数据向单变量数据的转换;

②采用百分位数法建立统计深度指标的指定容量的单侧参考值区间(右侧区间,包括中心点对应的统计深度最大值);

③对于新样品,先依据参考样本的中位数向量和秩相关矩阵计算其对应的统计深度,并依据上述统计深度单侧参考值区间判断其正、异常分类.

1.2.2运算环境与分析方法本研究的全部分析计算过程均在SAS 9.1软件环境下通过编程方法完成. 将从参考值范围空间几何特征、参考值范围一致性以及实例分析等方面对改良马氏深度法和现有的几种方法(多元正态分布法、多指标百分位数法、全息元法)进行对比分析,以考察改良马氏深度法的优缺点及其实际应用价值.

参考值范围空间几何特征分析以计算机模拟数据为基础,为简便操作仅从二元正态分布资料参考值范围的几何分布形态入手进行探讨. 具体操作为:针对二元正态分布的模拟数据建立多变量参考值范围,并直接对参考样本进行分类并绘制散点图,观察其空间几何特征,从而考察各种方法所建参考值范围的合理性.

由于多元正态分布法是针对多元正态分布资料的最可靠的多变量参考值范围统计学方法,此处我们通过考察多元正态分布情形下改良马氏深度法和多元正态分布法所建立参考值范围的一致性(针对参考样本的分类结果一致性),来验证该方法的可靠性.

实例分析将采用随机抽样方法(采用SAS的surveyselect过程实现)从实例数据抽取800人作为参考样本,应用改良马氏深度法和多元正态分布法建立其50%,75%,95%的参考值范围,并将此参考值范围应用于全部受检者,判断其“正、异常”分类,计算“正常”者的百分比并与理论水平比较,从而评价两种方法所建立参考值范围的可靠性. 2结果

2.1参考值范围几何特征一般来讲,理想的多变量参考值范围应当表现为样本数据点分布中心区域上椭圆或近似椭圆的几何形态. 本研究的分析结果显示,现有三种方法中多元正态分布法的参考值范围呈中心区域的椭圆型,多指标百分位数法为矩形,而全息元法则为带状,后两者的结果不符合中心椭圆区域的基本要求. 改良马氏深度法建立的参考值范围与多元正态分布法一致,呈中心区域的椭圆形. 对于三维或更高维度的数据样本,不难推断上述结果应当同样适用,此处不再列出.

2.2参考值范围一致性分析结果显示,改良马氏深度法建立的参考值范围与多元正态分布法具有很高的一致性,一致率均在98.5%以上.

2.3实例分析对于全部三类多元指标,改良马氏深度法建立的参考值范围大小均比多元正态分布法更接近理论水平,表现出更高的可靠性(表1).表1三类多元指标参考值范围可靠性对比情况

3讨论

多变量参考值范围是医疗卫生领域常见的数据处理问题之一. 多元正态分布法的应用条件较为严格,要求样本服从多元正态分布的假设. 虽然某些资料可通过变量变换的方式转换为多元正态分布,但实际工作中多数数据资料仍无法满足此条件[1],因此多元正态分布法的适用范围有限. 目前常用的替代方法多次重复应用单变量参考区间的方法仍然无法解决,所进行的有关此类问题的研究也未能完全解决多元数据各分量间相关性所带来的问题.

统计深度函数作为一种描述多元数据空间分布相对位置的非参数统计量,为多变量参考值范围统计学建立方法的降维操作提供了新的选择[5-8]. 马氏深度函数考虑了多元数据的内部相关性,更符合医学多变量参考值范围中的实际应用需要[9]. 然而其定义中的位置参数和变异矩阵以参数法为基础,影响了其稳健性. 本研究以马氏深度函数为基础,提出一种改良的马氏深度函数,并尝试了该深度函数在解决多变量参考值范围问题方面的应用效果. 改良马氏深度改变了原有函数定义中的位置参数和变异矩阵,提高了深度函数的稳健性. 从本研究的分析结果来看,改良马氏深度法能够建立合法有效的多变量参考值范围,具有更高的稳健性,在医学多变量资料参考值范围统计学建立方法方面值得进一步的探讨和研究.

【参考文献】

[1] Hekking M, Lindemans J, Gelsema ES. A computer program for constructing multivariate reference models[J]. Comput Methods Programs Biomed, 1997, 53(3): 191-200.

[2] 陈彬, 李克, 林昆, 等. 用多指标百分位数法确定医学参考值[J]. 西部医学, 2003, 1(2): 185-186.

[3] 王润华, 田小兵. 全息元法制定多指标参考值范围研究[J]. 重庆医科大学学报, 2001, 26(2): 171-174.

[4] Zuo YJ, Robert S. General notions of statistical depth function[J]. Anal Stat, 2000, 28(2): 461-482.

[5] Gerhard JW. A note on the depth function of combinatorial optimization problems[J]. Dis Appl Math, 2001, 108: 325-328.

[6] Anja S, Peter JR. Halfspace depth and regression depth characterize the empirical distribution[J]. J Multivariate Anal, 1999, 69: 135-153.

[7] Zuo YJ, Robert S. Structural properties and convergence results for contours of sample statistical depth functions[J]. Anal Stat, 2000, 28(2): 483-499.

第3篇:统计学变量的分类范文

Chang Wei

(Chang'an University School of Economics and Management,Xi'an 710061,China)

摘要: 随着科技日益发展,地质统计学在地质工程中也发挥着重要的作用,这就对地质统计提出了更高的要求。本文从地质统计方法入手,简要阐述了地质统计学发展的现状,并分析了统计方法在地质工程中的重要作用及其应用。

Abstract: With the development of science and technology, geostatistics plays an important role in geological engineering, which puts forward higher demand for geostatistics. Starting from geostatistics, this article illustrates the status quo of geostatistics development, and analyzes the important role of statistical methods and its applications in the geological engineering.

关键词: 地质统计学 地质工程 变差函数 应用分析

Key words: geostatistics;geological engineering;variation function;application analysis

中图分类号:P628+.2 文献标识码:A文章编号:1006-4311(2011)29-0081-01

1地质统计方法简述

地质统计学是在矿山储量计算工作中慢慢发展起来的,是上个世纪六七十年代法国统计学家马特隆教授(G.Matheron)大量的理论研究基础上形成的数学地质学科的一个分支,他的专著《应用地质统计学》的问世标志着地质统计学作为一门新兴学科的诞生①。地质统计学是和采矿业发展同步兴起的学科,它是以变差函数为主要工具,以区域化变量理论为基础,研究在空间分布上既有结构性又有随机性(或有空间相关性和依赖性)的自然现象(包括地质现象)的一门科学。

2地质统计方法发展现状

地质统计学作为一个年轻的边缘学科,正处在蓬勃向前发展的阶段,目前地质统计方法的发展主要有以下几个方面:

2.1 两大学派地质统计学发展至今,出现了两个学派。一个是以A.G儒尔奈耳(A.G Journal)为首的“斯坦福地质统计学派(非参数地质统计学派)”。这一学派研究了不需要对数据的分布做假设的快速条件模拟、概率克立格法和指示克立格法等方法,并且研究了软数据的使用问题。另一个学派以马特隆教授为首,他们开展了以正态的假设为基础的析取克立格法和条件模拟研究,把协同克立格法和主成分分析进行有效结合,形成简单克立格法、析取克立格法、泛克立格法和普通克立格法等一系列的方法和理论,这些方法都要用实际的样品数据为基础,所以也称“参数地质统计学”②。

2.2 多学科的渗透形成新克立格法目前,对于含有一些特异值,接近了高斯分布的具体数据,就要把稳健统计学思想应用到求变差函数当中,继而提出了稳健克立格法;把多元区域化的变量引到克立格法中,运用两个或两个以上有相关性的变量对某一个变量估值,继而产生了协同克立格法;把多元区域化的变量引到指示克立格法中,继而得到了协同指示克立格法。

2.3 多领域应用地质统计学目前不断扩展其应用领域,深入到生活的各个方面。

3地质统计方法在地质工程中的重要作用

随着市场飞速发展,统计方法运用在地质工程是时代潮流发展的必然。以前我们在计算矿产资源的储量时,常用不同级别储量的工程密度,用稀密法得到相对误差来论证矿产资源储量的可靠程度,并将相对误差值作为衡量矿产资源储量精度的标准。然而,这种方法缺乏科学根据,被许多人置疑,地质统计方法的出现很好地解决了这类问题。地质统计工作是深化我国经济体制改革和加强经济发展的必然要求。地质统计不但可以整体估计,还能对局部进行估计,对原有的数学方法和理论进行选择创新,把更好地解决面临的地质问题作为目标。地质统计估计的克立格方差是一个很好的估计精度,其估计精度高较高。地质统计的随机模拟能很好的再现出地质变量变化,从而为定量研究地质体提供一个有利的基础和可靠的保障。

4一维变差函数

可以假设空间中一点只在一维数轴x上变化,把区域化变量Z(x)在x,x+l两点处的数值的差的方差的一半定义成区域化变量Z(x)在x方向上的变差函数,记为:?渍(x)=■V[Z(x)-Z(x+l)]=■E[Z(x)-Z(x+l)]2-{E[Z(x)]-E[Z(x+l)]}2公式中,?渍(x)表示变差函数;E表示期望值,V表示方差。变差函数的函数值仅依赖于x和l两个自变量。在本假设条件下,变差函数仅依赖于分割它们的距离l和方向,因而变差函数可定义成:变差函数是在任一方向,相距l的两个区域化变量[Z(x)和[Z(x+l)的增量的方差的一半。变差函数是一个有关距离的函数,描述不同位置变量的相似性,?渍值越大,变量的相关性越差。通常情况下,?渍值随着距离矢量l的增大而增大,直到到达一定值时?渍达到极大值,之后保持不变。

5统计方法在地质工程中的应用

1977年地质统计学正式引入我国,经过我国对地质统计方法的努力学习,地质统计方法在我国得到了飞快的发展,目前广泛应用于以下几个方面:

5.1 用于储层的预测石油地质学研究中的一个重要的难点和热点,就是对储层的参数进行一个有效的科学的预测。我国原先利用的是传统数理统计的方法,这种方法是纯数学的方法,没有充分考虑到储层参数间相关性和空间连续性的问题,也不附带任何的地质意义,因此,对储层的参数预测有较大局限性。使用地质统计方法就可以有效解决这一问题,它以区域化的变量理论作为基础,对地质参数的空间变化方向性和趋势都有了充分的全面的考虑,再克里金方法的外推和插值的功能,算出了与地质规律吻合的统计方法和模型,继而表征储层参数的规律变化,利用这规律,针对渗透率和孔隙度等参数的空间展布开展有效又合理的预测。

5.2 用于不确定性描述油藏的复杂变化,很难通过动态或静态的确定性模型来反映。只有运用地质统计方法,用不确定性的描述,才能反映出真实的复杂油藏模型。地质统计方法最大的一个优点就是可以很方便地把不同的资料有效整合应用,如生产、测井、地震、地质等方面信息,这些对于油藏准确的描述是非常关键的。这种不确定性的描述可以给油藏工程师一个可选择的参考,帮助他们全面分析,制定一个合理的科学的开发方案。

5.3 用于数据整合地质统计方法通过随机模拟方法和油藏数值模拟相结合,继而预测出油藏动态的特征,为调整和制定开发决策和提高最终的采收率提供一个合理的依据。

6结语

统计学在地质工程应用中经过多年发展,已初显成效。而且其应用范围正在逐渐扩大。我们有理由相信,随着地质统计学方法的不断完善,其必将发展成为一个通用性工具性的科学。

注释:

①孙洪泉.地质统计学及其应用[M].徐州.中国矿业大学出版社,1990.

②李黎,王永刚.地质统计学应用综述[J].勘探地球物理进展,2006,(03).

参考文献:

第4篇:统计学变量的分类范文

[关键词]岩土参数 变异性 评价分析

[中图分类号] P58 [文献码] B [文章编号] 1000-405X(2015)-7-437-1

随着建筑、交通等建设规模的扩大,建筑物对地基的承载能力、沉降幅度的要求越来越高了。要满足这种高精度的岩土工程设计要求,取得建筑区域的岩土参数,并通过研究岩土参数,更加科学反映建设区域的岩土特质,在施工前对建筑工程带来必要的数据参考,从而保证工程建设的安全性和可靠性。

在工程建设中, 人们认识到同一点不同深度及同一地区的不同点处的岩土参数具有一定的差异, 对岩土参数的空间变异性有一定的认识。但是为了便于原始数据的统计分析而将岩土介质视为均质各向同性地层。却忽略了岩土参数的空间变异性, 而将这种“差异”仅仅作为试验过程中的纯随机误差。在岩土工程领域的可靠性设计中, 若将参数样本统计值直接作为岩土参数的空间统计值, 将对可靠度计算精度产生直接影响。

因此, 岩土参数的空间变异性分析和相关距离的计算一直受到重视。岩土最重要的特征是具有复杂的变异性也即地域特征,导致其参数值有显著不确定性。岩土参数是岩土工程设计时需要考虑的基本要素,同时岩土参数的空间变异性已经被人们所认识,并逐步引入岩土工程的实际分析之中。

本文通过岩土空间参数的变异性来源及其评价分析的阐述,说明岩土参数在岩土工程中的作用。

1岩土参数空间变异性的来源与特征

岩土参数所具有的不确定性除了来自岩土勘察导致的误差外,岩土参数本身也有了随机变量的特性。我们知道,长期地质变迁形成的岩土,其性质极为复杂。岩土因为其非均质和各向异性的特点,使得它具备有空间的变异性,这种空间变异性与建筑勘察时对岩土取样过程中的失真和量测误差,是导致岩土参数变异性的主要因素。

岩土变异性的来源总结起来可以归入以下几类:首先是岩土其本身的变异或者是模型变异,也来自于为试验误差或者是统计误差。而在大样本条件下,并舍弃明显不合理试验值后,可以忽略模型和统计部分引起的变异。根据区域化变量理论,可将展布于一定空间范围内,相互之间具有一定相关性的随机变量视为区域化变量。这恰好反映出岩土参数的空间相关性和随机性。

因此,岩土工程的设计计算中涉及的抗剪强度指标、压缩模量(系数)、孔隙比、容重和渗透系数等都可以看作区域化变量进行统计分析。

2岩土参数变异性的评价分析

岩土参数空间变异性分析,是根据取样并测定的数据资料,分析岩土参数的空间变化特征、参数自身及各参数之间的空间相互关系,以及将分析得到的结果应用于实际的工程中,并对未测点参数进行最优化估值,还可分析预测状态变量的空间分布。

在实际工程设计中,许多岩土参数可以看作是区域化变量。比如土的孔隙度相对密度塑性指数、渗透系数、压缩模量、抗剪( 压) 强度以及某一特定持力土层的厚度等。它们的依随空间位置点而变化, 并且具有两个基本属性,即结构性与随机性。由于区域化变量具有上述特殊性质,如果用经典概率统计方法来研究、描述这类性质的变化是非常不容易的,因为它无法道道岩土参数的空间结构方面的信息。

而通过区域化变量理论中的一个简单工具一一变异函数, 就可以很好的描述区域化变量的上述特性,并对区域化的变异性也能反映。

目前多数岩土工程可靠性分析计算中,岩土参数的变异性是按概率统计中的随机变量变异性来评估的,它采用样本的均方差与样本均值的比值(一般叫做变异系数)来表示,这很容易忽略岩土参数变异性中很重要的特点,即结构性。而我们采用的区域化变量理论中的变异函数来描述岩土参数空间变异性就弥补这一缺点。从而将这类变量的变异性分析的任务得以实现。同时,利用地质统计学方法可以得到的岩土参数空间结构信息,定量的描述岩土参数的空间变异性,更全面的分析岩土参数的空间变化,以及通过岩土工程勘探网的合理布局,从而得到定量的有关岩土参数空间的最优化值。而经典的统计方法使用的标准差,变异系数特征值的离散随机变量等参数,这些值的特征通常能用来总结某个范围内的岩土参数值给定的离散的规模以及总体集中度,却不可能反映岩土参数的空间局部作用域和特征值的一个特定的方向。所以,地质统计学方法可以弥补传统统计方法忽视岩土参数变异性的缺点,从而对岩土参数的空间变异性进行更现实的分析和评价。

3结论

岩土参数的不确定性根源是岩土参数的空间变异性和量测系统变异性所导致的。岩土参数的变异性特征确定了岩土参数的空间分布的结构性和随机性的双重特征,因此我们就用岩土参数的区域化变量理论对岩土参数的空间变异性做出客观的评估。变异函数及其参数的使用,使得我们能够对岩石结构特征进行定量描述,从定量的角度揭示岩土属性空间变异规律,在区域化变量空间结构分析基础上构建出的有别于传统统计方法的方向综合变异指标,然后充分利用经典统计学所丢失的信息,就可以对岩土参数的空间变异性得出可靠的定量评价。地质统计学是岩土工程研究岩土的空间变异性及数学地质领域有效的工具,有很广阔的应用前景,这体现其在储量计算、勘探等领域探索,以及采矿设计和采矿地质等方面都显示了强大的生命力,已经成为描述和考察各种自然资源工程学科。地质统计学研究岩土参数几个空间变异性,可以更全面的揭示岩土参数的空间分布特征,从而更为准确评估建筑工地的岩土特征,为工程施工前的做可靠的参照依据。

参考文献

[1]朱小林:岩上工程参数的评价(岩上工程系列讲座第五讲) [J].工程勘察,1989年5 期.

[2]戴维著,孙惠文,刘承柞译.矿产储量的地质统计学评价( 数学地质进展2)[J].地质出版社,北京,1989年.

[3]王俊庸.地质统计学及共在煤炭资源开发中的应用[J].煤炭工业出版社, 1990

第5篇:统计学变量的分类范文

【关键词】 离家;意念;行为;因素分析,统计学;学生

【中图分类号】 R 179 R 395.6 B 844.2 【文献标识码】 A 【文章编号】1000-9817(2007)07-0592-02

Runaway and Its Influencing Factors Among the Urban Junior Middle School Students in Henan Province/YANG Bian-sheng, HE Jian, ZHONG Ya, et al.H enan Provincial Center for Disease Prevention and Control, Zhengzhou(450016), Ch ina

【Abstract】 Objective To investigate the incidence of runaway and its influencing factors among urban junior middle school students in Henan Province, and to provide bases for the intervention measures. Methods By using health related behaviors questionnaire for Chinese youths, a str a tified sample of 5 158 students from 12 junior middle schools in 4 cities in Hen an Province were surveyed. The influencing factors were analyzed. Result s During the 12 months preceding the survey, 35.3% had the ideation of runaway from home and 7.2% tried to do it. Logistic regression analysis indicate d that smoking on-set age, living with stepfather, suicidal ideation, weight lo sing, loneliness, time of watching TV and insomnia were closely correlated with the ideation of runaway from home. Conclusion Effective measure s should be taken to prevent runaway behaviors among youths.

【Key words】 Intergenerational relations;Thought;Behavior;Fact or analysis,statistical;Students

为了解河南省城市初中生离家出走情况,以便为制订干预措施提供依据,根据中国疾病 预防控制中心(CDC)《中国青少年健康危险行为调查研究方案》的实施安排,河南省疾病预 防控制中心于2004年11月-2005年10月对河南省4个省辖市的青少年离家出走情况进行了调查 ,报道如下。

1 对象与方法

1.1 对象 选取河南省4个省辖市,共调查学生5 158名。其中男生2 554名 ,女生2 604名;一至三年级学生分别为1 796,2 069和1 293名;普通初中学生2 524 名,重点初中学生2 634名。年龄为11~16岁。

1.2 方法 采用分层整群抽样方法,首先将各省辖市市区内初中学校按类型 分为普通初中和重点初中2层,采用系统抽样方法抽取调查点校,再采用简单随机抽样方法 ,每个年级随机选取2~3个班。调查问卷采用中国CDC制定的“中国青少年健康相关行为调 查问卷”,离家出走是其中一部分。由经过培训的省辖市疾病预防控制中心学校卫生专业人 员担任调查员,在学校保健教师的配合下,组织学生以班级为单位进行不记名问卷调查。

1.3 统计分析 调查数据采用Epi Data软件进行录入,并采用双录入法对录 入数据进行核查,以保证录入数据的准确可靠。数据的统计处理采用Stata 9.0软件进行。

2 结果

2.1 离家出走意念 35.3%的学生调查前1 a想过离家出走,其中男生为31.7 %,女生为38.7%,差异有统计学意义(χ2=27.31,P<0.01);一年级学生报 告率为29.6%,二年级为37.7%,三年级为39.6%,差异有统计学意义(χ2=40 .94,P<0.01)。

学习成绩不同,离家出走意念的报告率也明显不同,自我评价学习成绩差、成绩中下等、成 绩中等、成绩中上等、成绩好的儿童离家出走意念的报告率分别为44.54%(163/366),43 .05%(406/943),34.80%(505/1 451),32.00%(423/1 322)和28.01%(145/516),差异 有统计学意义(χ2=56.04,P<0.01)。

2.2 离家出走行为 7.2%的学生在调查前1 a曾尝试离家出走。男生离家出 走的报告率(9.3%)高于女生(5.3%),差异有统计学意义(χ2=30.52,P< 0.01)。一年级学生离家出走报告率为6.6%,二年级为7.4%,三年级为7.8%,差异无统 计学意义(χ2=1.79,P>0.05)。自我评价学习成绩差、成绩中下等、成绩中 等、成绩中上等、成绩好的儿童曾尝试离家出走的报告率分别为14.60%,9.70%,6.55% ,4.93%和5.51%,差异有统计学意义(χ2=51.09,P<0.01)。

2.3 单亲家庭儿童离家出走倾向 603名单亲家庭的子女中,在调查前1 a曾 想过离家出走的为43.45%,高于双亲家庭(34.48%),差异有统计学意义(χ2= 8.75,P<0.01);曾尝试离家出走的占10.78%,高于双亲家庭(6.81%),差异有统计 学意义(χ2=12.52,P<0.01)。

2.4 重组家庭儿童离家出走倾向 66名重组家庭子女中,在调查前1 a中想 过离家出走的占62.1%,曾尝试离家出走的占21.1%,产生离家出走意念和曾尝试离家出走 的报告率均高于单亲家庭,差异有统计学意义(χ2=8.37,6.21,P<0.01或P<0.05)。

2.5 离家出走意念发生的相关因素分析 以离家出走意念有无作为因变量, 以父母文化程度、学习成绩、课外活动时间、课外补习时间、上网时间等47项相关影响因素 作为自变量(所有自变量均为二分类变量或有序变量),进行单因素非条件Logistic回归分析 ,最后筛选出31项因素具有统计学意义。

以离家出走意念有无作为因变量,以单因素Logistic回归分析具有统计学意义的31项因素和 行为作为自变量,进行多因素非条件Logistic回归分析(Backward法,剔除和选入变量的概 率为0.05和0.06),最后入选Logistic回归模型的影响因素有7项,模型回代的准确率为77. 0%。见表1。

3 讨论

调查结果表明,在河南省城市初中学生中,有35.3%产生过离家出走的意念。产生离家出走 意念与尝试离家出走人数之比约为5∶1。河南省初中学生离家出走意念及离家出走行为的报 告率均高于沈阳[1],低于广西[2]。离家出走意念、尝试离家出走的报告 率存在明显的性别差异,且随年级的升高而增加。女生尝试离家出走的报告率低于男生,但 离家出走意念的报告率却明显高于男生。本研究结果提示,父母离异、再婚、学业不良均是 影响儿童青少年离家出走行为发生的重要因素,首次吸烟年龄、节食减肥、孤独感、看电视 、失眠等因素和行为与离家出走意念密切相关。具有离家出走倾向的初中生其自杀意念的报 告率是正常学生的6倍,其OR值为6.63。对尚未成年的儿童来说,家庭和父母是他们成 长过程中的保护者和依赖者,一旦没有了依靠,而他们又不具有成年人独立解决问题的能力 ,离家出走便成为解决目前生活处境的一种办法。但离家出走不仅不能解决他们学习和生活 中遇到的问题,且由于没有收入,缺乏社会经验,增加了其他危险性,使他们常常成为犯罪 的受害者,被抢劫、殴打或遭到性攻击。离家出走的青少年,特别是经常出走的,很有可能 参与一些非法活动,包括吸毒、酗酒、的混乱等,对他们的生理和心理造成更加严重 的伤害[3]。在城市初中学生中,约1/3产生过离家出走的意念,这不能不引起政府 有关部门、家庭乃至全社会的高度关注。

4 参考文献

[1] 汤先伟,张丹,范康敏,等.沈阳市城区初中学生健康危险行为现状.中国慢性病预 防与控制,2001,14(2):88-90.

[2] 阮青,黄林,韩彦彬,等.广西青少年伤害相关危险行为流行状况调查.广西预防医 学,2005,11 (5):288-289.

[3] HAUKSSON H,ARNARSON EO.Operation of an emergency shelter in the Red Cross

第6篇:统计学变量的分类范文

关键词:数据挖掘;统计学;涵义

统计学如何为数据挖掘服务,这是在“数据挖掘”飞速发展的今天,统计工作者必须回答的一个问题,我国厦门大学的朱建平教授提出:“统计学应该随时关注数据分析,哪里有数据,哪里就应该有统计分析。”统计学是搜集、展示、分析和解释数据的学科,它拥有非常深厚的理论基础,并在社会生活的各个领域发挥着巨大的作用。近代统计学方法与信息处理的关系日益密切,作为信息处理的一个基本工具,统计学方法将发挥越来越重要的作用。

数据挖掘是近十几年里发展起来的一门崭新的学科,由于它与统计学都关心从数据中发现某种结构,因而从数据挖掘诞生之日起,就与统计学有了千丝万缕的联系。

一、统计学与数据挖掘的涵义

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察的系统数据,进行量化的分析、总结,进行推断和预测,为相关决策提供依据和参考;它分为描述统计和推断统计。描述统计包括对客观现象的度量、调查方案的设计,对所收集的数据资料进行加工整理、综合概括,通过图示、列表等方式进行分析和描述。推断统计是在搜集、整理监测样本数据的基础上,对有关总体做出推断,其特点是根据随机性的观测样本数据以及问题的条件和假定,对未知事务做出以概率形式表述的推断。

数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的,人们事先不知道的,但又具有潜在价值的信息和知识(模型或规则)的过程。这个定义包括以下含义:数据源必然是真实的、大量的、含噪声的;发现的知识可接受、可理解、可运用,并不要求发现放之四海皆准的知识,仅支持特定的发现问题。它能高度自动化的分析原有数据,做出目的性推理,从中挖掘出潜在的模式,从而帮助决策者调整策略,做出正确的决策。它融数据库技术、人工智能技术、数理统计技术和可视化技术为一体,是一个多学科相互交叉又融合所形成的一个新兴的具有广泛应用前景的研究领域。

二、统计学与数据挖掘的联系

(一)数据挖掘虽不同于统计分析,但许多挖掘技术又来源于统计分析,数据挖掘中有许多工作可以由统计方法来完成。比如预言算法(回归)、抽样、基于经验的设计等。

(二)数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。

(三)数据挖掘技术的出现为统计学提供了一个崭新的应用领域,也对统计学的理论研究提出了挑战。数据挖掘技术有相当大的比重是由高等统计学中的多变量分析所支撑。

(四)统计学与数据挖掘的结合日益紧密。数学是传统意义上统计学方法的首要工具,而计算机和网络为代表的信息技术,正逐渐成为统计学应用的首要工具。随着数据源的不断膨胀和数据结构的日益复杂,单纯依靠数据挖掘技术,已渐露力不从心之态,而统计学的同步发展,正不断充实、完善着数据挖掘技术。因此,随着信息化水平的提高,统计学与数据挖掘的应用平台渐趋统一。

三、预测性挖掘中常用的统计学方法

数据挖掘中应用的统计学预测性方法主要有判别分析和回归分析。其中,判别分析用于对离散型目标变量的预测,而回归分析则主要用于对连续性目标变量的预测。

(一)判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。判别分析是统计学的基本分析方法之一。

第7篇:统计学变量的分类范文

【关键词】 脑梗死; 血尿酸; 空腹血糖

中图分类号 R743.3 文献标识码 B 文章编号 1674-6805(2014)26-0065-02

尿酸是核酸中嘌呤碱的最终代谢产物,由于高尿酸血症往往与高血压、糖尿病、血脂异常等脑梗死的这些危险因素同时存在,高尿酸血症对人类罹患脑梗死产生的影响一直备受关注。近年来的研究证实,高尿酸血症除了明确与痛风的发病有关以外,也是脑血管病的危险因素之一[1]。而缺血性脑血管病(脑梗死)是老年人中的常见病,具有高发病率、高致残率、高复发率的特点,对老年人的危害极大。为进一步研究老年人高尿酸血症与脑梗死的关系,笔者对68例老年脑梗死患者和65例老年非脑梗死患者的血尿酸水平进行测定并做分析,现报告如下。

1 资料与方法

1.1 一般资料

选取2011年1月-2013年3月笔者所在医院收治的60岁及以上老年人发生脑梗死的患者68例,将其作为脑梗死组。其中男45例,女23例,年龄60~85岁,平均(69.6±8.5)岁。按1995年全国第四次脑血管病会议指定的诊断标准,所有患者入院后均经头颅CT或MRI检查确诊。对照组:随机抽取同期非心脑血管疾病老年患者(既往无心脑血管疾病病史)65例,其中男43例,女22例,年龄60~82岁,平均(71.3±9.1)岁。两组均排除患有肾脏疾病、肿瘤、肝肾移植后、血液病者,且近2个月未服用利尿剂等影响尿酸代谢的药物。两组患者年龄、性别、体重指数等一般资料比较差异均无统计学意义(P>0.05),具有可比性。

1.2 方法

两组患者均避免高脂及高嘌呤饮食,检查前禁食12 h以上,于入院后次日清晨空腹抽肘静脉血。采用SIEMENS公司生产的Dimension RL Max型生化分析仪,测定尿酸(UA)、空腹血糖(FPG)、总胆固醇(TC)、三酰甘油(TG)、高密度脂蛋白胆固醇(HDL-C)、低密度脂蛋白胆固醇(LDL-C)等指标。试剂由SIEMENS公司提供,操作方法按试剂盒说明书进行。

1.3 统计学处理

采用SPSS 19.0软件对所得数据进行统计分析,计量资料用均数±标准差(x±s)表示,比较采用t检验,计数资料采用字2检验,各组计量资料符合正态分布,数据采用二分类Logistic回归分析法进行多因素分析。P

2 结果

2.1 脑梗死组与对照组患者血清尿酸、血糖及血脂水平的比较

脑梗死组UA、FPG、TC、TG、LDL-C均高于对照组,两组比较差异均有统计学意义(P

2.2 脑梗死相关危险因素的Logistic回归分析

以是否发生脑梗死作为因变量,将上述两组比较差别有显著意义的各测量指标(UA、FPG、TC、TG、LDL-C)作为自变量,采用向前逐步法,进行二分类Logistic分析,获得P

3 讨论

嘌呤碱主要在肝脏、肾脏和小肠中通过黄嘌呤氧化酶降解,形成终产物尿酸,体内的尿酸主要由消化道和肾脏排泄。引起尿酸生成增多或排泄减少的因素均可引起循环中尿酸浓度增高,如高嘌呤饮食、代谢性和肿瘤性疾病、溶血、嘌呤代谢和尿酸合成途径中各种酶的活性变化、肾脏滤过功能减退及主动转换功能受损、有机酸排泄增加、某些药物如利尿剂和化疗药物影响等。老年人由于肾动脉硬化,肾血管阻力升高,肾血流相对减少,更容易引起高尿酸血症。高尿酸血症导致脑梗死的发病机制主要有:引起血管内皮受损,激活血小板,影响凝血及纤溶功能,引起炎症反应,引起血压升高,加重脂代谢异常等[2-4]。

本组资料显示,老年脑梗死患者的血尿酸水平(412.6±51.3)μmol/L明显高于老年非脑梗死者(298.6±39.8)μmol/L,比较差异有统计学意义(P

总之,血尿酸水平与老年人缺血性脑血管病的发生、发展和预后密切相关,脑梗死患者的血尿酸水平及高尿酸血症的发生率常高于非脑梗死者,且血尿酸水平与脑梗死发生率呈正相关,多数研究认为尿酸水平与脑梗死的预后呈负相关。因此加强对老年脑梗死患者血尿酸的监测和高尿酸血症的干预,对于改善预后、减少复发、提高患者的远期生存质量,无疑具有重要的临床意义。

参考文献

[1] Heo S H, Lee S H.High levels of serum uric acid are associated with silent brain infarction[J].J Neurol Sci,2010,297(2):6-10.

[2] Zhou H D,Wang Y J,Li J C,et al.Frequency and risk factors of vascular cognitive impairment three months after ischemic stroke in china:the Chongqing stroke study[J].Neuroepidemiology,2005,24(12):87.

[3] Iwashmia Y,Horio T,Kamide K,et al.Uric acid,left ventricular mass index,and risk of cardiovascular disease in essential hypertension[J].Hypertension,2006,28(2):195-203.

[4]李递通,梁志坚.尿酸与脑梗死关系的研究进展[J].医学综述,2013,19(4):612-614.

[5] Weir C J,Muir S W,Walter M R,et al.Serum urate as an independent predictor of poor outcome and future vascular events after acute stroke[J].Stroke,2003,34(5):1951-1957.

[6]杨淑琴,张泽萍.单纯药物治疗与联合高压氧治疗急性脑梗死临床分析[J].中国医学创新,2013,10(18):48-49.

[7]王丽.高尿酸血症与急性脑梗死的相关性研究[J].中国现代神经疾病杂志,2011,11(3):358-359.

第8篇:统计学变量的分类范文

关键词:统计学;教学模式;EXCEL

进入21世纪,随着我国市场化步伐的加快,社会对新知识的需求日益增加, 无论是国民经济管理,还是公司企业乃至个人的经营、投资决策,都越来越依赖于数量分析,依赖于统计方法,统计方法已成为管理、经贸、金融等许多学科领域科学研究的重要方法。教育部也将《统计学》课程列为财经类专业本、专科专业的核心必修课程之一。力图通过《统计学》的学习,使学生掌握探索各学科内在的数量规律性,并用这种规律性的解释来研究各学科内在的规律。同时,由于统计学所倡导的尊重客观实事,通过调查研究用实事说话,这也有利于培养学生的实事求是的学习、工作和科学研究精神。

一、《统计学》课程教学面临的挑战

1、内容日益丰富。长期以来,在我国存在两门相互独立的统计学——数理统计学和社会经济统计学,分别隶属于数学学科和经济学学科。20世纪 80 年代以来,建立包括数理统计学和社会经济统计学在内的大统计学,逐步成为我国统计学界的共识 。1992年11月,国家技术监督局正式批准统计学上升为一级学科。国家颁布的学科分类标准已将统计学单列为一级学科。随着大统计学思想的建立和统计学在实质学科中的应用的需要,大多数学校和老师在财经类专业的本、专科专业《统计学》教学过程中,除了保留社会经济统计学原理中仍有现实意义的内容,如统计学的研究对象方法、统计的基本概念、统计数据的搜集整理、平均及变异指标、总量指标、相对指标、抽样调查、时间序列、统计指数等;同时也系统的充实了统计推断的内容,如:统计数据的分布特征、假设检验、方差分析、相关与回归分析、统计决策等。这一变化使得《统计学》的内容更适合相关实质学科的发展需要。

2、学生的学习难度加大。首先、结合《统计学》的课程特点——概念多而且概念之间的关系十分复杂、公式多且计算有一定难度等。如果学生不做必要的课外阅读、练习和实践活动,是很难理解和掌握的。对于财经类专业的本、专科专业的学生来说,本身的专业课学习负担已不轻。其次、对于财经类专业的本、专科专业的学生来说,由于其本专业的课程体系要求,使得学生的数学或者数理统计的基础不是特别好,对于专科学生来说更不用说,推断统计将是他们学习的困难。再说,《统计学》作为专业基础课,一般安排在一年级或二年级第一学期,在这个学习时段也是大多数专科生和本科生忙于计算机课程和英语课程的考证时段。如果以牺牲授课内容和降低要求来减轻学生的学习负担,显然有悖于《统计学》课程的教学和相关专业的发展要求。所有这一切对于学生学好这一课程面临的困难可想而知。

3、教师的教学难度加大。授课内容越来越丰富;课程难度太大可能导致学生兴趣下降;在倡导学生自主性学习的背景下,授课时数大为减少(一般安排一个学期共17~19教学周,每周2~3课时);高等教育扩招后,由于师资力量一时没有跟上,大多数学校,授课班级学生人数越来越多,一个教师跨越不同专业授课不再新鲜。这要求授课教师必须深刻领会授课内容的核心和相互关系,学会控制和驾驭课堂教学,学会激发学生的兴趣,注重统计学在不同专业领域的具体应用等等。作为这门学科的授课教师特别需要认真考虑该怎么办?

二、《统计学》教学的发展趋势分析

1、统计学从数学技巧转向数据分析的训练。在计算机及计算机网络非常普及的今天,统计计算技术不再是统计学教学的重点了。统计思想、统计应用才应该是重点。现代统计方法的实际应用离不开现代信息处理技术。统计软件的使用,不仅使统计数据的计算和显示变得简单、准确,而且使统计教学由繁琐抽象变得简单轻松、由枯燥乏味变得趣味盎然。所以,在统计教学过程中,大量的内容只需要给学生讲清楚统计基本思想、计算的原理和正确应用的条件、正确解读计算的结果,而对大量复杂具体的计算可以交给计算机去完成。

比如方差分析,手工计算量非常大,没有计算机软件的支撑,是很难教学实际问题分析的。现在我们只要讲清楚方差分析要做什么,为什么方差分析要解决的中心问题是判断有无条件误差,而原假设又是K种不同水平下总体的理论均值是否相等,检验结果表示什么等就可以了,大计算量的工作让计算机去完成。

2、通过统计实践学习统计。也就是以学生为中心,通过课堂现场教学、引导学生先读后写再议、模拟实验、利用课余时间完成项目、利用假期时间,通过参加学校组织的某些团队、小组或自己组织去开展一些与专业有关的活动,如社会调查、专题研究、提供咨询、参与企业管理等方法。全方位地激发学生的学习兴趣、培养学生的专业能力、方法能力和社会能力。

比如依同学们在设计调查问卷和调查方案的基础上,让他们组成若干调查小组(如以寝室为单位),在校园内真正进行一次统计调查活动,从具体调查对象和单位的确定,样本的抽取(不一定要很大),问卷的发放、回收与审核,数据输入与资料整理,估计与分析,一直到调查报告的编写,调查总结或体会的形成,全部由同学自己来完成。这样,同学们就亲身参与了统计调查、统计整理和统计分析(含统计推断)的整个过程,效果很好。

三、基于EXCEL的《统计学》教学设想

如何从烦琐的数理统计技巧转向数据处理的训练,同时还要使学生容易掌握并有机会辅之于实践。教师的导向是第一位的,要求必须选择容易获得而且普及性比较强的统计分析软件,并在课堂教学和引导学生实践中广泛采用。

转贴于

(一)微软公司开发的EXCEL软件无疑是我们最好的选择

专业的统计分析软件SPSS、SAS、BMDP、SYSTAT其功能固然强大,统计分析的专业性、权威性不可否认,但是对于没有开设统计学专业的院校这些软件并不常用,如果学生要进行自主性学习也比较难以找到相应的工具,此外专业统计分析软件的英文操作界面,也让中国人用起来不是很顺手。微软公司开发的EXCEL软件作为一款优秀的表格软件,其提供的统计分析功能虽然比不上专业统计软件,但它比专业统计软件易学易用,便于掌握。在Windows操作系统极为流行的今天,EXCEL也是随处可见。对于《统计学》这门课程而言,利用EXCEL提供的统计函数和分析工具,结合电子表格技术,已能满足统计方面的要求。

(二)基于EXCEL的《统计学》教学设想

1、在教学内容上,依据EXCEL的函数功能、电子表格功能、数据分析功能,结合统计学原理的基本理论和方法,整合教学内容。比如传统的统计学原理教学过程中,对统计数据的搜集主要强调统计报表制度,在EXCEL环境应该更注重抽样推断,EXCEL提供的随机抽样工具使得抽样调查不再是十分复杂的技术,统计图也可以被广泛运用于对数据的描述;再比如现有统计学教材很多都讲根据整理的数据计算平均数时,都用加权平均的方法,当用组距式变量数列计算平均数时,用组中值作为各组的代表值进行计算。我们知道,组中值作为各组的代表值是假定各组变量值在组内是均匀分布的,如果实际数据与这一假定相吻合,计算结果比较准确,否则误差比较大。事实上实际数据往往就不是均匀分布的,因此用组中值计算的平均数都是近似的,而且相同资料编制的不同变量数列计算的平均数还不相等。其实为了编制变量数列,我们必须输入原始数据,EXCEL的有关程序可以得到准确平均数,哪里还有必要按加权算术平均的方法计算近似的平均数呢?那么有没有必要编制变量数列、特别是组距式变量数列呢?有没有必要按加权的方法计算平均数呢?我们认为有必要,但是组距式变量数列的主要功能不再是提供计算资料了,而是用于表现资料的分布状况和进行分析用;加权平均方法主要是介绍和要求学生掌握加权平均的思想,用于综合评价分析中。

2、案例教学成为《统计学》课程的重要内容。案例教学法不仅可以将理论与实际紧密联系起来,使学生在课堂上就能接触到大量的实际问题,而且对提高学生综合分析和解决实际问题的能力大有帮助。结合学生所学专业精选案例教学,比如对于金融专业的学生可以设计用几何平均数计算投资的平均收益率、运用标志变异指标考察投资组合的风险大小等。对于经管专业的学生,精选抽样推断、假设检验、方差分析对于控制产品质量,经营决策等方面的案例,深入浅出地介绍这些方法的基本思想、并用EXCEL进行分析。既激发了学生的兴趣、扩大了学生的视野,也使统计学的课堂不再是教师一块黑板、一支粉笔、一本教材、一张嘴巴就能将一门专业课程从头讲到尾。

3、改革考试方式和内容,合理评定学生成绩。考试是教学过程中的一个重要环节,是检验学生学习情况,评估教学质量的手段。对于《统计学原理》的考试,多年以来一直沿用闭卷笔试的方式。这种考试方式对于保证教学质量,维持正常的教学秩序起到了一定的作用,但也存在着缺陷,离考试内容和方式应更加适应素质教育,特别是应有利于学生的创造能力的培养之目的相差较远。在过去的《统计学》教学中,基本运算能力被认为是首要的培养目标,教科书中的各种例题主要是向学生展示如何运用公式进行计算,各类辅导书中充斥着五花八门的计算技巧。从而导致了学生在学习《统计学》课程的过程中,为应付考试搞题海战术,把精力过多的花在了概念、公式的死记硬背上。这与财经类专业培养新世纪高素质的经济管理人才是格格不入的。为此,需要对《统计学》考试进行了改革,主要包括两个方面:一是考试内容与要求不仅体现出《统计学》的基本知识和基本运算以及推理能力,还注重了学生各种能力的考查,尤其是创新能力。二是考试模式不具一格,除了普遍采用的闭卷考试外,还在教学中用讨论、答辩和小论文的方式进行考核,采取灵活多样的考试组织形式。学生成绩的测评根据学生参与教学活动的程度、学习过程中提交的读书报告、上机操作和卷面考试成绩等综合评定。这样,可以引导学生在学好基础知识的基础上,注重技能训练与能力培养。

参考文献

[1]谢安邦.高等教育学[M].北京:高等教育出版社, 1999.

[2]贾俊平.统计学[M].北京:中国人民大学出版社, 2000.

第9篇:统计学变量的分类范文

关键词:废旧家电;回收行为;Logit回归分析;分层回归分析

中图分类号:D9

文献标识码:A

文章编号:16723198(2015)17019101

随着工业革命的发展,人类进入了电子时代,电子产品已成为居民办公和日常生活的必需品,由于具有新功能电子产品的速度越来越快。这些产品方便居民日常生活的同时也给环境带来了巨大的压力,废旧家电处置不当不仅会对空气和地下水资源造成污染,也对环境和人类健康构成威胁。

1文献回顾

随着环境问题日益凸显,学术界纷纷在理论方面展开激烈探讨,试图从理论方面探讨造成这一问题的原因,国外学术界不仅在电子废弃物回收体系设计、回收设施布局及回收处理技术等方面进行了系统研究并取得了良好的成果,而且在居民电子废弃物回收行为方面也进行了深入研究。

在理论方面,Mannet主要考察了外部变量客观环境、回收便利性、自我能力等抑制回收行为的因素。陆莹莹和赵旭(2007)通过319个受访者,研究发现故去的回收习惯、知觉控制因素、居民的态度与回收行为成正相关,而主观规范无统计学意义。

2研究方法

2.1变量选取与问卷设计

问卷的设计主要借鉴以往的研究,同时通过与居民的访谈和小样本预试,对变量的测量题项进行修订,最终得到正式的量表。本文在前文文献综述的基础上,综合考虑环境心理学、社会学与经济学,提出影响回收行为的因素并分为内部变量(态度、道德义务、社会规范)与外部变量(法律法规、媒体宣传、社会责任感、环保知识、回收问题感知、回收经验、回收动机、人口统计学特征),并赋予这二类变量新的内涵。

2.2样本来源

选取峨眉山市居民为被访对象展开了问卷调查。考虑到研究对象应是在废旧家电中有一定回收权的居民,因此样本选取设定为年满18岁、具有稳定经济来源和固定工作的成年居民。研究于2012年12月15日至12月25日期间对西南交通大学校内人员及附近的居民进行了预测调查。对112个被试者进行调查。有98个被试者对问卷进行了完整的回答,回收率95%,回收效果较好适合做进一步分析。

3结果与分析

3.1描述性统计分析

(1)废旧家电回收频率与付费意愿都比较低。

本次调查显示,峨眉山市居民2013年回收废旧家电的平均回收废旧家电的次数为0.6次,平均付费意愿为1.9。调查结果还显示,有45.4%的受访者从未回收过电子废弃物,这个数字如此惊人,很可能与人们对废旧家电含有有毒物质和回收渠道的认识有关,进行过两次及以上回收的人数只有11%,可见,峨眉山市的废旧家电回收处于形成期。

(2)废旧家电回收态度积极。

废旧家电回收不仅仅指回收家电,也包括进行回收活动的态度心理因素,经统计发现78%的居民认为如果废旧家电不能得到正确处理,废旧家电的回收利用过程会对环境产生危害,不管是否参与过废旧家电回收,居民都倾向于对环境友好型的回收意愿,表明居民回收态度与回收意愿呈正相关,在下一节中得到验证。

3.2logistic回归分析

为探索上述公共因子对欠发达地区居民回收行为的实际作用水平,利用SPSS19.0软件进行logistic回归运算,选择Enter形式(自变量全部进入模型)。

从结果可以看出,HL检验的概率值Sig=0.727(>0.05),说明拟合较好,各影响因素的结果如下:

(1)内部变量的各个影响因素,态度、道德义务、社会规范的显著水平均为,在统计学意义上十分显著,表明内部变量是影响居民回收行为的主要变量;

(2)外部变量中的回收知识、经济动机、服务动机的显著水平均在小于0.005水平下显著,可视为对因变量有显著影响,情境因素中的法律法规、媒体宣传、社会责任感全部变量均无统计学意义,回收问题感知无统计学意义,人口统计变量均由一定的统计学意义,但不显著,回归系数均小于0.005。

4启示与建议

本研究的目的是为了了解居民的废旧家电回收行为的影响因素及相互作用机理,从而为废旧家电管理者提供理论决策参考。通过对居民回收行为的空间属性特征分析,验证了个体回收模型,根据研究结论为管理者设计回收网络体系提供以下几点建议:

4.1建立便利的回收渠道

由于我国还没有建立规范的废旧家电回收体系,以目前回收的方式来看,对于没有小区资源回收站的住户来说,存在不少困扰,减低了居民回收的意愿,建

议以小区为单位设立废旧家电回收站,集中小区内的

废旧家电,针对此问题,本研究提出以下建议:(1)以小区为单位设立废旧家电回收站,使居民能随时将家中的电子垃圾送至回收站,其它的公共场所与便利店等也可以广设资源回收站,方便居民随时放置电子垃圾;(2)政府单位应该提供居民更多有关回馈制度的信息,使居民知道更多的方式与管道,从资源回收中获得经济报酬,增加回收的意愿。