公务员期刊网 精选范文 数据分析报告范文

数据分析报告精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数据分析报告主题范文,仅供参考,欢迎阅读并收藏。

数据分析报告

第1篇:数据分析报告范文

其中一个原因可能是小企业受众非常多样化,行业范围跨越咨询,零售,食品,农业,科技等。即便在行业内,中小企业的需求也非常个性化并容易随着市场,运营,销售和财务情况而改变。

针对这点,American Express OPEN’数字营销和创新部门的副总Scott Roen在接受eMarketer采访时表示:当你细看中小企业的核心需求和挑战时,你会发现他们是时间敏感性的群体,他们不是那种整天坐在建好的大厦,呆在电脑旁的人,他们是没有围墙的,与客户和雇员在一起工作,他们天生是移动的。

小企业对笔记本电脑和智能手机的倾向性可能对B2B营销人员而言是个机会。Inc. Magazine和 Cargo发现91%的美国小企业主重视无线通信和智能手机对他们生意的重要性,这可能反映了他们每天的使用。平板电脑也被64%的受访者所看重。

第2篇:数据分析报告范文

【关键词】示范高职院校;超效率DEA;规模效应;评价模型

数据包络分析方法(DEA)为评价示范高职院校规模效益提供了一个优质的工具,其实质是根据一组关于多输入、输出的观察值来估计有效生产的前沿面,并据此进行多目标综合效果评价,并且不需要主观赋予指标的相对权重,因此评价结果更能够反映决策单元(Decision Making Unit, DMU)所处的实际状态。

但现有的研究基本存在三个缺陷:一是由于对高职院校规模效益的投入产出指标体系缺乏研究,从而不能合理的评价其规模效益;二是传统的CCR和BCC模型对于多个同时有效的决策单元(效率值为1)将无法做出进一步的评价与比较;三是采用的数据陈旧、不能反映近期示范高职院校规模效益情况。

综上考虑,本文在构建合理的示范高职院校规模效益评价指标体系的基础上,采用超效率(Super Efficiency)评价模型对浙江省22家示范高职院校2010年和2011年规模效益进行了实证研究,以衡量其规模效益。

1.模型及方法

1.1 DEA基本模型简介

数据包络分析(Data Envelopment Analysis, 简称DEA),是对具有多投入、多产出的决策单元(Decision Making Unit, DMU)进行相对有效性评价的一种非参数方法(Charnes et al.,1978)。

DEA方法能在同其它被考察单元相比较的情况下测量出某一被考察单元相对生产效率,假定一组被考察单元的个数为n个,每个被考察单元都有s个输出变量和m个输入变量。yjk表示第k个被考察单元的第j个输出变量, xik是第k个单元的第i个的输入变量。第k个决策单元总效率计算问题可以转化成如下面的线性规划问题:

minθ

s.t.■X■λ■≥θX■

■Y■λ■≥Y■

λ■≥0 (j=1,2,···,n)

其中,X■=(x■,x■,···,x■),Y■=(y■,y■,···,y■)。此模型称为CCR模型,是在规模收益不变(constant return to scale;CRS)假设下得到的。这里的θ即是第k家被考察决策单元的效率值,满足0≤θ≤1。其经济含义为:在某一决策单元产出Y可由所有k个决策单元产出线性组合替代的情况下,它的投入X的可压缩程度,压缩比例的大小为θ,θ也称之为效率测度值。当θ=1时,表示该被考察单元是效率前沿面上的点,因而处于有效率状态。当θ

Banker et al.(1984) 在该模型基础上提出了规模收益可变(variable return to scale)模型,即在CCR-DEA模型中加入一个条件■λ■=1得到的BCC模型。

然而,从上述基本DEA模型可以发现,其测算结果将所有DMU简单分为两组,一组为有效率DMU并据此形成Pareto边界, 另一组则属于无效率。对于这些有效单元若继续进行评价,上述模型是无能为力的。针对这一情况,为了区别这些有效率的决策单元,Andersen与Petersen(1993)两位学者提出构建超效率DEA模型测算所谓的超效率(Super Efficiency),将位于效率前沿面上决策单元再加以排序,而Tone(2002)认为可以由剔除具有效率的决策单元,判定决策单元到其余生产可能集合的距离来判断超效率的差异。

1.2超效率DEA模型

超效率CCR-DEA模型(Super–Efficiency CCR-DEA, SUP-CCR-DEA)的基本思想是在进行第k个决策单元效率评价时,使第k个决策单元的投入和产出被其他所有决策单元投入和产出的线性组合代替, 而将第k个决策单元排除在外,而CCR-DEA模型则将这一单元包括在内。

SUP-CCR-DEA模型能够有效地区别出有效(效率值为1)决策单元之间的效率差异,可以对所评价的决策单元进行有效的排序,其模型如下:

minθ

s.t.■X■λ■≤θX■

■Y■λ■≥Y■

λ■≥0 (j=1,2,···,n)

这里各数学符号含义同前,所不同的是,由于上述模型算出的数值有可能大于1,因此可以对有效率的决策单元运算出的效率值再加以排序,即可区分出CCR-DEA模型中效率值都为1的决策单元,在SUP-CCR-DEA模型中,对于无效率的决策单元,其效率值与CCR-DEA模型一致,而一个有效的决策单元可以使其投入按比率增加,而其效率可保持不变,其投入增加比率即其超效率评价值。例如对于有效率的示范高职院校,其效率值为1.51,则表示该示范高职院校即使再等比例地增加51%的投入,它在整个示范高职院校样本集合中仍能保持相对有效即效率值仍能维持在1以上。

2.规模效益指标体系的建立

运用DEA的过程中,最为重要的一个环节便是投入产出评价指标的设计,本文尽量选择能够反映高职院校资源配置效率的输入输出指标体系:

(1)在高职院校的输入指标方面,本文将其界定为三个方面:人力、物力和资金等方面的投入。

其中,人力资源的投入包括生源的数量质量、师资队伍的数量结构,而且应该包括学生投入学习、教师投入教学科研的时间和精力。高职院校物的投入主要是考虑学校的硬件设施投入情况,如学校校舍状况、实训场地、实验实训设备投入、图书馆等信息资源投入情况。财力投入指的是学校每年经常性支出,主要是教学科研经费、学生管理经费、办公费等。

(2)高职院校的产出也有三种形式,即直接产出、间接产出和最终产出。直接产出是教师的教学活动。间接产出是学生增长了专业知识、发展了智能和提高了操作技能,是学生消费教学劳务的直接成果。而最终产出是高等教育提高劳动质量而为社会创造财富。根据高职院校办学过程,和投入指标分析类似(具体分析过程暂略),分别从数量角度和质量角度得出高校产出结构,输入输出指标汇总如表1。

表1 示范高职院校规模效益有效性评价指标体系

综上可以看出, 上面选取的投入产出指标体系较科学、全面地反映了示范高职院校的投入和产出,满足了高职院校规模效益所蕴含的要求。

3.高职院校规模效益计算结果与分析

3.1 样本与数据

本文实证研究所采用的资料,来自于2010~2011年度浙江省高等职业院校人才培养工作状态数据分析报告。

3.2 实证结果与分析

结合CCR模型和SUP-CCR模型和2010~2011年度浙江省22家示范院校统计数据开展实证分析,可以得到2010年和2011年的院校规模效益值(评价数据通过使用MATLAB7.1软件编程计算得到),结果如表2所示。

表2 示范高职院校规模效益评价结果

从表2中数据不难发现:

(1)CCR模型基本反映了示范高职院校的规模效益,但没对效率值为1的示范高职院校进行区分。

2010年有4家示范高职院校(浙江金融学院、浙江机电学院、金华职院、宁职院)CCR模型效率值为1,规模效益相对有效的院校约占整个样本院校数量的19%;温州职院、浙江警官学院、浙江工贸学院、浙江经济学院、浙江交通学院、浙江工业学院等7家院校规模效益相对良好;其余示范高职院校规模效益不太理想。

2011年有7家示范高职院校(浙江金融学院、宁波职院、浙江机电学院、金华职院、温州职院、浙江警官学院、浙江工贸学院)实现了规模效益相对有效性,即θ=1,规模效益相对有效的院校约占整个样本院校数量的32%;有9家院校(浙江经济学院、浙江交通学院、浙江商业学院、浙江工业学院、浙江旅游学院、浙江艺术学院、湖州职院、丽水职院、杭州职院)呈现良好的态势,θ值接近1,分别排在8~16名;其它的6家示范院校规模效益一般,排名靠后。

(2)SUP-CCR-DEA对效率值为1的示范高职院校的成本效率进一步进行了评价排序,解决了CCR-DEA有效院校的排名问题,而无效率的院校得分完全同CCR-DEA的评价得分。

2010年浙江金融学院规模效益排在第一位, 宁波职院第二位。浙江机电学院、金华职院、温州职院和浙江警官学院分别位居第三到第六位,但效率值都大于1。而其它效率值小于1的示范高职院校成本效率得分完全与CCR模型的评价得分相同。

2011年宁波职院排在了第一位, 浙江机电学院排名第二, 浙江金融学院退至第三位, 金华职院排第四,浙江工贸学院升至第五。

值得注意的是,DEA有效是相对的,因此在评价中,有效的院校并不是不需要改进,与省外很多同类院校或者与本科院校相比还有不少差距,而且有效的院校之间也存在差距,这些院校仍需针对自身特点,充分挖掘影响效率主要因素,进一步提高院校的资源配置能力, 改善其状况以提高规模效益。

4.结语

在本文的实证分析中,采集了22家示范高职院校2010~2011年度的统计数据,开展了院校各年度规模效益相对有效性的纵横向评价研究,获取了示范院校在2010和2011年度的规模效益评判值,掌握了院校的运行状况并试图揭示院校运行现状和在同行业内所处的地位。结合横向和纵向分析的结果,可以全面地、深入地、客观地评判示范院校的规模效益,但鉴于篇幅所限,规模不经济院校松弛变量输入冗余额S-和输出不足额S+的值未列出,列出后可以看出各项指标改进值,有助于院校找到规模不经济的原因,从而提高资源配置效率。

【参考文献】

[1]Tone K.A slacks-based measure of super-efficiency in data envelopment analysis[J].European Journal of Operation Research.2002,143:32-41.

[2]Andersen P, Petersen N C.A Procedure for Ranking Units in Date Envelopment Analysis[J].Management Science.1993,39(10):1261-1264.

第3篇:数据分析报告范文

1、代码(403)渔业经营收入方面比去年同期增加56000元,原因是去年同期受持续降雨影响,大部分养殖户(养殖南美白对虾)圴有不同程度的损失,而今年年初越冬棚虾却有大幅的价格上升,所以今年上半年渔业收入方面有少许增加,但从本村总体情况来看,因四、五、六月开始南美白对虾价格持续下滑,故从总体来看,本村渔业经营收入方面与去年同期相比差距不是很大。

2、代码(412)渔业生产费用支出方面,比去年同期有所增加,原因是受到鱼塘租金上升及渔业生产资料(虾料)价格上升所影响。

3、代码(317)财产性现金收入比去年同期增加22970元,主要受代码(405)村集体分红影响,本村集体分红主要来自两方面:一是年终分配款,二是口粮款;这两方面的收入又受到本村集体鱼塘租金及花地租金的多少而决定,随着现在每年鱼塘租金的上升,故村民集体分红也跟着增加,这是今年上半年财产性现金收入增加的原因。

4、代码(320)期内非收入所得现金增加57500元,主要受代码(323)取回存款所影响,与去年同期相比,取回存款增加57500元。

5、代码(315)工业和建筑业经营收入与代码(333)工业建筑业生产费用支出,此两项与去年同期相比减少近11万多元,原因在两方面:一是去年登记数据时是按不扣除成本即总收入来登记,而今年上半年开始,登记时是按扣除成本的净利润来登记,故是造成差距极大的原因;二是本村“吴开荣”一户是经营毛织厂的,去年均是全年经营,而今年开始此毛织厂每月才开工两、三天,故经营收入或支山均有较明显的减少。

6、代码(340)居住现金支出:比去年同期增加6万多元,此项受代码(415)新建(购)房支出影响,原因是有一户有新建房屋支出。

7、代码(342)医疗保健支出:比去年同期有所增加,原因是有一户有一个新出生婴儿,所以在保健方面费用有所增加。

8、代码(343)交通通迅支出:此项比去年同期有所减少,原因是外出(远行)减少,所以交通费用相应减少。

9、代码(418)教育费用支出:比去年同期有所减少,原因是去年有部份读高中或中专的学生去年7月已毕业,今年上半年在读的学生绝大部分是初中生或小学生,学费相对较少,甚至有一户有一学生已没有上学(个人原因辍学),所以教育费用相应减少。另外代码(419)旅游费用支出方面,今年上半年16户之中均没有外出旅游,故此项没有支出。

10、代码(339)衣着消费支出和代码(353)存入银行信用社款的减少,这些项目主要是受农户“主观性”原因所影响,不用深究!

第4篇:数据分析报告范文

摘要: 目的 以社区健康服务中心为基本研究单元,应用数据包络分析法(DEA)开展社区高血压综合防治效果评价。方法 采取单纯随机抽样方法,抽取39个社区健康服务中心,运用数据包络法评价社区健康服务中心综合防治效果。结果 社区健康服务中心社区高血压综合防治DEA有效率667%,DEA无效社区健康服务中心的问题主要为患者服药依从性和生命质量得分较低,其不足率分别为2268%和821%。知晓率较高,不足率为071%,接近理想产出。结论 DEA对高血压综合防治进行效果评价,其结果可靠、科学。

关键词: 社区;高血压;综合评价;数据包络分析

Data envelopment analysis for evaluation on effect of comprehensive prevention and control on hypertension

Abstract: Objective Based the community health service,using data envelopment analysis(DEA) to evaluate the effect of current model of comprehensive prevention and control communitybased for hypertension in Shenzhen city.Methods Thirty nine community health service centers of 6 districts in Shenzhen city were sampled using random cluster sampling,and the effect of prevention were evaluate by DEA.Results The result of DEA showed that there were 26 centers (667%) reached the best InputOutput ratio within those;and the main problems of 13 inefficiency centers were lower level of compliance rate,control rate of bloodpressure,satisfactory extent and scores of life quality.The insufficient rate were 2268% and 821%,respectively.Whereas the aware rate of hypertension was close to ideal output,the insufficient rate was 071%.Conclusion The result from using DEA to evaluate the effect of comprehensive prevention and control communitybased for hypertension is reliable and scientific.

Key words: community;hypertension;comprehensive evaluation;data envelopment analysis (DEA)

项目评价为项目管理中的重要环节,目前的多指标综合评价方法对同一类型项目的横向比较,由于不能很好解决指标权重赋值和共线性问题,使得评价结果不尽人意。数据包络分析(data envelopment analysis,DEA)是近年来所发展的一种新的项目绩效评价方法,由于它在处理多输入、多输出问题上的绝对优势,目前已成为评价具有相同类型投入和产出的若干部门(决策单元)相对效率的多指标综合评价方法〔1〕。本研究将DEA用于公共卫生服务项目,以深圳社区健康服务中心为基本评价单元,对深圳市高血压社区综合防治的投入产出效率进行客观评价,找出低效率社区健康服务中心的原因所在,为深圳市慢病社区综合防治的量化管理提供科学依据。

1 资料与方法

11 资料 来源于深圳市科技计划项目《社区慢病综合防治模式及评估指标体系研究》专项调查。课题组对深圳市222个社区健康服务中心采取单纯随机方法,抽取了39个社区健康服务中心。采用自编调查问卷,在调查前向被调查者说明知情同意内容,如本人同意后调查。本调查询问并收集了社区健康服务中心运行情况及其管理的1907名社区高血压患者的知识,态度,行为(KAP)得分、满意度、依从性及生命质量等;在文献复习的基础上,通过统计学筛选,确定了防治效果评价指标体系〔2-4〕,包括投入和产出2大类共计6项,具体为:(1)资源投入指标:千人医生数和业务收入;(2)效果产出指标:满意率、知晓率、服药依从性和生命质量得分。

12 相关指标定义 参阅文献〔2-5〕。其中患者服药依从性,采用服药依从性量表(MORISKY)推荐的高血压病人服药依从性测量问卷进行测量〔6〕。深圳社区高血压患者药物治疗在全国《高血压防治基层实用规范》指导下,采用个体化治疗原则。

13 统计分析 以SAS软件提供的运筹决策支持工具包SAS/OR为基础,采用自编SAS程序[7],进行DEA线性规划求解。

转贴于   2 结果

21 社区高血压综合防治效果评价指标体系情况 见表1。

表1 深圳市高血压防治投入、过程和产出指标一般情况(略)

22 DEA评价结果 在随机抽取的39个社区健康服务中心中,达到DEA有效的有26个(效率指数θ=1),占总数的667%。对13个社区健康服务中心的DEA无效(0

表2 13个DEA无效社区健康服务中心产出亏量情况(略)

将13个DEA无效社区健康服务中心平均产出亏量与其在4项产出指标的平均得分相比,即可得到无效社区健康服务中心各项产出指标的不足率。由此可以分析其投入产出无效的症结所在。可以看出,无效社区健康服务中心主要问题是服药依从性和生命质量得分不足,其不足率分别为2268%和821%,而知晓率(071%)和满意率(327%)与实际得分相差不大,表现尚可。

3 讨论

本研究结果表明,39个社区健康服务中心,达到DEA有效的有26个,占总数的667%。6个行政区DEA有效顺位为:南山区(3/3)、福田区(5/6)、龙岗区(3/4)、罗湖区(6/10)、宝安区(9/15)和盐田区(0/1)。表明深圳市各社区健康服务中心进行高血压综合防治,半数以上达到了较优的投入产出比,目前采用的以社区为依托、以健康促进为策略的高血压综合防治模式运作良好,有效的达到了高血压综合防治的目的。进一步分析表明,13个DEA无效社区健康服务中心的原因各不相同,主要问题为服药依从性、生命质量低,而知晓率和满意率表现尚佳,即存在健康教育理论所谓的知信行脱节现象,特别在特区外(宝安、龙岗)社区健康服务中心表现明显。随着降压药的不断更新换代,现有的降压药能使90%以上的高血压病人血压控制在正常水平〔7〕,但高血压人群中血压正常率并不高,美国1988~1991年的调查为27%,英国最近的调查为6%,原因是多方面的,其中最主要的因素是服药依从性差。较低的总体健康和生命力维度得分也表明,高血压患者总的健康状况较差,提示高血压患者的生存质量应该引起关注。因此,针对DEA无效的社区健康服务中心的不足之处,提高其人员配置水平,改进服务态度,加强健康教育力度,增强患者服药依从性,更好地控制血压,以达到最终提高高血压患者生命质量的目的。

参考文献

〔1〕 Sherman H David.Hospital efficiency measurement and evaluation:Empirical test of a new technique[J].Medical Care.1984,22(10):922938.

〔2〕 周学富,刘红建,王飞霞,等.社区高血压系统管理近期效果评估[J].实用预防医学,2002,9(1):1013.

〔3〕 刘运海,杨期东,刘尊敬,等.队列人群心脑血管病危险因素干预效果评价[J].中华流行病学杂志,2003,24(2):102105.

〔4〕 谢虹,詹思延,孔灵芝. 我国社区慢性病综合防治示范点组织管理评价指标体系的建立[J].中国农村卫生事业管理,2002,22(5):3134.

〔5〕 茅福成.医院满意度调查统计方法探讨[J].中华医院管理杂志,1994,6(15):358359.

〔6〕 Dusing R.Adverse events,Compliance and change in therapy[J].Current Hypertension Rep,2001,3(6):488492.

第5篇:数据分析报告范文

Abstract: Nowadays some researches have already applied data envelopment analysis in university research management access. However, the existed models deviate from the facts of the current university research status, with faults on the respects of discipline difference, university difference and index choosing. This research advises introducing weighted DEA model, cross-benching DEA model and undesired output DEA model to make it up.

关键词:高校;科研管理;数据包括分析

Key words: university;research management;data envelopment analysis

中图分类号:G31文献标识码:A文章编号:1006-4311(2010)05-0157-02

0引言

高校科研管理在推动高校科研工作进步中发挥着重要作用,为更完善地做好相关工作,建立良好有效的科研绩效评价体系是必要的。该评价体系应建立在科学理论基础上,并有着科学的实施方法。

数据包络分析(DEA)方法为建立科研评价体系提供了一种思路。有很多学者循着这一路径进行了探索和积累。运用DEA方法进行高校科研绩效评价的国内外尝试主要有以下:

在国外,Geraint Johnes 和 Jill Johnes(1993)分析了英国大学经济系的科研效率。Avkiran N K(2001)研究了澳大利亚大学的技术效率和规模效率。Banker R D、Janakiraman S、Natarajan R(2004)研究了得克萨斯公立大学的科研投入产出效率。Johnes,J(2006)分析了中国高等教育机构的科研效率问题。Ng,Y(2006)分析了中国高等教育机构的科研效率问题。

在国内,田东平、苗玉凤、崔瑞锋(2005)对我国重点高校的科研效率进行了DEA分析,陈凯华(2006)试图建立高校院系运行效率的均衡评价模型,利用DEA(Max-Min)强化互评模型。孙世敏、项华录、兰博(2007)得出我国西部地区的高校科研投入产出效率相对较低,且大多处于规模效率递增阶段的结论。张运华、吴洁、施琴芬(2008)运用价值链效率DEA模型对我国高校科技投入产出及科研成果转化效率进行了分析。成刚、孙志军(2008)分析我国高校1998-2005年的效率状况,发现DEA和SFA的效率值相关但不显著。赵书新、郑林昌(2009)选取北京市13所重点高校作为样本,对北京市高校科技投入产出效率进行评价。另外,赵正洲、王鹏(2005)、王莹、刘延平(2007)、陆根书(2007)、段永瑞、霍佳震(2007)、童康(2007)、田水承、孟凡静(2008)、成刚、林涛、穆素红(2008)、梁权森,彭新一(2008)、李清彬、任子雄(2009)等也都主要使用DEA方法分析了国内高校的科研投入产出问题。

以上成果是本研究的良好基础和借鉴。本研究试图更进一步地拓展DEA方法在高校科研管理方面的运用。

1现有研究成果模型设定的不足

现有成果在高校科研管理绩效评价研究中运用数据包络分析方法时,其模型设定上尚有改进的余地。现有成果一般运用的是CCR模型,以田东平、苗玉凤(2005)为例,其模型为:

D■=min[θ-ε(■■■TS■+eTS■)]=V■s.t.■X■λ■+S■=θX■■Y■λ■-S■=Y■λ■?叟0,j=1,…,nS■?叟0,S■?叟0

■■■T=(1,1,…,1)∈Em,eT=(1,1,…,1)∈Es

另外在加入了∑λ■=1的限定条件后,也使用BCC线性规划模型。但这和高校目前的科研现状尚有一定的差距。

1.1 在学科差异方面存在不足由于文、理、工、农、医等学科的天然差异,简单地以一种模型套用所有学科的投入产出绩效是不足的。例如工科单位的经费收益会显著多于文科单位,而经管法学科单位的政府报告采纳显著多于其他单位。置于同样的模型中加以计算会得出不符合事实的结论。学科差异不仅体现在不同的高校间,也体现在同一高校内部。在分析时,现有的模型需要进行相应的更改。

1.2 在学校差异方面存在不足在科研绩效上,可能也存在一定的“马太效应”。DEA毕竟是一种相对性分析。重点院校由于得到大力扶持,所以在投入产出方面也可能进入良性循环,由于对其投入加大而导致效率提高。而非重点院校,相对而言,可能因为投入少而导致产出更少。正因为这样的因果互动,单向的投入产出分析可能会得出要进一步加大对重点院校的投入的结论。这会误导决策者,人为地拉大各校的投入差距,而损害长远的整体绩效提高。

1.3 在指标选取上存在不足目前的科研产出指标选取就长远而言并不一定能完全推动科技进步。由于强调量化考核和职称标准,导致科研产出存在浮躁和泡沫现象。在大量科研良好成果涌现的同时,粗制滥造的赝品也会出现。但现有的研究往往将其全部纳入科研产出一视同仁,这使科研绩效评价打了折扣。

2模型改进的可行途径

为解决上述的缺陷,建议变更数据包络分析模型。

2.1 赋权DEA模型通过赋权DEA模型控制由学科差异引起的评价不合理。模型设定如下:

min■=■

■w■=n

■w■=l

2.2 交互基准群DEA模型用交互基准群DEA模型控制不同级别高校的科研绩效评价。其原理如图1示意,是将高校按不同级别分为群,以各群相互为基准进行交互式评价。这样通过不同的分群方法,不仅能比较高级别高校对低级别高校的绩效差距,也比较同级别高校间的相对差距,使评价更为客观丰满。

2.3 非期望产出DEA模型用非期望产出DEA模型控制科研赝品。模型设定如下:

min■=■

s.t.(1-?准)X■-Xλ-S■=0

Y■λ-(1+?渍)y■■-S■=0

Y■λ-(1-?资)y■■+S■=0

在此,d代表期望科研产出,u代表非期望科研产出。w■代表期望科研产出的权重。wu代表非期望科研产出的权重。

3结语

目前运用数据包络分析方法研究高校科研绩效还存在一定可改进之处,在学科差异、学校差异和指标选取方面存在一定不足。本研究建议引入赋权DEA模型、交互基准群DEA模型、非期望产出DEA模型加以完善。

参考文献:

[1]成刚,孙志军.我国高校效率研究[J].教育与经济,2001,(4):1079-1104.

[2]CooperWW, SeifordLMand ZhuJ.Handbook on Data Envelopment Analysis,Springer (Kluwer Academic Publishers), Boston, 2004.

[3]段永瑞,霍佳震.基于数据包络分析的高校科研绩效评价[J].上海交通大学学报,2007,(7):1074-1107.

[4]孙世敏,项华录,兰博.基于DEA的我国地区高校科研投入产出效率分析[J].科学学与科学技术管理,2007,(7):6-8.

[5]梁权森,彭新一.基于DEA方法的研究型大学办学效益评价研究[J].高等工程教育研究,2008,(2):83-86.

第6篇:数据分析报告范文

关键词:财务分析;大数据;教学改革

作者简介:王晖(1973-),女,黑龙江鸡西人,北京信息科技大学经济管理学院,讲师;段文军(1969-),女,山东蓬莱人,北京信息科技大学经济管理学院,副教授。(北京 100192)

基金项目:本文系北京信息科技大学教学提高-专业建设项目(项目编号:5028023501)的研究成果。

中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)25-0111-02

当今时代不断涌现各种新型信息方式,例如博客、社交网络等;不断兴起各种新技术,例如云计算、物联网等。数据的产生不受任何的限制,数据以前所未有的速度不断增长和累积,大数据时代已经来到。[1]《华尔街日报》认为大数据时代是引领未来繁荣的三大技术变革之一。麦肯锡公司在一份报告中提出数据是一种生产资料。企业每天面对海量的财务数据,如超市的销售记录、银行的交易记录、淘宝网站数千万笔交易记录(产生量超过50TB,存储量40PB①)。企业如能利用这些巨大的数据集挖掘出有价值的信息,那么企业就能掌控下一个创新、竞争和生产力提高的关键。大数据时代,尤其是财务大数据时代,呼唤创新型人才。[2]呼唤具备综合财务分析能力的人才,利用财务大数据为企业创造财富。

如何培养财务分析人才?在财经类高校本科,一般都开设“财务分析”课程,该课程教学目的是培养学生对真实企业进行综合财务分析,并能独立撰写财务分析报告的能力。[3]本文以北京信息科技大学(以下简称“我校”)为例,探讨大数据时代下财务分析人才的需求特点,对高校“财务分析”课程设置的影响,并提出改进“财务分析”课程教学的建议。

一、大数据时代下财务分析人才需求特点

相较于其他类型数据,财务数据更大、更复杂,蕴藏着更多宝贵信息。麦肯锡公司2011年报告推测,利用大数据分析,零售商可增加运营利润60%,制造业设备装配成本会减少50%。[2]在财务大数据环境下,如何整理与统计这些杂乱无章的数据?如何让财务数据开口说话为企业管理者经营决策提供科学依据?朱东华(2013)认为,大数据时代下,传统的数据分析方法已经不再适应当前的数据环境,同时,各种企业对数据的依赖与日俱增,甚至定量分析方法将逐步取代定性分析方法。[4]财务大数据和大量的财务数据分析需求助长了企业对统计和数学背景的人才需求。

可见,大数据时代下财务分析人才应该具备扎实的统计学和数学功底,能够熟练运用定量分析方法分析数据以获取信息,撰写分析报告为企业相关利益人决策提供依据。

二、“财务分析”课程教学现状

张先治(2007)认为,财务分析是财务分析主体为实现财务分析目标,以财务信息及其他相关信息为基础,运用财务分析技术,对分析对象的财务活动的可靠性和有效性进行分析,为经营决策、管理控制及监督管理提供依据的一门具有独立性、边缘性、综合性的经济应用学科。[5]财务分析课程是为我校经济管理学院财务管理专业本科三年级开设的一门专业必修课。学生前期已经学过数学、经济学、会计学、财务管理、统计学等课程。财务分析课程正是在学生掌握前期所学各门课程的基础上,培养学生综合运用所学专业知识,分析判断企业的财务状况,并根据数据分析结果找出企业存在的问题,提出解决方案。[6]为了更好地实现“财务分析”课程教学目的,课程组的老师们经过讨论,决定修改2008级财务管理专业教学计划,将原来课堂教学的方式改为1/2的学时用于课堂教授基本理论,1/2学时用于实践教学。笔者自2011年开始,按照新的教学计划给三届学生讲授了“财务分析”课程。

1.理论教学部分

教材选用东北财经大学出版社出版,张先治和陈友邦主编的《财务分析》(第五版)。该教材体系完整,内容丰富,全书以一家虚拟的ZTE公司为例,演示财务报告分析、财务效率分析和财务综合分析。每章设有案例和复习思考题,该书还有配套的习题集。在课堂教学中,以教材为主线,突出介绍各种财务分析方法的使用,以及根据分析结果得出结论,提出解决方案。

2.实践教学部分

一人一企,边学边分析。每位学生选择一家上市公司作为分析对象,利用学校购买的金融数据库以及相应网络资源,结合所学财务分析理论知识进行上机实验,在Excel内完成数据分析,并将分析结果形成财务分析报告。学生分析判断和决策能力在实战中得以锻炼,教学效果得到改善。

但是,随着大数据时代的来临,外部环境对数据分析能力要求的提升,仅仅学会利用Excel进行水平分析、垂直分析、趋势分析、比率分析和因素分析,已经远远不能满足市场对财务分析人才的需求,学生就业的竞争力无从谈起。结合前面大数据时代下财务分析人才需求特点,我校学生财务分析能力的培养存在着以下问题:

1.学生数据收集、整理和分析能力弱

定量分析方法应用的基础是数据,财务分析人员必须学会从海量的网络资源中搜集并筛选与自己的分析对象和分析目的相关性较强的资料信息,[7]这些资料信息可能是结构化数据,例如金融数据库等;也可能是非结构化数据,例如网页等。从实践教学环节反映出学生数据收集和整理能力弱,分析其原因主要是:

(1)学生不熟悉对财务分析有帮助的网络资源。搜集有价值的数据需要一定的技巧,其中最为重要的是熟悉一些重要的网站,知道相应的数据应该在哪里找到的概率比较大,做到有的放矢。

(2)学生无法将非结构数据快速地转换成所需的数据形式。类似金融数据库这样的结构数据,学生基本能够筛选出所需信息。但是,对于类似网页这样的非结构数据,他们就只能运用最原始的复制粘贴的方法提炼数据信息,耗时且耗力。2013年2月1日,人保财险执行副总裁王和在中国第七届“保险业管理信息化高峰论坛”上指出,在过去的两三年里,结构和非结构数据发生了本质性的逆转。过去就整个社会来讲,绝大多数的数据是结构数据,而现在非结构数据正呈快速增长的趋势,现在以及未来,非结构数据将占到95%,甚至更多。

“财务分析”课程讲授的基本方法主要是比率分析和因素分析法等。目前,无论是学术界还是业界,研究人员大量使用统计模型进行财务数据分析,例如聚类分析、多元回归、因子分析、时间序列预测法等。因而,我校学生数据分析能力急需加强,尤其是统计学和数学的基础要扎实。

2.学生财务分析报告撰写水平有待提高

财务分析的结果是以财务分析报告的形式展示给企业利益相关人,为其进行财务预测、财务决策、财务控制和财务评价等提供可靠信息。财务分析报告是对企业经营状况、资金运作的综合概括和高度反映。李宝智(2012)认为,报告应具备八要素:准确、完整、可比、用户导向、相关、问题的解决方案、及时和易用。[8]从我校学生提交的财务分析报告看,与上述要求还有很大差距。

三、“财务分析”课程教学改革建议

1.培训网络资源使用

重点介绍几个数据库的使用:

(1)金融数据库。我校购买了两款金融数据库,北京聚源锐思数据科技有限公司金融数据库(http://)和深圳市国泰安信息技术有限公司CSMAR财经系列研究数据库(http://)。登陆金融数据库后,输入查询条件即可下载上市公司财务数据,速度快且数据量大,数据格式可以任意选择。

(2)中国资讯行(国际)有限公司高校财经数据库(http://),INFOBANK于1995年在香港成立,是一家专门收集、处理及传播中国商业、经济信息的香港高科技企业,信息范围涵盖19个领域、197个行业。

(3)国务院发展研究中心信息网(国研网)(http://.cn)。国研网已建成了内容丰富、检索便捷、功能齐全的大型经济信息数据库集群,包括:六十几个文献类数据库、四十多个统计类数据库等。

网站资源:中国证券监督管理委员会(http://)、上海证券交易所(http://.cn)、深圳证券交易所网站(http://)、巨潮资讯网(http://.cn)和相关协会网站等。

2.培养数据预处理和建模能力

收集到数据之后,需要对数据进行预处理,利用统计学的理论和方法将数据转换成一个分析模型。[9]学生在统计学、计量经济学课程中,已经完成基本模型理论、SPSS或者Eviews三分析软件的学习。但是,若想实现对大数据的整理和分析,应该掌握R或者Matlab统计分析软件,同时,还要掌握一种编程语言,例如C++、JAVA、C#等。利用编程语言调用统计分析软件,从而实现大数据的分析。另外,建议学生了解Perl语言编程,该语言擅长处理非结构数据。

3.培养文献阅读及财务分析报告撰写能力

数据分析之后,需要撰写财务分析报告,为各方利益相关者的决策提供依据。不同财务分析的目的,形成的财务分析报告具体要求会有所差异,但是撰写财务分析报告的基本步骤相同。首先查阅文献,阅读相关学术文章、财务分析师分析报告、评级机构报告等;其次,模仿写作,组织财务分析结果,形成报告。此中没有捷径,需多看、多写。

注释:

①1TB 等于1000GB,1PB 等于1000TB。

参考文献:

[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1).

[2]邬贺铨.大数据时代的机遇与挑战[J].求是,2013,(4).

[3]张肖飞.财经类高校《财务分析》课程案例教学改革研究[J].商业会计,2013,(1).

[4]朱东华,张嶷,汪雪锋,等.大数据环境下技术创新管理方法研究[J].科学学与科学技术管理,2013,(4).

[5]张先治.财务分析理论发展与定位研究[J].财经问题研究,

2007,(4).

[6]陈卫军,徐文学,陈平.基于上市公司网上资源的《财务分析》实训教学探讨[J].财会通讯,2012,(2).

[7]王桢.网络环境下财务分析案例教学方法的改进[J].中国教育信息化,2012,(1).

第7篇:数据分析报告范文

本文将针对数据分析,同时结合客服中心的具体需要,来帮助大家理清如何做数据分析、如何提高工作效率和质量、如何让分析出来的内容更有价值、如何才能够让领导认可。下面就是我在工作中总结出来的十个必须要问自己的问题(如图1)。

1. 目前领导的关注点是什么?

任何分析都是应该建立在企业整体战略之上的,了解领导目前的工作重心,自然就可以判断我们应该朝着哪个方向进行分析,这样才能够帮助领导全面深入地了解目前状况,从而决定要采取哪些措施。所以,要根据数据分析的受众对象来进行分析,把握好分析的整体方向与深度及广度。

2. 分析的主要目的是什么?

分析之前要考虑为什么要做分析,在这里我们举例来说明。例如在考虑上一问题时我们假定目前领导主抓服务水平(20秒接通率),那么我们在这里就应该清晰分析的目的就是分析目前整体服务水平在历史中处于什么水平?问题出现在哪里?我们应该在哪些方面上采取措施来提高服务水平?

3. 需要哪些数据来支撑分析?

在明确了分析目的之后,我们就要准备数据。在这里我们要先根据客服中心运营的经验对可能影响到服务水平的因素进行提前判断,以确定我们需要哪些数据来支持我们做分析。像对服务水平产生影响的因素可以有人员方面、系统方面、流程制度方面等,所以我们可以分析话务量、排班人员情况、人员出勤状况、在线人数、示忙人数、离席人数、平均通话时长、平均事后处理时长等数据。

4. 数据应该从哪里收集?

现在我们已经明确需要的数据有哪些了,下面就是开始收集数据,最主要的数据来源就是目前客服中心内部现有的报表系统。在这里我们假定报表系统是完善的,可以根据我们的分析需求来随意提取任何数据,当然有些数据是很难在系统中提出的,这时我们就需要手工进行数据收集。

5. 应从什么角度进行分析?

这个问题其实在第三个问题中就已经区分出来了。举例来说,我们可以分析不同时段的话务情况以及各时段对应的排班人数,以此来判断是否是人员不足或者是话务突增造成的服务水平低。最终,通过不同角度进行定性与定量的综合分析,找出问题到底是人的原因、系统的原因、还是流程制度的原因。

6. 应该用什么分析方法?

我们只需要掌握一些简单的分析方法即可满足目前客服中心的日常分析需求。选择分析方法的原则就是只选最合适的不选最高深的。一般我们可以用到的分析方法有:

对比分析:在同一分析维度下对不同数据集合进行比较,找出其中存在的差异,并进一步深入挖掘差异原因;

趋势分析:观察数据序列随时间的变化趋势,找出其一般规律,如移动平均、同比、环比等;

排名分析:将大量数据按某种分类方法进行频次统计,观察其中的Top N数据,反映其对整体的影响程度如何;

结构分析:在统计分组的基础上计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构变化规律;

相关性分析:测量某两个变量之间的相关程度,即当一个变量发生变化,另外一个变量也会随之发生的变化趋势。

7. 如何展示分析结论?

1) 根据不同的报告选择不同的展示工具

我们一般是以分析报告的形式来展示分析结论的,根据不同的报告类型选取不同的工具进行展示。报告大致区分为三种:日常运营状况分析报告、专项问题解决报告、历史数据(问题)研究报告。

用PPT撰写分析报告可以加入丰富的元素、动画效果等,图文并茂,适合现场演示汇报,大大增强展示效果;但是不适合大篇幅的文字,对于汇报人员的演讲技能要求较高;专题分析报告与历史研究报告均可以使用PPT来制作。

用Word撰写分析报告易于排版,显得相对正式;但是缺乏交互性,不适合演讲汇报;适合撰写各类型的分析报告。

用Excel则适合日常报告的撰写,还可以有动态的图表,方便实时更新、交互性较强,但不适合演讲汇报。

2) 根据不同内容选择不同的展示图表

数据展示的原则就是简单直观、清晰易懂, 在选择图表来展示数据时需要考虑清楚我们想要展示给领导什么,要说明什么问题。用来展示数据的图表大致有用饼图、条形图、柱状图、折线图、散点图、雷达图、面积图。

以下给出几个图例供大家参考(说明一下,图表的标题已经去掉,只展示图表大致形式)。

8. 产生问题的原因有哪些?

经过以上的综合分析我们可以判断是以下原因:

人员问题:人员招聘不足、排班不够合理、人员出勤差、人员接续效率低、人员培训效果不明显等问题;

系统问题:话务系统故障、知识库系统故障等问题,具体是什么问题需要查看系统故障的历史记录;

流程制度问题:管理流程和服务流程不合理、过于复杂,职责界定不清晰、制度不完善等问题

9. 可以采取的措施有哪些?

在经过全面的分析后,将造成服务水平低的所有因素按照重要性进行排序,根据80/20法则首先解决重要的影响因素,针对各影响因素的不同采取不同的措施进行改善。制定改善计划需要明确改善的事项是什么、负责的人员(或部门)是谁、预计的周期是多长等要素。

10. 最终的改善效果如何?

第8篇:数据分析报告范文

【关键词】投资 可行性分析 作用

现阶段全世界都向着全球化和一体化方向不断迈进,尤其是在世界经济贸易方面,各国之间的联系越来越紧密,市场竞争也更加复杂更为激烈。在这种经济大环境之下,投资者的每一次的经济投资都面临着巨大的风险和挑战,甚至有血本无归的可能。投资者在进行经济投资的决策之前一定要做出完整的可行性分析报告,这对于提高决策者的决策效率,降低决策者因为个人感情因素以及对国家及地方政策不了解或是了解不全面而造成的决策失误,错失最佳的投资良机情况出现的可能,还可以起到优化市场资源配置,使自然资源得到最充分的分配和利用,提高产品的市场竞争力等作用。因此,本文就对在现实经济实际投资过程中,投资可行性分析所起到的重要作用进行深入分析和研究。

一、经济投资可行性分析的原则

(一)前瞻性

可行性分析最为基本的原则就是前瞻性,这也是投资可行性分析存在的最大意义。前瞻性,顾名思义就是在事件发生之前对其发展趋势及最终结果进行预判。从经济管理方向来说,可行性分析是预控行为的一部分,经济投资前对于要投资的对象是否具有升值空间运用已有资料进行合理分析,对投资的收益性做出预判,所以这一分析本身就是一项有预测性质的活动。在进行投资目标的实际可行性分析的时候,要时刻谨记这一重要原则,对于可能对投资活动产生影响的因素都要充分了解并分析,每一个细小的因素都有可能对投资结果带来巨大的影响,从而提高可行性分析的准确程度,为投资者做出明智的投资选择提供有效的数据支持。

(二)公平性

在进行经济投资可行性分析时候,想要获得更为准确的数据、得到更加精准的判断,就必须要遵循可行性分析的公平性原则,这在分析过程中起着十分重要的作用。相关金融数据分析师必须要坚持这一原则,不带任何感彩地进行数据分析和综合判断,明确自身肩负的重要职责,对于外界的影响因素要尽最大的力量进行屏蔽,科学客观地对待收集的数据和资料,并据此进行公正客观的分析和计算,还要按照经济市场的价值波动规律进行检测,确保分析结果的科学性和可行性。

(三)真实性

可行性分析中想要确保分析报告科学且合理就要坚持真实性的原则。相关金融数据分析师要在实际数据分析的时候保持谨慎认真,确保所有工作流程都是按照相关规定及标准进行的,收集的资料要翔实可靠、广泛真实,这是做好投资可行性分析的基础和依据,数据分析阶段结束之后就到了考验数据分析师真正实力的时候了,特别要注意的就是工作中要贯穿真实性的原则,开展好数据分析工作,保证数据分析工作的有效性。

二、可行性分析在经济投资中的作用分析

就目前我国实际情况来说,在经济投资过程中可行性分析起着非常重要的作用,甚至对最终的经济效益起着决定性的影响作用。因此,必须充分利用好可行性分析,以便能够使其在实际经济投资中发挥出更加重要的作用。

(一)为投资者摸清投资市场真实需求及情况做出参考

投资决策是否明智,就要看这个决策是否符合市场需求以及和市场需求符合的程度,如果投资者的投资项目没有符合市场需求或者与市场消费主流方向有所偏离的话,就会给投资者带来严重的经济损失,甚至让投资者因为一个决定而血本无归,因此做出决策之前必须对市场需求进行全面而深入的调查,并综合其他数据做出可行性分析报告,只有这样才可以最大程度地降低决策对投资者带来的负面影响,为投资者带来更多的经济收入。相关金融风险测评师要对国内外相关市场的规模、竞争力以及价格等进行深入的调查及了解,预判潜在市场的大小,对可能出现的风险进行估计并拟出对应的应急方案,做出最为合适的经济投资项目分析报告,为投资者自行做出决策提供科学可靠的数据支持,并在一定程度上减小了投资者进行经济投资项目选择的压力,减轻了工作负担,并提高了决策效率。

(二)科学合理地对投资对象各方面条件进行分析和评价

进行投资的可行性分析能够对投资项目进行充分的了解和认知,避免因为不了解投资项目而造成的盲目决策。一方面,能够提高投资项目在同类产品中的竞争力,促进各类自然资源及经济资源的合理分配及利用,使得资源利用效率实现最大化。由于各类生产资源在地域上分配不均衡,并且各地拥有的资源也有一定的数量限制,不同地区的同类资源在数量、质量等方面都是不同的,因此各地的生产成本也就不尽相同。可行性分析对投资项目进行的全面分析包括了项目开发的地区、项目的规模大小、项目所具有的潜在价值等等,这些都是在进行实际决策时需要参考的对象,具有优势因素的投资项目自然会获得更多投资者的青睐,这样就使得优势因素得到更多的利用,进而加强了项目的竞争能力;另一方面,进行可行性分析时,对投资项目的全面考察、完整的数据分析方式以及科学的数学模型应用、从宏观角度对投资项目所处的环境等方面进行统一整合及分析等都使投资方案的合理性得到充分保证,为决策的顺利执行提供必要的备选方案,还从一定程度上维持了市场竞争的平衡性。

(三)避免由于决策者缺乏对国家政策等外部环境的了解导致的决策失误

经济投资项目的开发及上市都必须要遵守国家相关政策做出的相关规定,还必须要获得国家相关审批部门的认证和允许才可以在金融市场进行上市。国家政策则是国家根据实时市场情况做出宏观调控的一种重要手段和方法,国家政策包括很多方面,比如投资政策、出口政策,还有在某些特殊地区实行的特别经济发展规划,还有国家为了扶持某种新兴行业而提供的特殊优待条件等等,如果投资者不能及时了解国家政策改动及增添的动向,不能对国家相关政策及地区政策做出详尽而透彻的了解,就很容易出现投资项目超过审批时间或者是错过优惠条件实施事件等等而带来的很多不必要的经济损失。因此,投资者在进行实际投资的之前一定要做可行性分析,对国家及地区的相关政策及优惠条例进行完全的掌握,并聘请专业的金融风险测评师对市场可能出现的变化及风险做出预判,做出相对应的应对措施及方案,才能够最大程度的避免因为信息了解不及时而造成的决策失误或是错失投资的最佳时机,甚至带来严重的经济损失。

(四)使得投资者的决策更具稳定性

投资者想要保证经济投资能够持续平稳不断地运行下去,就必须要保证自身投资具有稳定性、渐进性和一定的系统性。投资者再进行一些比较大型的经济项目投资的时候,因为其本身具有的投资规模大、投资风险高、资金回收期较长等特点,很容易出现投资的不连续,产生一定的投资混乱,这就需要投资者在进行投资之前做好可行性分析工作,为之后投资项目的决策提供红宏观上的方向引导,维持投资的稳定性和有序性,才能够使得市场资源得到有效充分利用,才能减少在投资中的决策混乱,进而减少决策失误,获取更多更长远的经济利益。

三、结语

综上所述,投资者在进行经济投资的决策之前一定要做出完整的可行性分析报告,这对于提高决策者的决策效率,降低决策者因为个人感情因素以及对国家及地方政策不了解或是了解不全面而造成的决策失误,错失最佳的投资良机情况出现的可能,还可以起到优化市场资源配置,使自然资源得到最充分的分配和利用,提高产品的市场竞争力等作用。本文介绍了经济投资可行性分析的基本原则以及可行性分析在经济投资中的重要作用,希望可以为投资者在进行投资决策之前对可行性分析充分重视起来,认识到只有做好可行性分析报告才能够尽量减少市场决策的风险,做出最为合理的投资决策分析,希望可以为相关经济投资者提供一点参考和借鉴。

参考文献:

[1]吴三湘.投资可行性分析在经济投资中的作用[J].才智,2013(35).

[2]李素香.投资项目的可行性分析[J].中国集体经济,2012(03).

[3]彭贵华.随机模拟技术在制造业固定资产投资项目经济可行性分析中的应用[J].会计师,2012(09).

第9篇:数据分析报告范文

随着数据的爆炸式增长,“大数据”一词受到了越来越多的关注,很多领域已经开始应用大数据。大数据技术不仅能应用于数字出版中,在传统的纸质出版中也有应用前景。本文拟以医学出版为例,探讨大数据时代下,医学出版选题策划的思路转变,以及面临的问题与挑战。

一、大数据时代素描

“大数据”是人们给信息爆炸所产生的巨量数据起的一个简单的名字。一方面,这些数据蕴藏着巨大的潜在价值,人们迫切需要更先进的技术,对其进行实时处理;另一方面,技术的进步,包括云计算、分布式计算等方法的应用,极大地提升了信息处理能力,提供了广阔的研究空间,使大数据分析成为可能。

很多人认为“大数据”就是指数据量大,这是一个误区。大数据的本质是发现和理解了信息与信息之间的关系,是思维的变革,而这种变革主要表现在以下三方面。首先,大数据强调的不是随机样本,而是全体数据。为了实现“全体数据”,需要我们尽可能多地搜集、保存与行业相关的各类数据和信息。其次,大数据时代,人们不再一味追求精确,而是承认混杂性。因此,人们需要对于非结构化数据给予更多的关注。也就是说,我们不仅要关注图书销量、读者群构成、直接反馈;也要关注鼠标点击、驻留在一本书的时间,后续购买、关联购买情况,购买地点等。这些看似杂乱的信息,可能蕴藏着巨大的商机和价值。再次,大数据不再追求因果关系,而是关注事物之间的相关性。例如,沃尔玛通过数据分析发现,在飓风来临的季节,不仅手电筒的销量增加了,某一种牌子的蛋挞的销量也增加了,因此,沃尔玛在飓风季节来临时,将库存的蛋挞摆放在靠近手电的位置,以增加销量。在医学出版中,我们也可以通过数据分析,找出与读者的购买行为或阅读需求相关的要素。

二、大数据在医学出版选题策划中的应用前景

1. 教材出版

各个出版社都很重视教材出版。不管是新编教材还是修订教材,调研都是启动编写的基础。教材调研,需要先搜集开设本专业学校的名单,逐个寄出调研函。学校的名单主要来源于相关学会、教职委、行职委提供的资料,但需结合前一版教材或相关书籍发货的省市分布数据,有些时候这两者有较大出入。例如,提供的名单中,河南省没有学校招生,但出版社前三年的发货资料中,河南省每年的教材发货数很大。另外调研函发出后,回收也存在一定困难,通常只能做到部分回收。正因为学校的名单很难搜集齐全,调研函也不能全部回收,这种传统方式上的调研,虽然力求全面,但仍是一种抽样调查,很难涵盖整个行业的样本量和全部信息。

在大数据时代,一切都可以被数据化,大数据强调的不是抽样样本,而是全体数据,因此将数据分析引入教材调研,可以对互联网上有关专业的开设省份、招生学校、招生人数等信息进行分析,得出更全面的数据分析报告。在教材修订、搜集反馈意见时,也可以通过搜集论坛、网购机构的销售记录、读者评论等,分析需要增加、删减及修改的内容。在遴选主编、副主编及编者时,编辑同样可以通过分析网站上的会议情况、会议日程、发言频率和题目、各领域专家的专业特长,确定其学术影响,以及在教材中适合担任的角色,并将这些信息形成分析报告,供决策者参考。

2. 学术专著

在传统出版模式下,学术专著的选题方式属于经验型,由策划编辑提出选题,报出版社选题会讨论。选题委员会由社领导、经验丰富的老编审、生产及销售部门负责人等组成。选题会上讨论的依据主要是以往选题的销售情况及市场反馈,当前市场同类书的情况,以及其他出版社类似图书的销售情况。这种选题论证方式所参考的数据,只是整个出版市场数据的一部分。而利用大数据,人们可以获得整个医学图书市场的书目信息、销售情况,并进行分析。通过数据分析得出的报告,可以形象地理解成一批有无限经验的策划编辑、生产人员和销售人员讨论后得出的结论。理论上,这种论证模式更客观、更有说服力。

现有的医学相关网络社区、数据库的资源已经十分丰富,通过对诸如丁香园医学论坛、中国期刊网(CNKI)、PubMed等的搜索记录、浏览记录、用户留言,以及对亚马逊、当当网的专业图书购买记录的分析,可以筛选出各个专业领域的热点,并对相关用户的地理位置、年龄、职称等信息进行分析,准确定位读者人群,并预测市场容量,为图书选题提供参考。

3. 应急出版

应急出版对于医学出版社来说是一个很重要的部分,在遇到较大的公共卫生事件或异常天气时,公众很需要专业出版社出版的相关预防书籍普及防范知识,医师也需要专业书籍补充相关知识,专业出版社有义务为他们提供高质量的出版物。例如人民卫生出版社在2003年“非典”暴发时紧急出版的SARS诊治、防范等方面的图书,以及在2013年出版的《实面“霾”伏――“雾霾”中的生活与健康》。如果等到公共事件或异常天气已经暴发再组织编写,出版时间容易滞后。

大数据分析在应急出版方面将会有明显的优势。例如,谷歌公司通过对检索词条的分析,提前几周时间预测甲型H1N1流感爆发。这个案例对于应急出版是一个很好的启示。编辑可以通过类似的数据预测方式,如在流感暴发前,即组织编写流感预防及治疗相关的书籍。再如,如果能够通过网络的搜索词条,或者同诸如中央气象台等单位合作,共享数据库,提前预测会有严重雾霾天气出现,就能提前组织专家编写,为书籍出版赢得宝贵的时间。同时,可以通过搜索频率预测印刷册数,避免过多的库存。

三、医学编辑应对大数据时代的策略

1. 医学编辑应做好基础工作

一是立足自身,做好医学编辑出版的大数据基础工程建设。例如进一步实现网络化、电子化和标准化,为实现大数据的应用打好基础。只有将出版物网络化、电子化,才能使与出版相关的信息和数据成为可以搜集的资源;大数据技术可以分析杂乱的数据,数据的标准化可以为数据分析提供更多便利。

二是学习借鉴,建立基于云计算等先进信息技术的新型工作模式。例如民生银行开发的小微金融数字地图平台,通过这种地图将数据可视化,由此提供相应的信息分析、营销实务等服务。出版社如果建立类似的平台,将销售数据可视化,就能为选题策划工作提供更多的服务。

三是寻求协作,引接信息产业界力量。例如一些新兴的提供数据分析技术服务的公司,同它们积极合作开展大数据分析研究工作,推动研发基于大数据的智能选题策划系统。