公务员期刊网 精选范文 大数据时代数据的特征范文

大数据时代数据的特征精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的大数据时代数据的特征主题范文,仅供参考,欢迎阅读并收藏。

大数据时代数据的特征

第1篇:大数据时代数据的特征范文

共享服务中心(shared service center,SSC)是一种新的管理模式,是指将企业部分零散、重复性的业务、职能进行合并和整合,并集中到一个新的半自主式的业务中心进行统一处理。业务中心具有专门的管理机构,能够独立为企业集团或多个企业提供相关职能服务。共享服务中心能够将企业从琐碎零散的业务活动中解放出来,专注于企业的核心业务管理与增长,精简成本,整合内部资源,提高企业的战略竞争优势。共享中心的业务是企业内部重复性较高、规范性较强的业务单元,而且越容易标准化和流程化的业务,越容易纳入共享中心。

财务共享即依托信息技术,通过将不同企业(或其内部独立会计单元)、不同地点的财务业务(如人员、技术和流程等)进行有效整合和共享,将企业从纷繁、琐碎、重复的财务业务中剥离出来,以期实现财务业务标准化和流程化的一种管理手段。福特公司在20世纪80年代建立了世界公认最早的财务共享服务中心,整合企业财务资源,实现集中核算与管理,并取得了巨大成效。随后财务共享服务中心模式在欧美等国家开始推广,并于20世纪90年代传入我国。而随着我国企业的快速发展和规模扩张,以及信息化技术的普及,许多国内大型企业集团已经组建了自己的财务共享服务中心,如海尔集团、中国电信等。一项来自英国注册会计师协会的调查显示,超过50%的财富500强企业和超过80%的财富100强企业已经建立了财务共享服务中心。

(英)舍恩伯格在《大数据时代》一书中指出,“数据已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。数据的奥秘只为谦逊、愿意聆听且掌握了聆听手段的人所知。”全球经济正进入一个数据爆炸式增长的新时期,正如美国官员所说,“过去3年里产生的数据量比以往4万年产生的数据量还多”。据一项调查报告显示,当前企业每天的信息存储量高达2.2ZB,而大型企业集团单体产生的数据量已达到10万TB级,并仍呈高速增长态势。据IDC预测,到2020年全球的数据规模将较现在扩大50倍。全球企业已经迈入大数据时代。

财务数据作为企业最重要、最庞大的数据信息来源,在企业财务活动日益复杂、集团规模日益庞大的今天,财务数据处理的效率、安全等问题考验和制约着企业集团的更高一层发展。而伴随着以云计算为标志的新时代的财务共享模式,能够为大数据时代下企业集团再造财务管理流程、提高财务处理效率提供助益。财务共享模式能够为企业带来规模效应、知识集中效应、扩展效应和聚焦效应,实现企业会计核算处理的集中化运作,整合企业内部的知识资源,提高企业财务模式的扩展和复制能力,将企业财务管理人员从琐碎的财务数据处理中解放出来,专注于企业的核心业务。另外,财务共享模式的集约式管理能够提高数据处理的屏蔽性和安全性,控制企业财务风险,降低生产管理成本,提高经营效率,提升企业财务决策支持能力,优化企业的财务管理模式。

二、大数据时代财务共享中心构建

(一)财务共享服务中心的先期评估

首先,应组建相应的管理机构。企业集团在决定建设财务共享服务中心后,应及时组建相应的管理机构。管理机构应将企业决策层领导纳入其中,并下设项目团队,具体建设业务由项目团队负责推进和监督。项目团队应吸纳财务人员、IS专业人员等,也可邀请第三方咨询人员,制定评估计划、范围。其次,做好数据搜集工作。财务共享服务中心涉及企业多个职能部门和业务流程,应做好多方面数据信息的采集和整理,主要有人事数据、财务数据和业务数据等,如当前财务人员的基本信息、企业资产信息、财务业务流程信息、业务量等。最后,准确定位财务共享中心。项目团队将搜集整理的信息进行筛选汇总,并形成分析报告,上报管理机构,由企业决策层依据评估信息及企业发展战略,对财务共享服务中心作出准确合理定位。

(二)财务共享服务中心的规划设计

首先,共享中心的科学选址。财务共享服务中心选址应综合考虑诸如成本收益、基建设施、地方政策、人力资源等多种因素。项目团队应制定多维评判指标体系,对候选城市进行综合评估分析。其次,确定共享中心服务规模和共享范围。在规划设计阶段,共享中心组建团队应依据企业集团规模和结构,集团所处行业,集团运营模式及业务流程共享范围等,从建筑配置和IS配置等方面合理框定共享服务中心的建设规模,满足基础设施保障需求。最后,就项目建设进行投资收益分析,制定财务共享中心建设规划。在规划设计阶段,项目团队应就共享服务中心建设的资源需求和经济效益进行投资收益分析,科学反映财务共享服务中心能够为企业集团发展带来的效益产出,用资料和数据打动企业决策层和股东,推动项目顺利进行。投资收益分析应全面罗列财务服务中心的各种直接、间接效益产出及所需资源,权衡比较确立最终建设规划。

(三)财务共享服务中心的建设实施

首先,规划财务共享服务中心流程及架构。项目团队应在前期基础数据的整理和分析的基础上,按照科学方法合理规划财务共享服务中心的流程及架构,详细制定KPI考核指标。企业集团应对原有的财务框架进行优化重组,依据会计政策和规范将财务流程标准化、规范化,集中串联可重复性的财务职能。其次,实施建设财务共享服务中心。财务共享服务中心的建设实施可采取多种途径,如内部自行组建、“交钥匙”工程外包、联合组建等。在采取工程外包模式过程中,项目团队应承担起建立职责,协调内部资源配合建设。最后,做好过渡期的相关工作及人员转移。过渡期工作转移包含原财务人员、服务、业务、场地及设备等的转移,以及依据实际运行情况对前期流程及KPI的再修订,并据此确定最终SLA协议。工作转移应充分考虑人员的稳定性和业务的对口性,对于因上马财务共享服务中心而出现的冗员,应予以合理安置,难以安置的应协商解除劳动合同,协商过程中注重遵守法律法规政策,以人为本。同时,对留用的业务人员和新招募的财务人员进行上岗培训,加强系统操作演练和实践。

(四)财务共享服务中心的运营管理

财务共享服务 中心建设工作完成以后,开始进入正式运营阶段。此时,前期的项目团队应逐渐淡出管理,让位于中心自身的管理团队。企业集团可以在吸纳前期项目团队的基础上,组建中心正式的管理团队,缩短磨合期。管理团队应认真执行之前的业务设计流程及SLA协议,确保中心运营稳定。财务共享服务中心在集团正式上线运营后,企业集团内部的财务资源将迅速向中心靠拢,实现同原各部门、子(分)公司的快速剥离,提高集团经营效率,降低集团运营成本。首先,运营管理期间,企业集团及中心管理团队应从保障共享中心正常运转的角度,从人力资源、风险控制、绩效考核、内部稽查等多个角度加强对共享中心的管理和控制。共享中心运营团队应及时搜集服务中心运营中的问题,并及时上报研究解决。其次,对财务服务共享中心进行后期完善。后期的完善主要包括对运行期间问题的集中搜集与解决,硬件设施的维护、管理与更新,新技术的应用与推广以及人员的招募与培训等。运营团队应定期就共享中心运营情况进行评估和稽查,依据企业战略调整和经营变动等情况及时作出流程优化和调整。

三、大数据时代财务共享中心面临的风险

(一)系统自身风险

首先,财务共享服务中心建设投资成本较高,存在一定的财务风险。财务共享服务中心前期需要巨大的人力、财力等资源投入,包括人员差旅费用、工程建设费用、人员设备转移费用等,同时伴随有因财务服务中心选址而衍生的地区差异费用及场地建设费用等。即使到了后期也仍然面临设备维护、信息系统更新等费用,成本投入较大,却不一定能带来预期效益甚至将企业集团拖入债务危机。其次,实行财务共享集中管理后,财务人员由业务前端转为后端,业务敏感性和紧迫性下降,容易滋生官僚作风,中心与子公司等交互模式客观上造成了业务迟滞,而信息高度集成化也存在管理漏洞。最后,共享服务中心运营后,信息处理的高度集成化加大了责任认定和追究的难度。一旦出现问题,企业需要通过来回查阅资料,调阅影像,ERP问询等才能确定责任人。

(二)人员管理风险

首先,由于财务共享服务中心实行财务集中化管理,财务人员离开一线前端,将逐渐与子(分)公司、其他部门之间的具体业务脱离联系,难以掌握具体的业务情况,仅能从数字上去研究和判别,一线业务能力逐渐萎缩。其次,财务共享中心实行的是标准化管理,其业务流程犹如车间生产的流水线,财务人员每天将疲于应付各种索然无味的财务数据、凭证、报表等,业务量大,机械化程度较高,工作内容枯燥,财务人员容易失去耐心和激情,产生厌烦心理。最后,财务共享中心的人员流动比率较大,财务人员跳槽另谋出路的比比皆是。这样容易导致业务处理中断或产生新的磨合期,如发票不能及时入账或新人需要重新熟悉业务等,影响企业集团财务稳定。

(三)法律政策风险

企业集团规模扩张到一定阶段,其子(分)公司必然分布于全国各地,而各地政策在实际规则和操作过程中却千差万别,存在地区政策差异。而共享中心的财务人员很可能因为对财务活动发生所在地的财务政策认识不够,导致在财务处理过程中加剧了信息流通和处理的难度。财务人员由于长期居于共享服务中心所在地,缺乏前线业务经验,同时也与各地地税部门稽核人员缺乏沟通和联系,在处理税务问题上产生偏差,易引发法律风险。

(四)信息安全风险

大数据时代企业的数据信息量激增,信息访问、交换、处理、分析的业务吞吐量较以往呈几何级数增长。企业集团建成财务服务共享中心,将集团财务业务集中处理,更是加剧了企业信息的传输与处理流量,这容易导致信息量过大引发信息通路的拥堵。同时,也会由于信息量过大引发传输、处理的延迟。由于财务共享服务中心面临10万TB级别数据的处理量,其数据过滤、筛选和分析功能将显得更为重要。而目前信息数据过滤、筛选和分析仍处于半智能化状态,仅能适应简单的信息过滤、筛选与分析需求,无法应对复杂信息处理与交换需求。信息时代由于信息网络的开放性与不稳定性,容易发生信息泄露和病毒入侵事件,一旦造成信息泄露或病毒入侵使得系统瘫痪,将对企业集团的运营管理造成不可估量的损失。

四、大数据时代财务共享中心建设与管理

(一)建立风险评估制度,完善管理机制

首先,企业集团应建立风险评估和绩效评价制度。财务共享服务中心的投入、建设和运营是一项复杂巨大的系统工程,需要企业集团全体上下的通力配合和不菲的资源消耗,企业集团应谨慎对共享服务中心进行风险和效益评估,科学决策。共享中心建成运营后,应及时开展绩效评价,明确投资收益。其次,科学制定共享中心的管理制度,建立稳定运营的保障机制。共享中心建成运营后,由于涉及中心人员与前端业务人员之间的权责及业务往来,往往存在利益纠葛及推诿现象。企业集团应统一协调各方关系,科学制定管理制度,明确业务前端与中心之间的业务处理流程、权责关系,如会计凭证影像处理的要求、责任人等。最后,应加强部门之间的联系沟通。畅通沟通渠道,加强业务前端与中心人员之间的联系,减少沟通不畅引起的业务故障。

(二)推进使命文化建设,加强人员管理

首先,企业应定期组织中心人员进行培训,培训内容包括中心流程规范及前端业务介绍,在提高中心人员规范操作意识的同时,加强其对前端业务的熟悉和认识。其次,企业集团应积极推进企业文化建设,加强中心人员的使命感和光荣感。中心管理人员应及时关注工作人员的思想动态,定期组织开展文化教育和活动,在流程化管理之中融入人性化的思想,减少员工的挫折感和迷茫感。最后,应完善中心人员的绩效考核制度,健全目标激励机制。企业集团应根据岗位特点设置合理的目标任务,并制定详细的奖励措施,通过物质刺激和精神奖励多途径提高中心人员的积极性。

(三)强化流程标准管理,优化ERP系统

首先,建立集团内部统一的会计标准,实现会计数据接口的标准化。企业集团应在对内部会计数据、财务工作认真调研的基础上,按照方便、快捷、准确、全面的原则设计会计数据标准接口,规范会计数据信息传递。其次,共享中心联合其他业务部门加强对流程标准化的改进和完善。共享中心是需要不断优化和更新的系统,尤其是业务标准化流程,需要 集团内部各部门尤其是前端业务部门的配合。共享中心应统筹协调各部门依据实际拟定标准化流程,再依据实际完善部署实施。最后,加强对业务覆盖地法律法规的遵守。共享中心必须认真研究业务覆盖地的法律法规,在进行业务处理时应注意各地法律的差异,及时与前端业务部门及地方税务部门沟通联系,业务凭证保存备查。

(四)提高信息处理能力,防范信息风险

首先,加强平台建设,提高系统的应用可靠能力。企业集团应加大对财务共享中心平台的投入和建设力度,加强巡检和维护,定期进行更新和完善。合理配置科技资源,构建适应大数据环境的信息系统。其次,创新数据挖掘方式,构建智能化共享中心。大数据时代的共享中心,数据挖掘处理能力是关键。企业集团应积极引入先进的数据过滤、挖掘分析技术,建设数据仓库,按照业务需求应用数据分析技术,实现共享中心的智能化管理。最后,加强信息安全管理,建立风险防范体系。按照数据传递原则进行归口负责管理,明确安全责任人。同时,积极构建网络防御体系,应用数字签名认证等安全技术。同时积极建立备用系统和应急预案,定期做好数据备份和管理,防范网络灾害。

五、结论

大数据时代,财务共享对于企业集团的长远发展显得更为迫切和必要。然而财务共享的实施过程并非一帆风顺,企业集团应持客观心态,内外并举、上下齐心,审慎缓步推进共享中心建设,确保共享中心运营稳定有效,达到提高企业集团管理水平目的。

参考文献:

[1] 陈刚.对中石化构建财务共享服务中心的分析[J].财务与会计(理财版),2013(4).

第2篇:大数据时代数据的特征范文

在大数据时代,从数据中心的基础架构到运营服务,从数据的分析到数据治理,大数据积聚了多少新的需求,数据中心又将经历怎样一场轰轰烈烈的变革呢?

云计算数据中心、云基地、超级计算机中心……这些与云沾边的数据中心的新称谓让用户难以区分清楚。其实,云只是一个定语,它所修饰的后面的名词(某项具体的业务或应用)才是用户真正应该关心的。比如云基地,它就是希望通过云计算技术为园区内的企业提供一种共享的服务。“企业无论要建设什么类型、具备何种功能的数据中心,都必须从业务和应用的需求出发,明确建立数据中心的目的。”中国惠普有限公司技术服务事业部IT规划与咨询、云计算服务总经理卫东表示。

大数据的三维视图

有市场分析机构预测, 未来12~18个月内,全球产生的数据量是现有数据量的总和。数据量的迅猛增长给企业的数据存储、管理和分析带来了巨大的压力。另一方面,有统计表明,企业能够有效利用的数据量只占数据总量的5%。这些就是大数据(Big Data)带来的难题。

大数据包含了不同来源的所有结构化和非结构化的数据。大数据在数据量的大小以及复杂性方面已经远远超出了用户现有的能力范围。这也意味着在合理的成本范围和时间区间内,人们已经无法使用通用的数据处理技术来收集、管理和分析大数据。卫东表示,用户可以通过三维视图来理解什么是大数据:从数量级来看,交易数据量以几何级数倍增;从数据的多样化来看,除了结构化数据以外,还有大量非结构化数据需要进行处理,比如社交网络媒体资料、视频、音频、邮件、图像等;从数据处理的角度来看,人们希望以更快的速度来处理大量的数据。

“很多中国用户在新建数据中心时明确提出,数据中心的建设要为大数据服务,因为大数据与企业的业务应用密切相关。数据中心架构的融合、变革和转型是当务之急。”卫东表示。

那么,传统数据中心与大数据时代的数据中心或者说新一代数据中心到底有什么区别呢?

通常来说,传统的数据中心包括与风、火、水、电相关的数据中心基础设施以及IT硬件设备。新一代数据中心除了包含上述基础设施以外,更重要的是应用一些新技术让数据中心的架构变得更加灵活和高效,比如采用新的数据处理架构以及一些节能减排的新技术等。“传统数据中心是堆栈式的,而新一代数据中心是模块化的,其动态架构的好处可以在日后数据中心的运营过程中得以充分展现,比如降低运维成本,管理更简单等。”卫东表示,“用户在建设数据中心时,除了要关注数据中心的土建以外,更要考虑数据中心内设备的摆放。惠普现在能为用户提供包括数据中心基础架构、云计算、能源管理服务等在内的全套数据中心解决方案。”

大数据带来的三大改变

大数据的出现将给数据中心基础架构、数据中心的应用和运维带来什么样的挑战呢?

卫东表示,总体来看,由于数据量的增加,企业首先需要灵活、可扩展的存储解决方案;其次,企业需要相应的商务智能处理软件、算法模型来访问并分析大量结构化和非结构化的数据;最后,随着需要大数据分析的企业、部门、人员逐渐增多,势必需要整个数据中心的计算能力、网络速度以及整体业务反应能力得到进一步提升,这将促使数据中心整体架构加速向以适应性数据服务(Adaptive Data services)为特征的新一代数据中心架构转变,集中化的数据中心、云计算中心和超级计算机中心将成为用户努力的目标。

从数据中心架构的角度分析,在大数据时代,数据中心呈现出数据密集的特征,存储、计算、网络传输的需求呈指数增长,高并发、低延迟的环境要求数据中心架构具备更强的横向扩展能力。由于数据增长具有不确定性,“数据洪流”发生的时间、流向、支流发展也无法确定。因此,用户对数据中心架构的灵活性要求更高。未来的数据中心将更多地采用分布式的数据库和文件系统,比如Hadoop架构可以存储和访问大数据,同时满足数据中心架构对灵活性的要求。

从应用的角度分析,数据仓库、数据挖掘和商业智能等应用领域会发生重大变革,对半结构化、非结构化数据的支持,尤其是基于非结构化数据的搜索应用将大量涌现。应用对大量数据的实时处理能力要求更高,并且希望利用更小的内存/磁盘空间处理更多的数据,同时借助数据压缩、网络优化等技术提升存储、网络等资源的使用效率。大数据分析要求企业拥有充足的IT资源。因此,并非所有的企业都需要自备完整的大数据分析能力,数据分析云服务可满足中小规模企业的分析需求。

从数据中心运维的角度分析,随着数据存储量急速增加以及应用模式的转变,用户在数据中心的运维方面将更关注如何提高性能和降低成本。用户可以借助精简配置(Thin Provisioning)等技术,提升IT设备的使用率,同时降低成本。此外,数据的分级存储变得更为重要。借助分级存储技术,用户可以根据数据的活跃程度、访问频度等分配不同级别的存储设备和网络区域。由于深度挖掘的分析结果的价值不同,与之相匹配的IT资源也不同。

惠普亚太区存储策略师Paul Haverfield指出,存储管理者面临着五大挑战:第一,如何以更低地成本访问数据;第二,如何让数据的组织、查找和处理过程更加高效;第三,如何更好地备份和保护数据;第四,如何删除不想要的数据;第五,如何提高数据中心的能效,节省空间。

避免陷入误区

许多用户在新建云计算数据中心时喜欢追时髦,而对于云数据中心到底能发挥什么样的作用,如何去运维缺乏清晰的认知。

“始于基建,止于基建是许多中国用户易犯的通病。”卫东表示,“由于数据中心的建设与使用分属基建和科技两个部门,基建部门建好数据中心就算交差,根本不会考虑数据中心内部IT设备应如何摆放。这就很容易造成数据中心在日后的运营过程中出现种种问题。”还有一些用户并没有真正理解新一代数据中心的内涵,单纯地以为新一代数据中心就是绿色、节能的数据中心,并且认为仅凭PUE值等几个简单的指标就能全面描述数据中心的状况。

卫东表示:“用户在新建数据中心前,一定要想好数据中心能为业务的发展提供什么样的支撑。新一代数据中心的建设要与业务运营相结合,要考虑与大数据之间的关系,只有这样才能缩短数据中心的建设周期,节省成本,避免风险。”

有些人认为,数据中心就是一幢房子,是固定资产。其实,数据中心是企业的战略性资产,是运营的基础。在建设数据中心的过程中,企业要把技术、管理和人的因素全都考虑进去。惠普能够为企业提供转向新型数据中心的全面服务。

针对企业在构建新型数据中心架构时可能遇到的问题,卫东提出了以下建议。

第一,在数据中心的自建、合建、租赁模式之间做出选择。企业可以根据自身的需求、资金实力等来判断。如果数据都是企业专有的并且企业拥有足够的资金,那么企业可以选择自建数据中心。

第二,制定战略目标。企业有了清晰的战略目标,才能更清楚自己需要什么以及如何实现目标和先后步骤等。

第3篇:大数据时代数据的特征范文

关键词:人力资源;大数据时代;机遇挑战

经过多年的发展,人力资源管理的理论基础依旧为工业时期中的管理经验,随着移动互联网的出现,人力资源新的管理思想正在发生着深刻的变化,但当下我国人力资源管理的方式以及理论均未出现对应的创新。在人力资源传统模式的管理中,企业人力资源部门由于对业务的认识缺乏深刻性,未对部门经理以及员工提供出及时直接性的支持,且其制定出的相关政策也缺乏灵活性与针对性,在实际推行中无法与其需求相互契合;同时,人力资源的管理者对事务型工作过于关注,无法提供业务需要的解决方案,因而人力资源部长期以来均被视为企业成本中心。

一、大数据的特征与类型

通常来说,大数据背景下的特征主要体现在三个方面,即多样性、迅速化以及信息量大。其中多样性主要体现在大数据形式的地理位置信息、手机GPS信号、传感器文本、视频、图片以及文字等方面;迅速化:在多数状况中,数据创建速度的重要性高于数量,接近实时或者实时的信息能够使企业的运作与竞争对手相比更加灵活;信息量大:当下影视娱乐、电子商务、地理信息以及医疗卫生等领域每日均产生出大量的数据,经国际数据企业监测统计,截止到2011年,世界数据总量已高至1.8ZB,且每间隔一年均呈现出增长翻倍的趋势。除上述三种特征外,有学者认为,大数据还应具备一个全新的特点,但对于这个新特点,各界的看法又各不相同,国际数据公司认为主要是大数据的价值性,即从海量的信息中可发掘出价值性极高的数据;而IBM公司则指出大数据理应具备真实性,例如社交网络中的言论会带有情绪化的内容,不一定准确真实。

二、大数据时代背景下人力资源管理面临的机遇

(一)加强人力资源管理的业务支撑力与专业性

大数据的到来使HR的管理从经验主义管理转化为规范化与科学化的管理,且在其技术支持下,职员、岗位、培训、薪酬、绩效以及激励等均能够以数据化的形式体现,并归纳为量化的范畴中,使HR的管理更具专业化与高效性。在传统管理中,对于数据的分析常为生成数据后的总结,管理具有滞后性;但大数据对于数据的分析则着重强调预测性,管理中要体现前瞻性,如传统的管理对员工的绩效水平是利用绩效管理来实现;大数据的思路则在于挖掘数据寻找高绩效职员的要素特征,并将其作为模型使每位职员均可持续性产生高绩效。对于HR数据的分析,传统方式会根据离职率进行;但大数据则是将所有的职员依照稳定的情况分为多个样本,通过挖掘数据寻找出与其稳定性有关的特征,构建出可对候选人稳定性进行识别的数学模型,进而通过分析应聘者的简历评估其稳定性,为保留环节与后续招聘提供相关参考。

(二)将大数据作为决策的工具,提高人力资源管理的效果

因HR管理的主要对象为人,其能够定量的程度与由资产、产品、流程以及制度等构成的物相比要低得多,与管理中其他的模块相比,HR管理中的可量化性较低,这便加大了人力资源管理的难度,主要表现在无法客观性评估资源管理的价值,充分认同其专业性。在大数据时代下,可使人才的供给与业务战略匹配,提高投资回报率、定量化与直观化管理人才,对人力资源管理来说,必须实时掌握信息动态情况,趋势性分析未来的发展。大数据技术可利用人事信息资源的汇聚,全面关联性分析其中的人员、组织、岗位以及业务等,对于人才的决策也有数据加以考量;同时,在人才的挑选、培育、应用以及保留等工作中,将大数据技术作为依托,能够有效实现科学管理中所规定的可分析、可记录、可测量以及可优化,进而使管理决策的有效性得以大幅度提升。且在大数据的有力支持下,管理人力资源的部门在甄选人才、培训提升以及鼓励激励等当中所发挥的影响与作用将越来越突出。

(三)加强人力资源管理对职员的影响

大数据背景下,人力资源管理将会向普通的职员靠近,通过与职员进行互动来建立数据接口,使大量的交互性数据得以产生,各部门职员也能够积极参与到人事管理组织的工作中去,拉近职员与人力资源之间的距离,并加强了对职员的影响作用。大数据的利用,不管是员工的生活还是工作,云平台均会自动收集与处理产生的各种数据,例如企业职员的出勤时间、加班时长、交流沟通的频率、培训需求、工作业绩,甚至是职员常登陆的微博与论坛等,此类数据均将职员社会关系、工作状态、能力情况、交往对象、发展潜力以及日常爱好等全面反映出。而人力资源部门可对此类完整全面的信息进行有效掌握,提高对职员的综合评价与需求的了解,确保人岗配置的精准性。

结语

在大数据时代下,人力资源管理者正处于对自身处境进行改变的良好机遇下,集团化方式、跨行业运营等均要求HR工作者积极创新,突破传统思维的屏障,勇于“跨界”工作。人力资源部门对大数据技术的利用,还可有效分析能够对职员产生较大激励作用的互动模式、行为方式、态度以及物质等等,同时HR还能够利用移动互联终端实现对职员绩效的激励与认可,从而使企业员工能够获得最大化的成就感与幸福感,达到员工价值同组织价值之间的平衡互动。

参考文献;

[1]李越恒.企业人力资源管理基于大数据的“挖掘”[J].人力资源管理,2015,24(2):8-10.

[2]郑薇薇.大数据时代企业管理的机遇和挑战[J].时代金融(下旬),2016,23(1):99-100.

第4篇:大数据时代数据的特征范文

>> 对数据新闻“热”的冷思考 新媒体 热追逐下的冷思考 新媒体时代下电视批评报道的冷思考 新媒体时代数据新闻的信息可视化应用 政务新媒体应用热的冷思考 新媒体时代信息洪流中的冷思考 “新闻评论热”的冷思考 DV新闻热的冷思考 社会新闻热的冷思考 民生新闻热的“冷思考” 大数据热背后的冷思考 政务大数据热的冷思考 新农保“热”的冷思考 冷思考:数据新闻的局限 对瑜伽热的冷思考(下) “减负”热下的冷思考 房产热下的建筑冷思考 热互联下的冷思考 “微课热”下的冷思考 热钱搅动下的冷思考 常见问题解答 当前所在位置:中国 > 艺术 > 新媒体时代数据新闻热下的冷思考 新媒体时代数据新闻热下的冷思考 杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠! document.write("作者: 赵国宁")

申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。 摘 要:新媒体时代数据新闻火爆。无论是专业媒体还是新型的自媒体,都在用数据新闻进行新闻信息产品的生产。笔者通过数据新闻溯源,发现数据新闻是传统精确新闻在互联网时代下的发展与进化,在这种条件下,数据新闻以其同时满足专业媒体重掌舆论引导权以及满足受众参与、对新鲜形式的新闻产品的需要迅速发展起来。但于此同时,也应当看到,由于技术原因的限制,数据新闻目前在有温度的关乎人情、人性的新闻生产方面还存在一定缺陷,并且关于数据获取与开发上在法律层面也存在争议。因此一面要注意对数据新闻的正确定位,一面也要注意数据新闻中对数据开发的合理化和合法化。 关键词:数据新闻;发展演变;原因探析;问题思考 中图分类号:G206 文献标识码:A 文章编号:1672-8122(2015)08-0127-02

数据新闻的出现和发展正在悄悄改变着媒体的新闻生产格局,那么数据新闻到底是怎么产生的呢?其发展过程又是什么样的?目前数据新闻如此火热背后的原因是什么?以及数据新闻存在的潜在问题有哪些?本文对这些问题进行思考,并进行了初步的探索。

一、数据新闻的本质与发展演变

数据新闻,又称数据驱动新闻,是大数据时代兴起的一种跨学科的新闻生产方式[1]。是一种新型的数据生产方式,其基础就是数据的抓取、数据挖掘、数据分析以及数据的可视化呈现。

数据新闻的前身是精确新闻。精确新闻指的是记者在进行采访新闻的过程中,运用多种社会科学研究方法,如调查、实验和内容分析等,来进行资料收集和事实查证,进而报道新闻的一种新闻生产方式。精确新闻的特点就是“精确”二字,它用精确的数据和概念等来分析新闻事件,尽量避免一些主观和人为的错误,让新闻报道更加符合客观性原则和公正性原则,从而更加令人信服。20世纪50年代,美国就有媒体记者利用大型计算机对政府提供的数据库中的信息进行分析,以发现和调查新闻事实[2]。并且在20世纪70、80年代就掀起了一场“精确新闻”运动。

当下火热的数据新闻其实就是精确新闻在网络时代的发展。在精确新闻时代,数据库有限以及数据处理存在较大局限等原因,使得其发展一直受到制约,虽然在新闻报道中出现了“精确新闻”这一类别,但是却一直未能大放异彩。随着网络时代的到来,限制精确新闻发展的门槛逐一被打破,使得其有了充分发展空间。并且还在这个数据极为丰富的时代和数据处理较为方便、高效率的时展成为了数据新闻。

网络时代的到来为数据新闻的发展至少提供了以下三方面的有利条件:首先就是数据库在网络平台的共享。所谓数据新闻,首先要有数据才能在此基础上进行新闻的开发和挖掘。在互联网时代到来之前,数据存储就是其发展一大瓶颈,因为所谓的大数据指的就是超出常规的数据库工具获取、存储、管理和分析能力的数据集。但互联网技术却解决了这些问题,给了以大量的数据作为支撑为特征的数据新闻样式充分的发展空间。另外,在目前,很多数据库资源的组织和个人都在积极寻求合作,希望共享资源,充分开发数据库,数据库的开放也为数据新闻的发展提供了坚实的基础;其次就是数据处理技术的发展。20世纪90年代中期以后,计算机辅助报道就逐渐兴起,发展至今日,数据处理软件逐渐完善,功能也日趋强大,这就大大提高了数据分析的效率,使得数据新闻处理起来能有更高的效率。并且,数据处理软件还可以生成形象化的图表,使得数据形象化;最后就是互联网技术的发展给数据新闻表达形式的多样化提供了便利。数据新闻时代数据的表达形式更加多元化,最初数据新闻的表达形式只是新闻图表,到互联网时代,计算机技术更加发达,H5动态图、动新闻等形式相继出现,使得数据新闻的表达更具有形象性。并且,新媒体这种新型媒体的出现也大大方便了这种新表达方式的传播,短小而精悍的内容非常适合新媒体时代的快速阅读、浅阅读和短阅读。

二、当下数据新闻“热”的原因探析

首先,就是新媒体的“即时新闻”给专业媒体带来巨大冲击迫使专业媒体另辟报道重点。新媒体环境下,以往凭借“时效性”竞争的媒体已经完全丧失了优势,在事件发生现场的公众成为了第一新闻者,尤其是有关突发事件的新闻信息的,一般其第一平台都是在社交媒体网站,之后才是捕捉到相关消息的专业媒体相关新闻信息。随着web2.0和web3.0的出现,公民新闻对专业媒体新闻的冲击日益凸显。在这种背景下,专业媒体不能与公民新闻争夺时效性,就需要转变报道思路,将重点转向其他的报道方向。在互联网时代大数据活跃的环境下,专业媒体人自然的将目光转向“数据新闻”,希望以较为专业的、与时俱进且报道角度和方式都较为新颖的数据新闻来在新闻报道中重新找到自我位置,找回自我在新闻报道以及舆论引导领域的主导权。正如彭兰教授所言,如若媒体能够利用互联网时代出现的大数据技术,把报道重点和更多的注意力转向对未来趋势的预测上面,那么,就很有可能在即时性“公民新闻”难以达到的一个高度上实现媒体价值的重新塑造[3]。

其次是新媒体环境下受众地位的改变与受众对数据新闻的需要。“互联网+”的时代,各行各业的发展都以“用户本位”的方式思考,传媒行业也不例外。以往垄断的灌输式的新闻生产方式和报道方式已经完全不适用当代的传媒规律,当下强调的“用户主导”、“以用户为中心”就是受众地位提升的体现。既然强调受众本位,那么了解受众就成为了专业媒体做新闻的当务之急,以大数据对受众喜好、习惯进行分析,找到新闻产品的市场,有针对的对新闻信息产品进行改良,使其符合受众的需要,这才是专业媒体的继续发展与再度繁荣之路。

而受众对于数据新闻的需要主要则基于以下两点:一方面是受众对形象化与新颖的新闻表达的需要。数据新闻的特色就是形象化、可视化和新颖性,新媒体时代是快速阅读的时代,快速阅读留给人思考的时间相对来说就比较短,形象、量化、简洁且有一定深度的新闻信息就成为符合当代读者需要的新闻内容,这样的新闻信息也比较受当代读者的欢迎。数据新闻无疑就是最符合上述特点的新闻形式,即基于数据的分析检索,通过词频检索、相关词组合等提炼出纷繁数据资料以及文字等资料中的核心内容,通过漫画图表新闻、动新闻等进行可视可听的表达,满足了受众需求;另一方面则是受众参与性的需要。传统媒体时代新闻信息传受不平衡,一般以传统媒体为核心,受众的反馈则处于末位。而新媒体时代,受众地位则迅速提升,伴随其地位提升的同时,其要求参与的愿望越来越强烈。恰好数据新闻的制作过程就可以融入读者参与的环节,比如众包选题,比如素材征集,再比如最后的评判等。于此同时,受众参与情况、侧重方面等的数据又可以反馈给专业媒体保存为数据库资料,掌握受众信息,再次促进新闻信息生产的改良,使其更符合受众、读者的口味。

因此,无论是专业媒体还是受众,都能在数据新闻上被满足需要,这也就是当下数据新闻火热的一个重要原因所在。

三、数据新闻潜在问题思考

通过以上对数据新闻起源以及其火热原因的分析,其前途看似光明,但是也存在不少潜在的问题。以下主要从两个角度来论述。

(一)数据新闻与有温度的新闻之间的矛盾冲突

从某种意义上讲,数据新闻是对复杂庞大资料的有序化、简洁化处理,这个处理是以关键词以及关键词间的组合频率为基础的。对一些时政硬新闻、经济硬新闻来讲是没有什么问题的,借助大数据和数据处理软件的技术从庞大的资料库中提取核心事实框架,并以形象化、趣味性的表达方式进行新闻信息的传播,使得受众也能够在最短的时间内获取最有价值的信息,提高新闻信息的传播与阅读效率。它既满足了专业媒体良好传播效果的需要,也满足了受众高效率获得新闻信息的需要。

但是,除此之外还应该注意到,新闻是为人服务的,要体现“以人为本”。因此,除了对那些硬新闻核心实时的报道之外,新闻还应该有温度,体现对人的关怀。尤其是在关乎人物的报道中,人情、人性与心理的展现才能让新闻有温度,新闻稿件从字里行间传递出情感,让新闻打动人、感染人、激励人。而有情感语言的表达不一定是情感词语的直接表达,还有可能通过句子、词语的特定组合与结构方式来传达,这就是所谓的话外音。这就给数据检索带来困难,目前还没有软件能解读这样的文字数据。因此,虽然数据新闻在新媒体时代具有强大的吸引力,但是也不能陷入“唯数据论”的极端之中,让新闻极化为只是冰冷数字的排列组合。应该将其作为一种新闻生产的辅助工具或一种新形式的生产方式,不能过分夸大其作用和地位。

(二)数据新闻与隐私之间的矛盾冲突

第5篇:大数据时代数据的特征范文

【关键词】 大数据 数据中心 海量 价值

智能电网在发电、输电、变电、配电和用电各个环节产生了海量的数据,电网数据类型复杂,并且数据体量已极具规模,传统数据中心已无法满足海量复杂数据的处理和分析要求。目前,电力企业数据中心已初步完成了结构化数据库、实时数据库、非结构化数据库、地理信息数据库的建设,但是各数据库分别独立部署,数据共享和关联性不高,传统数据中心平台难以快速处理海量复杂数据、无法满足大数据时代下的数据挖掘需求,无法支撑不同类型数据的关联分析应用。因此,电力企业需要积极思考传统数据中心需要如何应对大数据的挑战。

一、大数据的特征

目前大数据(Big Data)在业界尚无形成统一的定义,引用麦肯锡全球研究院在《大数据:下一个创新、竞争和生产力的前沿》报告中的描述,即:大数据是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。虽然大数据的定义还未统一,但大数据的特征却是明确和公认的。

数据体量巨大(Volume)。企业的各种终端设备和传感器产生了大量的数据,PB级的数据集规模可谓是常态。

数据类型繁多(Variety)。大数据时代,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些不同类型的数据对数据的处理能力提出了更高要求。

处理速度快(Velocity)。这是大数据区分于传统数据中心的最显著特征,在海量的复杂数据面前,数据的处理效率就是企业的生命,并且受数据时效性的制约,大数据要求处理速度更快、实时性更高。

价值密度低(Value)。价值密度的高低与数据总量的大小成反比,一段1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何在海量的复杂数据中快速完成数据价值的“去噪”和“提纯”成为目前大数据背景下亟待解决的难题。

二、大数据对传统数据中心的影响

目前,多数企业已建成一体化企业级数据中心平台,能够满足日常业务的需求,但大数据时代对传统数据中心的数据存储能力、数据处理能力、数据交换能力、数据展现能力以及数据挖掘能力都提出了更高的要求,大数据对传统数据中心提出了新的挑战。

2.1 非结构化数据的重要性越来越大

传统数据中心的数据一般来源于用户通过个人电脑、移动终端、POS机等常规渠道生成的结构化数据。而大数据时代数据类型多样化,半结构化数据和非结构化数据呈现爆发式增长,且增长速度远远超过结构化数据。这些通过传感器、监测仪、机读仪器等机器设备产生的天气、位置、音频、文本等海量复杂数据越来越多,企业开始使用这些数据来改进产品、提高效率、寻找缺陷,其数据的重要性将会越来越大。

2.2 数据的时效性要求越来越高

传统数据中心的数据更新周期基本为日、周、月,辅以少量的实时数据更新,商务智能也基本以日、周、月、季度和年为时间维度的静态数据分析。大数据时代,对数据的处理速度和数据的时效性提出了更高要求,而当今社会日益加剧的商业竞争让每个企业都希望能通过实时分析报表和结果数据来随时掌握企业运营状况,并迅速作出决策和判断。以电力电量平衡测算为例,需要实时采集电网数据、实时分析、实时计算,快速测算结果,并反馈至电力调度部门进行有序用电执行预案的实时决策,如果相关数据获取不及时则会大大影响调度部门对有序用电的分析和决策。

2.3 大数据改变数据分析模式

传统数据分析以结构化数据分析为主,业务分析更是以被动式信息接受为主。大数据时代下,随着数据的累积和增加,可做的分析和对比也越来越多。通过对大量的数据进行分析,从而揭示数据之间隐藏的关系、模式和趋势;通过结构化数据、半结构化数据、非结构化数据的融合关联分析,实现文本分析、数据挖掘、图形分析、空间分析等数据分析模式,为决策者提供不同角度不同形式的分析判断依据。

2.4 大数据影响信息基础架构

目前电力企业数据中心主要以Unix为代表的操作系统服务器硬件平台、以Oracle关系型数据库为代表的企业级数据存储平台和以BW(数据仓库,Business Warehouse)、BO(业务对象,Business Object)为代表的企业级商务智能分析平台组成。随着智能电网的发展,半结构化和非结构化数据呈现出快速增长的势头,大量部署的传感器、监视器、智能交互终端等设备都可以成为数据来源,并且其数据量大大超过了结构化数据。大数据时代下,分布式处理的软件框架使得x86服务器开始大行其道,列存储、内存数据库、NOSQL存储、流计算等技术将成为数据存储和处理的主流技术。

传统数据中心商务智能专注单一数据集的分析处理,这造成了不同类型数据之间的割裂。而大数据分析聚合多个数据集,注重不同类型数据的融合集成与关联分析,是一种综合关联性分析。因此,传统数据中心分析处理架构已无法适应大数据时代的分析要求。

三、大数据时代下传统数据中心发展的思考

大数据的核心价值在于从海量的复杂数据中挖掘出有价值的信息,通过大数据技术进行更快地分析、更准确地预测,发掘出新的业务模式,创造新的商业发展机会。因此,大数据时代下,企业迫切需要思考如何应用大数据技术改造完善已有数据中心平台,提升企业的数据处理能力,提高数据分析水平,将大数据融入企业的整体数据方案。

3.1 部署大数据分布式处理框架

分布式处理框架是大数据时代下数据中心架构的基本特征,包括分布式存储和分布式计算。分布式存储采用了可扩展的系统架构,利用多台存储服务器分担存储负荷,它不但提高系统的可靠性、可用性和存取效率,还易于扩展。分布式计算将大量的分析计算任务分解为若干小任务,然后将分解后的任务分配到不同的处理节点,最后将计算结果综合起来得到最终的结果。分布式计算具有更强的并行计算能力和扩展性,且适合多类型数据的混合处理,因此,电网企业需要在原有数据中心架构基础上,构建分布式处理框架,提升数据存储和处理能力。

3.2 研究构建大数据分析处理架构

梳理电网企业数据中心现有的技术架构,研究大数据关键技术,结合目前行业主流的大数据处理架构,重点研究基于大数据平台的数据中心信息基础架构,在保护企业现有信息化投资的基础上,探索适合自身的大数据解决方案,将大数据融入企业整体数据方案。利用大数据技术改造完善数据中心分析处理架构,研究融合结构化数据、实时数据、位置数据和非结构化数据的大数据信息基础架构,构建企业级大数据分析与挖掘平台,实现不同类型数据的融合集成与关联分析,支撑大数据分析应用,提升数据分析和挖掘能力。

3.3 利用大数据分析创造价值

数据的核心是发现价值,驾驭数据的核心是分析。如何驾驭大数据,如何在海量数据中挖掘有价值的信息是重中之重,因此企业更应专注于数据中隐藏的价值,通过应用大数据技术分析,充分挖掘数据的核心价值,不断优化业务流程,降低管理成本,辅助企业做出科学的决策,为企业的持续创新与发展积蓄力量。

信息的影响力取决于数据关联的能力,聚合多个大数据集所获得的新的洞察力要远远超出单一大数据集所获得的洞察力。例如种子公司与农作物保护提供商和气象部门合作就综合利用了多个大数据集,包括天气数据、土壤湿度数据、土壤类型数据、种子数据和其他数据,对这些数据进行交叉关联分析,可以帮助种植户收获更高的产量。而在电力企业,将来自配电、用电、客户、天气等不同数据源的数据经过转换、整合,将会产生新的业务价值。对电力交易数据、气候数据与客户家庭年龄结构、生活习惯等因素融合分析,了解客户用电行为,满足客户的差异化需求,并通过探寻深层需求开辟新的增值业务空间。

3.4 如何让数据驱动业务

如何让数据驱动业务,这是大数据时代下数据中心必须思考的关键问题。传统数据中心疲于应付业务部门的需求,而大数据时代下,数据的复杂性决定了数据中心需要更加快速地应对业务需求的变化和不确定性,因此数据中心必须由数据的保管者和服务者转变为数据的管理者和决策者,从被动的响应业务部门的要求转变为主动向业务部门提供数据服务。

数据驱动业务是指数据作为一种生产力将数据分析挖掘的信息实时、主动地反馈给业务决策者并影响、反哺企业业务的过程。大数据时代下,可以对企业业务进行全过程分析、全方位监控、模拟预测,实时进行反馈,并及时调整决策改善业务发展方向,使得业务可以从数据上立即得以感知,业务可以用数据评价并由数据决策。

第6篇:大数据时代数据的特征范文

[关键词]大数据;企业;管理决策

doi:10.3969/j.issn.1673 - 0194.2016.06.038

[中图分类号]F272 [文献标识码]A [文章编号]1673-0194(2016)06-00-02

正确的决策是企业公共竞争优势的源泉,一项良好的决策能帮助企业产生更优的组织绩效,其效果积累也会为企业造就更强的竞争优势。伴随云计算、移动计算等新兴技术的兴起,数据模式的高度复杂化和数据规模的爆炸式增长标志着全球已进入网络化大数据时代。数据成为最重要的决策依据和基础,能够帮助企业进行更高效、更及时的管理决策,从而尽快创造新的商业机会和契机,转变企业以往僵硬的商业模式。当前我国对大数据方面的研究多基于或限定于技术层面,鲜有从管理学角度、大数据角度来分析企业管理决策的研究。管理决策和大数据应如何定义?大数据是如何发挥影响企业管理决策效应的?诸如此类的问题尚需要系统研究。

1 大数据的定义

维基百科对大数据所作出的定义是:难以在一定时间内,通过常规软件工具来对其内容进行采集、管理、处理等工作的数据集合。此外,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。就笔者而言,以上均是基于大数据特征方面来对其进行定义的。国内很多学者也对大数据的定义作出了探索。以李国杰先生为代表的学者们将大数据定义为:不能在一定时间内通过传统软硬件工具和IT技术对其进行获取、管理等的数据集合。而以冯芷艳为代表的学者们则认为大数据与大规模数据以及海量数据的概念相似,但相异之处是大数据在数据复杂性、产生速度等方面远超现有的技能处理能力,且产生了巨大的产业创新契机。而以刘玉枫先生为代表的学者们认为大数据是指所涉及的资料量超过现有主流软件和工具的承载能力,通过合理时间内采集、管理、整理等为企业经营决策提供更为积极的一种资讯。

作为一种基础性资源,大数据的商业价值绝不是只来自于数据本身,其更多源于企业采集、存储、使用大数据的能力。如果对学者们的观念进行整理归纳可以发现,这些基于大数据特征的定义多数强调大数据规模巨大到现有技术手段的处理能力难以承载。而那些基于其价值的定义也更多是对其价值实现的关注。当然,目前也有学者认为大数据的价值并不局限在数据本身,其只有上升到能力高度,其价值才能充分挖掘出来。

2 大数据对企业管理决策产生的影响

决策贯穿于企业管理的全过程,管理决策过程可分为情报收集、计划选定等阶段。企业的管理决策应涵盖战略决策以及在战略决策过程中的各项具体决策,此类决策注重对组织未来和组织环境的预测,也注重组织内部资源配置和协调的实现。作为一项高度动态性和复杂性的管理行为,决策面对着信息收集、筛选、模糊性及各类冲突。大数据技术的逐渐成熟、数据的飞跃式碰撞,这些都对当前企业的管理决策产生重要影响。这方面的影响既涵盖了决策主体和思维模式,也涵盖了决策文化和组织模式等方面。

2.1 大数据对管理决策主体方面的影响

一项有效的决策需具备相应的决策程序、文化、组织等,但究其核心还是决策的制定者,即决策主体。企业决策主体一般分为两类,一是企业高层管理者,高层管理者的职位权限能让其在重大决策中发挥关键作用。二是基层员工或一般管理者。对一般管理者和基层员工来说,他们创造的产品、服务和价值等更贴近社会大众的需求,这为其正确决策提供了便利。在此过程中,普通员工可以主动引导用户参与到产品的设计、推广、客户关系管理等环节中去,并依据用户的反馈,对产品、服务等加以改进,从而帮助企业实现快速发展。可见,普通员工也是企业获取决策信息的重要来源。

在互联网经济时代,不同产业间的界限性越发模糊,而社会化决策也应用而生。在大数据背景下决策主体发生了转变,从决策权归属来看,一些表现出色的员工开始参与决策,决策主体并不再局限于管理层;从企业决策信息来源分析,因信息技术快速爆炸和普及,普通民众也可以成为大数据时代中的主角,均能通过数据利用参与或作出决策,这也意味着决策主体开始呈现多元化,正从企业精英向普通民众扩展,决策者之间的特征也越发复杂化。

2.2 大数据对管理决策权配置方面的影响

大数据除影响决策主体外,也对企业管理决策权的配置方面产生着影响。笔者认为决策权配置主要包涵3个层面:①组织之间的决策权配置;②组织和外部环境间的决策权配置;③组织内部人员和部门、团队之间的决策权配置。此外,决策权配置分权程度也决定企业的决策权配置模式究竟是集中式还是分散式。集中式决策权主要指在组织系统中,决策权被较高程度地予以集中,其意味着企业较高、甚至最高的管理层掌握着企业组织的大多数决策。而分散式决策主要指决策权在较低管理层次上的分散,让各部门的管理者具备一定程度的自。

在大数据背景下,企业所能获取的信息越来越多,决策组织也开始扁平化发展。信息技术能让中低层管理者基于全局视野制定更好的决策,以金字塔型为标志的传统组织结构逐渐被具备企业管理网络化等特征的扁平式组织结构所取代。企业决策权的配置也应遵循此变化,分散式决策注定要成为大数据背景下主流决策模式,普通员工也将拥有决策权限。随着大数据时代的到来,企业决策需更多人参与其中,因此,扁平化组织结构模式的优势更为明显。

2.3 大数据对管理决策思维方面的影响

作为决策中的重要构成因素,决策主体思维的不同表现也决定在制定决策时,所依据的信息、方式等必然不同,且在决策制定的过程中也会予以表现。决策思维分为理性和感性,在大数据时代背景下,企业要尽量系统、全面、准确地收集信息,并通过数学方法来对其进行建模分析,从而挖掘出背后关系。传统管理决策模式对管理者经验和直觉判断非常依赖,而新的管理决策模式将会改变此种现象,即由“依靠直觉进行的决策思维模式”,向“依靠数据进行的理性决策模式”转变。

2.4 大数据对管理决策文化方面的影响

在不同文化作用下,企业管理决策的选择方面必然存在差异。决策主体在目标确定、方案设计和决策完成的过程中,其文化价值观均在这些方面发挥着作用。传统管理决策多数取决于管理者对企业内外部环境的评估,主观性显著,企业更多关注管理者的思维情感,且管理者制定决策的决策文化也充斥着各种潜在的决策风险和事务。大数据时代来临后,也为规避这些风险和失误提供了契机。日渐成熟的分析技术及爆炸式的数据增长,都为企业更精准的预判提供了更多可能性。企业数据资源的获取渠道越丰富,决策者作出正确决策的概率性就越高。随着大数据时代的到来,企业要提升预判准确性须确立通过真实数据来确定企业决策的文化机制。有学者指出,管理者应注重相关关系,而非对因果关系分外关注,意思是企业应将关注的重点放在如何充分利用自身现有数据来发挥最大价值上,而不是只关注企业管理者脑中思考什么。

3 大数据和企业管理决策管理影响因素分析

大数据时代的到来既为企业带来了大量商业机遇和契机,也产生了许多亟待解决的问题。同时,管理数据和大数据之间的关系也受到了多方面因素的影响,为此,笔者对影响大数据和管理决策关系因素予以充分关注,并在前人研究的基础上,通过宏观层面和微观层面展开分析,对大数据中的数据政策、行业结构、政府支持、技术发展及人才配置等进行探究。

3.1 数据政策

数据在大数据时代中具有无与伦比的价值,其也成为新型商业模式和经济投入的基础因素。伴随着数据规模扩展及数据价值被日益注重,大数据时代数据趋于跨组织便捷化和数字化,因此,在宏观大数据背景下,数据政策是影响管理决策的最重要因素,此种数据决策一般包涵数据安全和责任、知识产权、隐私保护等方面的政策。数据本身存在可复制、可反复利用、泄密性高等特性,企业因此在为作决策而收集数据时经常要面对知识产权、隐私保护等方面的问题,为制定正确决策,获取充分数据,企业必须攻克数据获取障碍的难题。

3.2 行业结构

麦肯锡研究报告指出,大数据价值获取难度很多时候会取决于行业结构和行业差异性。基于数据存储角度,行业总体的大数据增长趋势都很明显,各个行业在数据存储量上存在差异,产生和存储的类型也各有不同。企业的数据强度高,进行决策时则更为有利。

3.3 政府支持

大数据不仅能为企业发挥卓越功效,在提高国家创新能力方面也起到重要作用。为此,大数据也被上升到了国家层面。政府扮演着政策制定者的重要角色。大数据可从信息通信技术基础设施建立、数据安全保护和信息机制共享的建设等方面为管理决策提供帮助。

3.4 技术发展

相当比例的数据价值不是直接呈现给使用者的,其需要使用者对其进行创新性释放分析。大数据技术是作为基础对大数据和管理决策发挥着重要影响作用。容量大和速率较快的大数据工具也是大数据战略中不可分割的组成部分。对决策来说,大数据技术是不可或缺的因素,企业应保持其技术和技能方面的不断创新,从而有效应对数据洪流暴涨对其产生的新挑战。

3.5 人才配置

随着数据越来越廉价,数据处理和提取能力的价值便越发凸显,而这期间,数据科学家和其他相关的信息专业处理人员地位尤为重要。数据分析和挖掘方面的人才匮乏,会严重制约企业数据分析挖掘能力的提升,也必然会对企业管理决策的质量和速率产生影响。为此,人才方面也是大数据影响管理决策的因素之一。

4 结 语

大数据引发了企业管理决策多方面的变化,也为管理决策创新提供了更多的机遇和思考方向。此外,大数据支持下的科学管理决策对企业商业模式和服务等的创新都极有裨益,因此,在大数据时代背景下,只有不断提高决策速率和决策准确性,企业的效益才能实现长久、良性增长。

主要参考文献

第7篇:大数据时代数据的特征范文

随着物联网和云计算等信息技术的发展,数据呈爆炸式的增长,大数据时代已经到来。大数据时代的到来对数字图书馆的信息服务方式造成了巨大的冲击。本文开展了大数据技术在图书馆的应用研究,重点分析了如何将大数据技术融入数字图书馆信息服务中。

【关键词】大数据 数字图书馆 信息服务方式

1 引言

从2012年开始,大数据(Big Data)的概念被炒得火热,渐渐比物联网、云计算还要火热,种种迹象表明大数据时代即将到来。所谓大数据,其泛指海量的数据集合,人们无法利用原有的技术实现对数据集的高效处理,都可称之为大数据。如何从大数据中高效的挖掘出有价值的信息是研究的重点。在大数据时代如何将大数据技术应用于数据图书馆中,为用户提供更满意的服务,已经成为图书馆面临的首要问题。本文研究如何将大数据技术融入数字图书馆信息服务中,从而为用户提供更满意的个性化信息服务。

2 数字图书馆信息服务体系

2.1 数字图书馆信息服务的概述

何为数字图书馆信息服务?数字图书馆信息服务就是通过对信息和资源的搜索,采集,组织,查询,传播,得出各种需要的信息,制作出数据库,因特网,以及电子版等各种多媒体资料,它是一种对信息的采集整合活动,用户可以从中得到二次或者全部文献。

2.2 数字图书馆信息服务的模式

数字图书馆主要是将图书馆内的图书转换为电子数据,并提供图书检索服务。现如今,每个图书馆都可以构建图书馆,不同地区不同国家的图书馆也可以联合构建图书馆,这两种方式其本质都是通过数据集的信息共享来实现图书资源的共享。针对于以上两种不同的数字图书馆构建方式和信息服务方式,可以从宏观上将数字图书管的服务模式分为单一数字图书馆服务模式和多个数字图书馆联合服务模式。

2.2.1 单一数字图书馆服务模式

单一数字图书馆服务模式,从字面上理解,其就是针对于单个图书馆所构建的数字图书馆。单一数字图书馆服务模式所针对的数据集是由单一图书馆所提供的,并不涉及到图书馆之间的数据集交互。其主要针对于单个图书馆进行研究,并发挥该图书馆的特色,针对其特色为用户提供针对性的信息服务。在互联网发达的现在,数字图书馆的一个主要服务模式是通过互联网进行的,而数字图书管的网络服务模式又可分为主动服务和被动服务两种。

其中主动服务是针对与用的需要来提供信息服务,其是以用户未中心的,根据用户需要提供个性化信息服务,用户对图书馆服务的满意度取决于数字图书馆能否为提供用户满意的信息服务,主动式的信息服务模式主要通过分析用户需求和提供信息检索内容来提高用户满意度。主动服务模式的服务流程如图2-1所示。

被动式的信息服务模式,其是以图书馆的管理人员为中心的信息服务模式,其服务的目标是图书馆管理人员,并不考虑用户的实际需求,用户的信息获取方式是被动的,需要用户去适应数字图书馆,信息的接收方式也是被动的。这种信息服务模式从本质上来说提高了图书馆的内部管理和检索效率,但是并没有考虑对用户的服务质量,作为一个为用户提供服务的管理信息系统,该模式通常不能为用户提供满意的服务。被动服务模式的服务流程图如图2-2所示。

2.2.2 多个数字图书馆联合的信息服务

数字图书馆可以被全世界各个国家和地区广泛参与和应用,并且实现信息交流,由世界各国各地的多个图书馆构建起来的数字图书馆,对数据信息化的方式也有很多种,得到的内容也能用许多方式展现出来。因此,数字图书馆对信息的共享和流通有很大的作用,能最大化的满足用户之间的资源共享。要实现多个数字图书馆的联合服务可以通过以下几个模式:数字图书馆联盟、联邦检索服务和制定规范化的标准。

3 基于大数据的数字图书馆信息服务内容

3.1 基于大数据的数字图书馆资源发现

资源发现对图书馆信息服务来说至关重要。信息服务的基础就是资源发现。就大的数据环境来看,数字图书馆的信息资源具有复杂的结构,丰富,广泛的分布等特点,在这些广泛分布的资源信息中发现并找出他们的联系是一个至关重要的点。就目前来看,这些数字资源被储藏在不同的数字图书馆之中,面对各种不同的数据结构,还需要一定的工具和技术供数字图书馆利用,以便更好的发现寻找整合信息资源。

资源发现的目标是,发现更多的符合用户需要的数字化信息资源。在大数据环境下,就是通过大量的技术,从海量的数字资源中,提供用户满意的数字信息资源。

资源发现的内容是,数字化的馆藏信息资源和用户信息资源。在大数据环境下,数字图书馆不仅仅能够提供单一的馆藏信息资源(包括文献数字资源,图书数字资源以及声像数字资源),还应该能够提供用户信息资源的发现(包括用户行为信息资源和用户需求信息资源)。

资源发现的方式根据不同的发现内容,其方式也各有不同。用户行为发现和用户信息需求是信息资源发现的两个主要方面。发现的内容不同倒是结果不同。当然,发现的模式也不尽相同。用户的行为发现有通过在各个网站上的注册信息,雨用户的实时交流,以及各种网络问卷调查这三种模式。用户信息需求的调查包括基于元数据仓储资源发现模式、基于用户数据挖掘和分析的数字资源发现和基于大数据决策的信息资源发现。这些都是发现用户信息的模式,都被广泛利用。

3.2 基于大数据的数字图书馆信息存储

在大数据时代,数字化信息的容量呈现爆炸式的增加,存储的信息不再是简单的文献题目等基本信息,还有文献内部内容的部分信息,数据量从MB几何倍增至TB甚至是PB级别。针对于数字图书馆如此庞大的数据量,如果从其中高效准确的获取所需的数据资源,是大数据时代数字图书馆必须解决的问题。目前已有的文件存储系统的文件存储方式和检索方式已经不能适应如此庞大的数据管理需求。同时在大数据时代,数字图书馆除了要存储图书馆馆藏资源信息外,还需要存储大量的用户个人行为信息以便满足用户的特定需求,在此又涉及到数据结构的问题,在大数据时代数据结构呈现出多维化的趋势,针对结构的不同可以划分为结构化数据、半结构化数据和非结构化数据。如果解决不同结构数据的合理存储、融合、分析和处理是大数据时代图书馆迫切需要解决的问题。现在已有相关技术来解决以上的问题,包括Map Reduce技术、Hadoop技术、No SQL以及云计算。

3.3 基于大数据的数字图书馆信息资源组织

数字图书馆作为一个可复用提供检索服务的庞大信息管理系统,它是大规模、分布式、有组织的和具有资源共享的数据库和知识库的集合体。对于用户而言,其并不关心数字图书馆中数字资源的具体存在形式,其只关心获取的信息是否满足自己的检索需要。为了实现用户需求和检索结果匹配的精确性,就需要两者之间具有某种“默契”。一致性匹配方式是在数字图书馆中,为了更好的为用户提供信息服务,就需要首先针对数字图书馆的馆藏资源进行科学准确合理的描述和组织,进而形成一致的、充分的、有效的、有序的和准确的组织信息,并且为用户提供可检索和可操作的交互接口,最终实现对数字图书馆数字资源充分利用的效果。同时在大数据环境下,数字图书馆的信息资源表现为数量大、结构形式多样化和数据存储分布化的特点,在这种环境下,对数字图书馆的数字资源进行一致化资源组织就尤为重要,大数据信息资源的组织流程图如图3-1所示。

3.4 基于大数据的数字图书馆的信息检索

随着大数据的出现,数字图书馆主要为用户提供图书的检索服务,同时在大数据时代,数据的更新速度越来越快,如果对这些变化的数据进行快速处理,并为用户提供最新的检索信息是基于大数据的数字图书馆信息检索的难点和重点。

在大数据环境下,数字图书馆的服务核心是用户,需要针对与用户需要为用户提供个性化的信息检索服务。在大数据环境下,数字图书馆的检索特征主要呈现以下特征。

3.4.1 个性化搜索

数字图书馆信息检索是建立在对用户信息的收集的基础上进行分析,其中用户信息不仅包括用户的个人信息,还包括用户以往的行为信息。通过对用户信息的数据挖掘,可以准确的定位用户的实际信息需要,并且借助已有的信息推送技术,为用户推送所需的信息。同时数字图书馆的搜索引擎应该具有一定的智能化,根据用户输入的检索关键词,通过智能化分析,为用户提供按照相关度高低排列的检索结果,在保证信息检索准确率的前提下提高信息的查准率。

3.4.2 实时优化需求

在大数据环境下,数据呈现多维化、海量化等特点,而数字图书馆必须提供较高的检索速率,而数字图书馆中大量的数据呈现结构多样化包括结构化的数据、半结构化的数据和非结构化数据,到如今,非结构化的数据在数字图书馆中所占的比例越来越多,大大提高了数据的更新速度。针对以上的情况,图书馆应该根据用户检索需求变化和数据环境变化,对搜索引擎进行实时优化。

3.4.3 移动性需求

随着信息技术的发展,用户获取信息的方式也呈现多元化的趋势,用户期望数据的获取不受时间、空间和方式的限制。为了满足用户的实际需要,同时针对于移动智能终端的特性,数字图书馆应该能够提供移动终端的数据检索服务。

3.4.4 智能化需求

在大数据时代,要求数字图书馆的数据检索服务能够精确的定位的实际信息检索需求,并且能够快速的选择信息检索策略,并将信息检索结果快速的反馈给用户,这都要求大数据时代的图书馆搜索引擎具有智能化。第一,数字图书馆的搜索引擎应该具有“机器学习”的智能化功能;其次,搜索引擎应该能够通过“机器学习”过程,为用户提供多元化的数据检索服务;最后搜索引擎应具备实时更新功能。

4 结束语

近年来,随着信息化技术的飞速发展,数字图书馆的数据量呈飞速增长趋势,数据的存储成本和处理成本大大降低,并且随着数据挖掘技术的飞速发展。面对这一现实状况,如何正确的面对信息时代的“热门话题”,对其不能简单的推崇,而是需要“冷静思考”,准确的分析其利弊。大数据带来不仅仅是一个大机遇,更可能是一个巨大的挑战。可以这样说,大数据时代大大提高了人们对数据的驾驭能力,同时为人们对海量数据的处理提供了新的方法和策略。到如今,大数据已经充斥在人们的日常生活中。针对于这一现实情况图书馆如何正确合理的使用大数据技术改变图书馆的原有的信息服务方式,为用户提供更好的信息检索服务是图书馆未来的主要研究方向。

参考文献

[1]李广建,杨林.大数据视角下的情报研究与情报研究技术[J].图书与情报,2012(06):1-8.

[2]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(05):37-40.

[3]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(04):120-122.

[4]王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013,(3):81-83.

[5]刘明,李娜.大数据趋势与专业图书馆[J]图书馆工作与研究,2013(04):1-6.

第8篇:大数据时代数据的特征范文

关键词:煤矿;大数据;安全管理

0引言

安全工作是煤矿所有工作中的重中之重,它渗透于煤矿生产、加工、销售等各个环节,如何有效增强煤矿的安全管理,是提升煤矿综合管理水平,促进煤矿长远发展的重要保证。信息时代的到来对煤矿生产管理带来了许多机遇与挑战,不少煤矿已经投入信息化建设之中,并未安全管理积累了海量的数据,如监测数据等。由于分析工具的不完善,这些数据并没有得到充分地开发利用,因而其价值也并未完全实现。大数据的出现对解决此一问题提供了很好的契机,笔者从此出发,就大数据助力煤矿安全管理做了相应的研究。

1大数据的概述

大数据是信息技术发展到一个新阶段的产物,它最早由美国数据科学家提出,后经由麦肯锡研究院发表的研究报告而盛行全球。大数据,顾名思义,以“大”为特征,它强调数据的海量性,数据规模甚至了超过了传统数据库软件的工作能力范围,不得不依托于云计算来处理。总而言之,大数据有以下五个重要表征:体量大、类别多、速度快、真实性高以及价值密度低[1]。大数据是大数据时代的信息处理技术,它以云计算为基础,将大量结构化、半结构化乃至非结构化的数据分布到不同计算机构成的信息资源池中,从而获得分析与预测的结果。大数据相比于传统的信息处理技术而言,它有着多重价值。首先,大数据以海量的数据为基础,这符合当前信息时代数据爆炸的现状,是应对时展的必然产物;其次,大数据强调速度与价值,它能在最短的时间内对数据进行分析处理,从而在无数的数据中挑选出最有价值的部分,也就是说大数据的洞察力是其存在的客观依据;最后,大数据与云计算是不可分割的整体,随着信息时代的深入发展,它们已在全球范围内引发了一场商业与技术的双重变革,大数据正是大数据时代不可或缺的重要工具。

2大数据应用于煤矿安全管理中的策略研究

安全问题长期以来是制约我国煤矿发展的老大难问题,尽管2014年我国的煤炭百万吨死亡人数比率已经下降到0.255,但相比于其他产煤大国如美国、澳大利亚等,仍然有不小的差距[2]。大数据的出现为煤矿加强安全管理提供了一个窗口和契机,并且煤矿数据本身也存在着体量大、变化快、价值密度低等大数据的特点,因而,将大数据应用于煤矿安全管理之中是必然之举。

2.1强化技术认知,转变管理思维

信息化建设是煤矿为应对时展而采取的改革举措,经过多年的努力,已取得初步成效,并诞生了大量的数据,诸如矿山地质数据、矿图数据、环境监测数、视频监控数据等,这些数据分结构化数据与非结构化数据两种,其中非结构数据占绝对主体。管理者必须转变过往的管理思维,由抽样分析转变为全样本数据分析。大数据以分析煤矿结构化以及非结构化的全体数据为工作内容,它相比于抽样分析而言,尽管在数据的精确性上有所不如,但全面性大为增强,不仅如此,大数据还能发掘不同数据之间的关联性,并有效地捕捉传统分析工具中容易忽视的细节,从而逐步降低煤矿安全管理中的人为性错误。

2.2落实重点管理,做到实时监测

煤矿安全管理是一个系统性的工程,它包含很多层面的内容,如安全作业制定的制定、矿工安全作业的培训等等。面对如此复杂的管理内容,管理者要善于把握重点,如此才能做到高效管理,提升煤矿的安全水平。目前,随着煤炭事业的不断发展与转型,煤矿机械化与自动化程度与日俱增,甚至可以说,矿山设备能否安全运行对煤矿的安全生产起到了决定性的作用。在传统的管理模式中,通常是在设备出了问题之后再进行检修,这不仅耽误了煤炭的生产,还会给煤矿工人带来安全风险。大数据则为化解此一难题提供了很好的契机,管理者可以在重点矿山设备如矿井通风机上安装遥感器,记录并收集诸如风速、振幅等数据信息,通过大数据对所有数据进行分析和对比,及时将异常现象呈现出来,从而尽早安排工作人员在故障发生之前就进行相应的检修,降低设备损失,提升安全性能。

2.3强化事故分析,做好预先防范

安全事故是煤矿开采中难以避免的现象,同时也是煤矿安全管理过程中所极力防范的现象。尽管,我国每年由于煤矿事故而死亡的人数已由2002年的7000余人将至2014年的931人,但我国仍然是矿难死亡人数的主要国家之一,采矿事业仍然未脱去高危行业的帽子。事故分析是安全管理的重要内容,它能够通过事故发生原因的追溯、相关责任人的惩办来起到安全教育的作用。但这种分析仍然是浮于表面的,它对安全管理的效用也十分有限。大数据的出现为事故分析提供了一个新的视角,它能够从数据分析的角度来重新找寻事故发生的规律、模式,从而为煤矿采取针对性的防范措施提供可靠的建议。就以瓦斯事故爆炸而言,传统的事故原因分析大都从火源、甲烷浓度以及设备、管理等要素入手,缺乏全面性与细致性,有时候得出的结论也缺乏说服力。大数据则会全面收集瓦斯爆炸区域的所有数据,包括空气参数、抽采参数等等,进而分析与推测,并形成相应的结论。这种事故分析方式更具科学性,对未来的安全管理工作也更具指导性,是煤矿做好事故预先防范的基础。

3结语

大数据时代的到来为各行各业的安全管理带来了不小的机遇,煤矿事业也不例外。大数据在数据的收集、处理、分析上更具全面性,对于煤矿的安全管理也更为有效。因此,煤矿管理层应该从将大数据应用于煤矿的日常管理之中,从管理思维、管理重点以及事故分析三个层次做好相应的工作。

参考文献:

[1]方巍,郑玉,徐江.大数据:概念、技术及应用研究综述[J].南京信息工程大学学报,2014(05):405-419.

第9篇:大数据时代数据的特征范文

大数据,作为一种数据管理的理念和方式,其之所以出现,是云计算和物联网等信息技术的发展,与人类社会所积累的数据高速增长并海量积累相结合的结果。无论是如何定义,从本质上,大数据是信息管理者在当今的信息技术条件下,为解决新的海量信息处理需求,所提出的解决策略。而作为典型的信息管理活动之一的档案事业,势必会受到大数据理念的影响。

大数据并不是一个严谨而完整的学术概念,其所包含的内容相对比较抽象,从字面意义上进行理解,大数据所指的是数据规模的庞大。但从这一意义上来看,显然无法与传统的以往一系列概念进行区别,如“海量数据”(Massive Data)、“超大规模数据”(Very Large Data)。在学术界,对于大数据的定义尚未形成统一的观点,但综合各种说法,主流的思路是从大数据的特征出发,通过归纳的方式,通过对特征的描述进行定义。其中最有代表性的是3V定义[1],即认为大数据需满足3个特点:规模性(Volume)、多样性(Variety)和高速性(Velocity)。此外在实践层面,普遍认为大数据具有全数据规模、多数据类型、低价值密度、高处理速度的特点。

在数据管理理念层面,大数据的特点在于全数据规模、丰富的数据类型(可能包含半结构化数据)、全数据处理对象、多数据处理工具;在数据处理技术层面,大数据体现为对云计算和新一代数据库的应用;在操作方式层面,大数据体现为对零散信息价值的重视及对数据之间相关而非因果关系的分析。

二、大数据对档案工作带来的机遇

(一)解决信息化背景下档案的“胀库”问题

近年来,随着电子文件的理念逐步得到认可,以及档案的单位管理成本的降低,加之人们对于归档保存的重要性的认识的提升,我国的档案总量步入了一个高速增长的时期[2],但与此同时,信息化背景下的档案数据库胀库问题也随之到来了,其中较为明显的表现为“新增数据失败”等[3],胀库问题带来的,不仅仅对新增档案管理上的难题,同样重要的是,由于胀库现象的出现,档案的服务利用的效率将大打折扣,其原因在于案卷在出现胀库的过程中,无法及时有效地归档并建立索引以提供服务,破坏了档案案卷之间的连续性和关联性,降低了档案中所提供的信息的价值。信息化背景下档案的“胀库”问题,本质上在于存储和计算资源分配的不够合理,传统的数据库架构在处理新的海量数据的过程中,灵活性远远不够。解决这一问题,需要求助于大数据技术框架中的云计算技术[4],利用云计算技术强大的调配计算资源的能力,根据数据处理规模的需要,配置数字化档案管理所需要的存储和计算资源,保证档案的服务利用效率。

(二)有利于推动社会档案观的普及

大数据的核心在于从海量的数据中挖掘价值[5],这为档案价值的进一步发现和提升,提供了一个新的思路。传统的档案服务利用概念中,档案的服务利用对象是特定并且相对单一的,原因在于档案通过卷宗的形式,将一个相对完整的信息“包裹”存留,这部分相对完整的信息最终成为了档案卷宗的主题。而在服务利用的过程中,“主题匹配”成为了最为常见的档案定位方式,而主要来自于政府机关、企事业单位的日常运行信息形成的档案,其主题自然会牢牢地与其形成机关的业务活动相对应,而档案卷宗中所包含的零散的信息价值,相对容易被忽略,如今被公众广泛利用的档案,多数是民生档案[6],而其他类型档案中的零散信息价值,缺乏有效的挖掘服务利用手段,这是社会档案观在普及过程中必须解决的问题之一,即如何帮助公众挖掘他们所关心的分散于海量档案中的信息价值。大数据为档案的服务利用提供了新的价值挖掘工具,使得分散在海量数据中的零散价值成为可能,这就意味借助大数据的信息分析工具,公众将能够从主题上看上去并不相关的众多档案中,发掘其自身所需要的信息,获取相应的信息价值,将推动公众逐渐意识到档案作为当今社会最重要的信息价值载体之一的重要意义,而一旦这样的意识逐步成型,档案社会观将得到普遍的认可。

(三)有利于处理多载体类型的档案

信息技术的发展对于档案管理工作的重要影响之一,就是提供了多样化的信息载体形式,丰富了档案的类型,从最原始的纸质载体的文书档案,发展到如今的音像档案、图片等等。而随着电子文件概念不断获得认可,新的信息载体形式层出不穷,从理论上讲,每当出现一种新的信息载体形式,就会相对应地出现该载体形式的档案。这就意味着未来档案的管理工作必将是基于多载体的,其载体的丰富程度可能会远远超过我们的预期,而为最大程度保证原始证据价值,在技术条件允许的前提下,未来的档案管理工作将会尝试接受半结构化的数据作为档案,以最大程度地保留证据价值[7]。这使得未来的档案载体形式将呈现数量多、增长快的特点,这就要求针对具体档案类型的管理工具,或者抽象为一类特定的数据处理工具,是无法实现“One size fit all”的,即不再存在能够完美处理所有的档案载体类型的管理工具。这一点上与大数据对处理多数据类型过程中所提出的数据工具组合的理念,是相一致的。未来的档案服务利用活动,由于其面向的档案对象的载体是多样的,对其进行利用的工具也将是多样的,甚至为处理一些半结构化的数据的过程中,可能会需要多种数据处理工具的组合。

(四)有利于电子文件的管理

大数据将从真实性、有效性、及时性三个方面提升电子文件的管理水平。首先从真实性角度考虑,由于电子文件惊人的增长速度,其真实性鉴定工作一直是困扰档案工作者的难题之一,传统的“直接鉴定法”在实际操作的过程中所消耗的人力物力成本过于巨大[8],因此鉴定文件的真实性需要求助于大数据技术处理海量数据并分析复杂数据的能力;第二,从有效性角度考虑,电子文件的结构化特征并不明显,大量的电子文件都是半结构化甚至是非结构化的,在这种数据类型情况并不稳定的前提下,处理数据对象单一的传统档案管理数据库结构是难于驾驭的,而大数据技术框架下对于多数据结构的兼容性,能够较好地解决这一问题,提升对电子文件进行管理的有效性;第三,从及时性的角度考虑,电子文件的指数增长,使得及时地对新增档案进行管理成为了档案工作者所面临的一大难题,这样的海量数据的实时处理,是档案管理过程中前所未有的,这需要利用大数据技术框架中通过云计算的方式提升数据处理的及时性,才能保证电子文件管理的及时性。

三、大数据背景下档案工作的发展趋势

(一)从数字化到数据化

为应对信息时代对于档案工作新要求,档案数字化的工作已经进行了多年,并在一定程度上解决了传统档案利用信息技术进行管理及共享的问题[9],收到了相当的成效。但在大数据时代背景下,数字化仅仅是解决了载体形式或者说是信息技术的应用问题,可以理解为档案工作对信息技术的适应性应用,对于深入的数据挖掘与利用是远远不够的。在大数据的时代背景下,信息管理者已经不再满足于更易管理和共享的信息形式,应更为关注信息所能带来的价值,这就要求对于档案的管理工作框架,需要实现从数字化到数据化的转变,即不仅仅能够实现对档案案卷的数字化管理,更能够根据海量数据挖掘利用的需要,对档案的管理深入到数据层面,这将更为适合大数据技术架构下对数据的“流处理”模式。

(二)从信息共享到信息价值共享

随着大数据时代的到来,数据挖掘技术的应用进入了一个全新的阶段,所有的信息管理者都面临着同样一个问题:将简单而直接的信息共享活动转换为更为高级的信息价值的共享,即需要对自身所掌握的信息的价值有清晰的掌握和准确的理解,对应到档案工作者的现状上,即档案工作者仅仅了解自己在管理哪些档案并提供服务利用,已经无法适应大数据时代对档案服务利用的要求了,而需要能够了解自己所掌握的档案能做什么,所提供的档案利用服务所实现的是什么功能,也就是要明确所掌握的档案的价值。这需要对档案利用服务的认识有更加深入的认识,在大数据时代的背景下,由于对信息价值提取效率的提升,对于信息价值的共享将成为所有信息服务利用的主流趋势,这对档案服务利用工作将是全新的挑战,这不仅仅要求能够灵活地运用大数据技术在整合档案数据的基础上挖掘其中蕴含的价值,更加需要档案工作者对于信息价值有着更为敏感的“嗅觉”。

四、大数据对档案工作带来的挑战

(一)如何嵌入数据挖掘环节

传统的档案管理活动,最为通行的说法是包含收集、整理、保管、鉴定、统计和提供利用六个主要环节,这六个环节组成了基本的档案管理活动,并组成了一次完整的信息从收集到提供利用的过程。在大数据的时代背景下,对于档案管理活动提出了新的要求,即主动地挖掘其中的价值并提供利用服务,这就涉及到一个流程嵌入的问题,即数据挖掘环节应该通过什么样的方式嵌入到档案管理活动中来,是作为一个单独的环节嵌入到档案的管理流程之中,还是在传统的档案管理活动的某一环节中实现数据挖掘的功能,直接关系到档案管理活动流程的合理性。数据挖掘的嵌入问题,当档案事业逐步步入电子文件时代之后,必须要解决的问题。

(二)如何保障档案信息的安全性

大数据对于档案信息的共享程度提出了更高的要求,只有在档案资源高度共享的情况下,大数据技术框架下的云计算平台才能发挥作用,真正实现档案信息价值的利用。但随之而来,就是档案信息的安全性问题,如何解决在多类型、多结构、高共享程度状态下的数据安全问题,已经显得十分棘手。工作人员操作失误、设备及网络故障、计算机病毒、网络黑客攻击等对档案信息安全构成威胁的因素,在大数据的技术框架下,所造成的威胁可能会被相应地放大。大数据时代的档案信息的保密工作,其重心很有可能不再是保密体制的设计,而更有可能是信息安全技术的有效应用。

相关热门标签