前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的大数据调查方法主题范文,仅供参考,欢迎阅读并收藏。
/ 企业未来三年主要关注的领域 /
调查结果显示,有80%的受访ICT企业将在未来三年内关注云计算领域,74%的企业关注移动互联网领域,61%的企业关注大数据领域。可见,云计算、移动互联网和大数据是目前以及未来三年内业界最火热的三大领域。与去年相比,企业对大数据的重视程度有大幅增加,大数据时代已经来临。在用户为王的年代,不管是大数据,还是云模式,都能够帮助企业更好地接近用户,挖掘用户需求,从而最大程度地提升产品的用户体验,最终为用户带来最贴近其需求的产品,为企业树立良好的品牌形象,带来经济利益。
/ 移动互联网的到来对企业的影响 /
从调查结果可以看出,移动互联网的出现确实影响了企业的方方面面,几乎所有的企业都反馈,移动互联网影响到了他们的办公方式。此外,借助移动互联网完善销售流程、进行营销推广、构建新的运营模式等也是IT业界的新趋势。不管是传统的IT厂商,还是软件厂商,都通过成立专门的移动互联网部门、收购移动互联网企业等方式来进军移动互联网领域。可以说,移动互联网的诞生深度影响了企业的发展战略,改变了企业的运作方式,提升了企业的运转效率。
/ 云计算落地存在的障碍 /
调查结果显示,虽然目前云计算在中国的发展状况不错,但依然存在诸多障碍。存在安全问题、用户对服务的认知度不高、没有统一标准以及概念混乱是阻碍云计算发展的主要原因。目前,由于对云计算的认知不够,很多用户都称云计算为“晕”计算,这就需要涉足云计算的厂商与技术开发者做好沟通,以云计算为手段,设计出贴近用户的产品,才能逐渐使用户对云计算有更明确的认知,这对厂商来说可谓任重而道远。在互联网时代,安全是永恒的问题,云计算的出现会为网络安全带来隐患,用户会有顾虑而不会轻易使用云服务。此外,制定云计算的统一标准和明确云计算概念也是政府和行业亟待联合解决的问题。
/ 企业使用社交商务服务的领域 /
近年来,社交网络进入了我们生活。特别是最近几年,发展十分迅猛。根据调查结果,有79%的企业会借助社交网络进行产品和服务的市场推广,63%的企业会借助社交网络进行客户关系的维护与发展。社交网络为企业提供了大规模的用户资源,还为企业提供了更宽广的宣传和推广平台。社交网络还为企业的客户关系管理带来了新的变化。过去,客户信息保存在企业自己的数据库中,企业知道客户真实的信息。但今后,除了企业自身拥有的数据,社交网络也为企业提供大批客户数据。此外,微招聘、产品的研发沟通也是社交网络为企业带来的不可忽视的变革。社交网络对企业发展的价值已经显现,但若想被深度利用,就需要企业清晰明确地认识到社交网络的价值,然后将其逐步应用到日常办公当中。
/ 企业为迎接大数据带来的挑战将做出的改变 /
作为IT领域的关键词,“大数据”被不断地被大书特书。当前,得益于互联网尤其是社交网络的快速发展,承载着用户信息的数据量飞速增长,大数据时代已经来临。企业关注大数据,是因为海量数据有巨大的商业价值,能够为企业带来丰厚的利益。目前,很多企业都为迎接大数据时代的到来做了充分准备,67%的企业表示会优化存储架构,有效存储、利用、分析非结构化数据,获取商业价值。这说明,为了充分挖掘海量数据的价值,企业必须做好数据存储的优化工作,还要注重数据分析阶段,加大BI投入。从调查结果看,超过半数的企业注意到了这几点,这说明他们的大数据之路走得越来越成熟。
英特尔
在这个融合创新的时代,移动终端与计算设备的发展,与其说符合“物竞天择”的进化论,不如说是融合创新的演进过程。当下,融合正成为移动互联产业发展的新动力、新方向,而最显著的特征,就是从上到下各种设备都将具备触控功能,将消费者带向一个“全触控”体验新时代。此外,融合不但体现在移动终端和应用,在终端和云之间也有所体现。
Informatica公司
Informatica公司大中国区总经理王晨杰认为,社交计算和移动计算的采用,意味着数据采集的量大大增加。企业越来越强大的云计算应用部署同样产生了大量的云端数据。他说:“这些庞大的新型数据能够带来前所未有的商机,企业能够通过掌控大数据提高运营效率,降低 IT 基础架构和数据管理成本,并更好地管理品牌和客户关系。”
长虹佳华
云计算时代的到来提供了机遇和挑战。长虹佳华一直站在IT发展的前沿,多年前就敏锐地感觉到,云技术会成为未来IT发展的重要方向之一,并为此做了大量准备和技术积累。长虹佳华云体验中心不仅能为特定的行业用户提供定制的云技术解决方案,而且还能为下游渠道和客户提供基于云架构的数据全流程解决方案和增值服务。
据工信部运行监测协调局的统计显示,2015年1-11月,全行业生产液晶电视1.37亿台,国内市场预计全年出货量超过5500万台;另据中国智能多媒体终端技术联盟的相关数据显示,在内销产品展中,具备“可联网”、“开放OS”和“互联网电视平台接入”等基础功能的智能电视终端,渗透率已攀升至七成以上。
高渗透率下,一方面,智能电视大数据市场已成规模,而大数据在广电行业收视领域中的应用,成为了大数据拥有方瞄准的热点市场之一;另一方面,智能电视的普及也给电视收视率调查的变革带来了可能。
在这种大背景下,2015年12月21日,作为传统电视收视率调查机构和智能电视数据拥有方的两个行业巨头――CSM媒介研究与欢网科技举行了战略合作会。双方宣布共同开展智能电视大数据在电视收视领域的研究,携手推动和建立智能电视收视大数据的标准化应用;同时开展智能电视多维数据的研究应用。
据悉,CSM媒介研究是国内电视行业收视率通行货币的权威提供者,拥有世界上最大的电视收视率调查网络。欢网是目前国内最大的互联网智能电视服务商,独家拥有TCL和长虹的智能电视用户收视数据。CSM与欢网科技的本次战略合作,将聚焦于智能电视大数据,共同研究智能电视大数据在电视收视行为、广告效果评估与受众研究领域的应用。
对于双方的战略合作,CSM媒介研究董事长唐世鼎先生指出,本次合作集结了CSM在收视率调查领域的权威性资源和欢网在智能电视大数据上的优势。双方合作的具体内容包括:围绕电视观众行为,开展包括实时收视数据、收视行为与观众消费行为等多元数据融合在内的多项应用探索,推动建立智能电视收视数据系统应用的行业性标准,包括标准的监测方法、规范的指标体系、统一的平台;集结智能电视大数据领域的优势资源群体,共同推动建立智能电视大数据联盟,联通智能电视大数据领域的“数据孤岛”,为智能电视大数据科学有效地应用于电视受众研究搭建融通与共享的开放式合作平台;基于双方资源,共同开展智能电视广告全方位监测和第三方效果评估研究;合作开展互动应用服务、家庭互联网行为等智能电视多维大数据研究应用。
将数据孤岛联接为开放式平台
跨屏传播时代的受众研究,新媒体大数据和传统抽样小数据同时并存,将在相当一段时间内成为常态。打破数据壁垒,打通大小数据,探寻从媒介融合到效果融合、到数据融合的科学之路,是一项重要的时代命题。
“数据孤岛”是目前大数据发展的一个瓶颈,它是指企业规避数据整合而直接进入应用阶段,造成大数据的应用偏差不断出现,而出现此问题的原因就在于大数据融合不够。通过建立大数据联盟,不同数据之间可以增进协同,将私有大数据发展成公共大数据,最终实现数据融合。
在谈到CSM和欢网在战略联盟中的角色时,欢网科技CEO吴盛刚先生做了一个形象的比喻,“就像布和衣服的关系,需要一系列的新增元素,换句话说,布需要科学的方法裁减之后才可以变成衣服。”
所以,建立开放共享的大数据联盟,联接各个孤岛,势在必行。
“这个大数据联盟,会将主要品牌智能电视机的服务商逐步纳入其中,不仅有欢网科技的TCL、长虹的大数据,还要包含全中国的主要智能电视的大数据,这就是建立大数据联盟的意义。CSM希望成为这其中的第三方的角色,推动建立大数据联盟,让每个品牌的‘智能电视机大数据孤岛’相互联通,形成真正的覆盖全部智能电视的大数据。”CSM媒介研究副总经理肖建兵表示。
其实,CSM媒介研究与欢网科技倡导建立的智能电视大数据联盟早在筹划之初,就引起了行业关注。目前,除欢网以外,国内知名的智能电视大数据服务商奥维云网、一点网络等也表示将积极参与智能电视大数据联盟的建设。
为智能电视数据树立权威标准
智能电视大数据市场已成规模,但在大数据收视调查领域,目前还缺乏统一标准,难以形成整体生态,这困扰着电视行业的实践。同时,“数据孤岛”所代表的局部利益,进一步加剧了大数据在电视收视领域应用的复杂性和不确定性。数据源获取的稳定性,未来会成为竞争的焦点,而理想的数据源应该横跨不同区域的终端厂家。
所以,建立行业标准,解决智能电视大数据的分散资源迫在眉睫。在这方面,很多专家都有深刻的认识。
中国传媒大学受众研究所所长刘燕南指出,“当前行业从事相关数据调查的公司不在少数,但良莠不齐。所以,建立统一的标准对整个行业生态的健康发展有重大的意义。而CSM是在国内耕耘多年,有良好的信用的调查公司,我们希望CSM在大数据领域、基于合作双方的优势资源,联通大数据的督导、统一的平台,为行业发展提供坚实的标准化的定量支撑。”
“实时记录、追踪、呈现和刻画用户肖像,在实时收视数据系统领域进行多项应用探索,开发其数据价值,是用户的迫切需求。行业呼吁在这一应用领域中能尽快推出科学客观的价值量化标尺,希望此次战略合作提供的不仅仅是产品,更应该成为最终被市场检验、被行业认可的通用测量标准。”北京电视台研究发展部主任、CSM用户委员会代表秦新春女士表示。
“过去几年,CSM通过与数字电视、IPTV、电信运营商等的多形式合作,在大数据的收视调查应用上积累了丰富的经验。此次与欢网的合作是CSM在大数据应用领域的又一个大动作。在对智能电视大数据的观念和应用上,双方有着高度一致的共识。CSM将充分发挥标准化资源优势,与欢网共同研究建立符合行业需要的、科学、可靠的智能电视大数据收视应用标准体系。”CSM媒介研究总经理徐立军表示。
对于双方将共同开展的智能电视广告全方位监测和第三方效果评估研究,吴盛刚表示,智能电视广告行业目前处于一个终端飞速扩张、但广告价值尚未被有效认可的阶段,希望借助包括央视市场研究(CTR)和CSM在内的第三方机构的科学、专业、透明的广告监测体系和客观公正的效果测评,来推动智能电视行业的商业模式建立。
深入挖掘电视数据的多元应用
近两年尤其是2015年,大家都在抢占电视大屏入口。从微信摇一摇到支付宝红包再到电商与卫视的合作直播,电视的价值被重新挖掘。而智能电视终端让观众的收视习惯从单向转变为双向互动,更是提升了电视的行业价值。
今天,我们不仅仅可以了解观众在看什么电视、还可以与同源样本比对分析,了解观众的购买行为,甚至发现人的喜怒哀乐、甚至促成收视行为向消费行为的转化。”CSM媒介研究总经理徐立军说,“基于这样的突破,我们可以通过电视数据分析,承载一系列的后期服务,将观众变为用户。”
“除了广告以外,智能电视需要给用户提供更多的娱乐服务,当然还有一些关联服务。通过数据分析,可以非常清晰地了解到,用户除了看,还要买、还要玩,还有衣食住行。比如说用户对旅游节目比较关注,我们就可以做关联的咨询和旅游服务。”吴盛刚补充道。
关键词:敏感性问题;抽样调查
无论是进行社会问题研究还是进行市场需求的统计分析研究,运用的最为普遍的是抽样调查。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。抽样调查可以分为两类,即概率抽样和非概率抽样。
现在被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。抽样调查按抽样的组织形式划分,有以下几种主要方法:(1)简单随机抽样(也叫纯随机抽样,SPS抽样)。(2)等距抽样(也叫机械抽样或系统抽样,SYS抽样)。(3)类型抽样(也叫分层抽样,STR抽样)。(4)整群抽样(又称集团抽样)。(5)多阶抽样(又称多级抽样)。(6)二重抽样(又称两相抽样)。(7)比率抽样(PPS抽样)。
抽样调查中存在的主要问题:1.确定样本框难度大。2.被调查者不配合。3.调查者素质较低,能力差。4.问卷调查表设计不合理。针对上述提到的问题,我们应该认真研究合适的调查方法和技巧:(1)健全调查网络,建立稳固的调查队伍提升调查员的业务素质,这是减少调查误差的关键。(2)宣传统计法律,打消被调查者的心理顾虑,这是取得准确调查数据的基础。(3)采用迂回访谈,经常换位思考,消除防范心理,从而获得准确数据。(4)科学判断评估。抽样调查除了本身存在的抽样误差外,还存在调查误差。因此对调查数据质量进行科学评估显得尤为重要。
大部分的抽样调查,都会遇到随机抽样误差以外的误差,这些误差会导致产生偏差,使得置信叙述没有意义。产生误差的原因主要有:涵盖不全,即在选样本过程中,如果总体当中的有些部分,根本未被纳入选择范围,这时就发生了涵盖不全的问题,即使从该总体中随机抽样,所得结果还是有偏的;无回应,即无法得到已经被选入样本的个体的资料,最常发生无回应的原因,是联络不上受访对象或者受访对象拒绝回答。一项抽样调查中所宣称的误差界限只包括随机抽样误差。涵盖不全、无回应以及其他实际困难也会造成较大的偏差,但是误差界限并没有包含这些项目在内。从而,我们应尽可能减少这方面造成的偏差。好的技巧都有减少误差的作用。
当调查的问题比较敏感时,被调查者一般不愿意回答,或者即使同意回答但是却做出虚假的答复,这都会造成无回应的发生。例如涉及“你是否赌博”,“曾经是否作弊”,运动员“是否服用兴奋剂”的问题,有过如此经历的人是不愿意承认的。
我们以调查体育运动员服用兴奋剂所占的比例为例,为了得到实际的值,调查人员让运动员在无人的场所内,从装有黑球和白球的袋子中任意取一球,观察其颜色后放回,并承诺若取得黑球就讲真话,取得白球就讲假话,被调查者只需要在匿名的调查表中选“是”或者“否”即可。其中,袋中黑球和白球的比例分别是p0,q0(p0+q0=1)。
下面的问题是如何得到p值的估计p,p是否p是的无偏估计,为了得到更精确的估计,我们的抽样调查方法应该如何改进。
一、p值的估计p
对于任意一名运动员,设事件A1=“回答曾服用兴奋剂”,事件A2=“实际服用兴奋剂”,利用全概率公式得到
p1=P(A1)=P(A1|A2)P(A2)+P(A1|A2)P(A2)
=p0P(A2)+q0P(A2)
=p0P(A2)+q0(1-P(A2))
=q0+(p0-q0)P(A2),
于是,当p0≠q0时,我们有
p=P(A2)=P(A1)-q0p0-q0=p1-q0
p0-q0。
根据概率的统计定义:若是调查了n名运动员,其中有m名运动员回答“是”,则我们用频率来近似概率,便有p1=m/n。从而得到p的估计值p=p1-q0p0-q0。
例:在运动员服用兴奋剂比例的调查中,设袋中黑球与白球的比例分别是p0=3/1.,q0=7/10,运动员中回答“是”的比例是p1=19/30,从而我们得到p的估计值
p=19/30-7/103/10-7/10=16。
二、p是p的无偏估计
命题1:当p0≠q0时,p的估计p是p的无偏估计。
分析:要得到p是p的无偏估计,只需证明Ep=p,又Ep=Ep1-q0p0-q0,于是只需要求出Ep1即可。
证明:设X1,X2,……,Xn是独立同分布随机变量序列,其中
Xi=1,第i名运动员回答是
0,第i名运动员回答否,i=1,2,3,……,n,
则有
p1=X1+X2+…+Xnn,
且EXi=P(Xi=1)
=P(Xi=1|取到黑球)P(取到黑球)+P(Xi=1|取到白球)P(取到白球)
=pp0+(1-p)q0,
从而有
Ep1=E(X1+X2+…+Xnn)=EXi=pp0+(1-p)q0,
所以
Ep=pp0+(1-p)q0-q0p0-q0=p。
命题2:当p0≠q0时,对于p值的估计p,有pp,a.s. 。
证明:由强大数定律[1],我们有p1EX1 a.s., ,即存在样本空间Ω中的点集Ω0,满足P(Ω0)=0,且limn∞p1=EX1,ω∈Ω\Ω0,从而有
limn∞p1-q0p0-q0=EX1-q0p0-q0=p,ω∈Ω\Ω0或limn∞p=p,ω∈Ω\Ω0,
即pp,a.s.。
几乎必然收敛和依概率收敛这两种收敛性分别对应强大数定律和弱大数定律,强大数定律比弱大数定律要强,从而几乎必然收敛可以推得依概率收敛[2],我们得到下面的结论:
推论:当p0≠q0时,对于p值的估计p,有pPp。
三、如何设计才能减少误差
命题3:当p0≠q0,且|p0-q0|增大时,p的方差Dp减小。
证明: Dp=D(p1-q0p0-q0)=Dp1(p0-q0)2,由命题1的证明过程知
Dp1=DXin=EXi-(EXi)2n=
pp0+(1-p)q0-(pp0+(1-p)q0)2n,
从而有
Dp=Dp1(p0-q0)2=pp0+(1-p)q0-[pp0+(1-p)q0]2n(p0-q0)2
=p(p0-q0)+q0-p2(p0-q0)2-2pq0(p0-q0)-q20n(p0-q0)2
=p(p0-q0)-p2(p0-q0)2+p0q0-2pq0(p0-q0)n(p0-q0)2
=p(p0-q0)2-p2(p0-q0)2+p0q0n(p0-q0)2
=1n[(p-p2)+p0q0(p0-q0)2
]
又p0q0(p0-q0)2=
(p0+q0)2-(p0-q0)24(p0-q0)2=
14(p0-q0)2-14,代入上式得
Dp=1n[(p-p2)+14(p0-q0)2-14]。
由此可见,当|p0-q0|增大时,p的方差Dp减小。
当|p0-q0|增大时,p会更接近p,但是往往也不会为被调查者所接受,无回应还是会发生。遇到这样的情况,我们应该怎样处理这些问题呢?
首先,用其他人取代不回应的人。因为城市里的不回应率很高,如果用不回应住户附近的其他住户来取代,可以减低偏差。其次,数据搜集完成之后,应该用统计方法给回应加权,以纠正误差来源。如果城市里太多住户没回应,就给城市里有回应的住户加权。如果样本里太多女性,就给男士们加权。加权的确可以修正偏差,但是也会增加变异性。这就需要统计学家们继续研究更多地调查方法。
参考文献:
[1] 茆诗松,程依明,濮晓龙. 概率论与数理统计教程[M].北京:高等教育出版社,2004.
[2]李贤平,沈崇圣,陈子毅. 概率论与数理统计[M].上海:复旦大学出版社,2003.251.
就在8月底,沈阳奥吉娜药业有限公司宣布,将与医疗信息化企业东软集团合作,共同开展以阿司匹林肠溶片生物等效性研究和儿童药物最佳剂型开发为主的开放式大样本研究。希望通过对长期服用阿司匹林患者的大数据调查结论,探讨类似仿制药的未来临床评估和市场发展新思路。此前,临床研究领域的泰格医药也加大了对医药研究数据处理中心的建设,长远目标同样指向药研大数据应用。对于人数据在这些领域的使用,引起了国内企业及相关专业人士的纷纷议论。
再评价借力大数据
中国医药企业管理协会会长于明德指出,当前我国正处在新一轮医改深化推进的关键阶段,提升基本医疗服务保障水平和控制社会卫生总费用是摆在政府面前的两道难题。仿制药作为老百姓基本用药的重要支撑,需要大力发展,这已经为众多发达国家所证实和积极推进。
前不久,一份美国FDA的报告显示,2014年全球有326项药物基本化合物专利期满,达到历年到期专利数量的巅峰,2015年还将有293种原研药迎来专利期的结束。大量原研药的专利期满,是否意味着国内仿制药市场即将迎来前所未有的巨大机遇?答案不容乐观。当下中国医药市场97%的份额被仿制药占据,由于欠缺创新能力、竞争压力等种种原因,国内仿制药企业的发展面临着诸多挑战。“目前我国仿制药质量一致性评价工作因种种原因,进展不尽如人意,也在一定程度上影响到仿制药的临床使用。”于明德进一步表示。
“上市后产品的再评价将成为一个常态,不应该是在监管部门的敦促下才进行,而是企业期望对自身进行综合评价的自发行为,拿出更多的证据证明药品的疗效和安全性水平。”沈阳奥吉娜药业有限公司董事长魏国平表示,公司通过与东软合作,对服用公司阿司匹林肠溶片的患者进行长期跟踪和检测,以了解药品的有效性和安全性,这相当于从临床使用上进行仿制药质量一致性评价。
不过,国内某大型制药企业的研发人士则认为,如果要进行仿制药质量一致性评价,应该对使用原研药的患者也进对照跟踪,这一尝试可看作是药品上市后的再评价和不良反应监测。
对于仿制药的大样本大数据临床评估研究,我国药物流行病学专家、华中科技大学同济医学院教授曾繁典就此表示,如果能够通过“真实世界研究”思想指导下的大样本大数据开放式的比较研究来验证仿制药等效甚至优效于原研药,无疑会给临床选用仿制药提供更严谨也更有力的数据支持,但相关研究必须注重科学性的方案设计与实施管理,以保证研究的真实性和可信度。
“人数据挖掘是IT技术的热门主题,在医疗行业可以根据病例的相似性找到度量,预估药物的有效性,分析疾病的态势。”清华大学计算科学与技术学院教授杨世强表示,若将药企和医疗大数据联网,药企可以利用信息平台实时了解患者的用药情况,对药物的有效性进行临床评价和分析。
大数据分析用途待挖掘
值得注意的是,大数据除了可以应用在药物上市后临床评价中,将来也许对产品的开发亦有指导意义。
国家卫计委等六部委于今年5月30日印发的《关于保障儿童用药的若干意见》指出:“我国儿童用药适宜品种少、适宜剂型和规格缺乏。”在魏国平看来,在我国放开“单独二孩”政策可能带来新的生育增长的形势下,究竟哪些剂型和规格更加适合儿童,不仅需要专家学者、基层医疗机构医生的专业意见,更需要广大社会人群,尤其是儿童家长们的共同参与和研讨。
据魏国平介绍,奥吉娜将以互联网时代大样本大数据的“真实世界研究”方法和开放创新的众包设计方式,邀请包括医生、家长在内的全社会共同参与,启动仿制药生物等效研究及研制更适合儿童的仿制药创新剂型,提高药物的可及性及依从性。魏国平认为,企业可以学习、运用最新的技术,多方思考仿制药临床评估评价的可行路径,探索出一条可行的仿制药开发道路。
泰格医药总经理助理刘春光也表示,尽管相关工作刚刚启动,但上市后的泰格正通过建立大数据平台,对临床试验数据进行挖掘整理,该公司在嘉兴投建的国内最大的临床试验数据管理和统计分析中心,将成为今后服务国内和跨国药企的临床研究大数据管理与研究中心。在刘春光看来,目前国内还缺少医药大数据的相关法规和使用经验。可喜的是,有关真实世界研究和规范药物临床数据管理的相关方案和中文指南已经,这预示了医药人数据研究管理已经纳入监管部门的视线。
景林投资董事总经理汤国平对此也发表了自己的看法,他表示,医疗已经与大数据紧密结合,制药业运用大数据和数据分析也是大势所趋。互联网搜集数据的能力强大,可以帮助药企做很多工作,包括药物筛选、临床试验的入组病患和过程监控、上市后再研究和药物警戒等,但尽管如此,汤国平还是提出了担心,“单个企业的尝试也面临数据量和数据真实性的挑战,尤其是制药行业传统思维的开放需要一个漫长的过程,初期形成数据孤岛在所难免,如果有更多的制药企业、医疗机构、医疗信息化公司加入,才有望挖掘出真正的价值。”
关键词:大数据时代;新闻传播学;重构;进路
一、概述
随着大数据时代的到来,大数据逐渐渗透到社会科学的研究当中,这不仅使传统的研究条件和研究方式发生了变化,而且正不断拓宽学科边界研究领域,加快了各个学科之间的融合。在社会科学中应用大数据,可以改变整个社会科学的研究方式以及内容,从而使研究逐渐向深层次的方向发展。在大数据的影响下,社会研究的路径逐渐增多,其中包括计量研究、质化研究、量化研究3条路径。现阶段的社会科学研究逐渐与新闻传播学联系在一起,因此,新闻传播学与社会科学研究之间的界限越发模糊,这一现象也表明了各个学科之间的融合交叉。[1]现阶段各个学科领域的研究中,越发重视新闻传播学中存在的问题。在大数据的影响下,新闻传播学的研究路径逐渐发生变化,其研究的内容涉及各个领域,在这个过程中也逐渐与其他学科相互交融。
二、大数据对新闻传播学研究的内外部重构情况分析
在工业革命之后,专业化程度被作为社会现代化程度的重要标志之一。随着专业化程度的不断加深,人们对事物的认识以及社会效率的把握有所提升,但是人们对整体文化的控制逐渐降低。在社会科学研究不断推进的过程中,社会科学逐渐向细分化、专业化的方向发展,致使社会科学研究的专业性逐步增强。[2]对于整体的社会科学而言,由于专业化分工,各个学科之间的分化越加明显。在大数据时代的影响下,有可能推动学科融合的进一步发展,在这个过程中,以数据作为支撑,从而形成了学科融合交叉的新形势。在此背景下,新闻传播学科的融合发展也有了新的变化。
(一)从内部来看新闻传播学研究的学科定位逐渐发生了变化
在新闻学教育建立之初,人们将新闻学与传播学作为两个不同的学科,在研究定位上对两个学科的研究也有所不同,但是在学科布置方面时,教育人员会将传播学与新闻学并置。因此,新闻传播学分设了两个二级学科,即传播学与新闻学。新闻传播学在建设之初被看作人文学科,因此部分新闻传播专业都设有相应的人文学院或者中文系。受到历史原因的影响,在新闻传播学早期的教学当中,由于缺乏相应的师资力量,加之专业设计方式受到人文学科的影响较大,使新闻传播教师与文学以及中文有密切的关系,这在一定程度上奠定了新闻传播研究的人文学科研究基础。
20世纪70年代后,新闻传播学研究逐渐向传播现象的分析方向发展,在研究过程中逐渐使用实证数据调查的方式。在新闻传播学研究中应用大数据,一定程度上推动了新闻学科研究路径的改变,使其更加倾向于社会学科的研究路径,在研究的过程中,实践研究方法的作用充分发挥,使新闻传播学研究方向越发明确。[3]
在大数据的影响下,研究逐渐向精确化的方向发展,这对传统的实证研究方法产生了一定的冲击,使该研究方法获得了新的发展。于传统的数据采集方式而言,研究人员获得的资料比较有限,在大数据时代下,研究人员获得的信息以及数据十分丰富,这突破了研究人员的经验范畴。于传统的实证研究而言,无论利用哪种抽样方式,都会存在相应的误差,获得相应的结果后,还需要进行检验。利用大数据的方法可以获得较为全面的样本,通过简单的统计描述即可掌握其中的规律。利用大数据可以对全样本的数据进行分析,避免分析人员个人经验带来的影响,从而使研究人员在研究的过程中充分发挥自身的能力,不断发现经验以外的规律。
(二)从外部来看新闻传播学逐渐与其他学科交融
在新闻传播学的形成过程中,使用了社会学中的相关知识,并且对社会学中的相关问题给予了充分关注,并对传播行为关系等进行了重点研究。因此,在社会学发展的过程中,会利用传播学的成果对其内容进行研究,在大数据的影响下,其他学科也不断引用新闻传播学的成果。
在大数据的影响下,诸多学科领域出现了融合现象,新闻传播学科也不例外,其与其他学科之间的交流变得越发频繁。第一,在近几年发表的新闻传播研究论文中,有很多科学背景或者计算机背景的人员参与;第二,在大数据相关研究的工作中,有不同学科背景的学者参与。这两点充分说明了各个学科之间的交流。
在应用大数据的背景下,社会学科与科学之间的边界越发模糊,而精确量化也被应用于新闻传播学的研究中。在以往,精确量化主要应用在科学领域,这类依靠研究方法对学科进行划分并不是一成不变的。在新闻传播学研究的过程中,十分重视信息传播规律方面的研究,在研究的过程中,会从这一角度对社会问题以及社会现象进行相应的分析。[4]现阶段,各行各业要想得到较好的发展,需要充分发挥互联网的作用,并对互联网及相关问题给予相应的关注以及研究。于新闻传播学而言,其可以分析信息传播规律,从而为其他学科的研究奠定良好的基础。于大数据时代的信息传播研究而言,大数据可以为该项研究提供相应的方法。研究人员在研究的过程中充分利用大数据的作用,可以有效把握网络的结构以及组成,明确信息传播路径之间的关系。在这个过程中,会涉及其他学科方面的内容,因此新闻传播学科与其他学科之间的交融也得到了推进。
三、大数据时代新闻传播学的研究进路
大数据的影响越发突出,逐渐将新闻传播学带领到社会科学研究的舞台上。在大数据的影响下,新闻传播学研究方式不断发生变化,使新闻传播学的实践以及理论得到了重构,新闻传播学与其他学科之间的边界变得越发模糊,在此基础上,新的研究问题逐渐产生。新闻传播学者在研究过程中,其思维方式不断发生变化,研究思路也在大数据的影响下变得越发宽广,在研究中,研究空间逐渐扩展,需要不断找出研究主体,并弥补研究方式的不足。
第一,在研究新闻传播学的过程中,研究人员需要开放心态。虽然新闻传播学与其他学科的边界越发模糊,但这给予了新闻传播研究更好的空间,因此,研究人员可以与其他研究人员相互合作,在研究的过程中采用新的视角和方式,从而使研究内容不断扩宽。第二,在研究新闻传播学的过程中,要明确研究核心。研究人员在研究的过程中可以吸取其他学科的研究成果,通过其他学科研究成果的支持来保持新闻传播学研究的活力,在研究的过程中重视核心问题,充分发挥大数据的作用,使社会科学研究与新闻传播研究逐渐区分开来。
四、结语
大数据以互联网技术为核心内容,该内容在不断升级更新中,并且在各个领域不断渗透。新闻传播学的研究工作主要侧重于互联网传播规律方面的研究,这一方面的研究可以不断延伸,使新闻传播学研究逐渐向社会化的方向发展。在大数据的影响下,新闻传播学的研究重构以及进路发生了相应的变化,不仅为研究人员提供了更加科学的研究方法,而且指明了研究方向,在此基础上,新闻传播学的地位日益凸显。为了做好新闻传播学的研究工作,研究人员需要充分利用大数据的作用,探究新型的研究方法和研究路径,从而为新闻传播学的进一步发展奠定良好的基础。
参考文献
[1]王凯杰.大数据时代新闻传播学研究的重构与进路 [J].传播力研究,2019,3(09):40.
[2]奚畅波.大数据时代新闻传播学研究的重构与进路 [J].科技传播,2018,10(13):22-23.
关键词:大数据;企业管理;创新
1引言
伴随着科学技术的不断进步,各种网络社交媒体的出现以及数据的海量增长,都标志着社会已经发展到了大数据时代,这种新的时代背景给企业的管理模式提出了更高的要求,这就决定着企业要从各个方面出发,以实现企业管理模式的创新。本文主要对现阶段我国企业面临的问题进行了分析,同时,在分析问题的基础上有针对性地提出了相应的解决措施和意见,希望能够为企业的发展提供一定的帮助。
2大数据的定义
关于大数据的定义,经历了一个发展的阶段,从最初美国麦肯锡公司再到维基百科,不同的专家学者都提出了不同的看法。随着大数据的不断发展,据调查显示我国相关的服务市场也获得了大规模的增长,2016年较2011年来讲增长幅度达到了7.9倍,并且在未来的五年时间内也将继续保持高速增长的势头,这种快速增长的大环境给我国企业的发展带来了很大的挑战。
3新时代背景下企业管理模式面对的挑战
3.1管理者对大数据的应用不够重视
在我国,现阶段很多企业的管理者意识不到大数据的重要地位,缺乏相应的重视是导致企业面临挑战的一个重要原因,很多企业认为财务报表和盈亏表等简单的数字报表比大数据发挥着更为重要的作用。但是事实上,大数据可以帮助企业在激烈的竞争中始终保持领先的地位,有利于建立起企业自身的竞争优势。企业管理者在这方面的认识不足将会给企业带来巨大的损失。
3.2商业智能化的总体水平不高
商务智能化水平很大程度上决定着企业的经营管理水平和竞争力,但是商务智能化目前在我国还未得到大规模的应用和普及,很多企业的管理者还对商业智能没有太多的了解。商业智能最初是在上世纪九十年代被加特纳集团提出来的,并指出商业智能在大数据时代具有重要的地位,是与各个领域和行业有着密切关联性的一门核心技术,但是现阶段商业智能化在我国发展的总体水平还不够高,导致很多企业在面对市场变化的时候不能及时作出正确的反应。
3.3大数据数据观尚未成型
伴随着互联网的不断发展,通信技术的不断进步导致企业的数据总量正在以前所未有的速度快速增长。现阶段企业数据具有多种多样的表现形式,有结构化、半结构化和非结构化三种类型,比如数字文本、文字、视频、音频等。在这部分数据中,占比最大的是非结构化的数据,这就要求企业必须要采取一定的措施,找出最有效的办法来实现非结构化数据的整合和统一。
3.4数据安全得不到有效保障
在数据快速增长的大背景环境下,相应的信息安全保护工作进度跟不上是导致现阶段数据安全得不到保证的重要原因。网络空间环境下,计算机呈现出分散分布的状态,这种状态给黑客提供了可乘之机,很多互联网病毒成为信息安全的重要威胁之一。尤其是对于企业来说,企业内部的核心资料和客户信息等等数据一旦外泄,就将在经济和企业形象等方面给企业带来巨大的损失,这就要求企业必选要想出有效的方法来保证数据的安全性。
3.5数据处理不及时
随着大数据时代的到来,企业在面临海量数据信息的同时还应该在处理方法上进行创新和思考,其中最为重要的一点就是要保证数据的时效性,只有保证得到的众多消息在第一时间获得科学的分析处理,并得出相应的结论,才能为企业的决策提供帮助,这就对企业处理信息的快速性提出了要求。企业只有加强对数据信息处理的重视程度,并且不断提高自身的处理能力,才能真正实现企业的健康发展。
3.6相关人才匮乏
人才的综合素质很大程度上影响到企业的竞争力,大数据产业现阶段的人才总供求面临着巨大的困境。为了解决这一问题,就需要从多方面入手,比如相关的学校应该加强大数据专业核心人才的培养,重视理论教学的同时还要加强实践方面的训练,争取培养出一批具有完整系统工作能力的高素质人才。目前传统的人才引进方式和培养机制在很大程度上阻碍了人才的发掘和培养,是下一阶段亟待改进的关键点。
4大数据背景下企业进行管理模式创新的方法
4.1管理者提高认知水平
企业管理者的决策对企业的正常运行发挥着至关重要的作用,为了从根本上对企业的管理模式进行创新,首先就要实现管理者认知水平的提高。企业的管理者应该对市场的总体情况有着清楚的认识,立足于现实和时代要求,对传统的经营管理模式进行积极的创新,创造出符合时代背景的管理模式。管理者首先应该对大数据的商业价值有着充分的了解和认识,还应该把企业的发展决策和数据进行结合,进一步发挥大数据在企业中的价值。管理人员还应该和企业内部的技术人员进行相关的交流沟通,充分了解大数据技术的发展情况,进一步实现决策的科学性,促进企业的发展。
4.2实现商业智能化程度的提高
企业的信息化水平很大程度上决定着商业智能化的水平,这里的信息化主要指的是相关人员的大数据意识和素养。这就要求企业在人才方面多加重视,注意引进各个方面的专业人才,从数据仓库到联机分析处理,再到最后的数据挖掘,商业智能化的每个步骤都应该引入专业的数据人才,最终实现企业商业智能化水平的提高和发展。
4.3及时对企业数据进行处理分析
在大数据的时代背景下,拥有数据虽然是最基础的,但并不是最重要的,其中最为重要的应该是怎样对这部分数据进行科学的分析处理和应用,这就要求企业对搜集到的信息进行及时的处理和分析,对市场的整体形势和企业自身的运营状况进行及时的把控,从而实现数据的全面深入挖掘,进一步实现企业的科学决策。
4.4培养大数据综合性人才
大数据时代背景下对人才提出了个更高的要求。一般情况下高等学校在培养社会所需要的人才时都偏向于理论和考试方面的教育,而忽视了综合教育的重要性,这种传统的教育模式会对学生的创新合作意识带来不利影响。为了实现大数据对于高素质人才提出的各种要求,就需要学校在教育方面进行改革创新,将技术和实践结合起来,真正培养起学生对数据分析总结的能力,以适应岗位和时代的需求。当然,为了保证教学的高质量,学校还要在教师培养和引进方面做出努力,比如引进相关行业的专家进行专门的指导性教学,进一步提高学生的综合能力,从而为企业的发展提供人才保证。
4.5实现企业信息平台的建立和完善
数据信息在大数据时代具有重要的作用,是企业做出决策的基础和前提,如同企业生命的根基。要想获得更多的相关数据,就要求企业建立起智能的信息平台,为企业内部各个部门和成员之间的沟通交流提供桥梁。智能化的信息平台包括很多的内容,从产品的最初设计到市场上的最终销售都应该包含在其中,企业只有实现信息的智能搜索和处理分析,才能保证信息系统的健康运营。同时商务智能平台的建立还可以针对性地解决企业之间的问题,实现业务系统平台的建立和完善,实现跨业务的数据处理。
4.6促进管理水平提高,实现企业文化融合
企业文化对企业的发展有着重要的作用,不仅仅是汇聚人心的力量,同时也是企业形象的重要表现形式之一,好的企业文化可以促进企业管理模式的创新和发展,反之则会给企业的发展带来不良影响。在大数据时代的总背景下,要想实现企业管理模式的创新,就要在企业文化上下功夫,促进形成开拓创新、积极进取的企业文化。这种文化背景下,公司所有的成员,从高层的管理者到底层的工作人员,都会秉承着不断进取的思维方式,为企业的发展做出贡献和努力,在这种背景下,传统的高层决策模式将被打破,全员参与决策的模式将会得到进一步的发展。这种发展既利于调动全公司工作人员的积极性,又利于实现决策的民主性和科学性,发挥员工的创造精神,实现企业的新发展。
5结语
【关键词】大数据 跨屏 融合 传统媒体 互联网
【中图分类号】G206 【文献标识码】A
我们生活在一个被不同屏幕分割的时代,多屏的使用已经成为当前人们媒介消费的潮流。研究表明,美国民众每天的媒体消费时间达到了4.4小时,其中90%的时间用于跨屏行为。艾瑞咨询集团2014年7月的《在线视频用户跨屏研究白皮书》也显示,用户跨屏媒介使用习惯呈现上升趋势,人均使用终端个数为2.3个,使用三屏的用户比例达到46.8%。
当今,大数据将在生产信息提供者层面、媒体层面和用户层面为新闻业态带来深刻的变化,这种变化将对媒体的跨界融合带来影响,并可能在未来对新闻业态形成重构①。而以“跨屏大数据”为工具,充分利用互联网与传统媒体的互补性,开展全触点的内容生产与营销,将是未来行业发展的重要趋势之一。
什么是互联网大数据,与传统媒体的数据相比,各自有什么特点及应用空间;如何发挥用户媒介跨屏消费行为的协同效应,将产生的跨屏大数据用于内容生产与营销,是本文讨论的重点。
一、跨屏传播的定义与传播模式分析
(一)什么是跨屏大数据
当今媒体处于多屏竞争、多屏合一的阶段。消费者每天在不同的时间、地点会接触到很多屏幕,如电视屏、电脑屏、手机屏、卖场LCD屏、户外LED屏、电影屏等,用户在多屏之间转换,但多屏并不等于跨屏。
所谓“跨屏传播模式”,狭义上来讲,是指以视听内容(广告片)为中心在不同屏幕间传播;广义上的跨屏传播则是围绕消费者的行为特征与习惯建立的跨平台传播模式,不仅是图像、硬件、软件以及相应的数据的转移,更意味着消费者与各种终端形成的全新的媒介关系。跨屏大数据就是基于以上用户跨屏互动中产生的数据。广电行业以兴趣聚合人群,促进用户的跨屏互动,增加企业与消费者更多的接触点,更有利于提升传播效果与广告投放的价值。
(二)跨屏传播模式的影响
1.跨屏传播增加了广播电视传播的广度
跨屏,意味着用户媒介使用的时间、空间的增加。
在多屏乃至跨屏的时代,单一媒介形式使用率的下降是必然趋势,更何况我们以往习惯使用的数据开机率反映的是多少家庭开着电视机,不能代表一个人全天的媒介接触时长。多屏和跨屏时代带来的是广电行业总体盘子的扩张。以浙江卫视综艺节目《奔跑吧,兄弟》第二季一周数据为例,该节目除了在浙江卫视播出,还在爱奇艺、优酷、腾讯、乐视等播出,开播首周的网络点击人数就上升至4.5亿②,这一数字约是我国拥有电视家庭的总和。
根据《2013~2014年中国移动互联网调查研究报告》显示,手机视频用户的使用率为55.7%,使用规模达到2.9378亿人,进一步而言,手机网民中每天使用手机上网4小时以上的重度用户比例高达36.4%。友盟社会化平台的数据也佐证了这一点。2014年,移动互联网用户平均每天启动客户端近2小时,其中视频观看、广播客户端(App)成为重要的组成部分。手机上网已经成为用户日常生活的一种方式,即便看似碎片化、分散的时间,其实也是将场景无缝连接,客观上拓展了电视人群的覆盖人数,增加了广播电视内容的曝光次数与播出时长。如果再争论单一媒介的播放情况,是不合时宜的。
2.跨屏传播增加了广播电视传播的深度
跨屏,促进用户从“看媒介”到“用媒介”的转化。
内容在用户跨屏消费过程中,促使传播价值递增的同时,也大大提升了广播电视的传播效果。比如,《爸爸去哪儿》电影版首日票房就突破了9000万,成为我国首部在影院夺得票房冠军的综艺节目。同时,《爸爸去哪儿》相关的游戏版权的衍生价值也不容忽视。于是,业内越发重视核心版权的重要性,从源头发掘热门内容,进行产业布局。腾讯文学与盛大文学合并、阿里巴巴宣布成立阿里文学网络文学,都反映了好的版权内容的价值,为企业进一步打造跨屏的影视内容提供基础。
为核心内容打造跨屏产品,与为终端制作跨屏内容,是加深大数据运用的两个维度。新兴媒介形态一日千里,从桌面互联网到移动互联网,从智能手机到智能电视,多种媒介的信息传输,丰富了受众的体验。可以说“今日头条”的兴起与新闻门户网站的衰落,正体现了从电脑向智能手机转变的影响。如今,智能电视缔造了新的客厅革命,成为“跨屏媒体中心”。用户可以通过电视听音乐、看电影、浏览互联网。LG在国外的一项调查显示,67%的受访者表示会参与智能电视的互动。广播电视机构面对智能手机、智能电视时代的到来,应当创新内容生产模式,以适应用户跨屏的观看行为。
3.跨屏传播增加了广播电视传播的精度
跨屏,能够提供更加精准的用户数据。
在跨屏传播中,用户体验是连续的、整合的过程。例如,用户可能会在手机上观看视频,在平板电脑上进行购买,或者在回到家后将刚才在地铁上观看的视频推送到客厅的智能电视大屏上继续观看。这些以时间轴为出发点的跨屏传播过程,能够帮助我们完整地研究用户在不同时间、不同场景下的媒介消费习惯,从而进行精准营销。如图1所示,“黄金档”的概念在每个终端上有不同的定义。手机在凌晨与早间都很活跃,与传统电视的晚间时段形成差异。可以针对用户不同的跨屏行为,制作相对应的内容与广告投放产品。
同时,互联网上由于每个媒介设备都有一个识别码, 跨屏大数据为每个用户打上标签,可以完成从行为分析到身份认证的过程。定位到某个用户,能够根据他们的搜索、播放行为,进行内容的自动推荐、广告的精准投放。从“到人群”变为“到个人”,是互联网时代大数据的优势所在。
二、传统媒体与互联网大数据的区别
(一)数据来源与获取方式对比
1.传统媒体大数据的三种尝试方向
一直以来广电使用的数据,主要来自于索福瑞与尼尔森为代表的抽样调查。第三方调查公司的数据具有相对客观、公正的特点,在互联网领域,艾瑞咨询公司也充当了类似的角色。
随着各种新媒介形态的出现,以往的抽样调研数据已经不能反映当下的用户跨屏消费情况,于是媒体的大数据出现了三种变化趋势:
一种是以歌华有线为代表,联合各省市有线网络公司共同建设全国收视数据平台,进行收视数据的采集、分析与。“歌华”收视数据品牌产品的,标志着广电网络公司正式进军收视数据调查市场。不仅有直播数据,还对回看业务、点播业务进行收视情况统计③。
第二种是第三方调研公司纷纷与新媒体合作推出新的方法论。如索福瑞与新浪微博达成战略合作,共同推出微博收视指数,为电视媒体的社会化传播效果进行节目评估,为跨屏营销传播提供标准化的营销分析工具。尼尔森与腾讯推出中国数字广告收视率,又与阿里巴巴集团旗下的阿里云公司合作推出一项名为“赚金石”的咨询服务,提供关于“消费者看什么”和“消费者买什么”的深入分析服务。
第三种是媒体建立自身的数据,芒果TV在广电行业内率先实现了“一云多屏、多屏合一”,以视频网站和互联网电视为两大核心主营,包括了电脑、平板与手机的多终端芒果TV视频、芒果TV互联网电视、湖南IPTV以及移动增值业务,构建了全媒体发展互联网媒体平台。目前芒果TV的大数据系统,日数据收集量已经达到十亿级别,为跨屏运营提供了研究基础。
有线数字电视的普及、传统媒体平台的建立以及第三方数据公司的新媒体尝试,都为广电行业带来了更为庞大的用户信息数据库。基于跨屏大数据来分析观众喜好,进行更精准营销,是广电行业发展的方向,而互联网公司自带的科技基因,从创立至今已经在对大数据的挖掘方面积累了一定的经验。
2.互联网以自身平台数据为主
互联网公司的数据来源于平台自身的大数据,比如百度、阿里巴巴和腾讯三大互联网企业都拥有大数据信息系统,并且具有各自不同的逻辑。百度通过搜索关键词,反映用户兴趣和需求;阿里巴巴从用户网页浏览到支付,完成了漏斗式转化的大数据;腾讯则基于用户社交和娱乐的各种行为形成大数据。由于业务和商业模式的不同,决定了三者数据资产发展策略的不同。目前百度和阿里巴巴的大数据采取较为开放的策略。在日常跨屏研究中能用到三种主要的大数据工具:
一是搜索大数据工具――百度指数。用户可以免费查询到相关热词的搜索趋势、需求图谱、人群画像等。百度还推出了付费版本的百度指数、百度司南、百度舆情管家等,将大数据资产进行商业变现,同时也满足了企业精准化营销的需求。
二是电商大数据――淘宝指数。包括了长周期走势、人群特性、成交排行与市场细分四个维度,分别解决淘宝上任一关键词(如商品、行业、事件等)的搜索和成交走势;不同商品的消费人群特征;基于淘宝搜索和成交的排行榜;不同标签的人买过什么商品的市场细分等。
三是视频大数据――优酷、爱奇艺指数。爱奇艺指数涵盖播放趋势、播放行为与人群特征三大维度。分别提供支持多节目对比分析的视频播放周期曲线;用户观看视频的时间与地点,以及不同终端的使用行为习惯;视频观看人群的性别、年龄与地域分布等。优酷指数还增加了一个视频热度排行。
各种平台上的大数据,如果从用户跨屏使用的角度来看,会发掘出很多有趣的故事。比如:中央电视台《舌尖上的中国》播出后,我们发现了用户“搜索―评论―购买”行为的关联性,网络舆情与天猫搜索热度带动消费者在一段时间内产生持续的购买兴趣。可以看出用户跨屏或者说跨媒介使用行为之间的导流关系(如图2)。
另外,其它第三方公司主要通过与合作平台进行软件工具包的对接、网上问卷调研等方式获取数据信息进而提供大数据服务。艾瑞运用iclick社区在线定量问卷,对10,243个14~65岁用户进行跨屏使用调研,并于2014年7月了《在线视频用户跨屏研究白皮书》,在业内产生了一定的影响。精硕科技(AdMaster)与乐视联合推出《四屏研究报告》,对跨屏联动的广告效果及媒体价值进行评估。国双科技则通过在线业务优化、电子政务、电信运营等服务内容提供大数据分析服务。
(二)大数据体系与应用场景对比
长期以来,传统媒体的广播电视数据被成熟地运用于内容生产、运营、销售的各个环节。而对于大部分媒体来说,由于自身发展新媒体的时间短,在新媒体平台上搭建与使用大数据系统缺乏足够的经验,互联网公司的大数据应用场景或许可以为我们提供借鉴。
通常来看,有一定规模的互联网公司的大数据应用场景,可以视为是企业不同层面运营的数据价值金字塔,主要集中于七个层面(如图3所示):基础数据的接入与用户ID的识别、大数据体系的搭建与智能分析、用户与客户体验数据的监测、个性化推荐、数据产品的可视化、收入分析以及将大数据用于战略研究。金字塔大数据的分析难度从下到上、由浅入深,这些关键环节对于传统广播电视搭建自身的大数据体系,有一定参考价值。
进一步而言,网络视频平台时间概念的无限性,是其与传统媒体最大的区别。一方面,互联网视频公司具有与传统电视类似的“频道”“剧场”概念,打造组合类的视频产品包;另一方面,它们充分利用互联网的技术优势,在大数据的应用方面提出一些新的玩法。比如:爱奇艺提出“SWS”模式(搜索Search―观看Watch―分享Share),创新性地推出“蒲公英”计划、“一搜百映”等精准广告产品,大大提升广告跨屏投放的效率。国外视频网站奈飞(Netflix)的大数据使用因电视剧《纸牌屋》而成名,应用场景主要有:系统需要知道每一个用户的所有观看历史,以便于为用户推荐相关的视频内容,同时在页面上的“最近观看”一栏中显示观看历史。了解用户观看历史的内容推荐、用户跨屏观看的时间与地点、家庭成员间的观看差异,用户所看的内容对于用户兴趣的衡量、产品和内容的决定非常重要。
与传统媒体对内容生产的重视相比,目前互联网公司来更注重技术产品的运营与商业变现,相信随着网络自制内容的发展,大数据在内容生产方面的作用会越来越大,互联网与传统媒体大数据取长补短、协同发展,将是一段时间内大数据研究与应用的主题。
(三)数据指标功能不同
1.跨屏传播的共性指标
无论是互联网还是传统媒体在数据指标方面都存在一些有共性的维度,比如:反映人群规模的数据指标有到达率、到达频次的概念,反映人口属性的指标有年龄、性别、区域分布比例的指标等。在此基础上还增加了一些新的维度,比如对于用户星座、兴趣、不同终端的使用比例等。
一些指标看似不同但可以进行不同屏幕之间的转换类比。比如为了吸引投放电视广告的企业主,互联网广告效果的考量指标互联网毛评点(IGRP)就是从电视广告电视毛评点(GRP)的概念发展而来的。再如,分析台网同播的节目时,有机构用播放量与收视千人指标来对比分析走势,以及相应的各种节目热度排名,都可以用来进行跨平台的比较。
2.不同媒介的特性指标
还有一些指标是体现不同媒介属性特有的,比如视频网站的“完成率”“拖拽指数”等,体现了受众在观看挽留过视频时与广播电视不同的收视习惯。笔者在电视剧《乡村爱情故事》热播时期分析优酷数据与卫视数据走势发现:电视按时间线性播出,观众观看行为持续,收视曲线有一个累加的过程。而网络用户则以兴趣点为切入,拖拽数据呈现出了跳跃性,找出这些关键桥段,对于开发短视频的后续价值也很大。
另外一个案例是湖南卫视周播剧《轩辕剑天之痕》播出期间的台网用户大数据差异。以时长作为一个对标尺码,我们发现省级卫视该剧人均收看时长52分钟,优酷每日人均收视分钟数为45分钟,二者相差无几。其意义在于,传统媒体一般通过重播热门剧目增加覆盖人数,工作日里电视台观众不能每天收看这档周播剧,他们的需求得以在视频网站上予以满足,互联网增加了粉丝对该剧的黏性,他们持续的关注度,又会为电视台下一周剧集更新的首播之日,带来观众群的回流⑤。
三、传统媒体与互联网大数据的融合之道
在大视频的环境中,我们要思考的不是先要满足传统电视多少量之后,再用剩下的钱做别的媒体,而是在生产内容时就将电视、手机、户外等跨屏用户的需求考虑在内,贯穿整个内容生产与营销的过程,实现成本收益的资源最优配置。
(一)根据不同屏幕及观看场景进行内容生产
制作跨屏内容将成为时下热点。天津卫视的《百万新娘》、东方卫视的《女神的新衣》、央视的《开门大吉》,甚至微信摇一摇的多媒体互动方式,都是力求通过一档节目来调动各端上的用户的积极性。
除了适合跨屏传播的普适化产品,还应根据各个媒体终端特性与用户观看场景生产相对应的内容。有研究发现,大多数用户在使用多终端观看视频节目时,会使用不同终端观看不同类型的节目。用电脑看电视剧、综艺节目,用手机看短视频、网友自制视频和微电影等,从而根据不同屏幕的特点精细化地进行内容生产⑥。
还可以根据消费者在行为轨上对信息的关注程度来选择合适的信息内容与信息量。例如:白天注意力较分散,适合简单的信息;晚上回家休息注意力较为集中也有较为充分的时间,则适合深度的信息传送,有助于加强认知度进而产生购买意愿甚至行动。
由于用户在智能终端上喜欢观看的节目类型、时长等因素与电脑、电视一定存在差异。以往广播电视节目类型在互联网上的播出时间,以及关注的内容都要进行相应的调整。什么是互联网气质剧目,如何生产适合90后的网络自制综艺,这些都可以通过对比台网用户行为获得,而分析的出发点一定是基于台网跨屏大数据的研究。
(二)促进用户迁徙和媒介消费行为延伸
如何完成受众在多屏之间的转换是跨屏研究的方向之一。
无论是单体还是群体,依循时间轴的变化是恒定的。要抓住受众,也应当把握“时间轴”这条主要线索。通过梳理用户在时间轴上的跨屏媒介使用行为数据会发现能产生跨屏传播的协同效应,具体包括广播电视内容在传播时间与空间上的互补效应、人群在覆盖广度上的延伸效应,以及跨屏优化资源产生的成本效应等。将使用移动设备的用户重新拉回客厅,使听广播的用户也习惯收听同款App产品,促进用户在不同屏幕之间的流动,发挥跨屏传播效应是我们研究的目标。
然而,跨屏传播的大数据研究与优化,也面临一个巨大的挑战,即同源研究的问题。需要解决两个问题:一是通过同一样本收集受众接触不同屏幕广告的同源数据,二是数据的去重问题。只有大型互联网公司才能拥有跨屏幕的用户数据,然而由于涉及用户隐私等方面的原因,在这个领域的研究一直没有实质性进展。
(三)进行精准化跨屏内容营销
美国知名营销学教授唐・舒尔茨(Don E.Schultz)教授认为:大数据时代,消费者已经由过去被动的信息接收者,转变为对解决方案的主动探求者。大数据营销也改变了传统营销的因果推论,直接从结果出发,依据事实说话。
以个性化专属性传播方式,对用户精准定位,进行跨平台广告投放是目前广告主关心的话题。要进行大数据时代的视频营销,需要具备足够量的真实有价值的用户数据、多屏的用户接触点行为数据。
广播电视内容即产品、受众即用户、收视收听率即流量。在跨屏传播布局方面,英国广播公司(BBC)建立了内部的信息源共享网络,汇集了世界范围内的新闻素材、各种作品、新闻团队及用户信息。康卡斯特的电视无处不在(TV Everywhere)计划,为现有的电视用户提供互联网其它终端的服务。苹果公司也提出iTV战略,意欲通过苹果的ios操作系统无缝连接终端之间的交互功能,打造一个生态圈。对于国内广播电视而言,如何布局新媒体、开发跨屏大数据的价值,这些话题值得持续关注。
注 释
①喻国明 《大数据对于新闻业态重构的革命性改变》,载《新闻与写作》2014年第10期。
②数据来源:剧星传播 《5月25日~5月31日热播综艺网络播放量排行榜》。
③刘D 《跨屏 传媒跨屏、转型、融合 ――盘点广电业态变革的三大关系重构》,载《传媒》2015年第3期。
④傅志华 《BAT的互联网大数据应用有何不同》,载《数据观》2015年第2期。
关键词:计算机软件技术;大数据时代;应用
0引言
在计算机技术不断发展的时代,它已经普遍应用到了很多领域里。计算机技术的研发与应用对很多行业的传统经营模式造成了很大的困扰。这种趋势也让这些行业开始走向转型。根据研究结果可以看出,要想将公司的管理水平以及生产效率提高,就需要将计算机技术合理地应用到该公司的管理生产上。所以如何在这个时代合理的在公司中引用计算机软件技术已经成为一种重要的命题。
1我国计算机软件技术发展现状
在信息时代的不断发展下,每个领域都已经发觉到计算机技术给企业所带来的效益,并且它在社会发展中的地位也越来越高。很多公司都开始研究数据库的相关工作,其主要目的就是为了今后更好的发展,这样也有效地为社会提供了很大的便利。目前,计算机软件技术发展的重要趋势就在于大数据。这个大数据主要指的是大量的信息资料,也就是说,它能够给应用者提供他们所需的大量相关信息资料。根据大数据有效地对网络数据进行整理,这样就能够提供更加优质的服务给应用者。大数据的优势在于可以有一定的决策力,并且具备了很强的观察能力。这些优势可以帮助它能够在网络应用中对数据库进行扩大填充。这样不仅能够扩大数据库,还能够逐渐地积累了数据。根据调查结果可以看出,我国在未来几年里,大数据的总量将会突破到当前的一倍[1]。这个时代的到来为计算机软件技术今后的发展提供了很大的空间,从而推动力社会效益以及经济发展。但是随着大数据的不断发展,人才、公共关系等方面都面临着很大的挑战。
2大数据时代计算机软件技术的相关应用
2.1虚拟化技术
这项技术主要是根据虚拟的信息进行管理的,同时也会对这些信息进行优化。将虚拟化技术科学地使用不仅可以提高信息处理的速度,还能够确保应用者的操作灵活度。现阶段虚拟技术受到很多公司的欢迎,这项技术在计算机中能够体现的同时,也可以在人们的日常生活中体现。2015年,将这项技术应用在了大数据中,使其提高了虚拟技术的科研高度,并且也完善了大数据对虚拟软件的功能,这样就很好的推动了虚拟技术的发展[2]。
2.2云储存技术
当前很多企业、机构都在应用这项技术,应用者只要将网络终端设备连接至网络,就可以在云储存中进行相关内容的查找,它打破了传统的模式。云储存是一个由很多了储存单位组成的整体,它能够调动多种功能来完成工作,从而将资料储存完成。在这个时代出现的云储存技术能够为应用者提供便捷的信息搜索服务。这个技术在整个大数据时代信息处理过程中是非常重要的。
2.3信息安全技术
在大数据的时代下,很多数据之间都会存在一些联系。信息数据有可能会受到这种关系的不良影响。为了保证数据的安全,相关研究人员要对整个数据库进行合理地调整。互联网很容易受到病毒的侵入,但是大数据是要在互联网的基础上进行统计的,所以信息安全技术是一个很重要的环节。即使我国的互联网技术起步较晚,但是我国的信息安全技术已经在世界上占据一定地位。在大数据的不断发展下,计算机软件技术会遇到越来越多的挑战。所以要根据现实情况,制定出符合自身发展的策略,不断地完善数据处理技术,从而提高数据的可靠性。
3计算机软件技术发展过程中的注意事项
3.1信息通信
通过数据分析软件,对客源流失的问题进行了有效的分析,并且针对于行业管理方面所存在的问题制定出有效的方案。IBM最新研究了一种分析软件就是网络分析加速器,它不仅可以给公司提供一个平台,还能够给运营决策的制定提供很大的帮助[3]。
3.2商业运营
我们以动物园的运营为例,相关的管理人员利用即时功能平台随时掌握游客的访问信息,这样就能够让管理者即时的掌控动物园的运营情况。所以合理地使用计算机软件技术,不仅促进商业经济的发展,还能够确保公司在竞争中所占据的优势。就通信行业来看,工作人员你就可以借助计算机软件技术对客户信息进行统计分析,并且可以根据这些信息对客户的习惯进行总结,从而制定出符合客户自身需求的方案。这样就是利用大数据分析来协助各个行业更好的工作,以至于实现经济和社会的双重效益。
3.3公司信息解决方案
在这个大数据时代里,为了更好的提供优质的信息给公司,我们可以在数据挖掘环节进行以下几方面的突破。(1)抽样。其主要指的是在生产过程中对样本数据进行抽取,并且这些数据事有一定代表性的。相关工作人员会定位这些样本容量,这样会帮助产品的研发以及应用。另外,选择这种方法最重要的一点就是操作上非常方便,在整个过程中会应用到粘贴、复制等工具。(2)开发和探索。这一方面主要指的是分析一些异常值、趋向性的数据,这样就能够有效地提高人们对于数据的认知。在这个环节,只要科学的应用计算机软件,就可以提高整个过程的工作效率。这个过程中会应用到统计报告、变亮选择等工具。(3)修改。工作人员的目标就是模型的选择,数据通过转换变量的方式进行修改。在整个过程中,使用产品编码转变、缺失处理等工具。随后还需要对数据进行分析,这样修改这个环节才算完成。(4)模型。采用模型相关技术对结果进行验证。这一步骤是公司决策过程中的重要环节,因为它不仅可以确保产品的质量,还能够推动公司的经济收益。这个过程中应用了网络资源、逻辑回归等工具及技术。(5)定位。其主要是将评定技术与模型相比较,得出相关数据,然后对数据进行研究与分析。在整个过程中,相关工作人员需要不断地进行探索,找到新的方式。另外,为了确保工作人员能够直观的了解到数据,就需要选取可视化工具,这样不仅能够丰富数据的表现形式,还能够加深工作人员对数据的理解。
4计算机软件技术在大数据时代面临的挑战
在大数据时代的不断发展下,计算机软件技术应用较为广泛,它对于经济发展、居民生活水平都产生很大的影响,但是在这个过程中也面临着一定的机遇和挑战。在这个时代里,计算机的运作会受到很多因素的影响,需要即时的去解决。与此同时,数据较为复杂,在各个环节中,很容易出现泄露的现象。另外,也有很多网络黑客对计算机软件进行恶意侵入。以上这些问题都是在这个时代下所面临的挑战,这就需要不断地对其进行完善,从而能够即时的解决这些问题,计算机软件技术也就能够在这个时代里发挥出更大的作用。
关键词:高速公路;智能交通;收费系统;数据;大数据
中图分类号:TP30; U495文献标识码:A文章编号:1009-3044(2012)15-3752-03
Big Data Background: Studies,Analysis and Forecasts of the Highway Toll System Data
DU Yu-hui1,JIANG Jiao-li2
(1. Guangzhou Newsoft Technology Company Limited, Guangzhou 510101, China; 2. Guangdong Province Agricultural Machinery Test ing Station, Guangzhou 510515, China)
Abstract:This paper analysised the current status of the highway toll system data, for the amount of system data is increasing day by day, the diverse characteristics of the data structure, the Creatively put forward the problems faced by the highway toll system data in the context of big data, And explored the development trend of the future highway toll system data. Discourse of this paper, with a reference value on the future highway toll system data warehouse platform.
Key words:highway; intelligent traffic ; toll system; data; big data
自1988年中国第一条高速公路开始通车运营,到2012年,国内高速公路通车总里程达65000公里,广东省内的高速公路通车里程约为5500公里。高速公路的快速发展,提高了人、财、物等关乎经济发展的资源的快速流通,对中国经济的快速发展起到了重要作用。由于我国从上世纪80年代至今沿用“贷款修路、收费还贷”高速公路建设投资模式,造成高速公路路段、收费站林立。尽管交通部联合其他部委于2011年展开收费公路清理工作,并推进现代化收费系统建设,加快区域合并步伐,保障高速公路的通畅性,然而由于高速公路建设模式及复杂的投资关系,在今后相当长一段时间都难以大规模实现路段合并或撤并收费站。大量收费站的存在会持续相当长一段时间。
自80年代中期以来,随着互联网技术的普及和完善,人们将先进的信息技术、通讯技术、传感技术、控制技术以及计算机技术等有效地集成运用于高速公路收费体系,极大提高了收费和服务效率。同时,歧义路径算法、自由流模型等技术不断成熟完善,为未来高速公路收费体系跨越式发展和区域合并提供了坚实的技术支撑。在各种技术在高速公路有效运用的的背景下,各功能系统产生快速、大量、多样的数据,高性能的高速公路收费体系需要从数据中,快速获得有价值信息,就需依仗高效的数据查询、分析处理功能,也就是面向“大数据”的分析处理技术。对“大数据”的分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点,能提高收费效率,增强服务能力,提升管理的前瞻性,保障高速公路的通畅性,同时降低能源消耗,减轻环境污染。
1高速公路收费系统的现状及存在问题
1.1高速公路收费系统类型
高速公路收费体系的核心业务—收费系统,根据自动化程度的不同可分为人工收费、半自动收费、全自动机械收费、电子不停车收费(ETC)和半自动收费与全自动电子收费相结合的组合式收费等类型[1]。
高速公路收费体系的子系统有:收费站软件系统、路段收费中心软件系统、区域收费中心系统、省联网收费结算中心计算机系统以及业务支持类系统,例如:营运稽查系统、闭路监控系统、音频管理系统、视频管理系统、机电管理维护系统、道路养护系统、运营支持系统、紧急救援系统(EMS)、办公自动化系统(OA)等。
收费站软件系统包括数据通信管理子系统、参数浏览子系统、交接班子系统、报表管理子系统、数据备份与恢复子系统、发票管理子系统、车牌及卡号查询子系统、收费监控子系统、IC卡管理子系统等。
路段收费中心软件系统包括数据通信子系统、参数管理子系统、IC卡管理子系统、报表管理子系统、数据备份和恢复子系统、车牌和卡号查询管理子系统、收费监控子系统、图像稽查子系统、发票管理子系统等。
区域结算中心软件系统包括数据通信子系统、收费数据拆分和结算系统、数据分发系统、数据查询管理系统、人员管理与设置系统、IC卡管理系统;数据库管理系统、网络与系统管理系统、报表系统;安全保障系统等。
省联网收费结算中心计算机软件系统包括密钥管理系统、数据备份与恢复系统、粤通卡初始化系统、粤通卡库存管理系统、帐务管理系统、黑名单管理系统、通信管理系统、后台充值认证系统、交易认证系统、报表统计查询系统等。
1.2高速公路收费系统的现状
2010年l2月由交通运输部、国家发展改革委、财政部联合下发了《关于促进高速公路应用联网电子不停车收费技术的若干意见》,其中明确要求:扩大我国高速公路ETC车道的覆盖率,实现高速公路主要出入口均建有专用的ETC车道;力争到“十二五”期末,全国高速公路ETC平均覆盖率达到60%,ETC车道数达到6000条,ETC用户量达到500万个,非现金支付使用率达到40%。可以预计到ETC收费车道将是今后高速公路收费系统设计中要全面考虑的重点,在执行目前出人口车道数在3人4设置1入1出ETC车道原则外,在交通量较大的收费站可以适当增加ETC收费车道数量,这样即提高通行效率又符合国家政策导向。2011年年中,由交通运输部联合相关部委开展了收费公路整顿清理工作,也揭开了高速公路收费系统不断优化发展的大幕,通过优化高速公路收费方法,推动区域合并不断推进联网收费的区域和层次,满足人民群众对高速公路通畅性、舒适性的要求,与此同时提高通畅性也起到了节能减排等目的,可谓是一举两得。同时根据交通部“十二五”规划,要继续推进高速公路电子不停车收费系统的比例,推进国内联网步伐。
以广东为例,2012年已经着手对省内高速公路区域联网收费工作,并逐步推进高速公路区域合并,减少收费战数目,联网工作和区域合并工作的推进,未来高速公路运营中心将迎来“大数据”时代。广东高速公路联网收费要按照“分步实施、逐步完善”的原则,先在高速公路实施,再推广到其他收费公路。高速公路应按“分区联网、逐步合并”的方针,从区域联网收费逐步发展到跨区域的全省联网收费。
请试想一下:数以千万计的车辆实时通过收费站,不停地产生数据;当你想进行图片稽查、流水查询、信息搜寻等操作时,如何快速定位、检索资料、存取数据、数据交换等。大量、多样、快速的数据给高速公路运营提出了巨大挑战。而这一系列操作均需“大数据”做支撑。“大数据”的显著特征为:“大量化(Volume)、多样化(Variety)和快速化(Velocity)”。当前高速公路运营单位的数据分析与处理越来越不适应这种新的变化。
1.3高速公路收费系统数据存在的问题分析
一方面随着随着企业业务的推进和演变,高速公路车流量和通车里程不断飞跃式增长,同时高速公路信息功能系统不断增多,产生的数据越来越多,种类越来越多,数量越来越大,对存储成本、运用成本、查询成本方面的压力越来越大[2]。
另一方面,企业的领导者能够获取诸多的信息,但是并不代表他能够从信息当中得到的参谋价值,或者这种指导价值是正确的。
一些数据也在清晰地体现这些问题,根据调查,1/3的领导不信任现在的数据分析结果,1/2的领导抱怨没有得到自己需要的信息,83%的信息管理负责人觉得,商业智能(BI)应该成为他们信息规划当中的一部分。以上数据反映的问题实质就是:企业需要获得一种方法去有效地利用好大数据。因此亟需针对“大数据”的技术。
当前高速公路运营单位对数据的关注点还主要集中于收费流水数据的正确性和可追溯性,例如主要关注入口流水与出口流水的一致性、收费金额与车型的一致性、收费结算与通行数量的一致性等,对全局数据的分析处理还远远不够,这成为未来高速公路运营中心提高数据应用和“保畅通、促和谐”的主要矛盾。目前在数据处理方面,高速公路运营中心存在的问题主要有:
1)数据处理技术落后,还停留于总数核对,有问题再细化,没达到自动智能分析处理层次;
2)数据关联性不够,结构化数据与非结构化数据没有关联,一旦出现问题,查找数据非常耗费人力物力;3)数据没有形成数据集市、数据仓库等形式,数据后期应用价值低;
4)数据分析处理落后,导致数据应用匮乏,数据逐步成为各运营单位的负担,既不能丢弃又不能产生价值;
云计算、物联网等甚嚣尘上的概念,无不昭示着未来“大数据”对企业发展所蕴含的潜在价值,无不表明着未来谁掌握了“大数据”,谁就能解决在企业发展过程中各种业务数据增长所带来的痛苦,进而实现快速飞跃发展。
2大数据背景下的高速公路收费系统数据
随着图像、传感技术等新技术在交通领域应用的不断深入,高速公路信息应用技术不断走向纵深;再次,歧义路径算法、自由流模型等技术的完善,将在高速公路收费体系中大规模应用。显然可以预见,未来高速公路将是一个“大数据”引领的智慧科技的时代。更多的传感设备、信息终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。高速公路“大数据”时代的脚步悄然而至。目前,国内已经有很多技术研究者在深入研究这一领域,在中国人民大学王珊博导一文“架构大数据:调整、现状与展望”中提到,在大数据的时代背景下,只能对现有数据仓库系统实现方案进行重新审视,通过对并行数据库、MapRe duce、并行数据库和MapReduce技术的混合架构进行评价和归纳对比分析[3],文章对架构大数据有很深刻的指导意义。
2.1大数据的概念
“大数据”首先是一个现象而不是一种技术。“大”首先是指数据体量(volumes)大,指代大型数据集,一般在10TB规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。从IT角度来看,信息结构类型大致经历了三次浪潮。但是新的浪潮并没取代旧浪潮,它们仍在不断发展,三种数据结构类型一直存在,只是其中一种结构类型往往主导于其他结构:
结构化信息——这种信息可以在关系数据库中找到,多年来一直主导着IT应用。这是关键任务OLTP系统业务所依赖的信息,另外,还可对结构数据库信息进行排序和查询;
半结构化信息——这是IT的第二次浪潮,包括电子邮件,文字处理文件以及大量保存和在网络上的信息。半结构化信息是以内容为基础,可以用于搜索,这也是谷歌存在的理由;
非结构化信息——该信息在本质形式上可认为主要是位映射数据。数据必须处于一种可感知的形式中(诸如可在音频、视频和多媒体文件中被听或被看)。许多大数据都是非结构化的,其庞大规模和复杂性需要高级分析工具来创建或利用一种更易于人们感知和交互的结构。
2.2大数据背景下的高速公路收费系统数据
高速公路收费体系产生的数据内容不仅仅是多,而且结构已发生了极大改变,不是以二维表的规范结构存储。大量的数据是非结构化的办公文档、文本、图片、XML、HTML、各类报表、图片和音频/视频等,并且所有数据是大量且增长迅速的。据相关调查数据显示,企业80%的数据是非结构化或半结构化的,结构化数据仅有20%。并且全球结构化数据增长速度约为32%,而非结构化数据增速高达63%。预计今年非结构化数据占有比例将达到互联网整个数据量的75%以上。面临如此大量的非机构化数据,其移动和修改将耗费大量的人力物力,读取效率也将越来越低。当然这包括了物理存储和逻辑存储软、硬件两个层面。
以广深珠高速公路有限公司为例,高速公路收费系统数据的格式有结构化的数据库数据,非结构化的XML、JPG、音频、视频等格式。在未来路段、区域合并的大背景下,未来高速公路运营单位将进入“大数据”时代。如何在充分信息的情况下,对高速公路车辆进行合理的监控与疏导、控制和事件管理;路政部门可随时掌握车辆的运行情况,进行合理的调度;而运营部门对大数据的有效分析处理以支持交通、收费规划决策、发展战略决策等[4]。
“大数据”包括交易和交互数据集在内的所有数据集,其规模或复杂程度超出了常用技术按照合理的成本和时限捕捉、管理及处理这些数据集的能力,即在一定时间内还是采用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合,未来高速公路
已经完全符合“大数据”的特征[5]。
3大数据背景下高速公路系统的展望
通过对高速公路运营中心大数据的分析处理,可以提高运营单位数据综合应用水平,不断增强数据的价值,为提高高速公路运营提供可靠的决策数据支持,为“保畅通、促和谐”注入新的活力[6]。大数据背景下的高速公路收费系统数据分析优越性有以下几个方面:
1)提高路况管理的有效性:通过对大数据分析处理,不断优化数据处理模式,构建数据自动分析处理模型,提高数据分析的主动性和预警性。例如分析某段高速公路入站车辆与出站车辆,可以模拟出此段高速公路的车流量,分配等级,如果超出此段高速公路承载数量,则进行重点监控与疏导,避免车辆堵塞,做好预警。高速公路相关部门通过数据分析处理和数据挖掘,可以提前预防堵塞现象,通过收费站的疏导缓解某一阶段的通行压力,保障通畅性[7]。
2)增强数据利用率:通过大数据分析处理,建立数据集市和数据仓库,提高结构化数据和非架构化数据关联度,降低数据应用难度,使运营单位在数据方面的负担转化为资源,为后期数据分析处理和应用提供便利。
3)降低运营成本:在经济成本上,通过大数据分析处理技术,充分挖掘数据的价值,减少维护车辆出行使用费用上的支出;在人力成本上,通过大数据分析处理技术,提升管理水平和服务质量,满足人民群众对高速公路的要求。
4结论
本文分析了目前高速公路收费系统的现状、并提出大数据背景下高速公路收费系统数据的问题,及探讨了未来高速公路收费系统发展的趋势。就目前高速公路运营单位对数据分析处理的能力和水平远远不能满足未来数据发展需要的现状,依据在高速公路行业多年的经验,借助最新的大数据分析处理技术的实现方案的研究,对大数据背景下,高速公路收费系统数据分析方向进行了展望,对未来高速公路收费系统数据分析及处理有一定的参考性价值。
参考文献:
[1]杨平芳.先进的交通管理系统的关键理论与方法研究[D].长春:吉林大学,2010.
[2]刘志勇.高速公路交通系统的数据管理控制平台[J].信息与控制,2010(12).
[3]王珊,王会举,覃雄派,等.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752.
[4]李晶,张莉,杜娟,等.3G网络技术在智能交通系统中的应用[J].吉林交通科技,2010:38-39.
[5]覃雄派,王会举,杜小勇,等.大数据分析RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-4.