前言:想要写出一篇引人入胜的文章?我们特意为您整理了城市道路信息化数据质量评价体系探析范文,希望能给你带来灵感和参考,敬请阅读。
1概述
随着国民经济的快速发展,我国机动车保有量持续增高,日益严重的交通拥堵也成为了城市化建设必须关注的问题。如今通过智能化交通建设来提高城市交通运行效率是改善交通状况的重要途经。路通流数据作为智能化交通建设的基石,对发挥智能交通应用起着关键性作用。采集设备可通过对道路或者交叉口进行信息采集、分类,将能够反映道路或交叉口真实状态的交通参数数据上传至存储中心,为交通管理与控制提供数据基础。准确的路通流数据在管理方面对于信息,道路状态生成,决策规划等方面起着重要作用;在控制方面对于信号优化方案生成、效果评价等也至关重要。通过对路通流数据质量评价,保障路通流数据质量,将有效提高运行管理效率,增强交通管理的准确率,是实现智能交通的必要条件。施莉娟[1]、姜桂艳[2]等对于路通流数据质量宏观层面角度进行了相应的分析与研究,并取得了一些成果,但缺乏微观层面的路通流数据指标判断。针对目前较为常用的交通检测设备,包括地磁线圈、视频卡口、雷达设备等。地磁线圈由于其布设方式易于损坏,维护成本较大。本文从现今利用率、效率较高的雷达检测设备和视频检测设备入手,从宏观以及微观两个层面,提出一套较完整的路通流数据质量评价体系。
2数据质量问题分析
从路通流数据采集到上传至数据中心,链路中有多个环节相扣,任一环节出错都可能导致路通流数据不完整或者不可用。分析传输链路,可能出现的原因有数据检测错误、外场设备断电、网络通讯中断、检测设备故障等。对数据以及来源进行分析,可以归纳为以下几个方面:
2.1错误数据
错误数据即数据数值方面出现错误,表示数据与实际数据出入过大,不符合常规路通流数据规律。该类数据通常是由检测设备检测错误引起。
2.2缺失数据
缺失数据即相应数据丢失,具体表现为在短时段或长时段内无对应数据记录。该类现象通常是由设备断电或者网络中断造成。
2.3异常数据
异常数据与正常交通参数数据有一定出入,该类数据不代表数据错误,仅表示非常规数据。可能由于实际道路情况与检测设备设置有所出入引起,例如突发交通事故、道路管制或者非常规驾驶行为等原因。
2.4空值数据
空值数据即接收到数据但该条数据对应参数无有效值返回,该类数据现象需根据实际情况进行进一步分析。
3数据质量判断流程
交通基础数据质量判断涉及到宏观和微观两个层面。宏观层面的数据质量判断,涉及完整性、有效性、存在性三个方面。微观层面的数据质量判断,是对外场设备采集数据指标分类进行数据质量判别,本文通过对具体指标包括流量、平均速度、车头时距等交通参数进行判断指标设计,以获得路通流数据微观层面的有效性评价。在宏观层面,具体指标涉及:
3.1完整性
完整性是指设备采集到数据并传至存储中心的数据完整率,该指标表征了数据的缺失程度。通常由于外场设备故障、网络通讯中断或波动等原因,导致数据在某一时段类缺失,该指标由理论上传条数与实际上传条数获得。完整性检验是数据质量判断的基础判断条件。
3.2有效性
通过外场设备采集到中心的数据,通常需要经过有效性准则判断。对于采集数据数值本身,应当通过一系列判断准则,以检验该数据为有效数据,可用于后续应用。通过有效性判断,无效数据应剔除或标记。
3.3存在性
通常检测设备对对应数据字段配置检测算法,当某一指标字段无正常输出时,应检验其对应指标是否配置。在微观层面上,路通流数据指标涉及流量、时间占有率、车头时距等常用交通参数。通过对具体交通参数指标进行有效性判别,能够判断该数据是否有效,以用于后续质量控制或进入下一流程。
4数据质量指标设计
4.1宏观判断指标设计
在宏观层面,本文提出了完整性、有效性、存在性三个判断指标。4.1.1完整性。完整性由理论上传条数和实际上传条数获得。理论上传条数即根据设备上传周期,获得时段内理论上传总条数,通过该条数与实际获得上传数据条数的比值,即为完整性指标。具体公式如下:(1)(2)式中:Ntotaldata为设备采集到总条数;Nexpected为理论上传条数;Ttime为统计时段;Tperiod为设备上传周期。4.1.2有效性。有效性通过实际上传数据和完成判断指标数据两者比值获得。对于采集到的基础路通流数据满足微观层面数据质量指标判断的,即为有效数据。具体公式如下:(3)式中:Ntocc为统计时段内,数据异常的记录条数;N为统计时段内,实际采样总条数。4.1.3存在性。通过对某一指标进行连续时段检测,以判断该指标是否在检测设备上配置。排除掉错误、异常数据之后,设某一指标长时段内为固定值m,即判断该指标未配置。
4.2微观判断指标设计
对常规视频采集设备分析,标准视频设备采集数据指标由如下指标组成:流量、平均速度、时间占有率、车头时距、非高峰期占有率。通过对每一指标进行判断算法设计,以获得有效数据衡量该指标异常程度,得到该上传数据有效性。4.2.1流量。流量检测为某一设定时段内通过检测断面的车辆数,设流量的有效区间为,当检测流量值不在该有效区间时,则判定该条记录的流量数据异常。其中,。(4)式中:s0为基本饱和流量,参考美国HCM2010(HighwayCapacityManual),取值为1900pcu/h;tc为设备采样周期。4.2.2平均速度。平均速度为检测车辆通过某一断面的瞬时速度,即时间平均速度,当满足以下条件之一时,则判断该条记录的平均速度数据异常。(5)(6)式中:θlow为0km/h;θhigh为78km/h,城市地面道路限速60km/h,按超速30%取。4.2.3时间占有率时间占有率表征检测车辆占用检测断面时间上的关系。当满足以下条件之一时,则判断该条记录的时间占有率数据异常。(7)(8)(9)式中:θhigh为100;o为时间占有率;vol为检测时段内的交通量,辆;li为车辆长度,m;d为虚拟线圈长度,m;vi为车辆速度,m/s;T为检测时段。4.2.4车头时距。车头时距为两辆连续车辆车头通过同一检测断面的时间之差。当满足以下条件之一时,则判断该条记录的时间占有率数据异常。(10)(11)式中:hs为车头时距;θlow为0;θhigh为数据上传周期,Tperiod。4.2.5非高峰期间占有率。设采集的占有率为occ,并对占有率设定高位阈值,当50≤occ≤100时,称occ为高占有率。在车辆较少的时段高占有率的数据过多则判定线圈存在异常。因此规定当时段为非高峰时段内(00:00:00-05:59:59)出现高占有率情况时判断该条数据异常。雷达监测设备多采用微波、毫米波等检测方法,应用多普勒效应原理,通过向检测区域内的车辆发射波束和接受反射波束来实现车辆检测。由于原理区别于视频设备,雷达监测设备除流量、平均速度等参数外,还能检测到排队长度、车头间距、车身间距指标。因此对上诉指标进行数据质量判断设计。4.2.6排队长度。排队长度分为动态排队长度和静态排队长度,本文主要对静态排队长度进行指标设计。当满足以下条件时,判断该条记录的排队长度数据异常。(12)(13)(14)式中:queue为排队长度;θlow取0;lm为车长的较大值;lO为车辆车距。4.2.7车头间距。车头间距即为同方向行驶的连续两辆机动车,车头与车头之间的距离。本文对车头间距指标进行数据质量判断设计,当满足以下条件时,则判断该条记录的车头间距数据异常。(15)(16)(17)式中:hs为车头时距;θhigh为雷达检测器检测范围长度;l0为车辆间距;lmin为最小车辆长度。
5案例分析
目前,上海市已在大部分交叉口布设了视频检测器和雷达检测器。本文选取某区域的部分路口为例,根据上述公式,分析路口视频检测器和雷达检测器的宏观和微观指标情况。
5.1宏观指标分析
图2是视频检测器的数据完整性和重复性的分析结果。四个路口中,盈港路-涞港路路口视频检测器的数据完整率较低,为88.74%。崧泽大道-华徐公路路口和会涵路-华徐公路路口的视频检测器数据完整,但是完整率超过100%,说明存在重复数据。华徐公路-蟠中路路口视频检测器的数据完整性较好,且不存在重复数据。因此,选取华徐公路-蟠中路路口的视频检测器,进一步分析其数据的有效性和存在性。如图3,以分车道的形式,对华徐公路-蟠中路路口视频检测器数据的有效性和存在性进行分析。在该路口的每个车道,都存在异常数据;且存在检测故障的情况,即存在视频检测器为对某个指标进行检测分析的情况。
5.2微观指标情况
根据该路口视频检测器的产品说明书可知,该视频检测器提供流量检测、时间占有率检测、速度检测、车型检测、各车型流量检测、各车型速度检测等六项指标检查功能。下面对各项检测指标结果数据的有效性进行判断分析。如图4,该路口视频检测器的时间占有率存在检测故障,说明该检测器未按照产品说明书配置时间占有率指标的检测功能。车型数检测数据有效性差,各车道的车型数检测结果异常率都在55%以上。其余四项指标检测数据均为有效,其中,流量数据的有效性最好,异常率为0;平均速度、各车型流量和各车型速度等指标数据的异常率也均低于5%。
5.3结论
综合上述对视频检测器检测数据质量的分析判断可知,华徐公路-蟠中路路口的视频检测器检测数据完整性较高,不存在数据重复的情况。且其对流量、平均速度、各车型流量和各车型速度等四项指标的检查结果有效性较高。可将该路口视频检测器的流量检测、平均速度检测、各车型流量检测和各车型速度检测数据应用于深入的数据统计、分析、挖掘等工作中。
6结束语
路通流基础数据从外场设备采集到信息传输再到信息收集的过程中,容易受到各种因素影响导致数据质量下降,因此有必要对获得的交通流基础数据进行质量判别,以用于进一步应用,充分发挥出智能交通的效用,为正确决策提供数据支撑。本文从宏观和微观两个方面对基础路通流数据进行了数据质量分析与指标设计,对交通参数等数据采用算法判断数据质量。研究结果在微观上能有效剔除无效数据,在宏观上能给出数据质量宏观评价,对于路通流基础数据质量评价研究有一定指导意义。
参考文献
[1]施莉娟,朱健,陈小鸿,张祎.基础路通流数据质量评价研究[J].交通信息与安全,2011,29(05):57-61.
[2]姜桂艳,牛世峰,李红伟.动态路通流数据质量评价方法研究[J].北京工业大学学报,2011,37(08):1190-1195.
作者:王雪雪 杨学晨 单位:上海电科智能系统股份有限公司