前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉研究现状主题范文,仅供参考,欢迎阅读并收藏。
1计算机视觉概述
1.1计算机视觉学概述
从某种意义上说,计算机视觉学是一门在20世纪60年代兴起的新学科。它是一门边缘学科,融入了很多学科的特点,具有很强的工程性特征。比如,图像处理、应用数学、光电技术。换个角度来说,计算机视觉同属于工程领域、科学领域。
1.2计算机视觉的应用
计算机视觉的应用能够使计算机具有和人一样的视觉功能。在生活和生产过程中,照片资料、视频资料的处理是计算机视觉应用的主要方面。比如,在航空事业方面,对卫星照片的翻译;在医学领域中,主要用于辅方面的诊断;在工业生产方面,由于各种复杂因素的影响,计算机视觉在这方面的应用显得特别简单,有利于相关系统的实际构成。
2目标图像检索存在的问题
从某种角度来说,目标图像检索需要分为特征匹配、特征提取两个方面。它们表达了不同的含义。对于特征提取来说,它是图像进行检索的第一步,其提取结果会对进一步的研究造成直接的影响。而对于特征匹配来说,其匹配的准确度会直接影响图像检索系统的返回结果。但在目标图像检索完善的过程中,遇到一些问题阻碍了这两个方面的完善。因此,本文作者对其中的一些予以了相关的探讨。
2.1环境因素不断变化
对于目标图像来说,环境因素是影响其准确率的重要因素。同时,在复杂混乱的环境中,由于受到众多干扰物的影响,加上部分目标图像区域被遮盖,致使目标图像信息不够全面,使目标物体特征的提取难度进一步加大。
2.2图像噪声的影响
子为了更好地模仿生活中的图像检索,数据库中的图像也会随之发生一系列的变化。比如,尺度、角度、光照。而其中图像噪音的影响会使目标物体的外观发生对应的变化。在此基础上,严重降低了目标图像信息获取的准确度。
2.3目标图像检索训练数据的自动标注
由于处于网络中的图像资源信息过于繁多,需要采用手工的方式对它们进行标注。但这种方法非常浪费时间,准确率也比较低。很显然,这就需要目标检索图像能够具有自动标注的能力。实际上,图像检索方法过分依赖人工标注信息。而这些信息很多收到来自各方面因素的影响。比如,认识差异因素、个人经验。以至于对图像产生误解。
3基于计算机视觉下的目标图像检索技术
3.1以多尺度视觉为纽带的目标图像检索方法
该种目标检索技术的应用主要是为了提高目标图像检索的准确率,能够实现目标图像训练数据的自动化标注。该类技术主要是用于那些没有遮挡,不需要进行监督的目标图像检索方面。具体来说,它需要经过一系列的训练。在训练的过程中,以统计学习为纽带,对相应多尺度的目标检测模型进行适当的训练。在此基础上,以该模型为基点,对图像中那些显著性的区域进行合理地提取。比如,该区域的亮度、颜色。最后,需要对用于该实验研究中的概率潜在语义分析模型进行合理地利用。总之,利用这种检索方法可以对图像中那些显著目标所处的区域自动进行检测。同时,对其中目标图像的显著性进行合理地排序,能够提高检索引擎所返回图像结果的准确度。
3.2以彩色LBP局部纹理特点为媒介的目标图像检索方法
这种目标图像检索方法能够有效地解决图像信息采集过程图像噪声以及其它相关因素对所提取纹理特征的影响,提高了图像目标的准确率。对于这种图像目标检索方法来说,它把图像彩色空间特征和简化的LBP特征有机地相融合。在此基础上,该类方法增加了光照的不变特性,却保留了LBP局部的旋转特点。在提高图像检索速度方面,主要是利用原来的LBP特征来丢失其中的彩色信息。以此,使其中的特征维度能够在一定程度上降低。同时,这种目标图像检索方法的应用可以使对应计算方法的难度得以降低,还能对角度等变化状态下的目标图像进行准确地识别以及检索。
3.3以视觉一致性为桥梁的目标图像检索方法
从某个角度来说,它的应用主要是为了提高图像搜索引擎的返回效果,使局部噪声图形具有更高的显著性特征。一是:站在客观的角度,对搜索引擎返回结果的目标显著图予以准确的计算。此外,还要对其中的目标显著系数进行适当地过滤。二是:以所有图像为基点,以显著目标为导向,采取视觉一致性的模式。三是:以视觉一致性为基础,对其中的不同目标图像信息进行客观地分类。这种以视觉一致性为核心的方法能够有效地提高图像检索结果的准确率。更重要的是,在提高图像搜索引擎检索性能的同时,能够及时为用户选出最优的图像信息。而这些信息资源和用户寻找的主题信息密切相关。
4结语
关键词:数字图像处理;测距;聚焦;频域
中图分类号:TP391.41 文献标识码:A 文章编号:2095-1302(2012)09-0016-03
Images ranging method based on frequency domain analysis
ZHU Xue-yi
(School of Microelectronics and Solid-State Electronics, University of Electronic Science and Technology, Chengdu 610054, China)
Abstract: Using digital image processing theories and methods, the digital image pre-processing mode, the target graphic detection and the ranging model construction are studied and analyzed. Combined with a ranging scheme of single camera, a focusing ranging technique based on frequency domain analysis is given to process images captured by the monocular camera and calculate the distance from target detection image to the camera based on frequency domain image signals. The technique saves lots of complex hardware and reduces the demands of digital image processing, which has the advantages of high ranging precision and fast processing speed.
Keywords: digital image processing; ranging; focusing; frequency domain
0 引 言
视觉是人类观察世界、认知世界的重要功能手段,人类感知外部世界主要通过视觉、触觉、听觉和嗅觉等感觉器官,其中80%的信息是由视觉获取的。计算机视觉就是人类利用计算机实现人的视觉功能,从而对客观世界三维场景进行感知、识别和理解。计算机视觉是一个相当新而且发展迅速的研究领域。
在对生物视觉系统的研究中,人们早就注意到,几乎所有具有视觉功能的生物都有两只眼睛。用两只眼睛同时观察物体,会有深度或远近的感觉,我们称之为视差。因此,在计算机视觉系统中,也常用两台或多台摄像机从两个或多个视点去观察同一场景,从而获得在不同视角下的一组图像,然后通过同一场景点在不同图像中的视差,推断出场景中目标物体的空间几何形状和位置,这种方法称为立体视觉。它是计算机视觉的一个重要分支,也是计算机视觉的核心研究内容之一。
视频和图像是对物质世界客观事物的形象而生动的描述,是最直接且具体的信息表达形式之一,是人类最重要的信息载体。随着科技的日益发展,人们需要一种更加先进快捷的工作方式,另外,人们对工作环境和工作条件也提出了更新、更高的要求,视频测距系统便在这种背景下应运而生。
视觉测距技术的发展对于距离测量有重要的意义。在基于数字图像处理技术的视觉测距系统中,使用单个CCD(Charge Couple Device)摄像机的系统称为单目摄像系统,而同时使用两台摄像机对同一景物进行摄像,并运用计算机分析两幅图像来确定物体的三维状况的系统称为双目摄像系统。双目摄像系统测量精度高,但计算速度较慢,成本较高。而单目摄像系统方法则比较简洁、快速,因此,本文对采用单目摄像系统检测目标物的测距方法进行研究。
1 测距技术在国内外的研究现状
目前,国内外对视觉测距技术的研究仍在不断的进行之中,还并没有形成国际统一的标准模式,各种数字图像处理技术和算法之间孰优孰劣仍在不断的探讨和比较中。当前,国内外的研究机构主要研究的测距技术包括超声波测距技术、微波雷达测距技术、激光雷达测距技术和视觉测距技术。
1.1 激光雷达测距
激光雷达测距具有测量时间短、量程长、精度高等特点,但激光雷达在恶劣天气环境下或逆光状态下的测距准确性降低,另外,其造价、耗能、对人眼安全等因素也对其进一步应用有一定影响。
1.2 超声波测距
超声波是指振动频率在20 kHz以上的机械波,具有声波传输的基本物理特性。超声波测距是根据超声波反射时间来计算与前方车辆之间的距离。超声波测距原理比较简单,成本低,但超声波的传输速度受天气影响较大,不同天气条件下的传输速度不同。
为了加快我国城乡一体化进程建设,农业机械自动化的地位变得越来越重要。但是由于我国农业人口多,以及长期以来经济技术落后的现状,使得我国农业机械自动化在发展的过程中依旧面临着较大的难题。就目前的情况来看,我国农业机械自动化技术的水平,与西方国家相比还有很大的差距。所以,如何促进农业机械自动化技术的发展,以及对农业机械自动化技术进行优化,已经成为解决三农问题的关键。本文从农业机械自动化对农村建设的意义出发,对农业机械的分类做了相关的介绍,并指出了农业机械化技术发展中存在的问题,最后对农业机械自动化技术要点及优化应用措施提供了建议。
关键词:
农业机械自动化;技术要点;优化措施
0引言
所谓农业机械自动化技术,指的是将控制论、计算机技术、液气压技术等应用到农业机械的设计当中,使农业机械可以独立完成田间耕作。随着科学技术的不断发展以及为了响应政府高效农业的号召,我国农业正逐步朝着机械自动化的方向发展。农业机械的自动化,不仅能够使劳动的生产效率得到提高,还能减轻农民的劳动强度,并且提高劳动舒适度,在一定程度上缓解农村劳动力短缺的问题。在科技高速发展的今天,世界各国都加大了对农业机械自动化技术的研究。很多科研成果已经从实验室走向了实用阶段。
1农业机械自动化对农村建设的意义
对社会主义新农村进行建设,是我国构建社会主义和谐社会的基本要求。社会主义的和谐与广大农村地区的和谐是不可分割的。虽然从整体上看,社会主义新农村处于较为稳定和谐的状态,但不可否认的是,社会主义新农村的建设也存在着一定的问题。其中,最主要的问题是农民收入过低。因此,我国要大力推行农业机械自动化建设,为减轻农民的劳动强度、提高农民的经济收入提供保障。
2农业机械的分类
通常来说,农业机械是由动力设备和与之配套的农机器具组成的。这两者之间主要是以牵引悬挂或者是半悬挂的方式进行连接。也有的农业机械将这两者制造成一个统一的整体。动力设备和与之配套的农机器具这两者在耕作的过程中,互相配合,缺一不可。
3农业机械自动化发展中存在的问题
我国农业机械技术在发展的过程中,并不是一帆风顺的,而是遇到了很多问题。首先,我国大型农业自动化机械在推广的过程中难度较大。很多农民没有意识到机械化生产的重要性,导致了他们不愿意在农业生产的机械方面进行投入,最终造成了我国大型农业自动化机械供大于求的尴尬。第二,我国的农业机械制造水平较低。与西方国家相比,我国农业机械制造的起步较晚,在很多方面,科技水平还不够成熟。第三,我国对农业机械自动化技术的研究缺乏足够的动力。我国大型农业机械的制造企业,以及科院院所存在着资金不足、科研环境较差的问题。对农业机械进行设计,不仅需要耗费大量的时间和精力,还需要一定的技术条件作为依托。我国大部分科研院所和农业机械制造企业,由于资金不足,并没有完成对实验室的配套建设,使得科研人员在进行工作时困难重重,这一现状也严重影响了科研人员的工作积极性。第四,自动化技术在农业机械的应用中还处于起步阶段。对自动化技术的应用,需要很高的科技水平作为依托,但是我国科技基础薄弱的现实,使自动化技术的应用变得困难。
4农业机械自动化技术要点及优化应用措施
4.1实现计算机技术应用于农业生产
计算机视觉技术,作为新时期重点研究和应用性广泛的新科技,很多西方国家先后展开了对计算机视觉技术的研究。计算机视觉技术在农产品质量的鉴定方面,以及在记录农产品生长的信息等方面有着十分重要的作用。英国对计算机视觉技术的应用进行了首次尝试,利用该技术研制了专业性的采蘑菇机器人。采蘑菇机器人在采蘑菇的过程中,不仅能够对蘑菇的位置进行精准的定位,而且能够对所采的蘑菇进行合理化的分类。受到英国的影响和启发,我国国内也开始尝试在农业机械自动化技术中,加入计算机控制技术的内容。但是由于我国的经济技术发展还不够成熟,要实现对计算机视觉技术的应用,还需要科学家们进行努力。
4.2实现农业施肥和灌溉技术的自动化
我国水资源总量虽然比较大,但是人均资源占有量却很小,而且我国水资源分配的不够合理,使得我国水资源长期处于短缺的状态。要促进农业的发展,充足的水资源是必要的条件。在保证农业生产用水的同时,保证对水资源的节约,是我国农业发展过程中必须要面对的问题。农业自动化灌溉技术的应用可以很好地解决这一问题。所谓农业自动化灌溉技术,是把传感器与电子计算机进行有机结合,把农作物生长过程中对环境的需求及对用水量的需求,通过软件的形式加以呈现,从而避免水资源的浪费。对农业施肥技术来说也是如此,实现农业施肥和灌溉技术的自动化,是节约水资源、降低农业生产成本、避免浪费以及保护环境的必然选择。
4.3实现农业的精准化
农业精准化是指将我国的传统农业与农业机械自动化技术相结合,实现农业生产管理的科技化。精准农业是未来农业发展的主要方向之一。农业生产自动化,是一项以计算机网络和控制器等为基础的技术。我国对精准农业的研究,已经取得了一定的科技成果。世界上第一台观测农业气象的自动化仪器,已经在我国郑州气象站开始投入使用。农业气象观测仪,可以对农业生产的小环境进行合理化监测,并且通过网络把监测到的信息及时反映给当地农业部门。
总之,在经济全球化进程不断加快和城市化进程高速发展的今天,给各个行业带来机遇的同时,也带来了挑战。为了在经济发展的大潮中处于不败的地位,加强科技创新是一项必不可少的选择,同时也是长远发展的根本要求。对于农业产业而言,为了使我国农业能够更好更快的发展,政府要提高对农业机械自动化技术研究的投入,并将新的科技成果不断应用到农业生产中。作为科技工作者要努力钻研农业机械自动化技术,并且要对农业机械自动化技术的应用措施进行优化,从而实现农业的智能化时代,创造出我国农科发展的新道路。
作者:杨亚杰 单位:河北农业大学
参考文献:
[1]刘洋.我国农业机械自动化应用现状和推进模式探讨[J].化工中间体,2015(11):11-19.
关键词:数字摄影测量;影像匹配;影像匹配分类;匹配策略
中图分类号: P216 文献标识码: A
1.前言
影像匹配是数字摄影测量的典型问题之一。在航空摄影测量领域,影像匹配是自动获取数字地面模型(DTM)的关键技术,是以影像匹配代替传统的人工观测,来达到自动确定同名点的目的。一般来说,由于影像在不同时间、不同传感器、不同视角获得的成像条件不同,因此即使是对同一物体,在影像中所表现出来的几何特性、光学特性、空间位置都会有很大的不同,如果考虑到噪声、干扰等影响会使影像发生很大差异,影像匹配就是通过这些不同之处找到它们的相同点。在计算机视觉中,通常称为影像配准,而且很多领域中影像匹配都是必不可少的关键环节。目前影像匹配己成为现代信息处理,特别是图像信息处理领域中的一项非常重要的技术,已有很多学者进行这方面的研究而且已经取得了很好的成就。影像匹配研究涉及到了影像采集、影像预处理、影像分割、特征提取等,并且与计算机视觉、多维信号处理和数值计算方法等紧密结合。它也是其它一些影像分析技术,如立体视觉、运动分析、数据融合等的基础。目前,它的应用范围相当广泛,在计算机视觉、虚拟现实场景、航空航天遥感与数字摄影测量、医学影像分析、光学和雷达跟踪、景物制导、地形匹配、指纹与肖像检测等领域都有着重要的应用价值。在数字摄影测量的研究中,几何变换和对应关系是两大关键问题。几何变换问题经过数学和图形图像学的研究已经得到了解决,而对应问题(特别是同名点的对应问题)正是影像匹配的研究目的。影像匹配的良好实现,可以大大促进数字摄影测量自动化量测的发展,并为立体测图、建立立体模型、自动生成DEM、正射影像、等高线,构建三维立体和虚拟现实场景提供技术支撑。
2.影像匹配国内外研究现状与内容
影像匹配技术一直是数字摄影测量、计算机视觉等领域的关键技术难题,但它广阔的应用前景吸引了众多领域的科研人员孜孜不倦地对它进行攻关,成为经久不衰的研究热点。最初的影像匹配是利用相关技术实现的,因此又称为影像相关。从上个世纪五十年代至今,国内外学者提出了许多相应的理论,涌现了大量的匹配算法[1][[2][3][4],如相关函数法、相关系数方法、整体法等。Bellman于上个世纪50年代提出的动态规划法影像匹配,德国 Ackerlnann 教授提出的最小二乘匹配方法[5],Rosenhlm提出的多点最小二乘影像匹配[6],已及Ton Jez-ehing、JainA K提出的确定两影像区域间对应关系的点匹配方法[7],Daniel P Huttenlocher等人提出的Hausdorff距离匹配方法[8]等等;1978年,我国摄影测量学的先驱王之卓院士率先提出了“全数字摄影测量”的概念[9], 利用影像匹配来代替传统的人眼立体观测;张祖勋院士提出了基于跨接法的影像匹配 [10];吕言提出了特征提取的吕言算子和基于特征的影像匹配方法[11];张力、沈未名等也提出了基于空间约束的神经网络影像匹配算法[12]。尽管发展出了多种多样的匹配方法,但这些影像匹配算法按其匹配基元分类,主要可以分为基于像元灰度的影像匹配算法、基于特征的影像匹配算法以及基于影像的理解和解释的匹配算法。
3.影像匹配的基本概念
匹配是图像处理的一个基础问题。简单的说,匹配技术就是找到两幅不同影像之间的空间位置关系实现同一目标的两幅(或两幅以上)影像在空间位置上的对准。 Barbara zitova和 Jan Flusser在其著作中对影像匹配进行了定义[23],称其是针对来自于同一场景、不同时间、不同视角、不同传感器的两幅或多幅图像进行重叠 (Overlapping)的过程,这个重叠就是几何对齐 (Geometrically Align)的过程。可以从中看出两点,其一,影像匹配所研究的影像具有成像机理、自然条件、成像时间等的不同,这些都造成参与匹配的影像对具有很大的差异;其二,影像重叠的目的为了对两幅影像在空间上进行对准,以确定两幅影像之间的平移以及旋转关系。也可以说影像匹配时利用两个信号的相似性评价函数,评价它们的相似性以确定同名点。即首先取出以待定点为中心的小区域中的影像信号,然后取出其在另一影像中相应区域的影像信号,计算两者的相似性评价函数,以相似性评价函数值的大小来确定相应区域中心点位同名点,即以影像信号分布最相似的区域为同名区域,同名区域的中心点为同名点。
4.影像匹配的困难与解决问题思路
影像匹配的方法有很多,但都有不同程度的局限性。对于一些共性的问题,如匹配模糊度问题,匹配组合问题等,目前仍是影像匹配中的难点问题。在实际应用中主要表现在以下几种情况的影像匹配中存在的问题:
1.信息贫乏区域(非重叠覆盖范围)和纹理重复区域(遮蔽区域)的匹配
2.阴影区域的匹配
3.陡坡表面和断裂线地区的匹配
4.影像之间存在大的旋转角度的匹配
5.非漫反射地区的匹配
6.对运动的目标和阴影的匹配
7.存在较大比例尺差异的影像间的匹配
8.不同传感器影像之间的匹配
针对这些问题,一般的对于纹理贫乏和周期性纹理重复区域,自适应的调整窗口大小;对于遮蔽和断裂线区域采用双向匹配的方法;对于陡坡区域采用跨接法影像匹配;对于存在较大旋转角度的影像匹配则采用SIFT算子[28]进行处理。
5.小结
发展至今,影响匹配技术已经取得了很大的成就,多种多样的影像匹配算法基本能够满足实际应用的需求。但影像匹配中仍存在着诸多问题和挑战,这也是数字摄影测量面临的典型问题之一,也是我们今后科研的主攻方向和着力点。另外,目前的影像匹配算法大多是针对特定情况的应用,适应性方面不是太强。因此,寻找一种普适性的影像匹配算法或适应性较强的影响匹配处理系统从而实现数字摄影测量发展的一次飞跃是我们不得不思考的问题。
参考文献:
[1]张祖勋,新的核线相关算法一跨接法[J],武汉测绘科技大学学报,1988,13(4):19-26.
[2]王之卓,摄影测量原理续编[M],北京:测绘出版社,1986.
[3]吕言,用于提取数字图像点特征之有利算子研究[J],测绘学报,1989,18(3):175-182.
[4]张力,沈未名,张祖勋等.基于空间约束的神经网络影像匹配[J].武汉测绘科技大学报,2000,25(1):55-58.
关键词:计算机视觉;跟踪算法;综述;人数统计
中图分类号:TP391 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.03.003
0 引言
计算机视觉作为一门多学科的交叉领域,涉及图像处理、计算机图形学、模式识别、人工智能、人工神经网络、计算机、数学、心理学、生理学和物理学等。本文是对视频人数统计技术的综述,属于智能视频监控范畴。
由于智能视屏监控的挑战性以及其巨大的应用价值,越来越多的学校、研究所以及公司的研究人员投入到该领域中来。麻省理工学院、卡内基梅隆大学以及其他国外著名大学成立了专门的计算机视觉及多媒体方向的实验室;Nice和Object video等公司已经针对飞机场、国界线等应用场合开发了一些相应的智能监控系统。国际上的高级视频和录像(Advanced Videoand Signal-Based Surveillance)论坛每年都会举办PETS(Performance Evaluation of Tracking Systems)会议专门针对于人群行为分析,包括群体人数统计,人流密度估计;对单个人员以及群体中个体进行跟踪;特殊群体和特殊事件检测等。本文主要针对视频人数识别这个研究方向,从基于特征点、颜色与形状信息、模板匹配三种不同类型识别跟踪方式分析了近些年来国内外的研究工作及最新进展,通过对各种不同识别方法比较,对当前亟需解决的问题做了详细的分析。
1 人数识别研究现状
人数统计算法融合了运动物体检测、行人检测与分割、形状分析、特征提取和目标跟踪等多个领域的技术。从采用的手段来讲可以分为直接法和间接法:直接法(或称基于检测的),即首先在场景中检测出每个行人,再计数。第二种称为间接法(也称为基于映射或基于度量的),一般是建立场景特征与行人数量的函数关系来测算人数。在行人高度密集的场景中,间接法比直接法更加可靠,主要因为直接法无法有效分割每个行人,特别是在行人高度密集的场景中,从20世纪90年代起到目前为止这近20年里,出现了众多的视觉跟踪算法,1988年,Aggarwal和Nanadhakumar对运动图像分析算法进行了总结,将算法分为两类,一类是基于光流法的分析,另一类是基于特征点的分析,此后在视觉跟踪领域中,又出现了许多新的方法,目前,视频中人数的跟踪方法大致分为三类,分别是基于区域的跟踪、基于特征点的跟踪、基于模板和模型的跟踪,这种分类方法概括了目前大多数视觉跟踪算法,因此下面用这种分类方法对视觉跟踪算法进行介绍。
1.1 基于特征的人数识别
基于特征的人数跟踪算法选取目标的某个或某些局部特征作为相关时的对象,这种算法的优点在于即使目标的某一部分被遮挡,只要还有一部分特征可以被看到,就可以完成跟踪任务,另外,这种方法与卡尔曼滤波器联合使用,也具有很好的跟踪效果。这种算法的难点是:对某个运动目标,如何确定它的唯一特征集?这也是一个模式识别问题,若采用特征过多,系统效率将降低,且容易产生错误,文献对这一问题进行了讨论,在特征提取时,一般采用Canny算子获得目标的边缘特征,而采用SUSAN算子获得目标的角点信息。有关基于特征的跟踪算法还可参见文献。在2009年,Albiol使用角点个数作为场景特征来估测人数,首先通过Harris角检测器检测出图像角点,然后进行角点匹配以区分人身上的角点和背景角点,Albiol认为每帧总人数与人身上角点的个数成正比例关系,以此估测人数,算法虽然简单,但在PETS 2010“人数统计与密度估计”竞赛中取得优胜。2010年,Conte等“”基于Albiol的方法提出改进。采用的SURF(Speed up Ro.bust Feature)特征点以代替角点,同时,Conte等不仅考虑到特征点个数对人数估测的影响,还考虑到透视投影(拍摄距离d)密度人群遮掩(特征点密度p)对于估测的影响,同时对所有SURF点进行分组回归以提高精度,在这个基础上张茂军等相比Conte等的研究成果在处理远距离人群上精度提高,主要因为使用“非最大抑制聚类”——对不同拍摄距离的人群采取不同的聚类标准,有效解决远距离人群的类过大问题,提取人身上特征点的方法是在掩模上直接检测特征点,使得特征点个数更加稳定,有利于SVM预测。
1.2 基于区域的人数识别
基于区域的跟踪算法基本思想是:首先得包含目标的模板(Template),该模板通过图像分割获得或是预先人为确定,模板通常为略大于目标的矩形,也可为不规则形状;然后在序列图像中,运用相关算法跟踪目标,对灰度图像可以采用基于纹理和特征的相关,对彩色图像还可利用基于颜色的相关。
McKenna等首先利用色彩和梯度信息建立自适应的背景模型,并且利用背景减除方法提取运动区域,有效地消除了影子的影响;然后,跟踪过程在区域、人、人群三个抽象级别上执行,区域可以合并和分离,而人是由许多身体部分区域在满足几何约束的条件下组成的,同时人群又是由单个的人组成的,因此利用区域跟踪器并结合人的表面颜色模型,在遮挡情况下也能够较好地完成多人的跟踪。Marana等认为低密度人群在图像上体现出粗糙纹理特征,而高密度人群则体现出精细纹理特征。文献分别采用自组织理论和Minkowsld不规则维度理论从图像纹理特征预测人群密度。Lin等则结合Harr小波变换(HWT)和支持向量机(SVM)进行行人头部轮廓检测,从而达到人数统计的目的。文献利用颜色和形状信息实现人头的检测,包含两个步骤:黑色区域提取和形状分析。通过对HSV空间V通道的像素设置阈值这种方法有效地检测出黑色区域,同时可以少受光照变化和阴影的影响。使用一种基于形状描述的快速弧形结构提取方法实现人头检测。姬红兵等提出了一种基于局部特征的目标跟踪算法,通过多尺度分析方法,根据颜色和空间上的相似性将目标分割为多个区域,每个区域由一个团块表示,团块包含了该区域所有像素的颜色均值、形状和位置,根据团块特征构造目标的外观模型,定义团块的匹配准则,通过团块匹配进行目标跟踪。
1.3 基于模板匹配的人数识别
采用模板匹配识别跟踪方法首先将图像序列转换为一组静态形状模式然后在识别过程中和预先存储的行为标本相比较,
部分学者在运动前景提取的基础上使用了轮廓匹配方法对目标进行定位,文献使用了半圆模型搜索前景中人头肩所在位置,然后使用Snake模型与卡尔曼滤波相结合对目标进行跟踪目标,但Snake模型比较适合单目标的跟踪,当行人发生重叠时,定位精度会有一定的下降;在此基础上文献提出使用含有人harr特征分类器(使用头肩部上半身样本),对行人重叠情况下的检测精度有一定的提升。文献提出使用垂直摄像头降低行人之间的遮挡程度,通过对基于AdaBoost的人头检测本方法,建立一个良好的人头检测分类器。然后根据运动人头的特征去除误检区域。最后配合过线跟踪实现出入口人数统计。
2 视频跟踪问题中的难点
从上面的阐述可以看出,各种方法都有自己的优点和不足,是在文献基础上分析得到的几种具体识别方法的比较结果,由于各种方法在设定理想情况下都有较好的准确率,所以不对各种方法的准确率做出比较,而是从各种算法的复杂度、鲁棒性、先验知识需求、高密度复杂人群适应性(有遮挡出现)等方面进行相对的比较分析,分析结果如表1。
2.1 视觉跟踪问题中的难点
从控制的观点来看,视觉跟踪问题所面临的主要难点可以归结为对视觉跟踪算法在三个方面的要求,即对算法的鲁棒性、准确性和快速性。
鲁棒性是指视觉跟踪算法能够在各种环境条件下实现对运动目标持续稳定的跟踪。影响人数跟踪系统鲁棒性的最主要原因在于目标处环境的光照变化以及部分遮挡引起的运动目标不规则变形和全部遮挡引起的目标的暂时消失。当运动目标所处环境的光照发生改变时,采用图像灰度信息或色彩信息作为跟踪基础的视觉跟踪算法一般都会失效,而基于图像特征的方法往往不受光照改变的影响,如利用运动目标的边缘信息能有效避免光照变化对运动目标的影响,但在复杂环境中要将运动目标的边缘和周围其它目标边缘区分开来是非常困难的,遮挡问题是视觉跟踪算法中又一难点问题,利用单摄像机解决遮挡问题也一直是视觉跟踪领域中的热点。而利用多摄像机可以在很大程度上解决这一问题,但正如前所述,多摄像机的应用又会引入新的难题。
在视觉跟踪研究中,准确性包括两个方面,一是指对运动目标检测的准确性,另一个是指对运动目标分割的准确性,对运动目标检测准确性的目的是尽量避免运动目标虚检和漏检,从而提高对真实运动目标的检测概率。由于实际复杂环境中存在大量噪声。至今已经出现了上千种各种类型的分割算法,但由于尚无通用的分割理论,目前并没有一种适合于所有图像的通用分割算法。
一个实用的视觉跟踪系统必须能够实现对运动目标的实时跟踪,这就要求视觉跟踪算法必须具有快速性但是,视觉跟踪算法处理的对象是包含巨大数据量的图像,这些算法往往需要大量的运算时间,很难达到实时处理的要求,通常,简单算法能够实现实时跟踪,但跟踪精度却很差;复杂算法具有很高的跟踪精度,实时性却很差,一种通用的减小视觉跟踪算法运算量的方法是利用金字塔分解或小波变换将图像分层处理。
3 展望与结束语
3.1 展望
实现一个具有鲁棒性、准确性和快速性的视觉跟踪系统是当前视觉跟踪技术努力的方向。但视觉跟踪技术在这几个方面中每前进一步都是非常困难的,因为该技术的发展与人的感知特性的研究紧密联系在一起,由于目前对人的感知特性没有一个主流的理论,其数学模型更是难以建立。同时,在计算机视觉中大多数问题是不确定的,这就更增加了视觉跟踪技术发展的难度。但是,近几十年来,数学理论方面取得了巨大的进步,因此合理的使用在数学理论方面的知识提高系统的性能能够很好的解决视觉跟踪问题。例如现在已经应用在诸多领域的模糊算法,神经网络等提高系统性能,简化计算复杂度。
3.2 结束语
一、数据融合
1.1概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。
7年代末,在公开的技术文献中开始出现基于多系统的整合意义的融合技术。1984年美国国防部数据融合小组(dfs)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,buchroithner和wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。
1.2基本内容
信息融合是系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器id/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先
每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。
1.3处理模型
美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
二、多传感器在林业中的应用
2.1在森林防火中的应用
在用modis(moderateresolutionimagingspectroradiometer)数据测定森林火点时的2、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1m的热辐射通道的数据外加入空间分辨率为25m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得gps接收机输出的有关信息通过与rs实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2森林蓄积特征的估计
hampusholmstrom等在瑞典南部的试验区将spot-4×s卫星数据和carabas-iivhfsar传感器的雷达数据进行了融合,采用knn(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。
knn方法就是采用目标样地邻近k个(k=1)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3用非垂直航空摄像数据融合gis信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森
林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。 trevorjdavis等22年提出采用非垂直的航空摄影数据融合对应的gis数据信息实现森林调查数据
的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用gps对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的gis数据进行融合,做出资源变化的估计或影像的修正。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
三、数据融合在林业中的应用展望
3.1在木材检测中的应用
3.1.1木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。
在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。
x射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,
造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和x射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。
基于多传感器(机器视觉及x射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;auburn大学的生物系统工程系和usda南方林业实验站与有关公司合作开展用gps和其他传感器研究林业机器系统的性能和生产效率。
0 引言
从X光图像分析识别出铸件或其他产品内部缺陷的应用越来越多,产品不同结构形成的x射线图像
>> 基于视觉特征的图像聚类方法研究 基于特征的图像网格生成方法 基于计算机视觉的构件表面缺陷特征提取 基于加权特征空间信息视觉词典的图像检索模型 一种基于小波变换的墙地砖缺陷图像特征提取方法 铸件缺陷的检查与修补 基于图像缺陷分割技术的综述 图像中轮廓结构的视觉特征研究 浅谈铸件疏松和超声波检测的优点 基于文本区域特征的图像型垃圾邮件过滤算法 论城市视觉形象的生成与特征 铸件缺陷无损检测方法的研究现状分析 消失模铸件的常见缺陷及对策 基于互补特征的纹理图像检索 基于颜色特征的图像检索技术 基于局部特征的智能图像融合 基于联合特征的图像检索 基于纹理特征的道路图像分类 一种基于图像特征的图像分类方法 基于机器视觉的瓷砖缺陷检测机构 常见问题解答 当前所在位置:中国 > 科技 > 基于定性视觉特征的铸件疏松型缺陷图像生成 基于定性视觉特征的铸件疏松型缺陷图像生成 杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠! document.write("作者:未知 如您是作者,请告知我们")
申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。 0 引言
从X光图像分析识别出铸件或其他产品内部缺陷的应用越来越多,产品不同结构形成的x射线图像与缺陷识别算法密切相关,算法的有效性鲁棒性的调试检测因而需要大量待测产品图像样本。在产品质量较好的情况下。获取大量带缺陷样本通常需要一个较长时期。由于算法测试需要在产品批量检测之前进行,这使得样本更加难以获得。通过仿真缺陷并叠加至产品图像的方法获取样本很早便受到关注,并长期基于计算机辅助画图(CAD)软件技术:一方面可以对包含缺陷的工件整体仿真;另一方面则是上述的缺陷图像叠加。利用cAD软件除了其计算量太、模型计算复杂,还有一个较大的局限是缺陷生成的随机性差,cAD需在确定模型的基础上形成缺陷,模型的产生因此成为瓶颈技术。从实际生产看,基本上每个产品所存在的缺陷都不相同,因此缺陷的仿真,更确切地说应该是生成,就不是对某个具体对象的模仿和逼近,而应在视觉上符合缺陷的定义,在缺陷图像生成算法中满足其特征的统计数值范围。
【关键词】量子计算;量子计算机;量子算法;量子信息处理
1、引言
在人类刚刚跨入21山_纪的时刻,!日_界科技的重大突破之一就是量子计算机的诞生。德国科学家已在实验室研制成功5个量子位的量子计算机,而美国LosAlamos国家实验室正在进行7个量子位的量子计算机的试验。它预示着人类的信息处理技术将会再一次发生巨大的飞跃,而研究面向量子计算机以量子计算为基础的量子信息处理技术已成为一项十分紧迫的任务。
2、子计算的物理背景
任何计算装置都是一个物理系统。量子计算机足根据物理系统的量子力学性质和规律执行计算任务的装置。量子计算足以量子计算目L为背景的计算。是在量了力。4个公设(postulate)下做出的代数抽象。Feylllilitn认为,量子足一种既不具有经典耗子性,亦不具有经典渡动性的物理客体(例如光子)。亦有人将量子解释为一种量,它反映了一些物理量(如轨道能级)的取值的离散性。其离散值之问的差值(未必为定值)定义为量子。按照量子力学原理,某些粒子存在若干离散的能量分布。称为能级。而某个物理客体(如电子)在另一个客体(姻原子棱)的离散能级之间跃迁(transition。粒子在不同能量级分布中的能级转移过程)时将会吸收或发出另一种物理客体(如光子),该物理客体所携带的能量的值恰好是发生跃迁的两个能级的差值。这使得物理“客体”和物理“量”之问产生了一个相互沟通和转化的桥梁;爱因斯坦的质能转换关系也提示了物质和能量在一定条件下是可以相互转化的因此。量子的这两种定义方式是对市统并可以相互转化的。量子的某些独特的性质为量了计算的优越性提供了基础。
3、量子计算机的特征
量子计算机,首先是能实现量子计算的机器,是以原子量子态为记忆单元、开关电路和信息储存形式,以量子动力学演化为信息传递与加工基础的量子通讯与量子计算,是指组成计算机硬件的各种元件达到原子级尺寸,其体积不到现在同类元件的1%。量子计算机是一物理系统,它能存储和处理关于量子力学变量的信息。量子计算机遵从的基本原理是量子力学原理:量子力学变量的分立特性、态迭加原理和量子相干性。信息的量子就是量子位,一位信息不是0就是1,量子力学变量的分立特性使它们可以记录信息:即能存储、写入、读出信息,信息的一个量子位是一个二能级(或二态)系统,所以一个量子位可用一自旋为1/2的粒子来表示,即粒子的自旋向上表示1,自旋向下表示0;或者用一光子的两个极化方向来表示0和1;或用一原子的基态代表0第一激发态代表1。就是说在量子计算机中,量子信息是存储在单个的自旋’、光子或原子上的。对光子来说,可以利用Kerr非线性作用来转动一光束使之线性极化,以获取写入、读出;对自旋来说,则是把电子(或核)置于磁场中,通过磁共振技术来获取量子信息的读出、写入;而写入和读出一个原子存储的信息位则是用一激光脉冲照射此原子来完成的。量子计算机使用两个量子寄存器,第一个为输入寄存器,第二个为输出寄存器。函数的演化由幺正演化算符通过量子逻辑门的操作来实现。单量子位算符实现一个量子位的翻转。两量子位算符,其中一个是控制位,它确定在什么情况下目标位才发生改变;另一个是目标位,它确定目标位如何改变;翻转或相位移动。还有多位量子逻辑门,种类很多。要说清楚量子计算,首先看经典计算。经典计算机从物理上可以被描述为对输入信号序列按一定算法进行交换的机器,其算法由计算机的内部逻辑电路来实现。经典计算机具有如下特点:
a)其输入态和输出态都是经典信号,用量子力学的语言来描述,也即是:其输入态和输出态都是某一力学量的本征态。如输入二进制序列0110110,用量子记号,即10110110>。所有的输入态均相互正交。对经典计算机不可能输入如下叠加Cl10110110>+C2I1001001>。
b)经典计算机内部的每一步变换都将正交态演化为正交态,而一般的量子变换没有这个性质,因此,经典计算机中的变换(或计算)只对应一类特殊集。
相应于经典计算机的以上两个限制,量子计算机分别作了推广。量子计算机的输入用一个具有有限能级的量子系统来描述,如二能级系统(称为量子比特),量子计算机的变换(即量子计算)包括所有可能的幺正变换。因此量子计算机的特点为:
a)量子计算机的输入态和输出态为一般的叠加态,其相互之间通常不正交;
b)量子计算机中的变换为所有可能的幺正变换。得出输出态之后,量子计算机对输出态进行一定的测量,给出计算结果。由此可见,量子计算对经典计算作了极大的扩充,经典计算是一类特殊的量子计算。量子计算最本质的特征为量子叠加性和相干性。量子计算机对每一个叠加分量实现的变换相当于一种经典计算,所有这些经典计算同时完成,并按一定的概率振幅叠加起来,给出量子计算的输出结果。这种计算称为量子并行计算,量子并行处理大大提高了量子计算机的效率,使得其可以完成经典计算机无法完成的工作,这是量子计算机的优越性之一。
4、量子计算机的应用
量子计算机惊人的运算能使其能够应用于电子、航空、航人、人文、地质、生物、材料等几乎各个学科领域,尤其是信息领域更是迫切需要量子计算机来完成大量数据处理的工作。信息技术与量子计算必然走向结合,形成新兴的量子信息处理技术。目前,在信息技术领域有许多理论上非常有效的信息处理方法和技术,由于运算量庞大,导致实时性差,不能满足实际需要,因此制约了信息技术的发展。量子计算机自然成为继续推动计算速度提高,进而引导各个学科全面进步的有效途径之一。在目前量子计算机还未进入实际应用的情况下,深入地研究量子算法是量子信息处理领域中的主要发展方向,其研究重点有以下三个方面;
(1)深刻领悟现有量子算法的木质,从中提取能够完成特定功能的量子算法模块,用其代替经典算法中的相应部分,以便尽可能地减少现有算法的运算量;
(2)以现有的量子算法为基础,着手研究新型的应用面更广的信息处理量子算法;
(3)利用现有的计算条件,尽量模拟量子计算机的真实运算环境,用来验证和开发新的算法。
5、量子计算机的应用前景
目前经典的计算机可以进行复杂计算,解决很多难题。但依然存在一些难解问题,它们的计算需要耗费大量的时间和资源,以致在宇宙时间内无法完成。量子计算研究的一个重要方向就是致力于这类问题的量子算法研究。量子计算机首先可用于因子分解。因子分解对于经典计算机而言是难解问题,以至于它成为共钥加密算法的理论基础。按照Shor的量子算法,量子计算机能够以多项式时间完成大数质因子的分解。量子计算机还可用于数据库的搜索。1996年,Grover发现了未加整理数据库搜索的Grover迭代量子算法。使用这种算法,在量子计算机上可以实现对未加整理数据库Ⅳ的平方根量级加速搜索,而且用这种加速搜索有可能解决经典上所谓的NP问题。量子计算机另一个重要的应用是计算机视觉,计算机视觉是一种通过二维图像理解三维世界的结构和特性的人工智能。计算机视觉的一个重要领域是图像处理和模式识别。由于图像包含的数据量很大,以致不得不对图像数据进行压缩。这种压缩必然会损失一部分原始信息。
作者简介:
Abstract:There are three stages about the development of video monitoring system, simulative video surveillance system, digital video monitoring system and digital control system, and the intelligent video surveillance system is the future and hope of video monitoring system. Intelligent video analysis technology is the key technology of intelligent video surveillance, the core of changing passive surveillance into active identification.
关键词:视频监控系统,智能视频分析系统,智能视频分析技术
Key words:video monitoring system; intelligent video analysis system; intelligent video analysis technology
中图分类号:TP27 文献标识码:A文章编号:1006-4311(2010)17-0097-02
0引言
俗话说“百闻不如一见”,视觉信息在人类活动所涉及的信息中占据的比重最大,而且由于其空间和结构特性使其不能为任何其他信息所替代。智能视频监控(IVS,Intelligent Video surveillance)技术源于计算机视觉(CV,Computer Vision)技术,作为人工智能(AI,Artificial Intelligent)研究的一个分支,是一项新兴的安防技术,有着广阔的发展前景。智能视频监控技术是指利用计算机视觉的方法,在不需要人为干预的情况下,通过对视频序列进行实时自动分析,实现对目标的定位、识别和跟踪,并在此基础上进行行为分析,以达到完成日常管理和对异常情况预警的目的。基本的智能视频监控系统主要由视频数据采集、视频数据编码、视频数据传输以及视频数据分析处理和异常行为报警等部分组成。进入21世纪以来,国际反恐斗争的形势日趋严峻,智能视频监控作为安防系统的重要组成部分,广泛应用于各种公共场所和大型活动之中。我国的智能视频监控技术也在“平安城市”项目、奥运安防和上海世博会安防等各行业安防项目的强劲刺激和拉动下,进入了蓬勃发展阶段。
1智能视频监控的发展历程及研究现状
近三十年来,视频监控系统的发展经历了模拟视频监控系统、数字视频监控系统、全数字化监控系统(网络摄像机和视频服务器)三个阶段的演变,得到了巨大的发展。
1.1 模拟视频监控系统早期的视频监控是以摄像机、监视器(电视机)组成的纯模拟的视频监控系统,称为闭路监视系统。随后出现了视频切换设备,闭路监视系统加入多路视频切换、摄像机云台/镜头控制和报警联动等数字控制功能,实现了数字控制的模拟视频监控系统,称为第一代视频监控系统。
1.2 数字视频监控系统20世纪90年代中期,以DVR(Digital Video Recorder)为代表的第二代视频监控系统出现在视频监控市场上,大大提高了用户对录像信息的处理能力。DVR使用户可以将模拟的视频信号进行数字化并存储在硬盘而不是盒式录像带上。用户还可以通过DVR控制摄像机的启闭,从而实现移动侦测功能,对于报警事件以及事前/事后报警信息的搜索也变得十分简单。
1.3 网络视频监控系统进入21世纪以后,随着网络带宽、计算机处理能力和存储器容量的迅速提高,以及各种实用视频信息处理技术的出现,视频监控进入了全数字化的网络时代,称为第三代视频监控系统,即全数字视频监控系统或网络数字视频监控系统。然而由于作为监控者的人类自身生理上的弱点和视频监控设备在功能和性能上的局限性,使得各类视频监控系统均不同程度存在精确度差、报警不及时、误报和漏报等现象,以至系统的安全性和实用性得不到保障。因此,能够每天连续24小时实时智能监视,并能够自动分析摄像机捕捉的图像数据,当异常发生时又能向保卫人员准确及时地发出警报的智能视频监控系统应运而生,这样即可以有效预防犯罪发生,同时也减少了雇佣大批监视人员所需要的人力、财力和物力的投入。随着计算机视觉技术的不断发展和计算机处理能力的迅速提高,智能视频监控系统以其快速从海量视频信息中自动分析和抽取关键信息的优势,迅速占领国内外安防市场。
2智能视频监控系统的关键技术及优势
所谓智能视频监控,就是指采用智能视频分析算法,利用计算机视觉技术对视野范围内的目标进行行为的分析和内容提取,当发现符合某种规则的行为(如越界、游荡、滞留等)发生时,自动发出提示信号,采取特定对应措施(如声光报警、移动监测并记录)或通知监控人员进行人工干预等。作为智能视频监控的关键技术,智能视频分析技术可分为动态视频目标检测定位、动态视频目标跟踪、动态视频目标分类识别、行为理解与描述、异常事件分析等部分。
动态视频目标检测技术是智能视频分析的基础,主要是指通过监控画面识别目标区域的图像变化,从监控场景中将目标提取出来。主要方法是背景减除法、时间差分法、光流法、特征检测法等。动态视频目标跟踪是指结合物体的外表和运动特性,实现对不同形状、颜色、不同背景的目标进行识别的技术。常用的方法有基于运动估计的跟踪、基于特征的跟踪、基于主动轮廓的跟踪等。动态视频目标分类识别包含目标的识别、目标行为模式的分析、目标的状态分析等。行为理解与描述是最具挑战的研究方向,因为观察人的最终目标就是分析和理解人的个人行为、人与人之间及人与其它目标的交互行为等。近年来,利用机器学习工具构建人行为的统计模型方面有了一定的进展,但特征选择和机器学习仍然是行为理解的难点。主要方法是状态空间法和模板匹配方法。异常事件分析报警则是智能视频监控的主要目的,是视频监控智能化的必然要求。智能视频监控系统较于以往的视频监控系统有很大的优势,它在很大程度上弥补了普通智能视频监控系统的缺陷,变被动监控为主动识别。智能视频监控系统的优势很明显,如全天候可靠的视频监控,减少了人为因素造成的误报、漏报,将监控人员从"目不转睛"和主观的分析判断模式中解放出来。通过智能视频分析模块对监控画面的自动分析,实现对异常事件的主动编码、报警和保存。提高报警精度和响应速度,前端设备集成强大的数字图像处理功能,并运行高级的智能视频分析算法,使用户可以更加精确的定义安全威胁的特征,识别可疑活动,在安全威胁发生之前提示监控人员提前做好准备,并根据实际情况驱动预案生成和执行。智能视频监控还可以有效的扩展视频资源的用途,将视频资源应用到非安全领域中,如大型活动的人数统计、重要人物身份识别等。
3智能视频监控系统的应用及发展方向
智能视频监控系统的应用主要分为两大类:安全相关类应用和非安全相关类应用。安全相关类应用主要是在安防系统中。伴随重大政治、经济、体育活动的增加,恐怖袭击的频繁发生,市场上对此类应用的需求不断增长。主要包括:高级视频移动侦测(Advanced VMD)、物体追踪(Motion Tracking)、人脸识别(Facial Detection)、车辆识别(Vehicle Identification)、非法滞留(ObjectPersistence)等。目前,智能视频监控系统已经在高端的安防市场有了多年应用,如在机场、监狱、军事基地和其他大型基础设施中。以机场为例,它的周界太过分散,监控人员无法完全监控到所有周界。这时,智能化的监控系统就可以充分展示它的才能了,它能够自动探测在某些特定场所和时间内进入或离开某一区域的可疑物体。除了安全相关类应用之外,智能视频监控系统还可以应用到非安全相关类应用当中。这些应用主要面向服务和零售行业,可以看作管理和服务的辅助工具,有效提高服务水平和营业额。这类应用主要有:人数统计(People Counting)、人群控制(Flow Control)、注意力控制(Attention Control)和交通流量控制(Traffic Flow)等。例如一些宾馆或商场大堂的监控录像可以通过人数统计功能,计算客流量和销售情况;通过人脸识别等功能加强对VIP客户的服务,智能视频监控系统自动识别VIP客户的特征,并通过客服人员及时做好服务工作,有效提高工作效率和工作质量。
目前,大部分智能视频监控系统的核心算法仍然掌握在欧美等先进国家,并迅速形成了相对成熟的产品应用于安防系统中,如美国的Vidient、ObjectVideo,以色列的Mate,日本的NICE等。据IMS Research调查显示,世界范围内IVS(Intelligent Video System)的市场占有率为35%~36%,其中美国的OV(Object Video)就占有了9%左右。在国内,智能视频监控也得到了长足的发展,如中国电信“全球眼”、中国网通“宽世界”、中国铁通“智控眼”等品牌,大多面向行业用户开展,市场收入不菲,竞争越来越激烈。2008年奥运会和2010年上海世博会更是使智能视频监控系统得到了广泛的应用和发展。
4结束语
综上所述,智能化是视频监控发展的必然趋势,智能视频监控系统正受到越来越多的关注,需求量也在不断增加。虽然,目前仍存在许多问题,如:图像质量问题、安全检查问题等。但随着智能视频分析技术的不断发展,各种硬件费用的降低和通信运营商的投资发展,智能视频监控系统将得到更广泛的应用和发展。现在,它已完成了2008奥运安防的重大使命,也将为2010的"平安世博"保驾护航。
参考文献:
[1]郭瑞霞, 吴运新,宋跃辉.智能跟踪视频监视系统研究[J].电视技术, 2006,(2):74-77.