公务员期刊网 精选范文 计算机视觉研究的目的范文

计算机视觉研究的目的精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉研究的目的主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉研究的目的

第1篇:计算机视觉研究的目的范文

关键词:双目视觉;匹配算法;计算机视觉;立体匹配;相位一致性

1.计算机视觉系统分析研究

1.1计算机视觉技术及双目立体视觉

计算机视觉是通过计算机技术实现对视觉信息处理的整个过程,是一门新的学科。视觉是人们认知事物的重要途径,视觉是人们对视觉信息获取、处理和存储的过程。随着计算机技术的发展,信号处理技术的应用,人们通过照相机来把实际的事物拍摄下来转变为数字信息,并通过计算机信号处理技术队获取的视觉信号进行处理。计算机视觉技术对图像的处理分为获取图像、特征抽象选取、事物识别及分类和对三维信息的理解。获取图像主要是通过摄像机和红外线等技术对周围视觉事物进行获取,并通过计算得到和真实事物相应的二维图像,二维图像主要是数字图像。计算机视觉系统的最基本的功能是数字图像的获取。可以看出计算机视觉研究最基本内容是三维场景距离信息的获取。在计算机被动测量距离方法中,有一种重要的距离感知技术叫作双目立体视觉。双目立体视觉技术是其他计算机视觉技术无法取代的一种技术,对双目立体视觉技术的研究在计算机视觉技术和工程应用方面都是非常重要的。

1.2计算机视觉理论框架

第一个视觉系统理论框架的提出是以信息处理为基础,综合了图像处理和神经生理学等研究内容而建立的。这个视觉系统理论框架是计算机视觉系统的基本框架,与计算机视觉技术有着密切的关系。视觉系统的研究是以信息处理为基础的,从理论层次、算法层次和硬件层次3个层次进行研究。计算机理论层次主要是表达系统各个部分计算的目的和方法,对视觉系统的输入和输出进行规定,输入作为二维图像,输出是以二维图像为基础建立起来的三维物体,视觉系统的目的就是对三维物体进行分析和识别,通过计算对二维物置和形状进行重新建立。算法层次对计算机规定的目标进行计算,算法和计算机表达有关,不同的表达可以通过不同的算法进行实现,在计算机理论的层次上,算法和表达比计算机理论的层次要低。硬件层次是通过硬件来实现算法的一种表达方法。计算机理论层次在计算机信息处理中时最高的层次,取决于计算机的本质是解决计算机的自身问题,不是取决于计算问题的计算机硬件。要更好地对计算机系统和框架进行理解最好的方法就是要区分3个不同的层次,计算机理论的含义和主要解决的问题是计算机的目的,表达算法含义和主要解决的问题是实现计算理论的方法和输入输出的表达,硬件的实现的含义和主要解决的问题是如何在物理上对表达和算法进行实现。计算机视觉处理的可以分为3个阶段,对视觉信息的处理过程从最初的二维图像的原始数据,到三维环境的表达。第一阶段基元图的构成,基元图是用来表示二维图像中的重要信息,主要是图像中亮度变化位置及其几何分布和组织结构,图像中每点的亮度值包括零交叉、斑点、端点和不连续点、边缘等。第二阶段2.5维图描述,在以观测者为中心的坐标中,表示可见表面的方向、深度值和不连续的轮廓,基元是局部表面朝向离观测者的距离深度上的不连续点表面朝向的不连续点。第三阶段三维模型表示,在以物体为中心的坐标系中,有由体积单元和面积单元构成的模块化多层次表示,描述形状及其空间组织形式,分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积单元或面积形状基元都附着在轴线上。视觉理论框架图如图1所示。

2.基于计算机的视觉立体匹配算法研究

视觉立体匹配算法是基于人类视觉系统的一种计算机算法。立体匹配算法作为计算机立体视觉问题研究的重点,快速地实现图像对应点的匹配来获得视差图是当今研究的热点问题。立体视觉匹配算法根据基元匹配的不同可以分为相位匹配、区域匹配和特征匹配3种,其中区域匹配算法可以减少计算负担,区域匹配算法实时性高,应用前景广阔。计算机立体视觉通过对人的双眼进行模仿,在双眼的立体感知中获得信息,从摄像机拍摄的图像中获取物体的三维深度信息,这就是深度图的获取,把深度图经过处理得到三维空间信息数据,二维图像到三维空间实现转换。深度的获取在双目立体成像视觉系统中分为两步,首先在双目立体图像与图像之间建立点对点的对象关系,双目立体视觉算法研究的重点问题是解决对应点之间的匹配问题。其次以对应点之间的视差为依据对深度值进行计算。双目成像是获取同一场景中两幅不同的图像,两个单目成像模型构成一个双目成像模型。双目成像示意图如图2所示。系统的基线B是两个镜头中心的连接线,空间点w(z,y,z)作为世界坐标的值由(x1,y1)与(x2,y2)进行确定,如果摄像机的坐标位置和空间点w世界坐标的位置重合,图像平面和世界坐标轴xY的平面就是平行的。如果两个摄像机在坐标系统中的原点不同但是它们的光轴平行,那么双目成像计算人们可以看图3所示,图3表示的是两个摄像头连线在平台xY的示意。

立体视觉的成像过程是成像的逆过程,具有一定的不确定性。大量的数据信息在从三维影像向二维图像进行投影的过程会出现丢失的现象,所以视觉系统要通过自然的约束条件才能保证获取正确的解。这些约束条件在减少匹配的计算量方面可以提供有利的帮助。针对基于区域匹配快速算法,还可以应用基于视差梯度的匹配算法,这种匹配算法应用较大的搜索范围在边缘的特征点上进行搜索,采用视差梯度在非边缘区减少搜索范围。应用计算机视觉立体匹配算法可以减少成像匹配时间,大大提高了工作效率。计算机立体匹配算法征点的提取是算法的关键问题,今后的研究方向重点是对有效特征点提取方法的研究。

第2篇:计算机视觉研究的目的范文

关键词: 计算机视觉;快速开发;框架;模块化;模块耦合;底层剥离

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)29-7084-04

在视觉分析实际应用项目中,如何通过建立计算机视觉分析快速开发框架,搭建一个分工明确,快捷有效的图像学应用处理平台,提高开发效率,缩短开发时间,已成为项目开发人员关注的重点内容之一。本框架从项目应用和实际需求出发,将计算机视觉技术的核心算法从底层研究工作中剥离,可极大的缩短开发时间,提高开发效率。

在本框架下,开发人员可各司其职,分工、构成和职能划分明确,框架开发人员只专注于框架接口的定义;算法开发人员只专注于图像处理与识别等算法的开发;上层应用开发人员只负责抽取出一般的处理流程,专注于项目的具体实现和功能模块的组合应用。

1 研究与应用

1.1背景

计算机视觉是用摄像机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉。系统将获取的视频或图像资料,通过计算机处理成为更适合人眼观察或传送给仪器检测的图像,其中包括图像处理、模式识别或图像识别、景物分析、图像理解等相关内容,它们之间既有差别,又有相互重叠。

在计算机视觉分析技术中,对于一些复杂的问题,往往不是某单一学科能够解决的,它需要一系列相关技术的支持。例如:对航道中船舶的识别,获取的视频流往往要经过平滑、去噪等图像处理操作后,便于下一步运用基于直方图分类器的图像识别算法来区分船舶和水面,通过图像分割技术来提取检测目标。而这些方案的实现中,同一个问题的解决又往往需要有一系列的算法来支持。还是以船舶识别为例,图像平滑有领域平均、低通滤波等算法;图像去噪有各种滤波器算法;基于直方图的分类器也存在决策树、贝叶斯、SVM等等算法。虽然上述的算法本身没有优劣之分,但在特定的环境下一定会有某个最佳算法。

因此,在实际应用项目中如何找出其最优路径,除了需要开发者拥有深厚的图像学功底,更需要的是通过大量的对比实验来找出该最优路径的解决方案。即便如此,也只能解决特定环境下的计算机视觉需求,换个应用场景,上述步骤又需要重新进行,此类过程的重复,既增加了开发成本,又延长了开发时间。

本框架从工程化的角度出发,在不同项目中的计算机视觉软件开发中,研究如何提高开发结果的复用性,尽量降低上述各条件间的相互依赖关系,将视觉技术的核心算法从底层研究中剥离,达到缩短开发时间,提高开发效率的目的。

1.2研究目标

1) 框架系统的扁平化、模块化;

2) 完成处理过程的任意组合,使图像处理模块单一化;

3) 理行为在处理模块内部完成,处理结果可通过接口方式进行输出;

4) 处理模块间的数据流动定义在框架之中,框架负责配置数据流;

5) 置好的数据流,通过指定图像处理模块实现对物体的识别、行为的识别。

1.3.5框架的效果演示

从右侧功能区中选取两个输入模块:MediaOpen00和MediaOpen01,分别打开视频文件“.\公司监控视频.avi”和图片“.\Lena.jpg”,任意添加一些图像处理模块或者图像识别模块,这里我们选取了行人检测算法、基本全局阈值二值算法、人脸检测算法、轮廓检测算法,加入输出展示模块用于显示处理结果。最后我们用曲线将模块间的输入输出点连起来,完成数据流向的配置过程。其中一个输出点可以连接多个输入点,但一个输入点只能接入一个输出点。

2 结论

随着计算机视觉技术发展的日新月异,算法的更新和积累将会越来越多。计算机视觉快速开发框架从实际应用工程的角度出发,在不同项目计算机视觉软件的开发过程中,将视觉技术的核心算法从底层研究中剥离,使视觉分析应用项目中的框架开发人员专注于框架接口定义的开发,而项目中的算法、上层应用等开发人员各司其职,分工明确,不但提高了开发结果的复用性,同时,也降低了项目开发中各条件间的相互依赖关系,缩短了开发时间,提高了开发效率。

参考文献:

[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.

[2] 张广军.机器视觉[M].北京:科学出版社,2005.

[3] 张少辉,沈晓蓉,范耀祖.一种基于图像特征点提取及匹配的方法[J].北京航空航天大学学报,2008,34(5).

[4] 刘立,彭复员,赵坤,万亚平.采用简化SIFT算法实现快速图像匹配[J].红外与激光工程,2008,37(1).

[5] 戴斌,方宇强,孙振平,王亮.基于光流技术的运动目标检测和跟踪方法研究[D].国防科学技术大学机电工程与自动化学院.

[6] 陈胜勇,刘盛.基于OpenCV的计算机视觉技术实现[M].科学出版社.

第3篇:计算机视觉研究的目的范文

关键词:计算机视觉;案例推理;图像处理;图像描述

中图分类号:TP391.41 文献标识码:A文章编号:1009-3044(2007)04-11102-03

1 引言

基于案例推理(case-base reasoning)是人工智能中正不断发展的一项重要推理技术。基于案例推理与类比推理方法相似,案例推理将旧经验或教训转换为知识,出现新问题时,首先查找以前是否有相似的案例,并用相似案例解决新问题。如果没遇到相似案例的,经过推理后解决新问题的方法,又会成为新的案例或新经验,下一次再遇到相同问题时,就可以复用这些案例或经验。

这与人遇到问题时,首先会用经验思考解决问题的方式相似,这也是解决问题较好的方法。基于案例推理应用于工业产品检测或故障诊断时具有以下特点:

CBR智能化程度较高。利用案例中隐含的难以规则化的知识,以辅助规则推理的不足,提高故障诊断系统的智能化程度。

CBR较好解决“知识获取”的瓶颈。CBR知识表示以案例为基础,案例的获取比规则获取要容易,大大简化知识获取的过。

CBR求解效率较高。是对过去的求解结果进行复用,而不是再次从头开始推导,可以提高对新问题的求解效率。

CBR求解的质量较高。CBR以过去求解成功或失败的经历,可以指导当前求解时该怎样走向成功或避开失败。

CBR持续不断的学习能力,使得它可以适应于将来问题的解决。

所以基于案例推理方法正不断应用在产品质量检测和设备故障诊断方面,并取得较好的经济效益。为了产品检测和设备故障诊断中,更为智能化,更容易实现现场检测和诊断,计算机视觉技术起到很大的作用。

计算机视觉是研究用计算机来模拟人和生物的视觉系统功能的技术学科,使计算机具有感知周围视觉世界的能力。通过计算机视觉,进行图像的获取预处理、图像分割与特征抽取、识别与分类、三维信息理解、景物描述、图像解释,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。

计算机视觉随着科学技术发展,特别计算机技术、通信技术、图像采集技术、传感器技术等,以及神经网络理论、模糊数学理论、小波的分析理论等计算机视觉理论的不断发展和日趋成熟,使计算机视觉从上世纪60年代开始兴起发展到现在,取得快速发展,已经从简单图像质量处理发展到围绕着纹理分析、图像编码、图像分割和滤波等研究。图像的分析与处理,也由静止转向运动,由二维转向三维,并主要着眼于对图像的识别和理解上,也使计算机视觉的应用领域更为广泛,为案例推理中运用计算机视觉打下基础。

2 案例推理系统的主要关键技术

(1)案例的表示与组织

案例的表示与组织即是如何抽取案例的特征变量,并以一定的结构在计算机中组织存储。如何将信息抽取出特征变量,选择什么语言描述案例和选择什么内容存放在案例中,案例按什么组织结构存放在存储器中,这关系到基于案例推理方法的效率,而且对于案例数量越来越多,结构十分复杂的案例库,尤其重要。

(2)案例的索引与检索

案例的索引与检索即是为了查找最佳相似案例,如何建立案例索引和相似度算法,利用检索信息从案例库中检索并选择潜在可用相似案例。后面的工作能否发挥出应有的作用,很大程度上依赖于这一阶段得到的案例质量的高低,因此这一步非常关键。

(3)案例的复用和调整

案例的复用即是如何根据旧案例得出新解,涉及到找出案例与新问题之间的不同之处,案例中的哪些部分可以用于新问题,哪些部分不适合应用于新问题的解决。而复用还分案例的结果复用,案例的求解方法复用。

(4)案例的学习

案例的学习即是将新解添加到案例库中,扩充案例库的案例种类与数量,这过程也是知识获取。此过程涉及选取哪些信息保留,以及如何把新案例有机集成到案例库中,包括如何存储,如何建立索引等等。

针对案例推理的关键技术,根据检测和故障诊断系统的特点,计算机视觉主要解决如何将产品图像输入系统,如何将产品图像特征进行抽取和描述,如何区别产品不同之处。以便案例推理系统进行案例建模,确立案例的表示形成和案例相似度的计算。本文主要从计算机视觉如何运用在案例推理系统进行探讨。

3 产品输入系统

产品输入系统在不同产品类型和生产环境可能有不同之处,主要应有传感器单元和图像采集单元。如图1。

图1 产品输入系统结构

传感器单元主要判断是否有产品存在,是否需要进行图像采集,是否继续下一个产品图像的采集。这简单传感器可使用光电开关,配合光源,当产品经过时,产品遮挡住光源,使光电开关产生一个0值,而没有产品经过时,光电开关产生相反的1值,系统通过判断光电开关的值,从而判断是否有产品。

图像采集单元简单地说是将产品拍摄并形成数字化图像,主要包括光源、反射镜、CCD相机和图像采集卡等组成。光源和反射镜作用主要使图像中的物体和背景之间有较大灰度。CCD相机主要是拍摄设备。图像采集卡主要是将图像数字化。通过传感器判断有产品后,光源发出的光均匀地照在被测件上,CCD相机拍摄,拍摄图像经过图像采集卡数字化后输入存储设备。存储设备即为计算机硬盘。存放原始图像、数据、处理结果等。

这是案例推理系统的原始数据,是图像处理、图像特征抽取描述的基础。

4 图像处理

在案例推理系统中,需要对案例的组织和案例建模,案例的组织即案例的表示,相对计算机而言,即图像特征的抽取,即某图像具有与其它图像不同之处,用于区别其它图像,具有唯一性。同时,又能完整地表示该图像。所以案例的表示要体现案例的完整性、唯一性、操作容易性。

图像中有颜色区别、又有物体大小之分以及图像由不同的物体组成。如何表示图像,或说图像内部包含表示的本质,即图像的描述。根据图像特点,确立图像案例的表示,以图像的像素、图像的数字化外观、图像物体的数字组成等属性。这需要对产品输入的原始图像进行处理。

在计算机视觉技术中,对原始图像主要进行图像增强、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。具体工作流程如图2所示:

图2 计算机视觉的任务与工作流程

图像预处理是将产品的数字图像输入计算机后,首先要进行图像的预处理,主要完成对图像噪声的消除以及零件的边缘提取。预处理的步骤为:图像二值化处理;图像的平滑处理;图像的边缘提取。

图像二值化处理主将灰度图形二值化的关键是阈值的选取,由于物体与背景有明显的灰度差,可以选取根据灰度直方图中两峰之间的谷值作为阈值来分割目标和背景。

图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息。

图像边缘提取是为了将图像中有意义的对象与其背景分开,并使之具有某种指定的数学或符号表达形式,使计算机能够理解对象的具体含义,检测出边缘的图像就可以进行特征提取和形状分析了。可采用多种算法,如采用Sobel算子提取边缘。

图像预处理是为下一步的特征描述打基础,预处理的好坏直接影响案例推理的结果和检测诊断的效率。

特征提取是对图像进行描述,是案例建模关键,案例建模是根据案例组织要求抽取图像特征,是建立案例索引和检索的关键。如果图像没有特征,就谈不上进行检索。图像特征可通过图像边界、图像分割、图像的纹理等方法,确定图像特征,包括是什么产品、产品形状大小、产品颜色,产品有什么缺陷、产品缺陷在什么位置等特征,根据这些图像特征进行描述,形成计算机中属性值,并从数据库查找相应信息资料,从而确定产品之间的关系,相似度,也就是案例推理的方向。

5 系统的检索

根据案例推理原理和相应算法,建立案例推理系统模型,如图3所示。

图3 案例推理系统

对话系统:完成人机交互、问题描述、结果显示和系统总控制。

案例库系统:由案例库及案例库管理系统组成。

数据析取系统:对各种已有的源数据库的数据通过转换而形成所需的数据。

多库协同器:根据问题求解的需要,按照一定的数据抽取策略,完成问题求解过程中对模型库系统、方法库系统、知识库系统和数据库系统等资源的调度与协调。

知识库系统:由产生式规则组成,这些知识包括专家经验和以规则形式表示的有关知识,也可以是数据挖掘结论,支持案例检索、案例分析、案例调整等。 模型库系统:由模型库、算法库、模型库管理系统组成。完成模型识别和调用,并把结果综合,送入对话系统显示,作为补充信息供案例检索、调整使用。

数据库系统:存放待决策支持的所有问题,并完成其维护与查询等功能。

由于系统主要应用产品的现场实时检测监控或故障诊断,所以系统的检索时,也必须输入检索值,即输入现场产品的图像,在通过产品预处理、图像的二值化、分割和边界处理后,进行图像特征描述,根据图像描述进行分类识别。根据案例推理的算法检索案例库中,是否有相似的案例。即确定相似度。相似度确定主要由案例推理的算法确定,如贴近分析法。确定相似度最大作为结果,并将案例的解输出,给相关控制系统进行决策。如产品质量检测,确定产品质量是否合格,是否有不合格产品,不合格产品是什么原因造成,故障源是什么,如何解决和排除故障,等等。

6 结论

案例推理方法有效地解决计算机视觉技术中图像检索问题。对提高图像检索的效率和准确度提供了平台。

计算机视觉技术也为案例推理系统实现产品现场实时检测、监控、诊断提供技术支持。计算机视觉技术现场的数据采集、处理为案例推理打好基础。

两者的结合设计的系统适用范围很广,只要产品需要进行质量检测、监控,或设备需要进行故障诊断和维护,都可以适用。

系统提供的实时检测、监控和诊断功能,提高企业的生产效益,降低了生产成本。

参考文献:

[1](美)桑肯(Sonka,M).图像处理分析与机器视觉[M].人民邮电出版社.

[2]王宏等译.计算机视觉[M].电子工业出版社.

[3]蔡建荣.自然场景下成熟水果的计算机视觉识别[J].农业机械,36(2):61-64.

[4]王宇辉.基于计算机视觉的锥体零件尺寸在线检测算法[J].重型机械,2005,2:4-6

[5]骆志坚.基于计算机视觉检测技术自动计数系统的研究与应用[J].仪表技术与传感器,2005,3:41-43.

[6]左小德.贴近度分析法在案例库推理中的应用[J],南大学学报(自然科学版),1997,18(1):21-26.

[7]姜丽红.案例推理在智能化预测支持系统中的应用研究[J].决策与决策支持系统,1996,6(4):63-69.

第4篇:计算机视觉研究的目的范文

近日,国内创业公司商汤科技宣布获得4.1亿美元B轮融资,这是截至目前为止全球范围内人工智能领域单轮最高融资。至此,这家成立仅三年的公司累计融资额达4.5亿美元,估值超过15亿美元,成为全球融资额最高的人工智能独角兽企业。当前,人工智能发展势头良好,技术和产品研发能力大幅提升,市场空间逐步拓展,社会关注与投资力度持续加大,技术创新驱动的人工智能企业正成为资本青睐的热点。

一、商汤融资背景分析

人工智能迎来估值猛涨期。自2014年起,人工智能领域一直都是全球投资热点。近年来,技术与产品的迅速成长带动国内创业热情高q,也引发了资本的高度关注。据统计,截至2017年5月31日,我国人工智能类创业公司已超过650家,产业规模较2016年同期增长达到51.2%,投融资事件超过430起,融资总额达340亿元。科技巨头加大在人工智能领域的布局,投资案例不断涌现。同时,社会资本竞相追逐人工智能领域的优质项目,整体行业获投率偏高,超过一半的人工智能公司成立时间在两年之内,可见资本市场对人工智能产业发展的信心。

计算机视觉领域成为热点聚焦。在大数据、深度学习等新技术推动下,以计算机视觉和语音识别为代表的感知智能正呈现出高速演进态势。目前我国计算机视觉技术水平已达到全球领先水平,并在安防、汽车、金融等领域取得了显著的应用成效。在安防领域,智能技术如人脸识别、图形识别应用场景众多,如车牌识别、车辆视觉特征识别、被动人像卡口、身份证比对等应用。在汽车领域,围绕智能驾驶汽车人工智能在环境感知、路径规划与决策等关键环节均有所应用和体现,在该领域百度、乐视等企业已开展卓有成效的实践。广泛的商业化渠道和技术基础推动计算机视觉成为创投热门领域,据数据显示,中国人工智能创业公司所属领域分布中,计算机视觉领域拥有最多创业公司。2016年,人脸识别服务开发商旷视科技完成至少1亿美元融资,估值超过20亿美元,专注图像识别的图普科技获得千万美元A轮融资。

商汤科技技术实力领先,发展潜力巨大。商汤科技主攻人脸识别、视频监控识别算法、增强现实、文字识别、自动驾驶识别算法和医疗影像识别算法等技术,基础研究实力强大,高质量专利数量、专业学术数量均保持全国领先水平。在2015年ImageNet大规模视觉识别竞赛中,商汤科技获得视频识别冠军,次年在该竞赛中,商汤科技凭借原创深度神经网络平台,获得3个项目的冠军。商汤科技主要业务范围是将计算机视觉技术赋能给安防、金融、机器人、政府大数据分析以及虚拟增强现实等行业。

二、由商汤融资带来的两点思考

第5篇:计算机视觉研究的目的范文

【关键词】平面测量技术;铅球项目;成绩测量

0 引言

随着计算机处理能力的提高和传感器技术的发展,近年来基于视频图像处理的计算机视觉技术已成为图像处理领域的研究热点,该技术在众多的领域中都有十分广泛的应用[1]。

视觉是人类认识世界、观察世界的重要手段。人类从外界获取的信息量约有 75%来自视觉系统,这表明视觉信息量十分巨大以及人类对视觉信息有较高的利用率。人类利用视觉的过程可看作是一个从感觉到知觉的复杂过程,即从感受到的对三维世界的投影图像到依据投影图像去认知三维世界的内容和含义[2]。

计算机视觉技术是指利用计算机实现人的视觉功能,既对客观世界的三维场景的识别、感知和理解。该技术包括是仿生学方法及工程方法,仿生学方法是模仿人类视觉功能的结构及原理,建立相应的处理系统,完成类似的工作和功能;工程方法是从分析人类视觉系统着手,并采用任何现有的可行手段实现人类视觉系统的功能[3],该方法的特点是只关心系统的输入和输出。计算机视觉的主要研究目标是建成计算机视觉系统,完成各种视觉功能。也就是说,即要能借助各种视觉传感器(如 CMOS 摄像器件、CCD等)获取现实世界的图像,而感知和恢复 3D 环境中物体的几何性质、运动情况、姿态结构、相互位置等,并且要对客观场景进行识别、解释、描述、进而做出决断。目前,计算机视觉技术在体育运动中也得到了广泛的应用,利用该技术不仅可以从不同的视角观察运动员的动作,而且能将运动员速度、加速度、所在位置等数据进行量化处理,使体育训练及比赛摆脱依靠传统经验分析及判别的状态,从而进入科学化、数字化的状态,而且还可以完成竞技体育项目的成绩测试[4-5]。

在测试项目中铅球成绩的测量仍采用皮尺丈量法。这种方法存在着三个方面的缺陷,一是皮尺本身具有弹性以及易折叠特性,二是受场地的凹凸不平,三是人为因素影响较大。由于这三方面的作用, 故在铅球成绩的测量精确度受到极大的限制。针对这一问题本课题提出了一种基于同视场(铅球场地)测量地平面坐标的单摄像机模型[6-7]。该模型利用透视投影几何关系,对摄像机内部参数进行标定,然后,建立相应的网格匹配数学模型,通过单目CCD摄像机像面坐标,测量铅球落点的地平面坐标[8]。成功的解决了铅球着点测量在双目视觉交汇组合测量存在的死角影响系统的测量范围的问题,另外,单目视觉测量系统也避免了双目视觉系统存在对应特征点匹配问题。

1 平面测量原理

图1 铅球的2D场景坐标系

铅球场地是一个扇形区域(如图1)。假设建立一个如图1的2D场景坐标系,首先要做的事是要确定场地上指定点的真实坐标与采集到的图片的指定点象素坐标之间的对应关系,即要找到这两种坐标系之间的转换关系。而这种转换关系可以用平面测量的相关技术获得。在计算机视觉中,所谓的平面测量,就是从图像中获得2D场景信息。在实际的测量中,我们可以通过在图像上标定一定数量的坐标点来确定图像中场地指定点的象素坐标和真实世界中的指定点的现实坐标之间的单应矩阵。

我们获取一幅2D场景S的图像I,通过S与I之间的N(N>=4)对对应点,就可以确定它们之间的单应矩阵H。

令:

H=h■,h■,h■=h■,h■,h■h■,h■,h■h■,h■,h■(1)

在H的九个元素中,有八个独立比率,即一个单应有八个自由度变量,一个常数1。因此,在H中,往往设置h■=1。

令(x■,y■)∈I,x■■,y■■∈S为一对对应点,i=1,2,…N。由每一对对应点,根据图像与场景之间的单应关系,我们可以得到两个线性方程:

其中,h是矩阵H的向量形式,

于是我们可以得到2N个方程,写成矩阵形式为:

AH=0(3)

其中

因此,要求得8个参数的单应矩阵,至少需要4个对应点。在实际的测量中,为了提高精度,每个模板平面上提供的对应点数目都会超过4个。

当N>4时,我们可以用奇异值分解法(SVD)[14]求最小二乘解h。

求得单应矩阵后,利用公式(2),就可以计算出图像上指定点对应的真实坐标值,从而计算出铅球投掷的距离。

2 实验结果与分析

表1

2.1 实验结论(下转第38页)

(上接第21页)经实际测量的6个标定点(如图1)的坐标分别为A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639) 。为了测试本文提出的测量模型,在反复测量铅球投掷实验中选取了典型的10个测试样本,其中铅球落点10个。

2.2 误差分析

从表1中我们可以看到人工测量值和系统测量值有一定的误差,分析误差产生的原因有如下几种:

1)数字 CCD 镜头的光学性能引起的误差,如焦距、畸变和光学中心误差等通过摄像机内部参数校正来解决。

2)摄像机的支架及底座一定要有足够的稳定性和刚度,在视频图像获取过程中应保证摄像机的相对位置稳定不动,由意外情况所造成的误差在计算中应予以剔除。

3)环境的变化将对测量结果产生影响,因此测量中要及时修正背景图像。

4)人工测量本身就会与真实值产生一定的误差。

3 总结

本论文首先介绍了课题背景,对单目视觉测量的研究现状和测量建模在国内外的研究现状进行了分析和归纳,同时分析了视频图像处理技术在体育项目应用现状,将基于单目视频图像处理技术的铅球成绩测量作为切入点,对数字图像处理技术在田径运动中应用的关键技术进行了研究。结合铅球场地的特点,提出一种基于视频图像的铅球测量方法,并通过实际应用证明了该方法的可行性。

【参考文献】

[1]Criminisi A,Reid I,Zisserman A. A plane measuring device[J].Image and VisionComputing,1999,17(8), 625-634.

[2]Lorenzo Bruzzone, Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).

[3]L Sajó, Z Ruttkay, A Fazekas. Turk-2, a multi-modal chess player[J]. International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.

[4]Lichtenberg, D.B., Wills, J.G., Maximizing the range of the shot-put[J]. American Journal of Physics,1978,46:546-549.

[5]Maheras, A.V.. The relationship between the angle of release and the velocity of release in the shot-put, and the application of a theoretical model to estimate the optimum angle of release (throwing)[D].University of Kansas., 1995.

[6]Antonio Plaza, Jon Atli Benediktsson, Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment,2009,9,113(1):S110-S112.

第6篇:计算机视觉研究的目的范文

多采用是人工测量的方式,在误差的控制上选择的是多次测量,反复操作,再将多次测量的结果进行加权,最终得到相对准确的测量数值。这种方法在一定程度上是操作十分复杂,精度还很难达到设计要求,所以我们在矿区土地信息测量工程中引进了GIS技术这样的一个概念,下面我们就如何通过GIS技术进行有效的观测测量来进行讨论。

[关键词] GIS技术; 精密测量; 构造几何模型; 信号源的接收

地理信息系统(Geographic information system,GIS)是利用计算机及其外部设备采集、存储、分析、描述与空间和地理分布有关的数据的空间信息系统。GIS融合计算机图形和数据库于一体,在一定的地域内,将地理空间信息和一些与该地域地理信息相关的属性信息结合起来,达到对地理和属性信息的综合管理。从外部来看,GSI表现为计算机软硬件系统,而其内涵是由计算机程序和地理数据组织而成的地理空间信息模型,是一个高度信息化的地理系统。

1)等高线生成及等高线分析:等高线图是人们传统上观测地形的主要手段。可以在等高线图上精确地获知地形的起伏程度、区域内各部分的高程等等。等高线图可以从格网数字地形模型中获取相关的资料信息,也可在不规则三角形格网T(NI)中生成。

2)立体透视图分析:当用户需要从直观上观察地形的概貌时,用绘制透视图的方法(还可以用色彩)可以更逼真地显示地形。

3)坡度分析、地表面积计算及挖、填土方体积计算:建立DTM后就可以用之计算坡度、面积和挖、填土方体积,以其作为土地适宜性评价的因子。

一 GIS技术在信息管理模式中的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机GIS技术精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机GIS技术测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供矿区技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

(1)计算出观察控制点到计算机视觉图像测量仪器的有效距离;

(2)得出观察点到目标控制点之间的三维的运动几何参数;

(3)推断出目标控制点在整个平面上的表面特征(大多时候要求形成立体视觉);

(4)还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机GIS技术精密测量的在矿区土地信息管理中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。

所谓的压力感应就是一种新型的传感器,通过电阻的变化作为一种感应值的判断标准进行计算和采集数据。具体的做法是在受力物体上粘贴高灵敏度的感应片,通过力的传递将物体上受到即时的力传递到感应片上,以备技术人员收集。在物体的中心或者是机械的隔断处,使用丙酮溶液进行擦拭,以保证物体的表面洁净和贴合度较高。当液体充分风干的情况下将感应片贴在已涂丙酮的物体上(注意感应片的正反),再使用导线和感应片相互连接,从而形成了一个完整的闭合电路体系,在通电的情况下,在计算机终端上可以显示出来。以便技术人员可以在任何时候掌握每个检测点的施工使用情况,一旦机械设备发生异常现象,就会在计算机图形中显示出来。于此同时,它还可以对施工人员所处的具置做到应力感应,人自身的重量传递到地面上,结构会出现结构上的略微变化,这个仪器就能第一时间以信号的方式传送到计算机终端,让技术人员掌握相关施工的情况,并结合数据报告总结出相关的可行性分析付诸实践。

当无法观察到控制点是,计算机GIS技术测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。同时在信息管理中通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机GIS技术。

二 计算机GIS与CAD技术的结合

在计算机GIS技术测量中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在土地信息的选择中,无法使用高帧数的图片显示,无法将计算机测量的关键技术的优点发挥出来。在煤矿生产过程中,对于生产效率的提高就要对开采环境的要求更高。使用绘图技术与GIS技术相互结合可以将复杂的地理环境的具体形状在电脑当中展现出来,用较为直观的图形准确的反应出来。而且在使用中,可以在计算机中随时将图像进行修改,完全可以适应复杂情况下的设备调试。在以往传统的图像设计中,技术人员在图纸中很难将地理信息进行再次修改,在设计后期在计算机图形绘制处理技术中,对于图像的调试使用的范围很广,通过虚拟的模拟和现实的结合来实现煤矿信息的完整,有效的加强了煤矿的信息化管理。

CAD技术是基于工程图上的三维建模方式。三维模型是从二维信息中提取的三维模型信息,通过再次分类以后,得到的一系列的相关处理信息,之后在三维空间建立相应的二维信息的三维形状模型提,使模型本身恢复点,线,面和拓扑关系,从而实现形状重建工程。计算机图形绘制处理,也可以应用于测绘图纸和关于地形的建模。土地信息中包含的地貌和自然资源图,它是国民经济体系的重要组成部分。我们可以画一个图,三维地形图的存储信息的产生。为预测和决策水平的使用有重大的意义,也为综合治理和煤炭资源的研究开发利用提供科学依据,这些依据,在军事上也起着非常重要的作用。在煤矿机械设备也使用CAD软件绘制零件图,利用绘图软件在操作更简单的菜单式设计,绘制出图形更准确。

三 GIS技术测量的关键技术遇到的困难和使用前景

计算机GIS技术测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了矿区土地信息管理部门的广泛青睐。在测量调控方面的这些可靠性和稳定性也是有目共睹的。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。通过在一些相关的技术之间的相互结合才能使GIS技术发挥的更加完美。

我们都知道,人的眼睛是可以受到自身的控制,想要完成矿区土地观测是十分简单的,但是在计算机GIS技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

四 结束语

在煤矿土地工程发展的今天,很多的测量技术已经离不了计算机GIS技术的辅助,本文中详细的谈到了GIS技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案,对于和CAD绘图技术相互结合的使用方式也做出了详细的介绍。测量工程中使用计算机GIS技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题亟需技术人员不断去解决完善。

将GIS技术在矿区土地管理信息系统中使用,也是加强了矿区建设的信息化水平。可以预见的是,在未来使用计算机GIS技术在矿区土地管理信息系统建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让GIS技术在矿区土地管理信息系统在煤矿的开挖中的作用发挥的更好。

[参考文献]

[1] 汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36

[2] 段发阶等. 拔丝模孔形计算机视觉检测技术[J] . 光电工程时报, 2006, 23( 13):189-190

第7篇:计算机视觉研究的目的范文

关键词:增强现实;计算机视觉;三维注册

中图分类号:TP242 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02

1 引言

随着计算机技术的迅速发展,计算机视觉、虚拟现实技术、人工智能、计算机图形学等技术被广泛地研究和应用,这些技术引导着人们进入了一个信息数字化的虚拟时代。

增强现实技术(Augmented Reality,AR)作为虚拟现实技术和计算机图形学相结合的产物,它是在通过计算机渲染生成虚拟的物体或文字信息模型的同时,对真实的场景进行标定,从而使虚拟的物体能够被准确地放置到真实的场景中,最终通过显示设备显示出来,使用户处于虚拟和现实相融合的亦真亦幻的新环境中,无法清楚地分辨出真实和虚拟。增强现实技术增强了用户的观感及其与真实场景之间的交互。

增强现实技术作为虚拟现实的一个重要分支,是虚拟现实技术发展过程中的产物。如图1.1所示,该图为Milgram提出的增强现实和虚拟现实关系的一种分类学表示方法。由图我们可以看出,虚拟现实所创建出来的是一种完全虚拟的三维世界,它与真实的世界相隔离。而增强现实是以现实场景为基础,场景中的虚拟物体随着真实物体的变化而变化,提供给用户的是一种复合的视觉效果,就好像这些虚拟物体真实的存在于场景中。

2 增强现实技术的应用

增强现实技术在20世纪90年代真正兴起,其发展与20世纪60年代计算机图形学的迅速发展密不可分。增强现实技术不仅拥有虚拟现实的各种优点,同时又有其独特的视觉增强功能,因此成为了国内外研究机构和知名大学的研究热点,并广泛的被应用于教育、医疗、工业、娱乐、军事等多个领域。

2.1 教育

增强现实丰富了教育学习生活。传统的书籍中只存在文字信息,通过增强现实技术,我们可以透过书籍看见文字相关的动态画面或是影像,图文并茂,极大的增强了学生的学习兴趣。目前的魔法书系统就是这一技术的很好运用,用户通过头盔显示器可以看到书中描述的场景,使读者可以完全沉浸在虚实结合的环境中,提高学习兴趣和效率。

2.2 医疗

增强现实技术可以帮助医生实现可视化手术或手术培训。准确地定位真实场景是增强现实技术的一个重要方面,在医疗中,运用增强现实技术可以进行手术定位,实时地收集病人体内的3D影像,并将其与真实的人体相结合,使得医生可以“透视”病人体内,从而减少手术的风险,该技术对微创手术也有着深远的意义。手术培训方面,通过加入虚拟的提示注解,可以提醒医生手术中的一些必要步骤,降低手术风险。

2.3 工业

增强现实的另一个应用是工业组装和维修。通过增强现实技术可以显示出各种设备零件的内部结构图、使用说明等,方便安装和维修。显示的内容可以不仅仅是简单的文字或图片,更能直接渲染生成3D的图形,并按步骤一步一步的显示出来,方便操作。

2.4 娱乐

电影、广告、游戏、体育比赛转播中,增强现实技术也得到了广泛的运用。体育比赛中,能够在直播现场实时地插入三维的图形、动画、视频等虚拟的比赛相关信息或广告。日常生活中,出现一种增强现实浏览器,它利用多种传感器将日常需求通过实景与虚景结合后呈现在用户面前,用户可以通过增强现实浏览器看到实景的文字介绍、三维模型等,并可以搜索定位。

3 增强现实相关技术

增强现实系统具有虚实结合、三维注册、实时交互三个特点。三个特点之间紧密联系,要求在合成的场景中虚拟的物体能够拥有真实的存在感和位置感。因此显示技术、定位技术、虚实融合技术、用户交互技术是实现增强现实系统的基础支撑技术。

3.1 显示技术

理想的AR系统的显示器具有体积小、移动方便、图像绘制清晰、交互自然等特点,但是目前仍不能制造出完成符合这些特点的显示器。常用的显示设备可以分为四类:普通液晶现实器;头戴式显示器;手持式显示器;投影式显示器。

液晶显示器是最为常见,也最容易得到的显示设备。但是液晶显示器体积较大,移动不方便,限制了用户的活动范围。头戴式显示器,佩戴于用户的头部,这种显示器本身提供了一路或两路摄像机,采用视频合成技术,为用户提供场景的显示。但是头戴式显示器在户外长时间佩戴很不舒服,因此也不能为用户广泛接受。手持式显示器,较头戴式显示器稍有改进,但是也限制了用户手部的活动。投影式显示器能够将场景投影到较大范围的环境中,位置固定,适合于室内的AR系统。

3.2 定位技术

增强现实系统需要将虚拟的物体准确地放置到真实的场景中,因此定位技术显得尤为重要。目前的定位技术主要分为两种:一种是基于硬件的定位技术;一种是基于计算机视觉技术的定位技术。

基于硬件的定位技术一般使用硬件设备定位,主要包括:全球卫星定位系统、测距仪、导航仪、机械装置等。

基于计算机视觉的定位技术一般是从真实场景中获得一幅或多幅图像,根据图像中的信息,计算出摄像机和图形中物体的相对信息,最终恢复出三维场景的结构,从而达到定位的目的。

基于计算机视觉的定位技术主要包括以下几种:

(1)单视图法:在一幅图像中找到六个以上特征点进行跟踪,通过已知的特征点的三维坐标和其成像坐标进行定位。

(2)多视图法:从多个角度拍摄场景,根据常用的角点检测法,检测多幅图像的角点并进行匹配,从而计算出真实场景中物体的景深,最终实现定位。

(3)运动目标的序列图像:根据序列图像估算运动目标的各项参数。

(4)模板匹配法:从多个视角出发寻找真实图像中的物体作为模板数字化图像,继而将虚拟物体叠加到真实场景。

3.3 虚实融合技术

增强现实技术中的虚拟融合主要指虚拟物体在真实场景中的配准,以及虚拟物体与真实场景的一致性。

在增强现实系统的实现过程中,一致性是一个关键性问题。虚实融合的一致性包括动态一致性和静态一致性。其中,动态一致性通常指场景的实时绘制,跟踪过程中虚拟物体和真实场景的空间位置的一致性等;静态一致性通常指虚拟物体与真实场景外观的一致性变化等。

另一方面,为了实现很好的虚实融合效果,必须对拍摄真实场景的相机进行标定,并与绘制虚拟物体的虚拟相机参数进行匹配。摄像机标定主要是对摄像机的内外参数的确定。目前,摄像机标定技术已经较为成熟,主要可以分为三类:传统的标定法,如张正友标定法;自标定法,如基于Kruppa方程的自标定法;基于主动视觉的标定法,如基于射影重建的标定法。三类标定法各有利弊,并没有一种可以普遍适用,因此摄像机标定技术仍是一个研究重点。

3.4 用户交互技术

人们总是向往能够使用自然的方式和虚拟的物体交互,但这是十分困难的,增强现实系统根据跟踪定位获得的有关真实场景的信息对虚拟物体发出指令。目前,交互技术主要使用以下三种方式:

(1)在场景中选择一个或多个特征点作为标记点,这是增强现实系统中最基本的交互方式。

(2)使用计算机识别出人或物体的姿态,进而交互操作。

(3)制作特殊工具,能够通过按键等简单方式触发事件。

4 结束语

本文总结了现阶段增强现实技术的应用领域,并对其涉及到的关键技术进行了阐述。增强现实技术作为一个多学科交叉的研究领域,必将飞速发展,更多的融入到我们的生活中。

参考文献:

[1]纪庆革,潘志庚,李祥晨.虚拟现实在体育体育仿真中的应用综述[J].计算机辅助设计与图形学学报,2003,15(11):1333-1338.

[2]陈靖,王涌天,闫达远.增强现实系统及其应用[J].计算机工程与应用,2001,15:72-75.

[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.

第8篇:计算机视觉研究的目的范文

【关键词】机器视觉;VisionPro;识别定位;

1.引言

自20世纪80年代以来,机器视觉技术开始高速发展,已经从实验室走向了人们生产生活的各个方面。机器视觉系统的特点是提高生产的柔性和自动化程度。在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。而且机器视觉易于实现信息集成,是实现计算机集成制造的基础技术。现今,在机器视觉领域已经有了一些成熟的视觉开发软件,其封装了很多可靠、高效的算法和工具。本文选用美国康耐视公司的VisionPro软件,这是一套基于PC架构的视觉系统软件开发包,主要应用于各种复杂的机器视觉领域。它集成了用于定位、检测、识别和通讯等任务的工具库,可用C#、VB和VC等语言进行二次开发。本文基于VisionPro利用语言进行视觉定位系统的软件开发[1]。

2.视觉定位系统

2.1 硬件组成

在图像处理前首先要得到清晰、有效的图像,这就需要有一套完整的硬件设备。一般主要包括照明用的光源、调节图像清晰度的镜头、将图像转换为数字信号的摄像机和进行图像处理的计算机。其中摄像机与计算机之间的接口也比很重要的,主要分为IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆网三种[2]。

本视觉系统采用的是日本FUJINON工业摄像头,德国BASLER工业像机ACA1600-20GM,GigE千兆网接口。

2.2 基于VisionPro的软件开发

本视觉定位系统利用编写适合实验需要的界面,界面中只包含需要的操作功能和数据,使整个界面看起来更加清楚简单,操作起来更方便。

(1)图像采集

本视觉系统通过GigE千兆网作为接口控制相机进行图像采集。打开软件并连接相机,设置好参数后,就可以通过可视化工具Image Source直接获取图像。

(2)相机的标定

机器视觉的基本任务之一是从摄像机获取的图像信息出发计算三维空间中物体的几何信息,并由此重建和识别物体。空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的,这些几何模型参数就是摄像机参数。在大多数条件下,这些参数必须通过实验与计算才能得到,这个过程被称为摄像机标定[3]。

本文利用VisionPro的CalibChecker-boardTool工具进行摄像机标定。首先需要一个棋盘板,棋盘板必须满足以下条件:必须由大小相同的黑白格子交替组成;格子最好是正方形,如果达不到的话,格子长宽比也要在0.9和1.0之间。本系统采用康耐视公司提供的标准棋盘板进行标定[4,5]。图1是标定的结果。

(3)目标识别与定位

视觉定位的目的就是找出目标物的坐标位置。本文利用VisionPro的PMAlignTool工具对目标物体进行识别定位。PMAlignTool工具是基于PatMax算法,该算法采用模板定位技术(pattern-location technology),先训练模板,然后根据模板对采集图像进行模板匹配,实现定位。在训练模板和定位过程中,PatMax不是基于像素栅格(Pixel grid)分析图像,而是采用基于几何外形(Features based)的定位方法,通过图像的几何特征信息和特征之间的空间位置关系进行模板训练和匹配,使其能够保证很高的精度和抗干扰性,而且可以高速定位发生旋转、缩放、甚至拉伸形变的物体[1]。PMAlignTool工具定位的流程如图2。

通过PMAlignTool工具对目标物体识别定位后,利用VB调用该工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。这两个值就是序号为i的目标物在图像上的X、Y坐标值,其中i为识别的各个目标物的序号。

3.实验

3.1 PatMax识别定位

在对摄像机完成标定校正后,运用自己编写的人机交互界面完成对目标物体进行识别定位,并将所需要的目标位置坐标显示在界面上。同时又将识别到的所有目标物体的坐标信息保存到了文本文档中,方便调用。主要操作如下:

(1)模型训练。实验以一元硬币为目标物,图3为训练完成的模型。

(2)目标识别定位。图4是利用编写的界面,在图像上能够清楚的显示出所识别出的目标轮廓和形心位置,界面右方结果显示区内可以看到所识别的目标数量和所需要的目标物的坐标。

3.2 对比实验

视觉定位可以用的软件和工具包很多,其中应用最广泛的就是Opencv,它是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。为了验证PatMax算法定位的准确性,本文利用Opencv对相同的图像进行目标识别定位,对得到的效果图和坐标进行对比[6]。如图5所示,其中蓝色为轮廓曲线,绿色十字为目标形心。

图6为VisionPro识别硬币的效果图,轮廓和形心均用绿色线标识。对比两图可以看出VisionPro对轮廓的识别效果要更好一些。由于形心坐标是由轮廓曲线上的点计算得到的,所以VisionPro获得的形心坐标值也会比Opencv的更加准确,而且精确度更高。下表是两种方法得到的形心坐标。

4.结束语

本文基于VisionPro采用对其进行开发,首先利用VisionPro中的工具进行图像的采集,摄像机的标定,运用PatMax算法进行目标物的识别与定位,然后运用编写人机交互界面,可以更加方便快捷的得到所需要的目标物坐标值。本文利用Opencv对相同的图像进行目标的识别定位,与VisionPro得到的结果进行实验对比。结果证明基于VisionPro的视觉定位系统对目标的识别效果更好,定位的数据更加准确。基于该软件使应用程序的开发更加快速方便,得到的数据结果误差较小,具有应用价值。

参考文献

[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷机视觉定位系统[C].第十二届中国体视学与图像分析学术年会论文集,2008.

[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.机器视觉算法与应用[M].杨少荣,吴迪靖,段德山,译.北京:清华大学出版社,2008.

[3]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报,2000,26(1):47-59.

[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.

[5]Cognex,VisionPro,Net Help,2006.

[6]Bradski G.,Kaehler A.著.学习OpenCV[M].于仁琪,刘瑞祯,译.北京:清华大学出版社,2009.

作者简介:

韩庆瑶(1953—),男,华北电力大学教授。

张志远(1986—),男,华北电力大学能源动力与机械工程学院硕士研究生。

第9篇:计算机视觉研究的目的范文

关键词:数据融合传感器无损检测精确林业应用

多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。

一、数据融合

1.1概念的提出

1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。

70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。

1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。

Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。

1.2基本内容

信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。

数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:

(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。

(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。

(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。

根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:

(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。

(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。

(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。

1.3处理模型

美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:

数据源。包括传感器及其相关数据(数据库和人的先验知识等)。

源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。

态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。

处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。

二、多传感器在林业中的应用

2.1在森林防火中的应用

在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。

2.2森林蓄积特征的估计

HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。

KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。

2.3用非垂直航空摄像数据融合GIS信息更新调查数据

森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。

TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正。

试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。

三、数据融合在林业中的应用展望

3.1在木材检测中的应用

3.1.1木材缺陷及其影响

木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。

3.1.2单一传感器在木材检测中的应用

对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。

随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。

新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。

美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。

在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。

X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。

3.1.3数据融合在木材检测中的应用展望

单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。

基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。

3.2在精确林业中的应用

美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。

目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。

南京林业大学提出了“精确林业工程系统”。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。

[参考文献]