公务员期刊网 精选范文 计算机视觉的展望范文

计算机视觉的展望精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的展望主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉的展望

第1篇:计算机视觉的展望范文

关键词:计算机图形学;计算机视觉;可视化技术

中图分类号:TM862 文献标识码:A 文章编号:1671-2064(2017)01-0054-02

计算机图形学、计算机视觉以及可视化技术三者均是计算机领域重要组成部分,要做好计算机知识,就要先学好计算机图形学,但计算机图形学学习相对枯燥,尤其是算法教学难以理解,为解决这一问题,计算机视觉与可视化技术被应用到计算机图形学中。可见,三者之间存在一定的联系,因此,有必要对计算机图形学、计算机视觉以及可视化技术展开研究。

1 计算机图形学概述

1.1 计算机图形学目的

所谓的计算机图形学实际上就是怎样利用计算机表示图形,并利用计算机完成图形计算与处理,而这一过程的实现需要得到相关算法的支持。学习计算机图形学的目的是利用计算机技术为人们呈现既带有美感又不缺真实的图形(如下图1所示),为实现这一目标,就需要按照图形的要求创设合适的场景,并在一些光照模型的作用下,做好光照效果设计,在这一过程中需要计算机图形学能够与其他计算机技术相配合。经过计算机图形学出来的图像,多会以数字图像的方式展示出来,总的来说,计算机图形学与图像处理之间存在着一定的联系[1]。计算机图形学的涉及范围相对宽泛,不仅有图形硬件设计,还包括动画制作,虚拟现实等多个部分。此外,计算机图形学在动画制作中的应用频率也很高,如45分钟一集的动画影片中,85%的画面都需要用算机图形学来完成,由此可见,计算机图形学的应用频率极高,并在动画制作中发挥着不可替代的作用。因此,应重视计算机图形学的应用。

1.2 计算机图形学应用

随着计算机图形学的发展,它被应用到各个领域中,并发挥着重要作用。首先,在计算机辅助设计与制造中的应用,这是计算机图形学应用最多的领域,在计算机图形学被应用以后,不仅可以设计出更精准的图形,还能做好人机交互设计,强化修改能力。计算机图形学还被应用到三维形体重建中,利用该技术可以将原理的二维信息转化为三维信息,如在某次工程图纸设计中就应用了计算机图形学,经过一系列的处理以后,三维形体逐渐形成,最终实现了重建。其次,在医学领域中的应用。计算机图形学在医学领域中的应用多以计算可视化的形式展示出来,如在脑部手术中,医生为看清患处真实情况,经常需要利用在可视化技术的作用下将复杂的数据转化为图像,这时就体现了计算机图形学在其中的应用[2]。再者,在计算机动画中的应用,人们看到的动画影片就是计算机图形学作用的结果,以动画人物的行走为例,为保证动画人物的行走与自然人不存在过大差异,就需要应用大量的计算机技术,并在计算机图形学的作用下完成设计。最后,在计算机艺术中的应用。计算机图形学在计算机艺术中也有广泛应用,它不仅可以用于艺术制作,很多场景都是通过计算机图形学来完成的,现阶段,一些人正在利用计算机图形学创设人体模拟系统,其目的是让已故人士再次出现在荧屏上,这一目标的实现就需要得到计算机图形学的支持。

2 计算机视觉技术

2.1 计算机视觉技术含义

所谓的计算机视觉技术,实际上就是用计算机取代人眼做识别、跟踪以及测量等,同时也兼顾图形处理,其目的是让图像在计算机被处理以后更适于识别。对于计算机视觉技术来说,意在实现人工智能,主要是从图像与多维数据等方面实现人工智能系统设计[3]。计算机视觉是一种在相关理论与模型基础上发展起来的视觉系统,其主要构成部分有以下几种:

(1)程序控制,这一点主要体现在机器人设计上;(2)事件检测,多体现在图像监测上;(3)信息组织,主要体现在图像数据库等方面。计算机视觉三个阶段如图2所示,通过观察图1可以发现,计算机视觉存在于图像处理始终,从早期处理直到后期结束都存在,最终实现了3D描述,可见,计算机视觉具有十分重要的作用[4]。

2.2 计算机视觉技术的应用

现阶段,现代社会已经进入信息化时代,计算机技术也被应用到各个领域,并发挥着重要作用。计算机视觉的应用促使计算机实现了智能化,在该技术的支持下,计算机可以像人一样透过视觉看待世界万物,且具有良好的适应能力,但这一目标的实现还需要很长时间,需要一系列的努力才能实现。现阶段,计算机视觉应用最多的就是车辆视觉导航,然而,这种导航还没有实现完全自主导航,这也是需要进一步研究的地方。计算机视觉技术的适应性较好,特别适合在工业领域应用,即便是存在电子在干扰或温度变化较大的地方都能很好的运行,其整体效果也不会受到影响,再者,计算机视觉技术的嵌入性较好,成本相对较低,尤其适合在PC方案中使用,同时,具有一定的非接触能力,能够获取大量信息,且不受距离限制,总的来说,计算机视觉技术总体效果较好,适合利用在各种工业环境中应用,因此,应重视计算机视觉技术的应用[5]。同时计算机视觉还被应用到移动机器人设计中,主要是利用小波模板展示人体形态,然后做图像扫描,这样就可以顺利完成小波变换,进而了解到人的存在。同样,将计算机视觉应用到机器人设计上,可以自动检测出正在行动的人或车辆,而无法检测到静止的人,之所以会出现这样情况,主要是由于其中采用率步态分析法。

3 可视化技术

3.1 可视化技术含义

可视化技术是一种综合了计算机图形学与图像处理于一体的技术,它可以将复杂的数据转化为图像并在屏幕上展示出来。在可视化技术中,融合了以上两种技术的特点,并在多个领域都有应用,随着可视化技术的应用,不仅有效实现了数据表示,还强化了数据处理能力,更对数据决策分析有一定作用[6]。现阶段,虚拟现实技术已经成为可视化技术主要发展方向。

3.2 可视化技术的应用

首先,在计算机图形学教学中的应用,计算机图形学相对枯燥,相关知识也很抽象,不便于学生理解,在计算机图形学中最重要的部分是曲线曲面,而这些曲线曲面多是与数学模型有关,具有一定的抽象性,学生理解难度较大,以往教师只能通过一系列的公式演算帮助学生理解,尽管这样依然难以让学生掌握曲线变化情况,学生依旧无法正确理解。为减少这种情况的发生,可视化技术被应用到计算机图形学教学中,教师将抽象的知识用动画的形式展示出来,学生只要观看动画,拖动一定的控制点就可以了解到曲线变化情况,这样一来不仅增加了教学趣味性,学生也可以随意变动曲线,让复杂的知识变得简单,深化学生对计算机图形学知识的深度理解,同时,利用可视化技术在一定条件下,还可以完成代码编译,如在Actoin ScriPt中做编译,这样也可以增强学生的理解能力[7]。

其次,在医学领域中的应用。医学领域对于可视化技术的应用主要体现在放射治疗与矫正手术上。通过可视化技术可以屏幕上看到手术整个过程,并将原来细节部位放大,手术医生观察的更加细致,手术成功几率也会大幅度提升,患者生命也能得到保证(如图3所示)。如在对某名患者进行身体检查的过程中需要应用到可视化技术,由于通过检查会获得大量数据,而这些数据又相对复杂,但在可视化技术下就可以通过图表、曲线图或立柱图的方式展示出来,经过可视化技术的作用,了解到患者的血糖为5.6mmol/L,医生可以根这一数据做出诊断,而不必再分析这些数据。据不完全统计,80%的医疗检查工作都是需要利用可视化技术。

地质勘探是我国最重要的工作之一,由于多数矿藏都深埋地下,即便使用探测仪受多种因素影响也无法了解到实际矿藏情况,这就需要应用到可视化技术,在可视化技术的作用下,相关工作人员可以了解到地下有无矿藏,如果存在矿藏,相关工作人员也可以了解到矿藏所在位置与实际储备量,进而为矿藏开采奠定基础。如在地质勘探中,相关工作人员利用可视化技术做地形图整理,然后从中提取地形数据,再用CATIA做导入,这样就可以完成地形模型创建,这样就完成了三维地质模型创建工作,同时在相关工作台的影响下,还可以完成地形数据导入,进而生成一定的地形云点,如果其中存在错误,可视化技术也可以将其中的错误内容删除,这些都是可视化技术所带来的好处[8]。由此可见,可视化技术已经成为地质勘探中不缺少的技术。

最后,在气象预报中的应用(如图4所示)。利用可视化技术能够将数据转化为图像,通过观察图像就可以了解到云层变化情况,同时也能了解到实际风力大小与风走向等,气象预报人员就可以根据图像做出精准分析,需要了解气象变化的人也能了解到现实情况,如果气象条件恶劣,相关工作人员也可以及时做出工作调整,减少危险事件的发生。据不完全统计,可视化技术在气象预报中的应用频率高达100%,由此挽回的经济损失高达13.2亿元,可见,可视化技术在气象预报中的应用十分有必要,因此,应重视可视化技术在气象预报中的应用。

4 结语

通过以上研究得知,计算机图形学、计算机视觉以及可视化技术三者各具特色,三者间也存在一定的关系,尤其是可视化技术综合了前两者的特点,并融合了其他技术,在很多领域中都有应用。可视化技术是现阶段应用最多的一种技术,在计算机图形学教学中也有应用,并发挥着不可替代的作用。本文分析了计算机图形学、计算机视觉以及可视化技术的含义与应用,希望能为相关人士带来有效参考,正确利用这些技术。

参考文献:

[1]陈敏雅,金旭东.浅谈计算机图形学与图形图像处理技术[J].长春理工大学学报,2011(01):138-139+146.

[2]柳海兰.浅谈计算机图形学的发展及应用[J].电脑知识与技术,2010(33):9551-9552.

[3]滑瑞朋.计算机图形学的应用及研究[J].山西科技,2012(05):37-38+45.

[4]刘涛,仲晓春,孙成明,郭文善,陈瑛瑛,孙娟.基于计算机视觉的水稻叶部病害识别研究[J].中国农业科学,2014(04):664-674.

[5]关然,徐向民,罗雅愉,苗捷,裘索.基于计算机视觉的手势检测识别技术[J].计算机应用与软件,2013(01):155-159+164.

[6]许志杰,王晶,刘颖,范九伦.计算机视觉核心技术现状与展望[J].西安邮电学院学报,2012(06):1-8.

第2篇:计算机视觉的展望范文

关键词:果品;无损检测;品质

我国水果产量居世界第一,果品出口成为我国外贸的重要组成部分。但是我国大多数农产品国际市场竞争力弱,出口价格低廉。其中品质因素是重要原因之一,这是由于检测技术、评判标准等限制,所以对果品进行合适的品质检测对提高经济效益和市场竞争力具有重要意义。对农产品品质的无损检测,已引起国内外广泛关注。

所谓无损检测,又称非破坏检测,是不破坏被检对象却能评价其品质的方法。它利用自身力学、光学、电学及声学等物理性质对评价对象品质进行非破坏检测,并按照一定标准进行分级分选的新兴技术,广泛应用于工业和农业。农业中的无损检测技术是利用农产品的物理性质如光学性质、声学性质、电磁学性质和热学性质等的变化而实现。目前,无损检测技术主要包括:近红外技术、声学检测技术、软X射线技术、计算机视觉技术、核磁共振检测技术、力学特性检测技术等。

1.果品无损检测技术

1.1新型可见、近红外光谱无损检测技术

可见、近红外光谱法是农产品内部成分无损检测的有效方法,是利用农产品吸收、散射、反射和透射光的特性,进而确定内部成分的方法。近红外分析技术作为一种高新分析技术,能改造我国传统农业,提高农产品质量,尤其是农产品加工的质量控制,将产生巨大作用。为改造我国的传统行业,企业迫切需要对原料进行质量监测、生产过程监控的设备和技术。国际经验来看,近红外技术是首选。

韩东海等[1]利用柑橘正常及损伤部位在紫外光源下的差异发射性,可有效确定柑橘损伤果。Slaugther DC[2]鉴于近红外和可见光的分光光度技术,建立完好的桃及油桃内部品质的无损关系式,能够预测完好无损的桃与油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通过研究近红外光谱和可见光谱对红玉苹果质量的无损测量,进而得到双叉光纤记录的反射光谱与苹果参数之间的关系。Ali Moghimi[4]等用近红外光谱技术结合化学计量学建立猕猴桃SSC和pH的校正模型,比较多元散射校正、变量标准化、中值滤波和一阶导数光谱预处理对所建猕猴桃SSC和pH校正模型的影响,表明变量标准化结合中值滤波和一阶倒数预处理光谱后,用PCR-PLS法建立的SSC和pH的校正模型精度较高。

目前,分光检测技术在果蔬品质检测中的应用广泛,因为这种方法具有适应性强、高检测灵敏度、人体无害性、灵活使用性、成本低廉和自动化易实现性等优势。利用这种技术能自动分级果品,而合理的分级标准,便于果品深加工和远销售。近红外光谱的研究虽起步较晚,但是其应用广,特别是在农产品的品质检测和分级领域取得较大的进展,开发应用前景广阔。

1.2声学无损检测技术

声学无损检测技术是利用果品声学特性与内部组织变化的关系,例如结构、成分、物理状态等物化特性信息来检测果品品质。声学特性是指在声波作用下农产品的反射、散射和吸收特性、衰减系数和传播速度及其本身的声阻抗与固有频率等,它们均反映声波与农产品相互作用的规律,这些特性随农产品内部组织变化而变化。一般使用低能超声波来检测,因为低能超声波在被检测物中传播不会引起物理或化学特性变化。超声方法检测果品品质始于近年,国内外研究集中针对水果成熟度、硬度和内部质量缺陷等无损检测。

与光学、电学及其他无损检测技术相比,声学无损检测技术具有适应性强、投资较低、操作简便快捷等有死,特别适用于在线检测,在农产品检测领域应用前景良好[5]。

1.3软X射线技术

适用性极强的X射线成像能够与图像识别、人工智能、现代通信技术等相联系。若待检测物体的密度和厚度不同,则不同的透射X射线量产生。鉴于分析穿透量,进而判断果品内部品质。软X射线拥有巨大优势,特别是在农产品的内部品质检测上,因软X射线具有穿透物料的特性,所以检测那种易损坏的农产品,能无损检测内部的品质。所需X射线强度方面,农产品检测弱于工业,所以称为低能X射线或软X射线。这种X射线成像技术来检测农产品内部品质方法已经受到研究者关注,例如基于X射线成像技术的检测核桃果核与果肉厚度,基于X射线图像的评价牛肉嫩度,以及评价红毛丹内部品质等。韩东海[6]用X射线来检测柑橘皱皮果,结果表明射线与激光分析法在果实品质检测中的可行性。然而目前国内此方面的技术开发较落后,期待学者们进一步的研究和探索。

1.4计算机视觉技术

伴随专业化的图像处理技术以及下降的计算机硬件成本和高速度特性,计算机视觉技术对农产品品质自动识别和分级的应用日益广泛。计算机视觉技术即以各种成象系统代替视觉器官作为输入敏感手段,借助于计算机替代大脑完成处理和解释。计算机视觉的最终研究目标是使计算机可以像人一样,通过视觉观察来理解世界,具有自主适应环境的能力。

基于机器视觉的果品无损检测的技术,一般是借助于CCD摄像头获取果品图像,图像信息输入计算机,进而应用检测方法和算法得到果品在大小、缺陷、外部损伤、内部品质等方面的特质值,从而来分级果品[7]。这种方法通常是由CCD摄像头、配备图像采集卡的计算机、光照系统和专用图像处理软件组成。在一定光源照射情况下,利用CCD摄像头得到水果形状、颜色、缺陷等视觉方面的图像信息,凭借图像采集卡转换为数字信号传输到电脑,分隔图像、提取特征值,从而得到特征值参数和水果颜色、质量状况、破损程度等品质指标间模型关系,进而确定内外品质等级。这种方法快速、准确、无损,使用一次能同时检测多项品质指标,方便设计自动分级流水线,自动识别水果外在品质(外形、缺陷、颜色、大小等)和内在品质(成熟度、坚实度、含糖量、含水率等),因此具有广阔的应用前景[8]。

我国利用计算机视觉系统,检测农产品品质和分类农产品的研究方法开展较晚,始于20世纪90年代,但逐渐受到重视。与国际先进水平相比,在农业领域的应用我国计算机视觉技术研究具有一定程度的差距,我国目前处于实验研究以及理论探索阶段,实用化和商品化的程度还未达到。这项项目基于数码摄像技术,通过电脑直接处理图像信息,其研发促使使我国获得最快速、最便利的视觉技术。

1.5核磁共振检测技术

1946年,核磁共振现象由美国科学家F.Bloch和E.M.Purcell发现,这一技术广泛应用于研究物质结构。核磁共振可以便利地生成果实内部组织结构的高清图像。方便检测果品压伤、虫害以及成熟度,因此在检测苹果、香蕉糖度等方面潜在价值极高。而那些因采收成熟度而影响品质的品种,鉴于核磁共振技术,能提高收获和运输可靠性。现阶段,这种技术要想真正应用于果品检测和评价果品质量,还存在诸多问题,然而其优势明显,这种技术无疑是一种良好的果品无损检测方法[9]。

1.6力学特性检测技术

基于动力学原理测度农产品硬度的检测方法是力学特性检测技术。采用振动频率分析法以及冲击力检测法,检测果品坚实度来判断果实成熟度。力学特性检测技术方便判断果品的采收期,依照成熟度分级、贮藏果品,确定果品的保鲜期和贮存期。尽管这种技术具有较为坚实的实践应用基础及历史,但介于果品品质和物理参数间的复杂关系,实际应用是一个漫长的研究过程[10]。

第3篇:计算机视觉的展望范文

关键词:深度学习;行为识别;神经网络

1 概述

动作行为识别是计算机视觉领域中的一个研究热点,已经广泛应用于智能监控、人机交互、视频检索等领域中[1]。动作行为识别技术是通过对视频或者图像中人体动作行为做出有意义的判断。有效表达图像(视频)中的实际目标和场景内容是最基本,最核心的问题。因此,对于特征的构建和选择得到广泛关注,例如STIP、SIFT、MSER等。但是,能通过无监督方式让机器自动从样本中学习到表征样本的特征,会让人们更好地利用计算机来实现人的视觉功能。而深度学习作为神经网络的延伸和发展,是通过逐层构建一个多层网络来使得机器自动学习到隐含在数据内部的关系,从而让学习到的特征更加准确性。

文章旨在探讨深度学习与机器学习(神经网络)之间的关系,并且介绍深度学习的由来、概念和原理;同时介绍目前深度学习在计算机视觉中的应用。最后提出深度学习目前发展所面临的问题,以及对未来的展望。

2 深度学习

2.1 深度学习概述

深度学习源于人工神经网络的研究,是机器学习的拓展。深度学习是经过组合低层特征来形成更加抽象的属性类别和特征,从中发现原始数据的特征表征[2]。现在用于动作行为识别的技术是通过“动作表征”+“动作分类器”的框架来进行行为识别的。其中“动作表征”是人们手动设计特征获取到的,也就是在目前识别框架内存在一个对动作图像(视频)的预处理过程。

深度学习和浅层学习相对。目前许多学习算法是浅层网络学习方法,具有一定的局限性,例如在样本有限的状况下,表示复杂函数的能力有限制,且对复杂分类问题的泛化能力也会受到一定约束[3]。而深度学习通过学习深层非线性网络结构,达到复杂函数逼近,又能在样本少的情况下学习原始数据的特征。BP算法作为传统神经网络的典型算法,虽然训练多层网络,但仅含几层网络,训练方法很不理想[3]。因为其输入和输出间非线性映射让网络误差函数形成含多个极小点的非线性空间,因而经常收敛到局部最小,且随着网络层数的增加,容易过拟合。而深度学习可以获得分布式表示,通过逐层学习算法来得到原始输入数据的主要变量。通过深度学习的非监督训练完成,同时利用生成性训练避免因函数表达能力过强而出现过拟合情况。

2.2 深度学习原理

传统机器学习仅含单层非线性变换的浅层网络结构,而且浅层模型单一。这对于深度网络来说易造成陷入最优或产生梯度分散等问题。因此,Hinton等人在基于深度置信网(DBNs)的情况下提出非监督贪婪逐层训练算法,随后提出了多层次自动编码器深层结构,这给解决深层网络结构相关的优化难题带来了希望。此外Lecun等人提出的卷积神经网络是第一个多层次结构的学习算法。同时深度学习还出现了许多结构:多层感知机、去噪自动编码器、稀疏编码等。

卷积神经网络是第一个真正采用多层次网络结构,具有鲁棒性的深度学习算法,通过探究数据在空间上的相关性,减少训练参数的数量。而且卷积神经网络(CNN)适应性强,善于发现数据的局部特征。它的权重共享结构降低了网络模型的复杂度,减少了权值的数量,使得卷积神经网络在模式识别中取得了很好的结果。

自动编码器的核心关键是将原始图像(视频)输入信号进行编码,使用编码后的信号来重建原始信号,使得两者之间的重建误差最小。通过将原始信号编码成另一形式,能够有效地提取信号中的主要信息,能够简洁地表达原始图像(视频)的特征。

3 深度学习的应用

3.1 语音识别

从2009年开始,微软研究院语音识别专家通过与Hinton合作,首先将RBM和DBN引入到语音识别声学模型训练中,使得语音识别的错误率相对减低30%,这彻底改变了语音识别原有的技术框架。在国际上,IBM、google等公司都快速进行了DNN语音识别的研究,并且速度飞快。国内方面,阿里巴巴,科大讯飞、百度、中科院自动化所等公司或研究单位,也在进行深度学习在语音识别上的研究。

3.2 视频中的动作行为识别

准确迅速识别视频中人的动作行为对于视频搜索和视频监控具有划时代的意义。最近几年,深度学习技术被应用于视频动作行为识别中。如Ji等人[4]提出多层网络的3D卷积神经网络来学习视频中的时空特征,并通过卷积来实现对整个视频特征的学习,从而代替之前的时空兴趣点检测和特征描述提取。在TRECVID数据库上进行的实验取得了不错效果。

4 结束语

文章对深度学习的主要概念进行了全面阐述,包括其由来、原理、研究进展和相应的应用等。在很多领域中,深度学习都表现了潜在的巨大价值,但深度学习作为浅层学习的延伸,仍处于发展阶段,还有很多问题值得我们深入探讨:

(1)我们需要了解深度学习的样本复杂度,需要多少训练样本才能学习到足够的深度模型。

(2)在推进深度学习的学习理论和计算理论的同时,我们是否可以建立一个通用的深度学习网络模型,作为统一的框架来处理语音、图像和语言。

(3)神经网络具有前馈性连接和反馈性连接,可是我们研究的深度网络中还没有加入反馈连接,这些都给深度学习的研究带来了严峻的挑战。

参考文献

[1]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):225-237.

[2]余凯,贾磊,陈雨强.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804.

第4篇:计算机视觉的展望范文

关键词:立体视觉;图像分割;阴影抑制;三维重建

1 概述

立体视觉的交通场景理解系统关键技术主要解决交通对象(行人、汽车、摩托车、自行车等)的三维信息模型化;低层处理,即先把图像数字符号化和特征c的提取过程,主要包括图像的分割和描述;运动检测与运动匹配,主要技术有基于时空梯度的方法、基于相关的方法、频率域法等;模型匹配与识别;交通对象的阴影检测;系统实时性,由于三维重构计算量较大,提高系统实时性等六大问题。其中对三维重建、运动检测与运动匹配和模型匹配与识别是立体视觉的交通场景理解系统关键技术主要研究方向。

从计算机视觉的角度进行分类,基于模型交通流量检测技术的方法可以分类为:基于区域跟踪的方法;基于动态轮廓的目标跟踪方法;基于特征的跟踪方法;基于3D模型(立体视觉)的车辆跟踪识别方法。

2 立体视觉的三维重建研究方法

基于立体视觉的三维重建是指通过对二维图像的处理,利用立体视觉的原理获取场景中目标的三维信息。双目立体视觉是直接模拟人类双眼来处理景物的一种新型研究方法,由于其灵活性较高,可以测量多种条件下景物的三维信息。

2.1 图像自适应阈值分割法

图像自适应阈值分割法无论参数的选取为何种特征值,都能准确快速的捕捉待处理的运动目标。采用自适应阈值分割方法对获得的交通对象的视频图像进行处理,把交通目标特征层经行分类处理,提高了类判别能力。同时,阈值来源较为广泛和准确,因此,不仅具有较好的识别率还具有较强的实时性。在背景存在微小运动和环境亮度突变的情形下也具有很好的鲁棒性。徐文聪等人主要从自适应阈值分割的方法对运动车辆进行检测和流量统计。

在徐文聪研究中,阈值的取值为图像的形态值,结合车道线和标定的摄像机内外参数,利用Dtsu算法提取候选车灯连通域信息。张虹波、孙明玉研究中,阈值的取值为图像的灰度值。张虹波利用图像差分方法获得运动目标。提取虚拟检测区域内的车辆图像,进行图像的数字化和滤除噪声等预处理,对视频图像提取背景模型,得到车流量信息。孙明玉提出基于新型自适应阈值的运动目标提取算法。孙明玉[4]提出基于新型自适应阈值的运动目标提取算法。首先,根据运动属性,分成两个聚类,一是运动目标,二是背景。对提取的图像按像素灰度进行分类,以聚类间的方根-算术均值距离最大值作为分割阈选择的准则,实时更新提取的运动目标的二值化阈值,从而实现对运动目标的准确完整提取。

2.2 基于侧影轮廓的三维重建方法

基于侧影轮廓的三维建模是一种新的建模方法,也称为可见外壳 (Visual Hull)生成方法。侧影轮廓法是利用摄像机拍摄的不同角度的图像进行立体重建,具有良好的几何和拓扑结构的一致性,同时提取的特征点较少,易于计算,有较好的鲁棒性。

阮孟贵、章毓晋利用摄像机在各个相异的角度获取的多幅图像完成三维重建。主要利用反射投影的交叉轮廓进行匹配,重建物体表面。伍燕萍用Marching Cubes算法,把获取的多幅图像进行侧影轮廓重建,生成物体的可见外壳。曹煜利用平面镜反射原理,对图像轮廓线之间极的线几何关系进行分析,获得相应的相机内外参数,实现目标物体的三维重建。

2.3 基于序列图像的三维重建方法

序列图像法主要是利用数字图像处理的方法对图像二值化,便于计算机处理。通过对提取的特征点之间进行相似度的匹配,利用矩阵分析进行三维重建。此类方法关键在于正确三维数据的获取,利用计算机相关软件进行图像扫描、图像预处理、建立数据模型,怎样辨别噪声是此方法的难点。虽然序列图像法存在一定的噪声污染,但由于其设备简单,在交通场景中运用面较广。

刘同敏利用提取的图像序列作为测量矩阵的参数,提出了一种基于匹配相似度的最小二乘法三维重建方法。谭论正提出了基于PCA的交通场景点的重建方法。利用最小二乘法求场景点的三维轨迹,根据获得的数据实现运动目标和背景模型的三维重建。孙丽娟通过透视投影重建算法中引入了迭代算法。利用矩阵扰动理论,分析图像噪声对不同特征点重构的影响,得出图像数量越多重建精度越高的结论。彭科举提出了尺度不变特征变换特征和角点特征相结合的三维重建算法。

2.4 混合高斯模型进行背景建模

随着信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术快速发展,基于视频的智能交通控制系统在交通控制中占主要作用。在交通对象的监测中,高斯背景模型在建立对运动目标的提取有着至关重要的作用。研究发现,视频图像提取的特征值背景颜色和像素的灰度值符合高斯分布。由于像素在时间域上的分布信息符合高斯分布,利用其构造其背景模型能解决光线突变等问题带来的影响,能够适应于户外复杂光线的环境。此方法建模后模型的鲁棒性强,准确率高。目前,高斯背景建模在交通智能控制系统中发挥着越来越重要的作用。

刘亚利等人提出了基于边缘特征的混合高斯背景建模方法。此方法加快了高斯模型的收敛速度,有较强的光变性。同时利用像素在时间域及空间域上的分布信信息,王永忠等人提出了一种基于自适应混合高斯模型的时空背景建模方法。监控系统采集的数库不仅仅有时间上的信息,还有空间位移信息。王永忠提出的时空背景建模方法利用时间和空间上的像素分布信息,不仅提高了建模精度还解决了传统的混合高斯背景建模方法对不平稳场景建模失效的这一缺点。

3 结束语

基于立体视觉的三维建模技术研究是一个非常有意义的研究课题,在交通参数检测技术的研究中,我们要结合相关的计算机图像采集和处理技术,充分利用道路已有的资源,并将其采集的资源图形化、数字化。双目立体视觉技术对目前的单视点平面监控系统缺点进行很好的弥补。利用双目立体视觉对交通对象进行检测和监控,对获得图像数据分析,完成运动目标的三维空间定位和追踪。结合现有的计算机、电子信息技术,互联网技术,对交通加强智能化建设,逐步实现增强道路交通监控的信息化和自动化。

参考文献

[1]周冬梅,张明星,代永霞,等.基于纹理的车辆阴影消除新算法[J].自动化与仪表,2014(1):133-138.

[2]徐文聪,刘海.夜间环境交通数据采集系统设计与实现[J].测控技术,2012,31(6):60-66.

第5篇:计算机视觉的展望范文

关键词:焊接自动化;图像处理;应用;发展趋势

中图分类号:C37 文献标识码:A

一、概述

随着计算机视觉技术的发展,近年来利用机器视觉直接观察焊接熔池,对焊

接质量进行闭环控制是通过图像处理获取熔池的几何形状信息,已是当前研究的主要方向。

和传统的手工焊和半自动焊接过程相比,使用机器视觉进行直接观测焊接熔池有着很明显的优点,采集的数字图像信息丰富,表象直观,且数字化的图像数据可以实时传输到计算机高速缓存内,提取特征信息, 进行实时处理,同时作出在线判决,可以实现焊接过程质量实时控制和传感。

在传统的手工焊接和半自动焊接过程当中,对于一个有经验的焊工,通过直接观察熔池的行为、接头的位置、焊道外形及电弧形状,能够感知焊接的状态。若是感觉到实际焊接过程中同最佳状态不一致,为了达到最佳状态可以通过调节各参数,以获得高质量的焊缝。可以把这个过程划分为眼-脑-手的控制过程。图像处理在焊接过程中的重要意义就等同于手工焊接过程中人的眼睛,可以实现采集和处理焊接位置的传感、焊接时熔池、焊道对中、熔宽和熔深的信息,然后利用计算机发出指令,实现焊接过程的各种工艺参数如电流、电压、焊接速度的调节和电弧或焊丝的对中。

二、图像处理的概念

图像处理(image processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。一般图像处理就指的是对数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。图像处理技术的主要内容包括图像压缩,匹配、描述和识别以及增强和复原这3个部分。常见的处理包括有图像复原、图像数字化、图像增强、图像编码、图像分析和图像分割等

三、焊接图像摄取方法

图像的处理一般包括量化、图像识别和图像预处理等几个步骤。图像预处理包括图像增强、图像变换和图像恢复,尽量把因为随机因素的干扰和摄像中各种条件的限制而产生的不足和噪声减小,继而可以获取焊缝位置的精确信息;量化由图像卡完成;图像识别包括边缘提取和图像分割等,可借助小波变换、快速傅立叶变换、概率统计等数学工具对图像进行理解、分析、模式识别和特征提取。

从国内外大量文献来看,利用机器视觉采集焊接熔池图像的方法主要分为被动式直接视觉传感和主动式直接视觉传感两大类,视觉传感器常采用CCD摄取原始图像。CCD是英文(Charge-Coupled Devices)的缩写,意即“电荷耦合器件”。具有体积小、耐震动、重量轻、稳定性好、寿命长、速度高,几何失真小及耐高压等一系列优点。CCD是固态图像传感器的一种,固态图像传感器是指把布设在半导体衬底上的许多感光小单元的光-电信号,用所控制的时钟脉冲读取出来的一类功能器件。

动式直接视觉传感利用窄带复合滤光系统滤除非连续光谱的电弧强光,并采用高强脉冲激光或具有图像增强器的高频闪光灯作为辅助光源,可有效地抑制弧光获得清晰图像。被动式直接视觉传感是利用焊接过程中的结构光进行成像。主被动式直接视觉传感存在强光干扰的问题,激光焊接中,通常采用中性减光的办法解决强光干扰的问题;在电弧焊中,对于短路电弧焊和脉冲电弧焊.可在短路期间或基值电流期间获取图像数据,或者在摄像机前通入部分保护气,减少烟雾和飞溅的影响;TIG/MIG/MAG焊时弧光在600~700nm波段内相对光强最弱最稳定,选用这一波段内的干涉滤光片和防热玻璃可有效地排除弧光及红外干扰。

四、图像处理在焊接中的应用

现如今,对于图像处理主要集中应用在脉冲机器人焊接、TIG焊、激光焊和焊缝质量的检测等领域。图像技术在机器人焊接领域应用较广。由于机器人需要有很强的适应能力,借助三维视觉传感系统和计算机图像处理技术,焊接机器人可对焊接环境进行实时控制。通过图像的采集,可帮助机器人进行焊缝的对中,为机器人焊接提供实时特征信息,如熔深、熔宽和熔池的形状等,从而实现焊接过程的智能控制。目前国内哈工大的吴林教授在这方面作了较深入的研究,从焊缝位置的传感到熔滴的过渡,从过程实时控制到最后焊接质量的检测都进行了较为系统的研究。

哈工大的何景山博士在脉冲TIG焊熔深及熔透的彩色图形法传感方面进行了较深入的研究。图像处理目前用得最广的领域是在脉冲TIG焊中,国内外许多学者都对该领域进行了积极的探索。首先创建了一套适用于脉冲TIG焊的彩色图像法熔深和熔透的传感系统,通过对脉冲峰值和脉宽的控制实现对熔深和熔透的控制,其控制信息来源于基值期间,进行图像信息的采集。

此外,图像处理还在焊接的其它领域中有一定的应用。有的将图像处理用于焊接缺陷的自动监测与缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者还将图像处理用于水下湿法焊接,通过复合滤光技术和水下CCD摄像系统,采集出了药芯焊丝水下湿法焊接电弧区域的图像,用中值滤波和梯度算子的电弧区域图像边缘检测方法,有效地区分了电弧燃烧区域和电弧气泡区域。哈尔滨工业大学的何景山、杨春利等人结合采用埋弧焊进行容器类焊接结构制造过程中的工艺特点及实际工况,设计了一种将微型摄像机、微型半导体激光发生器及具有滤光功能的光学系统三者集成一体的焊缝视觉传感器。

焊接控制过程中的一个重要环节就是焊接缝隙检测,图像处理在这方面的应用也有许多学者研究。为了实现电弧焊过程的自动对中和焊缝质量控制,必须对焊接缝隙的相对位置和坡口几何参数进行检测。西安交大的梁晋、贾昌申等在《图像法焊接缝隙检测的研究》一文介绍了一套自行设计的计算机焊接缝隙检测系统,包括图像采集卡、计算机接口、光学传感器、图像处理软件,分析了它们的基本结构和工作原理,讨论了提高光学传感器、图像处理软硬件等抗干扰能力的措施。该系统工作原理是:由光源和CCD摄像机组成的光学传感器摄取图象,CCD摄像机把图象转换为电信号,再经图象采集卡把模拟信号变为数字信号存储于计算机内,计算机对此信号进行必要的处理,即可得到缝隙位置和坡口几何参数信息,在监视器屏幕上显示出来,或经过D/A电路给执行机构,修正焊枪位置,实现闭环对中控制。有的将图像分割和小波分析应用于焊接领域,小波分析在焊缝视觉跟踪过程中检测焊缝,采用多次小波变换可获得清晰的焊缝边缘,大大简化了硬件设备;图像分割法可减小焊缝识别的图像处理的复杂性,使得焊接过程的实时性增强。

五、图像处理在焊接中应用的展望

为焊接现象的描述及内在规律的解释提供了极佳的条件和直接的证据,推动焊接理论和实践的发展就是通过图像传感的这种方法。同时也使得研究者能够观察到其它传感方法所不能观察到的被强光所淹没的丰富直观的信息。

把图像处理技术应用到现代焊接技术中,将会推动焊接过程质量实时传感与控制的发展和成熟,使得焊接过程通过闭环反馈控制而实现完全自动化,保证焊接质量,提高焊接生产效率。

总之,作为智能控制中关键技术―数字图像技术,在焊接过程中发挥的作用将会越来越大,将为焊接智能化生产作出贡献。现代工业正朝着信息化和智能化方向发展,现代焊接技术也必然要实现智能化。

参考文献:

[1]段佳佳,杨迎春.图像处理在自动焊接中的应用[J].电子测试,2012,02:12-15.

[2]陈彦宾,李俐群,陈凤东,陈杰.图像处理在自动焊接中的应用和展望[J].材料科学与工艺,2003,01:106-112.

作者简介:

第6篇:计算机视觉的展望范文

关键词:数字图像;处理技术;电子信息

中图分类号:TN911.7 文献标识码:A 文章编号:1000-8136(2012)09-0153-02

不论在哪种通讯手段中,人们都更愿意选择直观的图像表达,因此,未来社会对图像传递信息的要求越来越高,及时性、直观性、客观性等发展条件都对现有的数字图像处理技术提出了挑战。

1数字图像处理技术概述

数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。这一过程包括对图像进行增强、除噪、分割、复原、编码、压缩、提取特征等内容,图像处理技术的产生离不开计算机的发展、数学的发展以及各个行业的应用需求的增长。20世纪60年代,图像处理的技术开始得到较为科学的应用,人们用这种技术进行输出图像的理想化处理。

经过多年的发展,现在的电子图像处理技术已具有了以下特点:更好的再现性:数字图像处理与传统的模拟图像处理相比,不会因为图像处理过程中的存储、复制或传输等环节引起图像质量的改变;占用的频带更宽:这一点是相对于语言信息而言的,图像信息比语言信息所占频带要大好几个数量级,因此图像信息在实现操作的过程中难度更大;适用面宽:可以从各个途径获得数据源,从显微镜到天文望远镜的图像都可以进行数字处理;具有较高的灵活性:只要可以用数学公式和数理逻辑表达的内容,几乎都可以用电子图像来进行表现处理.

2数字图像处理技术的发展

自从美国在1964年开始通过卫星获得大量月球图片并运用数字技术对之进行处理之后,越来越多的相应技术开始被运用到图像处理方面,数字图像处理也作为一门科学占据了一个独立的学科地位,开始被各个领域的科学研究运用。图像技术再一次的飞跃式发展出现在1972年,标志是CT医学技术的诞生,在这种技术指导下,运用X射线计算机断层摄影装置,根据人的头部截面的投影,计算机对数据处理后重建截面图像,这种图像重建技术后来被推广到全身CT的装置中,为人类发展做出了跨时代的贡献,随后,数字图像处理技术在更多的领域里被运用,发展成为一门具有无限前景的新型学科。之后十年数字图像处理技术也朝着更高深的方向发展,人们开始通过计算机构建出数字化的人类视觉系统,这项技术被称为图像理解或计算机视觉。很多国家已在这方面投入了很多的研究精力,并取得了高深的研究成果,其中,20世纪70年代末提出的视觉计算理论为后来计算机数字图像技术的理论发展提供了主导思想,但理论上如此,在实际操作中还存在着很多的困难。

我国在建国之初就展开了计算机技术的研究,而改革开放以来,我国在计算机数字图像处理技术上的发展进步也是非常大的,甚至在某些理论研究方面已赶上了世界先进水平,首先,对于成像数据的收集能力方面,我国通过成功研发的一系列传感器以及发射的对地观测卫星,能够及时有效地获得风云、海洋、资源和环境减灾等方面的相关数据,并取得了有效的数据结果和数据成像效果。另外,数字图像处理技术应用较为广泛的领域代表分别是建筑、通行工程和生物医学工程方面,这些方面对数字图像处理技术的应用,最能直接体现该技术的发展现状。在建筑行业中,数字图像处理技术可以将拟建造的建筑或建筑群的高度、密度以及其他可能影响建筑质量、建筑环境的信息转换成图像,从而使设计者更为合理地进行规划;在通信工程领域,数字图像技术和语音、文字等因素构成了现代多媒体的基本内容,在传递图像的过程中,采用编码技术来压缩信息的比特量,这种技术现在的发展内容包括变换编码等,未来可能发挥作用的还有小波变换图像压缩编码、分行编码等。在生物医学工程中,书籍图像技术能将人体活动的机理以图像的形式客观地呈现在研究者面前,对医学未来的发展具有不可替代的作用。

3数字图像处理技术的发展趋势

计算机数字图像处理技术在未来信息技术方面将会发挥的重要作用早已被人们看到,对于计算机图像技术的发展道路,大致可以归结出3个原则性内容:①未来数据图像技术强调高清晰度、高速传输、实时图像处理、三维成像或多维成像、智能化、自动化等方向发展。②未来数字图像处理技术强调操作、运用的方便性,图像处理功能的集中化趋势是必然会存在的。③更新的理论研究与更快的算法研究。理论走在实践的前面,已经是现代科学的特点,未来数字图像处理技术的实际运用要取得更多的发展,必然离不开理论和研究方法的更新,新理论中包括小波分析、分形几何、形态学、遗传算法等都将得到更深层次的发展。

4结束语

数字图像处理技术的有效应用在人们日常生活中就能切身地感受到,不管是看电视、看电影、上网还是移动通信,每个人都与这种技术发生着最紧密的联系。数字图像处理技术的发展关系到每个人对优越的社会生活、现代物质享受的程度的深浅,所以,对之进行及时的研究和关注在电子通信行业中是非常重要的。

第7篇:计算机视觉的展望范文

【关键词】单目视觉 风洞 飞机模型 位姿判别 传感系统

【Abstract】In order to provide a reference for later flight control computers, the study has studied and written a software system which could discriminate the position and orientation of wind tunnels model based on monocular vision. An aircraft model with driving force is able to fly stably and autonomously in the wind tunnel. By control-law, the aircraft model stays static relative to the ground, unlocking all six degrees of freedom. Multiple LED marked points are placed on the aircraft model. The CCD industrial camera model at the top of the model continuously captures the image and returns real-time image data to an upper computer with a dynamic link library. The free-flight trials system can get the spatial position and altitude information of the aircraft model through the use of upper computer software with C/C++ language, achieving identification algorithms, as well as position and orientation solver algorithms.

【Keywords】Monocular vision wind tunnel aircraft model attitude determination sensing systems

1 引言

近年来,随着计算机技术和图像处理技术以及数字视频器件的发展,计算机机器视觉与视觉检测在许多领域得到了广泛应用[1]:如机翼表面油流试验、压敏漆表面压力测量、模型变形测量、投放试验、非接触位移测量等.另外在工业检测[2]中应用更加广泛,如流水线工件自动检测、大型复杂曲面的三维检测、大型工件平行度和垂直度测量、字符识别、医学图像分析、未来外星车导航[3]等等。在现代自动化生产过程[4]中,机器视觉系统广泛地应用于工况监视、成品检验和质量控制等领域。同时,机器视觉与视觉检测技术逐步发展为使用视频测量技术(Videogram-metric Technique)[5],该技术在风洞测量[6][7]这种要求非侵入式测量中具有无可比拟的优势,因此在风洞测量中得到了大量应用。目前虽然我国利用CCD图像传感器设计出车牌识别[8][9]等系统,逐步开始了工业现场的应用[10],但是我国该技术起步较晚,应用领域真正高端的不多。本文,将机器视觉技术应用于基于单目视觉的风洞模型位姿传感系统,提供了另一种获取飞机空间位置信息研究飞机位姿的方法。扩展了该技术的应用领域,填补了国内机器视觉技术发展的空白,顺应了时展的潮流。

2 风洞模型及其工作原理

常规风洞试验一般将模型固定在支架上,支架上装有天平测力系统,可以带动模型在一定自由度内运动。但其显著缺点是支架对模型周围的流场存在干扰,同时模型自由度受到约束。常规风洞试验如图2.1:

而风洞模型自由飞技术不限制模型自由度,没有支架干扰,可以最大程度的模拟飞机在大气中飞行的环境。本系统中引入机器视觉技术,通过设计控制律,使模型相对于地面静止,在模型上放置多个LED标志物,通过CCD摄像机识别,推算模型的姿态或空间位置。如图2.2:

3 相机接口实现

飞行器位姿识别属于典型的机器视觉技术范畴,机器视觉技术是依靠图像摄取装置将摄取目标转换为图像信号,并将该信号传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作的先进技术。

图像采集是机器视觉技术的两大技术核心之一,由于既需要优质的图像质量,又需要高效的图像采集速率,当下普遍使用CCD相机(Charge-coupled Device)对摄取目标进行图像采集。

CCD相机本质上是一种半导体器件,能够将普通的光学影像转化为特殊的数字信号, CCD上植入的微小光敏物质称作像素(Pixel)。一块CCD上包含的像素数越多,其提供的画面分辨率也就越高。一般而言CCD相机获取的图像为RGB图像,也就是说每一个像素都由红(R)绿(G)篮(B)三个成分组成,来表示RGB色彩空间中的一个点。CCD的作用就像胶片一样,但它是把图像像素转换成数字信号。CCD上有许多排列整齐的电容,能感应光线,并将影像转变成数字信号。经由外部电路的控制,每个小电容能将其所带的电荷转给它相邻的电容。

相机摄取的光学影像转换成的数字信号,通过相机的驱动程序可储存到计算机的存储器当中。利用相机提供的接口配置好计算机的工程环境可以通过编写开程序代码对相机进行操作控制,接口一般分为两大类,一是主功能接口,具体功能包含摄像机开启关闭、采集图像、控制摄像机等具体操作,包含文件 GxIAPI.h,动态链接库 GxIAPI.dll,静态链接库 GxIAPI.lib二是图像处理接口,包含数据转换等功能操作。利用这些接口便可编写相应的代码实现之后的位姿识别算法,包含文件 DxImageProc.h,动态链接库 DxImageProc.dll,静态链接库 DxImageProc.lib。

上述应用接口库支持32位编程开发工具Microsoft Visual C/C++。使用C/C++编程工具,用户 应在程序中调用相关的包含文件(.h),并将静态链接库(.lib)文件加入到工程文件中,供编译程序在链接(Link)时使用。

完成上述准备工作之后,便可采集图像并根据编写的程序对图像进行进一步处理,其具体采集流程如图3.1:

4 识别算法及其原理

通过CCD相机读取到的图像以类似矩阵的数据类型存储在计算机中,其中黑暗环境的亮度值较低,其数据结构中的标记位会被标记为0,而发光光源部分亮度值较高,其数据结构中的标记位会被标记为1。其模型类似图4.1,其中每一格代表一个像素点:

1代表亮点

该算法从矩阵首行首列开始,由左至右,由上至下开始进行遍历搜索,每当搜索到亮点(标记位为1的像素点),就对该点进行以该点为中心,依次按照上,右上,右,右下,下,左下,左,左上的优先顺序进行搜索判断,若相邻点也为1,则对该相邻点继续扩展搜索,直至将所有相邻的亮度点全部搜索完毕,之后将所有被搜索到的点标记为ACCESS,防止下次搜索重复计算,若此次扩展搜索获得的亮点总数超过设定值(本程序默认设置为200,可修改)则判定此处为亮点。按照上述方法将全图遍历完成后,便可求得全图所有亮度点。搜素伪代码如下:

//********************************************

// 寻找亮点区域,记录相关值,并标记已访问

// sumi 横坐标之和;sumj 纵坐标之和;

// points 点区内像素点的数目

//********************************************

findthearea(i,j)//标记一个片区

5 位姿判别算法

参考六自由度头部跟踪算法[11][12],以四个LED灯所标记的点所在平面为,即飞机为辐射坐标系() ,令CCD摄像机摄像坐标系代表风洞的坐标系(),CCD的成像面当成图像坐标系(,)。因此,判断飞机模型的姿态可以转化为分析辐射坐标系对于风洞坐标系的位置关系。由此可求得位姿信息,方位角α,滚转角β,偏航角。

辐射坐标系和摄像坐标系的变换关系为

而矩阵H的表达式

采用小孔成像模型,像点坐标(,)为:

其中i=A,B,C,D,代表所获取飞机模型上的4个LED灯的信息。

综合上述公式,进行等量代换

假设4个LED灯构成的正方形对角线长度为2L,则4个LED灯在辐射坐标系下的坐标为A(0,L,0),B(L,0,0) ,C(0,-L,0),D(-L,0,0)带入前式,可知每个LED对应2个方程:

设:

根据以上两式转化这6个中间变量,然后联系转换矩阵H,便可求得位姿角:

6 Labview接口设计

飞控计算机的系统状态实时显示程序采用LabView开发,便于模型状态数据的记录,飞控参数的调整。位姿信息最终作为输入数据传送到系统状态实时显示程序,程序对输入的位姿信息做进一步处理。

不同的位姿信息传送方法对实时性的影响相差较大,因此,选择高效的数据传送方法至关重要。本项目拟采用LabView调用动态链接库的方法来实现数据传送。

将获取位姿信息源代码编译生成动态链接库文件,然后将文件加载至LabView项目中,通过调用动态链接库的接口函数来获取位姿信息数据,达到快速通讯的目的。

7 结语

风洞模型自由飞技术是空气动力学领域一项先进的测试技术,可以模拟飞机复杂的飞行动作,这项技术实现的关键之一是姿态测量。

本文针对通过飞机模型有限个标志亮点来获取模型位姿信息并传送至上级处理系统的方法进行了详细的讨论。通过对飞机模型姿态与模型上有限个亮点的位置信息的关系进行分析,给出了实时位姿信息获取系统的构造思想。该系统提供实时的飞机模型位姿信息,为飞控计算机对模型的控制提供参考依据。

参考文献:

[1]贾云得.机器视觉[M].北京:科学出版社,2000.

[2]段峰,王耀南,雷晓峰,吴立钊,谭文.机器视觉技术及其应用综述[J].自动化博览,2002年03期.

[3]唐向阳,张勇,李江有,黄岗,杨松,关宏;机器视觉关键技术的现状及应用展望[J].昆明理工大学学报(理工版),2004年02期.

[4]关胜晓.机器视觉及其应用发展[J].自动化博览,2005年03期.

[5]R.Shorts,W:L.Snow.Video-metric tracking of wind tunnel aerospace models at NASA

Langley research center[C].The Thompson Symposium held at the University of York

on 20th April 1 996:673~689.

[6]Hassan Mostafavi. Wind tunnel model aircraft attitude and motion analysis[J].PRO.SPIE.Signal and image processing systems performance evaluation simulmion and modeling.199I(1483):104~111.

[7]ohn V Foster,Kevin Cunningharn.Charles M.Fremaux.Dynamics modding and simulation of large transport airplanes in upset conditions[J].Navigation and control conference and exhibit,2005:l5~l 8.

[8]郑南宁.计算机视觉与模式识别[M].北京:国防工业出版社,1998.

[9]刘焕军,王耀南,段峰.机器视觉中的图像采集技术[J].电脑与信息技术,2003年01期

[10]王庆友,孙学株.CCD应用技术[M].天津:天津大学出版社,1993

第8篇:计算机视觉的展望范文

关键词:铁路货车;轮对参数;铁路运输;安全系数;自动检测系统

中图分类号:U270 文献标识码:A 文章编号:1009-2374(2014)33-0025-02

轮对是铁路货车行走过程中重要的构件,安全高效的轮对是保证铁路能够快速、安全运输的关键因素,轮对故障导致的安全事故屡见不鲜,给铁路运输造成了严重的损失。另外,轮对故障也会给车辆本身以及铁路固定设施带来一定程度的损害。目前,我国仍然依靠传统的人工手动测量来对其进行故障的检测诊断,不但效率低下,检测精度以及可检测项目也不尽如人意,为铁路正常运行带来了隐患。因此,发展一种新型的自动货车轮对检测技术对于提高我国检测水平、提高铁路运输安全系数有着重要的意义。

1 轮对自动检测技术的原理及现状

目前来说,国内外主要应用的轮对自动检测技术按照原理分类,可分为以下三类:光截图像原理技术、视觉自动测量技术以及激光位移测距技术,主要应用于货车的入库检查以及地铁在线监查上。下面分别简述一下这三类原理:

1.1 光截图像原理技术

这种技术主要原理为利用三角激光测量技术来实现测量物体二维尺寸的目的。采用的投射光源为点状高强度激光,高速的CCD相机作为图像采集设备。当测试完毕后会得到一系列的曲线,将其和标准的校正曲线进行比对矫点,从而实现目标参数的自动检测。这种技术在低速以及静态测量中的精度比较高,但是对于高速测量的精度尚不能令人满意,这是由于CCD相机的采集速度有限而造成的。但是这种原理制备的设备价格低廉、操作简单,得到了广泛的应用,如丹麦的EDOC公司、美国的BEENA公司以及国内的哈尔滨威克公司等都有相应的产品。

1.2 视觉自动测量技术

视觉自动测量技术是一种基于视觉测量系统,建立在计算机视觉研究基础上的新兴技术,其优点为抗干扰能力强、高效易行,非常适合一些在现场生产中的在线非接触性监控及监测。在实际生产过程中,该技术基于视频成像原理及先进的图像识别功能工作,通过高速摄像机现场拍摄车辆轮对运行状况,采用逐帧截屏得到清晰图片,再对图片进行识别辨认的方法来实现对车辆轮对的监控监测。

1.3 激光位移测距技术

激光位移技术是一种高精度、高精密的非接触行测量技术,主要用于测量对象物体的位置以及位移的变化,可以准确监测出物体的位移、体积尺寸、振动频率等物理几何量的测量。按照原理,激光位移技术可分为激光回波法和激光三角测量法两种,而在铁轮货车轮对检测中主要用的是激光三角测量法,这种检测方法精度高,但监测的距离较短。在实际应用中,左右两路光电流从激光位移传感器发出,通过干涉成像,就可以反推算出物体激光点和成像透镜前面的距离,从而达到监测的目的。目前这种技术已经被应用于我国部分铁路

路段。

2 轮对自动检测系统的研制及简单介绍

2.1 系统结构整体设计

根据轮对检测工艺要求以及车间的实际工作状况,我们设计了一种以龙门通过式机械结构为基础的轮对自动检测系统,其简单组成主要包括进给总成、升降总成、带转总成、测量装置以及传感器等。待货车轮对沿着特定轨道进入测量装置后,通过各个部件的协同作用以及协调工作,自动完成对轮对各参数的测量。本装置可以检测的轮对参数主要包括轮缘厚度、轮座直径、车轮直径、车轴中央直径等。

待测的轮对在自动计算机控制系统的作用下,通过导向装置机构使得轮对到达指定的测量位置,具体如下:当轮对滚动到待测位置时,挡轮装置将其挡住,位于装置下方的轮对提升结构将轮对升起后由转动装置驱使轮对转动。

与此同时,测量装置在直线电机的驱动下,通过丝杠的带动使其沿直线运动单元迅速下降到测量位置停止。当测量传感器做横向运动时,可以测量轮对的中央直径,左右轮缘宽度等参数;和其相连的旋转电机可以控制测量传感器做顺时针以及逆时针的旋转,可以测量左右轮座直径以及轮辋厚等参数。在自动控制系统的作用下,激光传感器按照一定的路径做直线往复运动,可以自动采集被测轮对中各测量点的数据,通过安装的摄像装置可以将装置板上的图像反映到计算机的显示屏上,经过计算机运算处理后得到测量结果保存到相应数据库中并自动打印。当采集数据完成后,左右的测量装置以及激光传感器自动上升到初始位置,测试的轮对停止转动并自动下降,最后由轮推装置推出测量位置,完成整个的工作循环。

2.2 测控系统设计

本自动检测系统的测控系统主要有工业控制高精密计算机、运动控制部分、数据自动采集处理部分以及测控软件等部分组成。

2.2.1 工业控制高精密计算机。该部分作为整体系统的关键组成之一,担负着处理数据,采集打印图像以及对运动的部件进行高精度高准确度控制的作用。设计中我们采用的是方正的主机,CPU为AMD 速龙II X4 740,内存为4GB的DDR内存,配备Dell打印机,利用Windows自带的Microsoft Visual C++ 7.0编程系统进行编程。我们采用的计算机配置较高,编程系统较为先进,为整个检测系统的优良性能奠定了良好的基础。

2.2.2 运动控制部分。运动控制部分主要由步进电机、气动控制装置以及异步电机三部分组成。实际运行条件下,要求本系统的定位精度高,整体系统动作平稳,冲击力小。因为旋转特性不同,结合实际现场运行的需要,选择合适的电机是非常重要的。在轮对旋转中,由于对电机的要求较低,因此采用的是步进电机,最佳细分圈数为6400步/圈。在滑台极限位置两侧安装有光电开发,实现对运动极限位置的控制,保护与之相连的传感器。设计中旋转运动机构和横向运动机构对电机要求较高,因此我们使用了带有64位高性能RISC中央处理器的交流伺服电机,提高了机器的响应性。

2.2.3 数据自动采集处理部分。数据采集部分主要由激光传感器,电涡流传感器以及A/D采集卡三部分组成,这部分也是系统设计最重要的部分,其采集数据的准确度决定着系统的检测精度,是设计中的重点。其基本工作原理是激光传感器输出的电信号经由电涡流传感器的放大、滤波、抑躁处理后送入A/D采集卡进行模数转换。

设计中利用电涡流传感器对轮对的踏面进行高速的数据采集,计算机处理后可得踏面特征;对于车轮直径以及车轴中央直径等则采用激光传感器。为排除实际操作条件下的干扰,我们自行设计了一种A/D采集卡,带有32bit分辨率的A/D转换器以及模拟输入通道,保证最佳转换精度,最大限度地保证了数据的可靠性。

2.2.4 测控软件。本系统采用先进的VC++7.0进行软件的设计,采用先进的多线程编程技术,利用模块化设计方法,软件程序结构清晰,使用界面具有自动填入、人工修改编辑的功能,上手快,使用方便。数据库方面,我们采用的是ODBC法来访问Access数据库。

3 货车轮对自动检测技术展望

国内外的研究结果表明,现有的轮对自动检测技术基本上已经具备实际应用的条件,但是目前我国的检测系统大部分安装于列车通过速度较低的路段,并且受气候条件影响较小;而铁路重载货车具有速度高、环境恶劣等特点,还需对现有自动检测系统技术作进一步的深入研究,从而实现其广泛应用,消除安全隐患,杜绝由轮对故障导致的严重安全事故。

参考文献

[1] 黄曙光,黄海,吴乃优,敖银辉,高向东.铁路货车轮对自动检测系统的研制[J].机电工程技术,2002,(2).

第9篇:计算机视觉的展望范文

关键词:双目立体视觉; 摄像机标定;立体匹配;三维重建

中图分类号:TP37 文献标识码:A文章编号:1009-3044(2011)09-2145-03

The Analysis of the Technology and the Future Application of the Binocular Stereo Vision System

CHENG Huang-jin

(Huainan Union University, Huainan 232038, China)

Abstract: This article makes an analysis of the implementation process of the binocular stereo vision technology,presents implementation methods and drawbacks of camera calibration, feature extraction, stereo matching, especially gives a practical and effective 3D reconstruction method ,the article also analyses and prospects the future application and development of this technology.

Key words: binocular stereo vision; camera calibration; stereo matching; 3D reconstruction

双目立体视觉(Binocular Stereo Vision)是计算机视觉的一种重要形式,它是基于视差原理,由不同位置的A、B两台或者同一位置的一台摄像机(CCD)经过位置移动或者旋转来拍摄同一幅场景,通过计算对应点在两幅图像间的位置偏差,来获取物体三维几何信息的方法。和其他类的体视方法相比,如投影式、透镜板式、全息照相式等三维成像技术,双目立体视觉测量方法具有低成本、高效率、结构简单、精度合适等优点。自上世纪80年代创立以来,经过近几十年的发展,双目立体视觉已经成为计算机被动测距方法中最重要的距离感知技术,已在工业检测、机器人导航、医学机器成像、控制与检测位姿、以及在军事和航空测绘上等众多领域中得到了越来越广泛的应用。

1 双目体视系统的实现

双目立体视觉技术的实现一般可分为:图像获取、摄像机标定、特征提取、图像匹配和三维重建几个步骤,以下是各个过程的具体实现方法和特点。

1.1 图像获取

图像获取指的是先通过多个或单个摄像机从不同位置拍摄某物体,得到至少两幅的二维图像,再利用立体视觉方法对此图像进行处理,最终获取同一场景的三维几何信息的过程。立体视觉可在多种条件下灵活地测量景物的三维立体信息,在计算机被动测距方法中,它是一种最重要的距离感知技术,在非接触测量中占有越来越重要的位置。

双目体视系统的图像获取对应的针孔模型如图1所示。在理想状态下,摄像机C1与C2的光轴互相平行,内部参数和角距也都相等,并且图中的二维成像平面x1o1y1和x2o2y2重合,其中P1与P2分别是空间点P在C1与C2上的成像点。但在实际应用中,需要考虑两台摄像机的内部参数不完全相同带来的影响,要精确分析双目体视系统的结构参数与测量精度之间的关系,并对某一特定点进行三角测量试验,进而得到两台摄像机光轴夹角与该点测量误差之间的函数关系。通常在两摄像头光轴夹角一定的情况下,测量误差将随着被测坐标系与摄像头坐标系之间距离的增大而增大,在满足测量范围的前提下,一般选择两CCD之间的正向夹角为锐角,且大于45度。

1.2 摄像机标定[2,4-5]

对双目体视而言,摄像机或数码相机是利用计算机技术对物理世界进行重建前的基本测量工具,由于摄像机参数会因为组合过程、环境温度、零件更换等发生变化,为了准确定位,摄像机必须标定。摄像机标定是实现立体视觉技术的关键步骤之一,标定的参数有关于光学与几何性质的内部参数和涉及坐标系三维位置与方向的外部参数,为了得到两个摄像机的内、外参数,通常先采用单摄像机的标定方法,再通过同一世界坐标中的一组定标点来建立两个摄像机之间的位置关系。

标定方法分精度低但简单快速的线性标定法和考虑畸变参数但复杂繁琐的非线性标定法。在单摄像机标定方法中,目前常用的主要有:直接线性变换法、传统设备标定法、透视变换矩阵法和线性与非线性结合法等。在双摄像机标定中,是否有精确的外部参数决定着最终的标定结果,受结构配置的准确性和摄像机距离与视角的影响,一般都需要确定8个以上的已知世界坐标点,才能得到比较满意的参数矩阵。此外,双摄像机标定中除了考虑焦距、主点坐标、线性误差等以外,还需考虑径向、切向和离心畸变,以及镜头校正、测量范围等问题,应用范围受到了很大的限制。目前,通用性较好的有基于神经网络的双目立体视觉摄像机标定法,有采用线性与非线性变换结合标定法等,前者的基本思想是先对摄像机进行线性标定,然后通过网络训练建立起三维空间点位置补偿的多层前馈神经网络模型。后者是先利用直接线性转换模型(DLT)得到投影矩阵,通过约束条件分解参数矩阵,分别求出摄像机内部参数;然后将得到的标定参数作为初值,代入非线性方程进行优化,得到精确的标定参数。

1.3 特征点提取[1-3]

测量中,测量精度将直接受到特征点的二维图像坐标能否准确提取的影响,需要提取的特征点应当与传感器类型及抽取特征所用技术等相适应,并且要具有足够的鲁棒性和一致性。因为在图像获取过程中,存在一系列的噪声源,为了显著的改进图像质量,使图像征点更加突出,通常在进行特征点像的坐标提取前,要对获取的图像进行预处理。

目前,常见的特征点提取方法有边缘提取法、兴趣算子法、最小灰度差法等。其中边缘提取法和兴趣算子法对光照条件比较敏感,当物体相邻面的灰度近似时,这些方法能够在较低的精度要求下,概括且有效地提取特征点,然而当某一像素存在于局部灰度出现差异的区域,或者存在于具有不同灰度值的几个相邻区域之间时,这些方法也往往会将其作为边缘特征点提取出来。而最小灰度差法是对数字图像的每一个原像素,分别考察与其同行、同列或对角相邻的若干个像素的灰度变化,再选取这些像素与原像素间灰度差的最小值来作为特征点算子值的一种方法。它可以最大程度的消除物体相邻面及物体与背景间存在的灰度差异而造成的影响,对外界光照条件具有较强的适应性,但一致性较差。

1.4 立体匹配[1-2,6]

立体匹配是双目体视技术中最重要,也是最复杂的一步。当二维图像特征点提取后,关键任务是匹配,也就是寻求左(右)图像中的每个特征点在右(左)图像中的对应点。由于将空间三维场景投影为平面二维图像时,同一景物在不同视点下的图像中存在着明显差异,并且场景中的噪声干扰、光照条件、景物的物理特性与几何形状、摄像机特性等诸多变化因素都将被综合到单一的图像灰度值中,因此仅由灰度值来定性以上这些因素和特征是十分困难的。为了求解对应和减少错误匹配,人们建立了诸如唯一性约束、连续性约束、外极线约束、一致性约束等许多约束,然而随着约束条件的增加,匹配难度相应增大,匹配的选择性空间相应缩小。根据匹配基元的不同,立体匹配的算法可分为区域匹配、特征匹配和相位匹配三大类。

区域匹配算法是利用局部窗口之间灰度信息的相关程度,通过区域匹配建立特征点与对应点之间的相互关系的一种方法,它在变化平缓且细节丰富的地方可以达到较高的精度,但该算法的计算量大、速度慢,并且存在着匹配窗大小难以选择的缺点。与区域匹配相比,特征匹配则不直接依赖于灰度,利用对高频噪声不敏感的模型来提取和定位特征,因此具有较强的抗干扰性,算法简便且高效,但匹配结果的精确度受到特征提取和定位过程的直接影响,特征在图像中的稀疏性决定着特征匹配只能得到稀疏的视差场。相位匹配是近二十年才发展起来的一类匹配算法,它将相位作为匹配基元,很好的抑制了图像的高频噪声,适于并行处理,能获得亚像素级精度的致密视差,但也存在着相位奇点和相位卷绕的问题。

1.5 三维重建[1,6]

在完成了图像获取、摄像机标定、特征点提取和立体匹配之后,就得到了任一被测点在两个图像中的对应齐次坐标和两摄像机的参数矩阵,接下来就是对空间点进行三维重建。

结合上述图1,用两个参数标定过的摄像机同时观察空间物体表面上任意一点P,在确定了摄像机图像上的共轭对应点P1和P2是同一空间点P的图像点后,P点的空间位置就可以由两直线O1P1与O2P2的交点来唯一确定,其中O1,O2分别为两摄像机的光心。

设摄像机的投影矩阵为:

代入下式:

其中(x1,y1,1)与(x2,y2,1)分别为P1与P2在各自图像中的齐次坐标;(X,Y,Z,1)为P点在世界坐标系下的齐次坐标;ωi(i=1,2)为非零参数,αimn(m=1,2,3;n=1,2,3,4)为投影矩阵Ai(i=1,2)中的元素,它们与摄像机的位置及成像系统参数有关,可通过摄像机标定来确定。

摄像机标定后,根据式(1)和被测点P在摄像机像面上的像点坐标(x1,y1)与(x2,y2),可将上式变形为:

(2)

即:

(3)

这样就可以求出未知点P的三维空间坐标(X,Y,Z)。

在测量过程中,当标定参照物与被测物体的相对位置始终保持不变的情况下,也可以只用一个摄像机,采用多个不同位置分别拍摄的方法,得到同一物体的多幅二维图像。

2 双目体视系统的发展[1,6]

正如本文引言所述,双目立体视觉系统发展到现在,已经在很多领域得到了广泛应用。例如日本大阪大学自适应机械系统研究院研制了一种自适应双目视觉伺服系统;东京大学将实时双目立体视觉和机器人整体姿态信息集成,开发了仿真机器人动态行走导航系统;华盛顿大学与微软公司合作为火星卫星“探测者”号研制了宽基线立体视觉系统,使“探测者”号能够在火星上对其即将跨越的几千米内的地形进行精确的定位和导航;浙江大学机械系完全利用透视成像原理,采用双目体视方法实现了对多自由度机械装置的动态、精确位姿检测;哈工大采用异构双目活动视觉系统实现了全自主足球机器人导航等等。

但就双目立体视觉技术的发展现状而言,要构造出类似于人眼的通用双目立体视觉系统,还有很长的路要走,未来的发展趋势可总结如下:

1)如何建立更有效的双目体视模型,能更充分地反映立体视觉不确定性的本质属性,为匹配提供更多的约束信息,降低立体匹配的难度;

2)探索新的适用于全面立体视觉的计算理论和匹配策略,选择有效的匹配准则和算法结构,以解决存在灰度失真、几何畸变(透视、旋转、缩放等)、噪声干扰、特殊结构(平坦区域、重复相似结构等)及遮掩景物的匹配问题;

3)算法向并行化发展,提高速度,减少运算量,增强系统的实用性;

4)强调场景与任务的约束,针对不同的应用目的,建立有目的的和面向任务的体视系统。

参考文献:

[1] 管业鹏,童林夙.双目立体视觉测量方法研究[J].仪器仪表学报,2003,24(6):581-584.

[2] 隋婧,金伟其.双目立体视觉技术的实现及其进展[J].电子技术应用,2004(10):4-6.

[3] Barnard S T, Thompson W B.Disparity Analysis of Images IEEE Trans,1980,PAM I-2(4):333-340.

[4] Golub G, Loan C van, Matrix Computations[M].Balti-more,Maryland:The John Hopkins University Press,1996.