公务员期刊网 精选范文 计算机视觉的基本技术范文

计算机视觉的基本技术精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的基本技术主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉的基本技术

第1篇:计算机视觉的基本技术范文

关键词:计算机视觉;课程创新;教学改革

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02

计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。

一、计算机视觉课程的特点

近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。

二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别

1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。

2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。

三、高校计算机视觉课程教学的创新策略

1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。

2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。

3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。

四、结语

在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。

参考文献:

[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).

[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).

[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).

[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).

[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).

[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).

第2篇:计算机视觉的基本技术范文

关键词:计算机视觉技术 铁路检测 应用

中图分类号:TP391 文献标识码:A 文章编号:1007-3973(2012)002-075-03

1 前言

自1825年世界第一条铁路在英国出现以来,铁路已经成为人们不可或缺的交通工具,越来越多的人在使用铁路出行,由于近年来铁路事故频频发生,促使了计算机视觉技术在铁路检测上的广泛使用并大力发展。

传统的铁路检测一直是靠人工和静态检测,这种检测缺乏实时性和准确性,并且效率低下,根本无法满足铁路的发展。这就要求研究一种新的检测方法来适应环境的发展,人们就试图将计算机视觉技术应用于铁路检测上,并取得了很好的效果。将计算机视觉技术应用在铁路检测上显著提高了铁路检测的实时性、准确性,有效的减轻了人工检测中工作条件恶劣,工作量大等缺点。它能在列车行驶的过程中就能对铁路和列车状况进行检测,并及时的做出预警,防止安全事故的发生。目前有关铁路检测主要集中在铁路信号检测、轨道检测、接触网检测、电力机车检测及站台环境监测等五个方面。

2 计算机视觉技术

计算机视觉,也称机器视觉。它是利用一个代替人眼的图像传感器获取物体的图像,将图像转换成数字图像,并利用计算机模拟人的判别准则去理解和识别图像,达到分析图像和作出结论的目的。

计算机视觉是多学科的交叉和结合,涉及到数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域。计算机视觉已有多年的发展历程。随着计算机、控制理论、模式识别、人工智能和生物技术的发展,计算机视觉在机器人、工业检测、物体识别的应用越来越广,研究方向也从二维到三维,从串行到并行,从直接依赖于输入信号的低层处理到依赖于特征、结构、关系和知识的高层处理。

一般的计算机视觉系统是有CCD(电荷耦合器件)摄像机、装备有图像采集板的计算机、光照系统以及专用图像处理软件等组成。CCD摄像机将所要研究的对象和背景以图像的形式记录下来,这其实是一个光电传感器,将光学信号转成电信号,图像采集板把采集的电信号转为数字信号,即数字化,一般情况下在摄取图像时都需要一个照明系统提供光照,然后再用专用的图像处理软件对图像进行处理,输出分析结果。

3 计算机视觉技术在铁路信号中的应用

铁路信号灯和现在的交通公路上的红绿灯是一个功能,但铁路和公路不同,铁路有限定的道路,列车必须在限定的股道上行驶,所以一旦与其他车辆相遇的话根本没有办法避让,如果发生车祸将会对国家和人民的生命和财产造成严重的损失,因此列车必须严格按照信号灯的指示行驶。

铁路信号灯识别主要是利用了信号灯在不同情况下会发出特定色彩光的特点。文献[1]在HSV空间中对S分量图像边缘检测和膨胀等,结合各种信号灯色调H分量的取值范围得到信号灯区域,然后多次腐蚀直到消除孤立点得到信号灯的边缘,最后填充信号灯区域,从而实现了信号灯的识别。在文献[2]也与此类似。文献[3]将彩色图像由RGB模式转化为HSI模式,用彩色特征聚类分析法来对图像进行分割,文中提出了基于颜色和形状相结合的复杂环境中目标检测与识别方法,用Hough变化来提取目标边界,从而提取出特定目标,而后得到指示灯区域所有像素的H,S统计值确定信号灯的颜色。在文献[4]提出一种基于改进的Hough变化的吊车信号灯识别算法。Roberto将摄取的图片转换到HIS颜色空间,用基于形状特征和模板匹配的方法探测到相关的铁路标志而放弃无关的基础设施。

为了部分消除因为光照条件、背景和拍摄角度对目标识别的影响,文献[5]提出使用一种利用sift特征的方法,它首先建立已知样本模型的特征集,然后将视频流每帧灰度图像的sift特征与之比较,从而实现对目标的检测或跟踪。实验表明该方法不仅能避免目标的错误识别,而且也明显优于基于边缘检测的算法,在识别准确率上达到了90%。

4 计算机视觉技术在轨道检测中的应用

随着世界铁路运营速度的不断提高,列车在行驶时对轨道的撞击、摩擦加剧,这就会造成轨道的变形、零件松动、磨损乃至缺失等,这些都会对列车的安全性造成严重影响,极有可能会造成铁路安全事故的发生。因此轨道设备具备良好的状态是铁路运输安全的重要保证。

随着电子技术和检测技术的发展,轨道检测技术也经历了翻天覆地的变化,其中也有不少研究机构将计算机视觉技术应用于轨道检测上,且取得了若干有效的检测方法。

轨道表面缺陷对列车行驶的质量和铁路系统的安全性会造成严重的影响,文献[7]提出了一种轨道表面缺陷检测的实时视觉检测系统。利用跟踪提取算法分割出轨道的灰度图像,然后用局部归一化法增强轨道图像的对比度,最后用基于投影轮廓的缺陷定位法检测缺陷。该算法对噪声有较强的鲁棒性和计算速度快,在一定程度上克服了光照不均和轨道表面反射性质不同对图像的影响,但对局部归一化过程中参数的选择有待进一步研究,以使该系统有更强的鲁棒性。该系统在216km/h速度下能进行实时检测,但随着检测速度的提高检测的准确度会明显下降且缺乏实时性。

文献[8]利用一排结构光视觉传感器,将钢轨轮廓的大圆周和小圆周的中心作为检查点。首先结构光视觉传感器拍摄铁轨侧面并且将其标记 在参考坐标帧中,最后通过比较测量的钢轨轮廓与参考轮廓的比较计算出铁轨磨损程度。该方法简单快速精确且不需要特殊的图像处理设备,在列车较高速度时仍然能达到良好效果。

5 计算机视觉技术在接触网检测中的应用

接触网是沿铁路线上空架设的向电力机车供电的特殊形式的输电线路。其由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。它是轨道交通的主要组成部分,主要为机车提供动力,接触网的连接件由于受外界因素的影响容易产生过热现象,严重时会导致供电中断,引发列车停运事故。

我国的计算机视觉技术的接触网检测系统是基于德国相关技术而建立起来的,目前基于计算机视觉技术的接触网磨耗检测主要有两种方案:(1)基于镜面反射,激光照射接触线,线性CCD照相机捕获反射图像;(2)基于漫反射原理和CMOS(互补金属氧化物半导体)照相机。由于长期的频繁摩擦,接触网与受电弓接触部分很少被空气氧化,所以用光进行照射时该部分光反射率明显高于其他部分,因此这也为计算机视觉技术用于接触网检测提供了可能。

基于机器视觉的接触网检测系统主要是建立在图像识别和图像处理等视觉技术基础之上的,检测的内容涵盖接触网的所有基本几何参数。随着铁路的发展,原有的检测系统已经暴露出了一些问题,已无法满足需求,所以研究人员在系统硬件设备不变的情况下提出了许多改进的算法,如文献[9]针对现行的接触网定位器倾斜度检测方法效率低下、精确度不高的缺点,提出了一种基于计算机视觉的接触网定位器倾斜度自动测量装置,应用图像分割、剔除干扰线、图像细化等算法,对采集的图像进行处理,然后利用改进的霍夫(Hough)变换检测细化后的图像,对相邻的特征像素点进行聚类并感知编组,最后用随机Hough变换使感知编组后的每条线段更接近直线,进而计算装置中定位器的倾斜度,实验证明该算法精度高、速度快。

6 计算机视觉技术在电力机车检测中的应用

在列车的行进过程中,机车车轮与钢轨接触面不断发生摩擦,也就是轮缘与踏面的摩擦。从而会造成踏面的擦伤或剥离,而剥离会严重影响列车运行的安全性和平稳性以及轨道设施的使用寿命,因此需要对轮缘进行定期的检测和维修。

传统的检测方法需要人工逐项检测,存在费时费力、工作量大、工作环境差、效率低等缺点,所以人们就提出了一种基于计算机视觉技术的检测技术,该技术是一种非接触式检测方法,它能检测出所有关于火车轮缘轮廓的几何参数,从而计算出火车轮缘的磨损情况。这种检测方法检测速度快、准确率高且大大减轻了劳动强度,在实验中取得了满意的效果,并且在实际检测中也得到了广泛的应用。

文献[10]中研发设计了一种利用CCD成像测量技术、图像处理理论和计算机控制等相关技术,提出了一种非接触式的在线测量系统。采用二元多项式方法对由于硬件装置引起的误差的图像进行几何校正,用统计均值法对图像进行分割,从而求出车轮踏面的各项参数,通过在实验室对标准物进行测试实验而得到的测量数据结果进行分析而得出。此系统能够完成对火车轮对几何参数的测量,并且可得到相对准确的测量结果。

为了解决检测轮缘高度和宽度存在精度难以保证及稳定性不高的问题,文献[11]提出了一种基于三角法测量的在线监测系统,该系统由CCD高速摄像机和结构光发射器完成数据的采集,然后利用三角测量原理导出测量模型和计算模型,根据轮缘高度和宽度的定义完成对高度和宽度的测量,最终对轮缘磨损程度进行量化,实验表明该算法测量精度高,结果稳定可靠。

7 计算机视觉技术在站台环境监测中的应用

近年来铁路交通事业发展迅速,铁路客流量也不断增大,如中国每年的春运期间都有上亿人次通过火车返乡,各种危害乘客安全的事故也时有发生,因此世界各国特别是中国站台监控就显得越来越重要,目前的站台监控主要是依靠安装在各个角落的闭路电视或专业技术人员,这不仅需要专业技术知识还需要大量的人力物力。随着计算机、图像处理等技术的快速发展,对站台的自动监控也逐渐成为发展趋势。

近年来人们做了许多关于站台人群检测的研究,这些研究大都使用铁路站台中的闭路电视(CCTV)系统,在现代的CCTV系统中基本上使用的是数字化图像,在人群监测过程中大量使用了数字图像处理技术,如边缘检测、细化、像素计算等,通过图像的处理可以轻易的得到想要的结果。

文献[12]仍采用原有的CCTV监控系统拍摄的灰度图像作为处理对象,利用基于视觉的经过最小二乘法和全局搜索的混合算法训练的工业的额神经网络来估算站台的拥挤程度,该系统在实际的运行中获得了较高的精确度,虽然不能计算人数但却能实时的预测人群的密度。

文献[13]所设计的系统就较为复杂,它利用多台摄像头对站台进行检测。首先判断站台上列车的四种状态,如:没有列车、有列车、列车正在出站、列车正在入站等,然后对物体或行人检测及跟踪,最后对所检测的结果综合分析,做出合理的预警或警告。

8 计算机视觉技术在铁路检测上的发展趋势

随着计算机视觉技术的铁路检测中的应用越来越广泛和深入,并且随着计算机视觉技术等关键技术的不断发展,计算机视觉技术在铁路检测上应用发挥更大的作用,它就目前而言在铁路检测的应用上仍然存在技术难题需要研究:

第3篇:计算机视觉的基本技术范文

关键词:序贯相似性检测算法 图像匹配 计算机视觉

中图分类号:TN911 文献标识码:A 文章编号:1672-3791(2013)06(c)-0205-01

图像匹配最早是70年代美国从事飞行器辅助导航系统,武器投射系统的制导等应用研究中提出的。国内外学者对匹配辅助导航技术进行深入研究,使其在民用领域的应用越来越广泛[1,2]。计算机视觉计算主要分为低层处理、中层处理和高层处理,而在低层进行数字化差异检测、中层进行参数化相似分析,高层处理完成图像的识别、解释和描述等任务,都需要图像匹配技术[3]。序贯相似性检测算法(SSDA)能够快速地丢弃非匹配点,减少非匹配点的计算量,从而提高匹配的速度,算法简单,易于实现。

1 序贯相似性检测算法

序贯相似性检测算法的基本思想是基于对误差的积累进行分析。在进行图像匹配时,通常非匹配点处的误差ε会随着运算点数的增加而迅速增长,很快超过某一门限,而对于匹配点处,误差的增长要缓慢得多。这样对于大多数非匹配点,只需要分析前几项,而只有匹配点附近的点才需要计算整个循环,这样就大大地减少了匹配的运算量。

设源图像S的大小为J×K,模板图T的大小为M×N(其中M≤J,N≤K),模板覆盖的区域子图为,(p,q)为模板左上角像素点在图像S中的坐标,S中的待匹配区域是以点(p,q),(p,q+M-1),(p+N-1,q),(p+N-1,q+M-1)组成的区域。相对于参考点位置为(m,n)点的匹配误差定义为:

其中k=1,2,…r。将累计误差值与预定阈值进行比较,当累加值超过设定阈值Tk时,就停止累加计算,并记下累加次数k。计算下一个待匹配点处的误差,若累计误差小于预定阈值,则继续计算此处的误差,直到>Tk或k=r,记下k值。对不同的待匹配点进行上述匹配计算,最后取最大k值对应的待匹配点位置,即为要找的匹配点。

2 实验结果与分析

图1显示了基准图与实时图像,图1(a)为基准图像,大小为256×256,图1(b)为实时图,大小为65×65。图1(c)找到了实时图像在基准图中的位置。

由图1可以看出,SSDA算法能够良好地进行匹配。而通过对匹配时间的计算可以看出,SSDA算法的运行时间相对较短,效率较高。

参考文献

[1] GONG H C.Development of terrain contour matching algorithm for the aided inertial navigation using radial basis functions [J].Journal of Astron Space Science,1998,15(1):229-234.

第4篇:计算机视觉的基本技术范文

【关键词】株高 HALCON 双目视觉 误差修正

1 引言

计算机视觉技术是近几年来发展较快的信息处理技术,随着图像处理技术的专业化、计算机硬件成本的降低和速度的提高,计算机视觉的应用已变得越来越广泛,其中不乏在农业中的应用。

株高是植物生长指标的重要参数,是一个物种争夺阳光的能力的主要决定因素[1]。对于作物来讲,株高参数是作物产量预估不可或缺的参数。

然而对于具体的利用机器视觉方法直接测量株高的研究还是比较少的,本文就是利用HALCON软件,采用双目计算机视觉方法来实现株高的测量。

2 双目视觉原理

双目视觉的基本原理是从两个视点观察同一景物,获取不同视角下的两幅图像,然后根据三角测量原理计算不同图像对应像素间的视差(disparity ),获取景物的三维信息,从而实现场景三维重构。

根据两个摄像机位姿的不同,双目视觉有多种模式,常用的有双目横向模式,双目横向会聚模式以及双目纵向模式(也称双目轴向模式)。

为了增加测量精度,基线一般不能太小,但基线长度也不可太长,否则,由于物体各部分相互遮挡,两个摄像机可能不能同时观察到目标点。

图1是会聚双目成像中的视差原理图。图中给出两镜头连线所在平面(XZ平面),两镜头中心间的距离(即基线)是B,两光轴在XZ平面相交于(0,0,Z)点,交角为(未知)。现在来看如果已知像平面坐标点(x1, y1)和(x2, y2 ),如何求取世界点W的坐标(X,Y,Z)。

根据相似三角形的关系可以很明显得出: (2.1)

(2.2)

(2.3)

其中r为从(任一)镜头中心到两系统会聚点的距离(未知)。将式(2.2)和(2.3)联立, 可得:

(2.4)

上式把物体和像平面的距离Z与视差d直接联系起来,若想求解式(2.4),除视差d外,还需要知道x1和x2本身。另外,由图1可以得到:

(2.5)

代入式(2.2)或(2.3)可得:

代入式(2.2)或(2.3)可得:

(2.6)

现实测量中,两相机的光轴与世界坐标Z轴的夹角不可能相等,不过即便如此,也只会引入几个待确定的三角函数,而这些三角函数在相机标定时即可确定。

3 测量过程

实现该测量过程包括如下几个功能模块:图像获取、摄像机标定、特征提取、立体匹配与三维信息恢复、后处理。本实验采用是分比率为960×720的双摄像头。被测区域大小约为56cm×42cm,所以采用的标定板应为被测区域1/3大小的HALCON专用的200mm标定板。标定数为24×2张图片。利用HALCON自带的标定助手,可以轻松实现单目标定。

双目标定时,需要有15张以上左右相机相同时刻拍摄的标定板的图片。再利用for循环,find_caltab函数,find_marks_and_pose函数以及binocular_calibration函数,可以实现双目标定。将标定过程中,获得的摄像机的内参以及两个摄像机相对位置关系作参数传递给函数gen_binocular_rectification_map,可以很好地实现双目视觉校正的目的,得到两幅校正后的图像,还能得到校正后虚拟立体视觉系统中两个摄像机的内参和外参。

不同种类的植物其株高定义不同,测量方式也不尽相同。本文研究的株高只针对直立型的,是指从植株根部露出土壤部分到植株最高处的株高。

先利用gen_binocular_rectification_map函数为map_image函数提供控制参数,再通过map_image函数对采集到的图像做校正处理,利用threshold函数,fill_up_shape函数以及select等函数找出校正后图像中植株的最低和最高点,利用intersect_lines_of_sight函数,可获得植株最低点和最高点的真实三维坐标,最后通过几何运算得到双目测量结果。

我们在图像采集时就应该考虑到,摄像头应该稍微带一点俯拍的角度,保证左右两幅图像上最高处均为现实坐标中的最高处。切忌俯拍角度不可太大,否则由于拍摄角度而引起的像差会很大,对结果将会有很大的影响。

经过以上几步骤得到的三维坐标,常因各种原因而存在一定的误差,需要进行误差校正。我们对已知高度的对象进行了测量,得出结果如表1:

通过上述数据得出的修正关系如下:

y=-0.0002x2+1.0699x (3.1)

其相关系数R2=0.9993

4 实验结果

我们对三种植物进行了测量得出的结果如下:

从测量结果中可以看出,修正后相对误差控制在2%之内,可以接受。误差引入的原因可能如下:

1、标定板的选择决定了标定精度。一定要选用高精度的标定板,且标定板的大小应约为测量范围1/3大小。

2、相机是图像获取的根本,高质量的图像离不开高分辨率相机,但是高分比率,高解析度的相机又会带来成本上的提升。本文中,对于390.0mm左右的对象,1个像素的误差可以带入约0.4mm的实际误差。

3、本文所采用的算法只能针对比较理想,比较直的植株,算法的不断优化,才能不断减少误差,提高精度。

5 结语

本文介绍了一种基于HALCON的,利用双目视觉测量株高的方法。对于直立型植物,通过对立体匹配与三维信息恢复结果的误差修正,其株高测量相对误差不超过2%,方法具有一定的可借鉴性。

参考文献

[1]章毓晋.计算机视觉教程 [M].北京: 人民邮电出版社,2011.

作者简介

郝慧鹏(1988-),男,内蒙古乌兰察布人,硕士研究生,主要研究方向为计算机视觉技术在农作物检测上的应用。

指导老师

田跃(1956-),男,北京人,北京科技大学数理学院物理系教授,北京市弱磁检测及应用工程技术研究中心副主任。

作者单位

第5篇:计算机视觉的基本技术范文

【关键词】 运动目标检测 视频图像 OpenCV

一、绪论

随着计算机技术日新月异的发展,计算机视觉,模式识别,人工智能,多媒体技术,越来越受到人们的重视的快速发展。广泛地被定位对象使用运动跟踪和检测,监测和智能人机交互和分析他们的行为,一旦发现有异常行为的对象,监控系统发出警报,提醒人们注意和及时的治疗,改善人类的人工监督注意力浪费资源等问题。计算机视觉是通过计算机代替人的眼睛和大脑感知外部环境,分析和理解。

1.1 OpenCV技术介绍

视觉处理算法的OpenCV提供了非常丰富的,它部分是用C写的,有它的开源特性,妥善处理,无需添加新的外部支持进行编译和链接,生成程序的完整实现,所以很多人们用它做算术移植,OpenCV的可正常运行的系统DSP和MCU系统正常重写代码。

二、运动目标检测

运动目标的检测在整个视频监控系统的底层,各种高级应用,如目标跟踪,目标分类,目标行为的随访,了解互惠的基础。运动对象检测装置,从在实时目标视频流中提取,目标通常设置面积和颜色特性。结果运动目标检测是描述一些静态功能的“静态”的目标前景。根据上下文,其中环境可分为两大类静态背景下运动目标检测和动态背景运动目标检测,本章与实际纸工作主摄像机静态背景运动目标运动结合,不会发生前景对象的运动目标检测检测算法。

2.1运动目标检测的基本方法

目标检测和提取已在目标跟踪应用程序中的重要地位。目标检测和提取的精度直接影响结果和准确性的跟踪。一个良好的各种环境动目标检测算法的应能适用于监测,在正常情况下,移动体检测算法可以根据场景被监视在室内或室外监测算法被分成室内和室外监视算法,则可以按照使用特定算法的方法分为连续帧差分方法,背景减除法和光流法。

2.1.1帧间差分法

对于许多应用,图像的连续帧之间的差检测出图像的顺序是非常重要的一步。场景中的任何可观察到的运动将反映在场景图像序列的变化,如果能检测到这种变化,我们可以分析的运动特性。

2.1.2背景差法

基于该原理的背景差分方法非常简单,基本操作过程示于(4.2)如下:首先使用式(4.3)来计算背景图像之间的差fbk当前帧fk,然后根据下式(4.4)是差分图像的Dk值化和形态学滤波处理,并获得当该区域的通信区域比给定的阈值RK进行连通区域分析的结果,它成为检测对象,并且该区域是区域目标在区间的,你能确定的最小边界矩形的目标。

其中T 是二值化设定阀值。

2.1.3光流法

光流是指在图像模式(或表观的)运动的表观亮度。用“表观运动”,主要是由于光流的运动图像不能有部分信息只以确定,例如,区域性或亮度轮廓点更均匀的亮度不能唯一确定的运动对应的点,但观察到的运动。这解释了光流和该流不一定是由物体的运动所产生的光,而运动的主体不一定会产生光流体育场不一定是唯一的。

三、目标跟踪算法的研究

目标对象的运动信息的条件的先验知识下跟踪,通过从信息源的实时数据来估计所述目标状态,以实现所述目标位置和运动趋势判定。运动目标跟踪问题是一个复杂的估计。研究精度高,性能稳定,目标跟踪方法的适用性仍面临巨大挑战,具有重要的理论意义和实用价值。

3.1图像匹配法

通过图像匹配方法可以识别要跟踪的运动对象,并确定它们的相对位置。早期跟踪涉及的目标位置的变化的两个图像之间的测量计算出的相关函数,跟踪点是,这两个图象相匹配的最佳位置,这是相关函数的峰值。

3.2基于团块的目标跟踪

基于团块(BLOB)的基本原理是用于图像分割候选像素跟踪算法,它决定像素是否属于背景或属于定位或属于其他区域。基于跟踪算法的质量也可称为基于图像分割的跟踪,分割结果刚够目标和背景之间的区分,而传统的图像分割算法需要目标轮廓的精确显示。分裂台球在目标,纹理特征和图像的深度信息的一般特性。

四、结语

随着在军事领域的计算机视觉,智能交通监控,视频运动目标检测与跟踪的发展必将得到更广泛的应用和发展。在本文中,历时四个月中,主要研究的OpenCV实现运动目标检测与跟踪的应用,实验结果表明,该系统具有良好的鲁棒性和准确性,实现毕业设计的预期目标,在工作和问题结合起来实际应用中。

参 考 文 献

[1]刘瑞祯, 于仕琪. OpenCV教程基础篇[M]. 北京: 北京航空航天大学出版社,2007.

[2]彭达. Visual C++多媒体编程技术[M]. 北京: 人民邮电出版社, 1999.

[3]丁金铸. 基于图像处理的运动目标检测跟踪系统的设计与实现[D]. 华中师范大学, 2007.

[4]王建中, 姜昱明. 基于块匹配的运动对象检测算法[J]. 微电子与计算机, 2005, 22(1): 10-12.

[5]林少丹. VC++程序设计基础[M]. 北京: 人民交通出版社, 2009.

[6]唐双发. 基于OpenCV的车辆视频检测技术研究[D]. 华中科技大学, 2009.

[7]李庆忠,陈显华,王立红. 视频监视中运动目标检测与识别方法[J]. 计算机工程, 2004, 30(16):30-33.

[8]胡晓峰, 吴玲达, 老松杨, 司光亚. 多媒体技术教程[M]. 北京: 人民邮电出版社, 2002.

[9]韩鸿哲, 王志良, 刘冀伟, 李郴, 韩忠涛. 阴影消除的自适应背景建模[C]. 第二届全国智能视觉监控学术会议论文集, 2003, 35-39.[10]张玲, 叶海炳, 何伟. 一种基于边缘信息的改进车辆检测方法[J]. 重庆大学学报(自然科学版), 2004, 27(11): 56-58.

[11] J.B.Kim, H.J.Kim. Efficient Region―based Motion Segmentation for Video Monitoring System [J]. Pattern Recognition Letters, 2003, 3(24):113-128.

[12]王春平, 朱元昌,黄允华. 基于图像信息的跟踪算法分析[J]. 火力与指挥控制, 2000, 25(1): 64-67.

[13]杨枝灵, 王开. Visual C++数字图像获取处理及实践应用[M].北京: 人民邮电出版社, 2003.

第6篇:计算机视觉的基本技术范文

关键词:农业机械;技术手段;应用;发展前景

我国在国际上的地位正在逐渐提高,这与我国的经济发展是分不开的,经济的发展需要基础的支持,农业就是我国的基础,我国是农业大国,农村人口基数大。随着近几年我国农业的发展,很多高新技术也被运用到农业的机械设备中,使农机设备向着智能化的方向发展,有效地提升了农业生产的整体效率。在农业的生产中使用高新技术还能够提高农业的生产效率,保证农机相关机械的正常运作。

1农业机械技术的应用分析

1.1计算机技术

这里所说的计算机技术主要指的是计算机视觉技术,这一技术最早被运用在农业机械上是在20世纪70年代中期,当时主要运用的是计算机技术中的视觉技术,利用这一技术的主要目的是可以对农产品的品质质量进行分级别检查。计算机视觉技术是以图像处理为基准,随着图像处理以及视觉模拟技术的发展,计算机视觉技术不仅可以用来检查农产品的品质,而且还可以用来对农产品进行播种、收割。虽然计算机视觉技术在我国农业技术领域的应用时间还不是很长,在实际的使用中还有很多的问题出现,但是相信随着科学技术的不断发展,计算机视觉技术必将会改变传统的农业作业模式,为现代化农业发展提供技术上的支持。

1.2网络信息技术

网络信息技术在我国农业机械上的应用是非常成功的,信息技术与地理信息系统的有机结合不仅可以为农业的生产提供高精度的监控,而且还能够对农业生产中出现病虫害的情况进行及时的检测,然后根据定位系统来进行田间作业。

1.3液压技术

液压技术主要依靠的是微电子技术和工业传感技术,在数据的采集上,运用液压技术主要完成的是能量的转换和匹配,其目的是为了让农业机械的效率能够得到进一步的提高,让机械设备的相关系统特征可以得到完善,让机械设备的可靠性能够得到提升,这也很好地符合了环境保护的相关标准要求。而大部分的农业机械都是采用内燃机作为原动力,所以很多时候都会出现工作负荷,一般情况下,我们都是通过电液控制手段来完成负载与原动力之间的匹配情况,尽可能地减少功率传输过程中出现的损失,从而提高农业机械系统的工作效率。

1.4人工智能技术

随着信息全球化的不断深入,高端技术不仅在大型的企事业单位中被运用,在农业中也得到了广泛的应用,比较有成果的就是美国利用人工智能技术研发出激光拖拉机、机械的内部导航装置,等等,这些装置可以对拖拉机的运行方向及所处位置进行实时的测定,在了解地区土地信息之后,再制定合理的土地种植方案、农药及种子的数量,等等。

2农业机械技术的发展趋势

2.1推广农业机械产品的技术发展

目前在我国的农业机械发展上,已经开始运用机电智能化技术和计算机技术,这使得农业机械化设备的科技含量有了极大的提高,不仅有效地提高了农业机械的作业效率,而且也提升了农业的生产效率。

2.2农业资源的利用率得到了提升

只有提高了农业资源的开发利用率,才能够确保农业实现可持续发展,同时也为保护生态环境奠定基础,如回收农业生产的废弃物,普及无害化的处理设备,运用无害化技术来处理废水可以有效地达到保护环境的作用。而在农业种植的过程中,使用有机肥料还可以进一步提高农业资源的利用效率。除此之外,大力发展节能型动力机械设备可以有效地避免出现资源浪费,从而提高农业资源的整体利用效率。

2.3提高农业机械产品的质量监督水平

要想提升农业的机械化水平,还要从规范设计的基本要求出发,全面提高农业产品的质量。在质量提升的过程中,还要注重农业产品的整体造型和外观,农机设备的耐久性也要经得起考验。选用与农机设备相配套的发电机及元件,能够最大程度上提高农业机械产品的质量。在农业机械设备完成安装之后,还要对其进行试运行,只有保证了设备各项指标都正常的基础上,才能够真正的投入使用,这也是提高农业机械产品可靠性的前提。

2.4加大政府的补贴力度

各级地方政府要加大农业机械的技术推广,做好农业机械的培训工作。国家还要将拖拉机、插秧机等农机具作为农具购置补贴的关键,普及农业机械知识。这样也能够更好地提高农业机械化的发展进程。

2.5确保农业机械技术的安全生产

关注安全监督管理及装备的创建工作,加大农业机械的安全投入,以便更好地满足农业机械工作安全监督管理的需求。除此之外,最重要的是,要将农业机械的安全检验工作纳入到各级县市政府的财政预算当中。

3结语

随着科学技术的飞速发展,一些高新技术正在逐渐地被运用到农业的机械设备中,这些机械设备的出现不仅提高了农业的整体生产水平,而且还进一步提升了农业的生产效率,很好地实现了农业的可持续发展。在今后的农业发展过程中,农业机械也必定是智能化的,所以要求操作人员要不断地提高自己的专业素养,全面推广农业机械新技术,只有这样才能够真正意义上实现我国农业机械的智能化。

作者:徐家亮 刘晓鹏 单位:黑龙江省克东县农机安全监理站

参考文献:

[1]陶乐然.长春星宇小区新技术应用[C]//增强自主创新能力促进吉林经济发展———启明杯•吉林省第四届科学技术学术年会论文集(下册).2006.

[2]刘蒙之.传播新技术与国家发展———一种政治经济学的观察[C]//中国传播学会成立大会暨第九次全国传播学研讨会论文集.2006.

[3]张仁江,田莉.制造业企业新技术采纳:动因、路径及障碍分析———基于T公司的纵向案例研究[C]//第六届(2011)中国管理学年会———技术与创新管理分会场论文集.2011.

[4]胡札进,姚尚斌,徐七三“.双低”储藏与四项储粮新技术的综合应用[C]//全面建设小康社会:中国科技工作者的历史责任———中国科协2003年学术年会论文集(上).2003.

[5]柳旭.浅析电视空间新技术对审美体验的影响[C]//2009中国电影电视技术学会影视技术文集.2010.

第7篇:计算机视觉的基本技术范文

进行了阐述。

关键词:自动控制技术 农业自动化

由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距, 已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术, 如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展, 从而形成了一系列适合我国农业特点的自动化控制技术。

一、已有的农业机械及装置的部分自动化控制

自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上, 成功研制出6CRK-55型可编程控制加压茶叶揉捻机, 它利用计算机控制电功加压机构, 能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制, 是机电一体化技术在茶叶机械上的首次成功应用。

1.应用于拖拉机

在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。

2.应用于施肥播种机

根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。

3.应用于谷物干燥机

不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时, 自动掐断燃料供给的装置。

二、微灌自动控制技术

我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年, 全国共有节水灌溉工程面积0.133亿m2, 其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段, 高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况, 对灌溉用水进行动态监测预报, 实现灌溉用水管理的自动化和动态管理。在微灌技术领域, 我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备, 总结出了一套基本适合我国国情的微灌设计参数和计算方法, 建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统, 可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。

三、自动控制技术在精准农业中的应用

第8篇:计算机视觉的基本技术范文

关键词:增强现实;计算机视觉;三维注册

中图分类号:TP242 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02

1 引言

随着计算机技术的迅速发展,计算机视觉、虚拟现实技术、人工智能、计算机图形学等技术被广泛地研究和应用,这些技术引导着人们进入了一个信息数字化的虚拟时代。

增强现实技术(Augmented Reality,AR)作为虚拟现实技术和计算机图形学相结合的产物,它是在通过计算机渲染生成虚拟的物体或文字信息模型的同时,对真实的场景进行标定,从而使虚拟的物体能够被准确地放置到真实的场景中,最终通过显示设备显示出来,使用户处于虚拟和现实相融合的亦真亦幻的新环境中,无法清楚地分辨出真实和虚拟。增强现实技术增强了用户的观感及其与真实场景之间的交互。

增强现实技术作为虚拟现实的一个重要分支,是虚拟现实技术发展过程中的产物。如图1.1所示,该图为Milgram提出的增强现实和虚拟现实关系的一种分类学表示方法。由图我们可以看出,虚拟现实所创建出来的是一种完全虚拟的三维世界,它与真实的世界相隔离。而增强现实是以现实场景为基础,场景中的虚拟物体随着真实物体的变化而变化,提供给用户的是一种复合的视觉效果,就好像这些虚拟物体真实的存在于场景中。

2 增强现实技术的应用

增强现实技术在20世纪90年代真正兴起,其发展与20世纪60年代计算机图形学的迅速发展密不可分。增强现实技术不仅拥有虚拟现实的各种优点,同时又有其独特的视觉增强功能,因此成为了国内外研究机构和知名大学的研究热点,并广泛的被应用于教育、医疗、工业、娱乐、军事等多个领域。

2.1 教育

增强现实丰富了教育学习生活。传统的书籍中只存在文字信息,通过增强现实技术,我们可以透过书籍看见文字相关的动态画面或是影像,图文并茂,极大的增强了学生的学习兴趣。目前的魔法书系统就是这一技术的很好运用,用户通过头盔显示器可以看到书中描述的场景,使读者可以完全沉浸在虚实结合的环境中,提高学习兴趣和效率。

2.2 医疗

增强现实技术可以帮助医生实现可视化手术或手术培训。准确地定位真实场景是增强现实技术的一个重要方面,在医疗中,运用增强现实技术可以进行手术定位,实时地收集病人体内的3D影像,并将其与真实的人体相结合,使得医生可以“透视”病人体内,从而减少手术的风险,该技术对微创手术也有着深远的意义。手术培训方面,通过加入虚拟的提示注解,可以提醒医生手术中的一些必要步骤,降低手术风险。

2.3 工业

增强现实的另一个应用是工业组装和维修。通过增强现实技术可以显示出各种设备零件的内部结构图、使用说明等,方便安装和维修。显示的内容可以不仅仅是简单的文字或图片,更能直接渲染生成3D的图形,并按步骤一步一步的显示出来,方便操作。

2.4 娱乐

电影、广告、游戏、体育比赛转播中,增强现实技术也得到了广泛的运用。体育比赛中,能够在直播现场实时地插入三维的图形、动画、视频等虚拟的比赛相关信息或广告。日常生活中,出现一种增强现实浏览器,它利用多种传感器将日常需求通过实景与虚景结合后呈现在用户面前,用户可以通过增强现实浏览器看到实景的文字介绍、三维模型等,并可以搜索定位。

3 增强现实相关技术

增强现实系统具有虚实结合、三维注册、实时交互三个特点。三个特点之间紧密联系,要求在合成的场景中虚拟的物体能够拥有真实的存在感和位置感。因此显示技术、定位技术、虚实融合技术、用户交互技术是实现增强现实系统的基础支撑技术。

3.1 显示技术

理想的AR系统的显示器具有体积小、移动方便、图像绘制清晰、交互自然等特点,但是目前仍不能制造出完成符合这些特点的显示器。常用的显示设备可以分为四类:普通液晶现实器;头戴式显示器;手持式显示器;投影式显示器。

液晶显示器是最为常见,也最容易得到的显示设备。但是液晶显示器体积较大,移动不方便,限制了用户的活动范围。头戴式显示器,佩戴于用户的头部,这种显示器本身提供了一路或两路摄像机,采用视频合成技术,为用户提供场景的显示。但是头戴式显示器在户外长时间佩戴很不舒服,因此也不能为用户广泛接受。手持式显示器,较头戴式显示器稍有改进,但是也限制了用户手部的活动。投影式显示器能够将场景投影到较大范围的环境中,位置固定,适合于室内的AR系统。

3.2 定位技术

增强现实系统需要将虚拟的物体准确地放置到真实的场景中,因此定位技术显得尤为重要。目前的定位技术主要分为两种:一种是基于硬件的定位技术;一种是基于计算机视觉技术的定位技术。

基于硬件的定位技术一般使用硬件设备定位,主要包括:全球卫星定位系统、测距仪、导航仪、机械装置等。

基于计算机视觉的定位技术一般是从真实场景中获得一幅或多幅图像,根据图像中的信息,计算出摄像机和图形中物体的相对信息,最终恢复出三维场景的结构,从而达到定位的目的。

基于计算机视觉的定位技术主要包括以下几种:

(1)单视图法:在一幅图像中找到六个以上特征点进行跟踪,通过已知的特征点的三维坐标和其成像坐标进行定位。

(2)多视图法:从多个角度拍摄场景,根据常用的角点检测法,检测多幅图像的角点并进行匹配,从而计算出真实场景中物体的景深,最终实现定位。

(3)运动目标的序列图像:根据序列图像估算运动目标的各项参数。

(4)模板匹配法:从多个视角出发寻找真实图像中的物体作为模板数字化图像,继而将虚拟物体叠加到真实场景。

3.3 虚实融合技术

增强现实技术中的虚拟融合主要指虚拟物体在真实场景中的配准,以及虚拟物体与真实场景的一致性。

在增强现实系统的实现过程中,一致性是一个关键性问题。虚实融合的一致性包括动态一致性和静态一致性。其中,动态一致性通常指场景的实时绘制,跟踪过程中虚拟物体和真实场景的空间位置的一致性等;静态一致性通常指虚拟物体与真实场景外观的一致性变化等。

另一方面,为了实现很好的虚实融合效果,必须对拍摄真实场景的相机进行标定,并与绘制虚拟物体的虚拟相机参数进行匹配。摄像机标定主要是对摄像机的内外参数的确定。目前,摄像机标定技术已经较为成熟,主要可以分为三类:传统的标定法,如张正友标定法;自标定法,如基于Kruppa方程的自标定法;基于主动视觉的标定法,如基于射影重建的标定法。三类标定法各有利弊,并没有一种可以普遍适用,因此摄像机标定技术仍是一个研究重点。

3.4 用户交互技术

人们总是向往能够使用自然的方式和虚拟的物体交互,但这是十分困难的,增强现实系统根据跟踪定位获得的有关真实场景的信息对虚拟物体发出指令。目前,交互技术主要使用以下三种方式:

(1)在场景中选择一个或多个特征点作为标记点,这是增强现实系统中最基本的交互方式。

(2)使用计算机识别出人或物体的姿态,进而交互操作。

(3)制作特殊工具,能够通过按键等简单方式触发事件。

4 结束语

本文总结了现阶段增强现实技术的应用领域,并对其涉及到的关键技术进行了阐述。增强现实技术作为一个多学科交叉的研究领域,必将飞速发展,更多的融入到我们的生活中。

参考文献:

[1]纪庆革,潘志庚,李祥晨.虚拟现实在体育体育仿真中的应用综述[J].计算机辅助设计与图形学学报,2003,15(11):1333-1338.

[2]陈靖,王涌天,闫达远.增强现实系统及其应用[J].计算机工程与应用,2001,15:72-75.

[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.

第9篇:计算机视觉的基本技术范文

关键词:解析几何 代数方程 计算机绘图 人C交互 教学实验

一、解析几何与线性代数课程教学内容的现状和历史

解析几何主要内容是用向量代数方法研究二、三维空间内曲线、曲面的几何问题。向量代数方法主要是一、二次的代数方程与线性方程组。从现在一些高校使用的教材可也看到,解析几何与线性代数课程[1][2]的合并(或集成)为一门课占有不小的比例。下面相关教材的信息统计,可以获知这些变化。工科与理科专业使用教材的情况:工科专业使用的教材《线性代数与解析几何》 (网络检索结果约500,000个)或 《线性代数与空间解析几何》(网络检索结果约562,000个)的主要章节为:行列式及其计算,向量代数,平面与直线,平面与直线,矩阵及其运算,n维向量与线性方程组,特征值与特征向量,二次型与二次曲面,线性代数与空间解析几何的应用模型。工科专业使用的教材《线性代数》(网络检索结果约686,000个)。使用这两类教材的比例约为562s686。理科专业使用的教材《高等代数与解析几何》(网络检索结果约19,400个)的主要章节为:多项式,行列式,矩阵,线性空间,线性变换, Euclid 空间,双线性函数与二次型。理科专业使用的教材《空间解析几何》(网络检索结果约49,200个)。使用这两类教材的比例约为194:492。从教材和课程内容,我们看到二次曲面与线性代数在其中扮演重要角色。把高等代数与解析几何合并成一门课具有其内在的合理性,但是,解析几何范围内的几何问题包括除了圆锥曲线(Conic Sections)和二次曲面性质与图形之外,还有其他的曲线、曲面。这些曲线和曲面大量地出现不同的科学、工程领域中。例如螺旋线、环面。对于这些曲线和曲面,线性代数方法很难处理。同时,按目前的信息与计算科学的解析几何课程教学计划学时,学生系统地学习解析几何比较困难。我们希望了解和认识一门课程的内涵,也就必须认识它的发展史。解析几何的创立得益于代数学的飞速发展,17世纪笛卡尔[3]引进坐标系后,一大类几何图形和代数方程成为等价的事物。把图形转换为代数方程描述的数与数的关系来研究的方法就称为解析几何。1874年,美国翻译出版的法国学者J.B.BIOT的解析几何教材:《AN ELEMENTARY TREATISE ON ANALYTICAL GEOMETRY》[4],其中没有出现行列式与矩阵等线性代数的主要方法。1902年,David Hilbert 的几何基础[5]出版了。100多年后,北京师范大学出版社在1984年出版了朱鼎勋与陈绍菱的解析几何教材《空间解析几何学》[6]。这是一本解析几何课程的典型教材。其中主要的方法是向量代数、坐标变换与二次型。传统的数学课程体系中(包括工学数学课程体系),将解析几何单独列为一门课程(或一些独立的章节),主要讲述空间图形(包括空间直线、平面和二次曲面)的代数处理方法。其实,解析几何本身与线性代数有着深刻的内在联系,例如,空间直线和平面都是由线性方程组来表示的,二次曲面的分类其实就是二次形的标准形问题。所以将这些内容加入到高等代数中来,不但节省了大量的时间,而且对学生加深两门课程的理解也是非常有益的[1]。

二、解析几何的现代化与应用前沿以及课程的教学实验

1963年,伊凡・苏泽兰(Ivan Sutherland)在麻省理工学院发表了名为《画板》的博士论文[7],它标志着计算机图形学的正式诞生。至今已有五十多年的历史。使用计算机处理三维空间的曲线与曲面的显示与人机关系。它可以研究大量的复杂方程的曲线与曲面的性质以及它们之间的关系。在解析几何课程教学方面,计算机作图确实可以增加学生的对非二次曲面几何的直观理解,极大地提高了教学的效率,以及学生直观地理解复杂曲线、曲面。例如用某种计算机语言,计算、绘制一个旋转的椭圆抛物面。如果用z=x^2+y^2形式的方程,编写程序:

x=[-10:0.1:10];y=[-10:0.1:10];[X,Y]=meshgrid(x,y);Z=X.^2+Y.^2 ;

plot3(X,Y,Z)

画出来的立体图上的网格是分别按x、y的参数值的变化生成的图(1)。同样的方法,编写程序:

x=[-10:0.2:10];y=[-10:0.2:10];[X,Y]=meshgrid(x,y);Z=X.^2-Y.^2;

plot3(X,Y,Z)

画出的方程为z=x^2-y^2的双曲抛物面上的网格是分别按x、y的参数值的变化生成的图(2)。

不仅仅如此,计算机作图是对解析几何的传统教学方法、手段的重大改进,还克服了复杂曲面曲线无法绘制的寰场H绻仅仅认识到利用计算软件绘制曲线与曲面,可以比较直观的看到曲面的一些基本性质,例如:对称性,有界性,边界等,那实质上还是辅助教学,教学的内容没有进化与更新,也就是给定了曲面的方程,然后计算、绘制该曲面的3维图像,那是远远不够的。一方面计算机绘图渗透到了解析几何课程的教学中,另一方面更重要的发展是三维空间中的曲面、曲线已深入到了可以直观展示不同学科领域的现象、性质与规律。例如,近二、三十年,计算机计算速度的大幅提高,曲线、曲面的计算已经有了相当的发展。最初的3D动画、3D电影,现在的3D打印、3D重构已经深入到科学研究、工程设计以及日常生活中,这些新应用、新技术、新理论还在不断地进化。这些都依赖曲线、曲面的计算与测量。一般情形是曲面并不都是教材中的二次曲面。测量方法有无线电、激光等电学、光学设备,例如:照相机、摄像机、雷达等。特别是在计算机视觉[8]方面, 3D重构[9]的发展对三维空间的曲面、曲线的计算提出更高的要求,计算机视觉是计算机图形学的反向计算。计算机图形学是从3维对象测量计算获得图像数据,而计算机视觉通常是从图像数据通过计算获得观测对象的3维图形,也有这两种方法的结合趋势,例如:在增强现实技术中,就是在屏幕上把虚拟世界套在现实世界并进行互动。

1.解析几何中,n次曲线、曲面在笛卡尔坐标系下的3维计算的手段是n次代数方程,笛卡尔坐标系与代数方程构成了这类3维计算的基础。 笛卡尔坐标系与代数方程帮助我们充分认识了二次曲线与曲面。例如:图(1)与图(2)就是使用了笛卡尔坐标系与椭圆抛物面方程x2+y2-z=0、双曲抛物面方程x2-y2-z=0,通过计算给出的这两类曲面的视图。

2.在工程与其他科技领域,等高线图可以表示观测对象特定数据的3维图。这一类曲面一般不能由代数方程来表示。例如:陆地的海拔等高线地图,规则物体或流体的温度分布图,某区域的大气的水汽分布图,运动物体的GPS轨迹图。等高线图实质上是一张关于某种特定数据的照片,形式上等同于图(1)与图(2)。这类图都是通过对观测对象进行测量而获得的某种特定数据对应的三维空间的曲线与曲面图。这些曲线与曲面没有对应的方程,都用离散的二维数据来表示,并存储为一张数字照片。

3.观测对象的3D重构是从一些二维数据照片通过计算得到其他若干个笛卡尔坐标系下的二维数据照片。

1)如果已知曲线、曲面在一个笛卡尔坐标系内的代数方程,那么通过不同笛卡尔坐标系之间的坐标变换,能够确定地计算曲线与曲面的新代数方程。

2)如果已知曲线、曲面在一个笛卡尔坐标系内的等高线图,同样的方法可以得到新笛卡尔坐标系下的二维数据照片。

3)如果已知曲线、曲面在一个笛卡尔坐标系内的其他类型的二维数据照片(例如:一般的相机照片),如何得到新笛卡尔坐标系下的二维数据照片?这部分内容正是计算机视觉研究的核心内容之一。我们指导学生在这个方面做了一些试验与计算。下面简单介绍一下实验的基本方法与实验的结果。在对物体进行拍摄后得到的相片中,由于物体表面几何形态、点光源位置、光强等因数的改变会导致物体表面反射光路的改变与反射光光强的变化,照片中拍摄对象的明暗关系都会发生变化。我们可以根据光源与物体表面的关系(包括理想反射面与一般反射面的成像理论,点光源与反射面亮度的关系),得到点光源下理想表面反射成像的规律。控制其中一个或多个影响物体表面成像的重要参数,改变点光源位置等,拍摄观测对象,利用软件读取照片,用给定的光反射模型进行计算,可以得到观测对象的一个完整的表面的三维数值图像。下图(6)(7)是试验中拍摄的倾斜纸板照片与计算得到的三维数值图像。

三、解析几何教学实验的一些体会

解析几何课程本着联系实际科技应用与科学前沿[10],拓展教学内容,开阔视野的目标,把计算机图形学与“3D计算”的思想、方法与实践引入。我们可以在教学过程使用计算机与显示设备,一方面,在三维空间中,把复杂代数方程对应的图像的基本性质比较直观地显示出来。另一方面,认识到三维数值图像在计算机视觉等高新科技领域的重要应用。通过这一方面的教学与实践,让学生认识到不仅仅方程的计算与推理可以分析曲线、曲面的性质,还可以通过适当的计算也可以分析曲线、曲面的性质。进一步,认识到计算机的计算能力与显示同样能够证实曲线、曲面的特征。即基于适度的基本编程的人机交互[7]来学习曲线、曲面的基本规律。上文列举了的解析几何与计算机相结合的例子,通过使用这种更简洁易懂,同时更加现代化的解题办法,真正实现数学与计算机的结合,使得解析几何这门学科具有新的生命力。

参考文献:

[1] 孟道骥. 一门“国家精品课程”的建设-南开大学“高等代数与解析几何”课程[J]. 高等数学研究, 2005,8(3).

[2] 冯良贵,戴清平,谢瑞强,李超,陈挚. 国防科技大学“线性代数与解析缀巍笨纬探ㄉ璧奶厣[J]. 大学数学,2009,(6)25.

[3] R.Descartes.The Geometry of René Descartes [M].Translated by David Eugene Smith and L. MaricaLatham,Dover Publications, Inc. 1954.

[4] D.Hilbert. Foundations of Geometry[M]. Authorized by translation by E.J.Townsend, 1902.

[5] J.B.Biot. An Elementary Treatise on Analytical Geometry[M]. Cadets of the Virginia Military Institute at Lexington VA, 1874.

[6] 朱鼎勋,陈绍菱.空间解析几何学[M].北京师范大学出版社,1984.

[7] I.Sutherland.Sketchpad:A Man-Machine Graphical Communication System[D].Mass-

achusetts Institute of Technology, 1963.

[8] O.Faugeras. Three-Dimensional Computer Vision : A Geometric Viewpoint[M]. MIT Press, 1993.

[9] U. C. Pati. 3-D Surface Geometry and Reconstruction:Developing Concepts and Ap-