前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的作用主题范文,仅供参考,欢迎阅读并收藏。
关键词:计算机辅助语言教学;网络;教师合作
计算机辅助语言教学是以校园网和互联网所提供的多媒体环境为背景和素材,将计算机和网络等现代信息技术整合到英语教学中,利用网络优势把英语教学移植到校同网和互联网上进行的新型教学模式。利用网络辅助英语教学确实有着传统教学所不可比拟的优越性,然而我们也不能忽视在这种教学模式中所存在的问题。
一、计算机辅助语言教学的优越性
利用计算机辅助语言教学,教学内容丰富多彩,教学手法多种多样,使得学生能在轻松愉快的环境下自主地学习,极大提高了学生的学习兴趣。教师可以充分利用计算机和网络的强大的多媒体播放功能,不仅把原汁原味的带入了课堂,让学生们始终沉浸在英语环境中,而且能为学生们提供了丰富的图、文并茂的学习资料,使学生们在较短的时间内接受大量的信息,增加教学容量,拓宽学生的知识面。运用多媒体网络组织教学,可以使学生在学习目标的指引下,进行自主学习。在这个过程中,学生是教学的中心,教师在整个教学过程中起组织者、指导者、帮助者和促进者的作用,利用情境、协作、会话等学习环境要素去充分发挥学生的主动性、积极性和首创精神,最终达到使学生有效地实现对当前所学知识的意义建构的目的。
二、计算机辅助语言教学中存在的问题
1.因教师操作技能欠缺或设备故障而影响教学。计算机辅助语言教学对教师的计算机水平提出了更高的要求,而大多数英语教师的计算机水平只是停留在简单的课件制作和基本的上网查找资料等方面,然而一旦计算机出了问题,很多教师无法解决,无形中浪费了很多时间。特别是在上课的时候,电脑突然出了问题而导致课程无法进行的事情频频出现,更是让学生对课程失去兴趣。原本是希望用现代科技来辅助课堂,可反而却因为对技术掌握不成熟而导致课堂的失败,让很多老师,特别是年龄偏大的老师感觉无所适从。
2.计算机的作用没有得到充分的发挥。王莹等于1999年在苏皖两省、马俊波2001年在湖北进行的调查发现,计算机辅助语言教学并没有得到深入人心的发展,多媒体多数时候只起到了显示屏的作用,网络和网络教室也没有物尽其用,传统教学模式依然占主导地位。有很多教师上课已经变成了课件播放和朗读,而且内容枯燥死板,就只是简单的知识点的罗列,说简单点就是把黑板变成大屏幕,只用在电脑上输入一次,以后都不需要在黑板上写字。这虽然节约了不少课堂时间,但长期下来,学生无法接受这么大的信息量,慢慢就会失去了学习的兴趣。
3.对网络自主学习缺乏必要的引导。计算机辅助语言教学中的“辅助”说明,“教育原则永远主宰着技术的使用,网络多媒体技术无法动摇教师的主导作用”。在英语网络课堂中,学生的自主学习是很重要的一部分。教师把网络上的信息与课本知识结合起来,搭建一个学生自主学习的平台,让学生花课外的时间去学习,教师则是作为一个监督者,在这个过程中,教师仍然起着主导性的作用。可是往往一个教师所负责的是好几百学生,要在网上搜集资料,布置作业,检查学生学习情况,分析学习成果往往需要花费大量的时间。学生对于自主学习还不是很熟悉,面对大量的信息往往感觉有些迷茫,不知该如何下手,种种问题让老师无法一个个的去解答。长此以往,会让教师感觉到身心疲惫,学生也感觉收获不大,面对这样一个冷冰冰的机器,没有任何人情味可言。而且由于网络教学的普及性,教师除了要进行编写电子教案,制作课件外,资料搜集外,自主学习辅导及成果分析也成了教师份内之事,而且有很多教师每节课做的是相同的工作,这无形之中也给教师增加了更大的负担。
三、利用教师合作来解决计算机辅助语言教学中的问题
1.在计算机技术上互相帮助,取长补短。每个教师的计算机水平不一,而且感兴趣和擅长的方面不同,有的老师比较擅长做课件,有些老师比较会处理表格做数据整理分析,有些对图片、声音和影片的处理剪辑游刃有余。同时查找资料的时候对计算机水平也有一定的要求,有些软件如果用得好就可以对资料搜集起到很大的作用。如果教师能够互相合作,在课件的质量和资料搜集的实用性和广泛性等方面都能够起到很大的作用。
2.集体备课,资源共享。统筹安排一下,让同一课型的老师各自分配一些单元或主题去备课,这样因为相对来说任务较少,老师就可以花更多的精力去把这部分课备好。然后老师们把这些备好的课整合在一起,大家可以共同研究一下哪些课备得好,或者是哪些方面比较突出,哪些地方有待进一步的改进,自己再上课的时候就可以参照别人写的教案,再根据自己的实际安排加以改动。当然也可以一起研究如何能更好的提高学生的兴趣。有些老师用了比较好的方法,也可以跟大家分享一下。这样发挥集体的力量,网络教学的质量肯定会有很大的提高。
3.发挥各自的学科和计算机优势,钻研出自己专长的领域。让不同的老师去负责不同的版块,特别是考虑到个人兴趣,让教师去搜集自己比较感兴趣的方面的资料,这样也不会感觉那么枯燥。而且从网上下载的资料很多都是需要重新整理编排,或者说是需要重新核对的,一个老师下载后再顺便整理,给其他老师共享就会节约很多时间。这样每个老师就有了自己专长的信息版块,同时也可以在建立的资料库中享用别人的资料,这不仅提高了教师的专业素质和非专业素质,也大大提高了网络教学的质量。
(广东农工商职业技术学院,广州 510663)
(Guangdong AIB Polytechnic College,Guangzhou 510663,China)
摘要: 本文就计算机视觉的理论框架进行阐述,对计算机视觉理论框架存在的问题进行分析,提出计算机视觉理论框架的新发展,以确保通过计算机视觉获得的景物信息更加完整。
Abstract: This paper expounds the theory framework of computer vision, analyzes the problems of theory framework of computer vision, and puts forward new development of the theory framework of computer vision to ensure that the scene information obtained through computer vision is more complete.
关键词 : 计算机视觉;理论框架;问题;新发展
Key words: computer vision;theory framework;problems;new development
中图分类号:TP391.4 文献标识码:A
文章编号:1006-4311(2015)02-0209-02
0 引言
在计算机系统中,计算机视觉是通过模拟人类视觉,从而对不同事物进行相关描述,以获得更全面的信息。随着计算机视觉在文字识别、漫步机器人和导航中的成功应用,计算机视觉的理论框架研究显得越来越重要,对于促进我国计算机应用技术水平不断提升具有重要意义。
1 计算机视觉的理论框架
随着计算机视觉的不断研究和总结,从二维景物图像发展到三维景物图像,计算机视觉的理论框架主要有如下三个:
1.1 计算视觉理论框架 在七十年代中期,有关研究人员提出了第一个计算机视觉理论框架,即计算视觉理论,将视觉过程看作是信息处理过程,并将信息处理过程分为三个不同的层次,它们分别是计算理论层次、数据结构层次和硬件实现层次,从而对计算机视觉进行全面分析。根据相关数据和资料显示,视觉是对图像的位置、形状和特征等进行描述,因此,计算理论层成为了研究的重点,进而将视觉过程看作是从二维图像信息中对图像进行重塑,从而将三维物体的形状、位置和空间等反映出来,最终形成三维图像。由此可见,早期的视觉处理是从输入的二维图像中获得二维要素图,即图像中强度变化较强时的位置和几何分布情况、结构等;中期的视觉处理是从二维要素图中获得二点五维图,即以观察者为中心,对表面的法向、深度和不连续的轮廓等进行观测。虽然二点五维包含的深度信息比二维要多,但还不是真正意义上的三维表示,而仅仅是有多个相对独立的视觉模块组成的,在相关研究中被称作是“shape from X”模型,将运动视觉、立体视觉等融入到其中;后期视觉处理是指从二点五维图中获取物体的三维描述,从而将场景中的物体识别处理,确定物体的确切位置和姿态。
1.2 基于知识的视觉理论框架 在计算机视觉理论中,基于知识的视觉理论框架,是围绕感知特征群集来进行相关研究的,从而通过人类感知的经验来描述目标,最终确定物体在场景中的真正位置、形态等。相关研究人员认为,基于知识的视觉理论可以通过知识的引导来直接完成三维重建,以将相对应观察方向保持不变动二维特征称作是非偶然性聚类,而人体中视觉识别发挥重要作用的一种感知组织,通过对非偶然性聚类的检测,可以有效辨别出目标。因此,首先是利用感知组织来提取图像中相对于观察方向大范围变化,并且保持不变的分组和结构等;然后,利用概率排队的方法来进行模型匹配,从而缩小检测空间;最后,通过对观察点的未知求解和寻找模型参数对应关系,使三维模型的投影和图像得到最合适的匹配,最终完成三维重建。
1.3 主动视觉理论框架 第三种计算机视觉理论框架是中东视觉理论矿坑,是根据人类视觉的主动性特征提出的。由于人类视觉会根据自己的意识选择视野范围内所看见的事物的主次,从而移动身体、转向或者改变视角,因此,人们的视觉过程是与所在环境交互感知和动作的过程。在计算机视觉理论框架的主动视觉框架中,视觉行为不需要三维物体的相关精确信息,就可以完成物体重建。主动视觉系统根据所需的物体对象特征、分析结果和当前要求等,通过控制摄像机的相关操作,如取向、位置、焦距等,就可以完成相关处理任务和信息交换。与此同时,主动视觉还可以用改变摄像机的参数和处理摄像后的数据等,使图像的时间、空间和分辨率等发生变化,从而增强图像的感知效果。
2 计算机视觉理论框架存在的问题
现展中,计算机视觉理论框架的提出,是计算机视觉领域研究的重要突破,而在这个发展过程中,存在着如下一些问题,影响计算机视觉理论框架的更完善构建。由于视觉过程是成像过程的逆过程,存在着混合、投影、噪音和畸变等干扰因素,使图像三维重建存在不稳定性和不确定性,因此,从一幅景象到多幅景象的重建存在很多困难,使三维图像的准确性和通用性大大降低。并且,计算视觉理论认为输入是被动的,整个视觉过程自下而上不存在反馈,处理目的没有发生任何改变,因此,对物体的确切位置和形状有一定要求。另外,有关学者提出计算机视觉理论框架没有充分运用知识,对知识表达没有给以高度重视,从而忽略知识推理和知识库的构建,没有对空间约束和场景假设进行充分考虑,从而使场景假设受到局限。并且,没有进行多次的分析和试验,致使计算机视觉理论框架构建存在很多问题。
基于知识的理论框架忽略了计算视觉理论的重要性,认为人类视觉和重建无关,然而,在进行物体尺寸判断、物体距离估算等情况时,光靠识别是不够的,必须要依靠三维重建,才能将物体的确切位置、形状等准确地描述出来。
主动视觉理论没有排除三维重建,通过改变摄像机的参数和角度等,来改变物体空间、时间和分辨率的感知效果,从而对图像出来过程进行相关约束,使很多不稳定和不合适的问题得到有效解决,最终完成三维重建。运用主动视觉理论框架,可以大大降低问题的难度,但主动视觉理论框架仍存在缺乏高层知识指导的问题,导致主动视觉框架还不够完整,使计算机视觉理论框架构建受到一定影响。
3 计算机视觉理论框架构建的新发展
在计算机视觉理论框架的构建过程中,计算视觉理论比较系统地解释了从二维图中获取三维物体形态的方法和可能性,而基于知识的实际理论和主动视觉理论则对计算视觉理论进行了补充和进一步提升。因此,计算机视觉理论框架的新发展,可以以计算视觉理论为主,将基于知识的视觉理论和主动视觉理论结合到一起,从而使计算机视觉系统框架变得更加完善。
在实际应用过程中,将早期视觉处理分为图像分割、图像预处理和二维模式识别等,以对二维图像进行滤波降噪和图像增强等,因此,不需要知识引导和控制视觉目的。在图像分割、二维图像模式识别、中期处理、后期处理和三维模式识别的过程中,没有知识引导和模型匹配,最终得出的图像效果会更好、更完整。在早期视觉处理和后期视觉处理中,二维模式和三维模式的识别,需要根据物体的实际情况来确定,由于特征、模型等各不一样,所以,二维物体和三维物体的描述方式也各不相同。由于二维信息的质量会影响三维信息的效果,因此,在计算机视觉中,二维信息应当给以高度重视。而模型库和视觉目的的应用,为计算机视觉理论框架构建提供了更多的信息。由此可见,在计算机视觉系统中,通过视觉目的来进行物体形象、位置等的输出判断,同时,运用视觉目的可以对图像分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别等进行有效控制,最终使三维重建的图像信息更加完整。
4 结束语
随着高科技信息技术的不断推广,计算机视觉理论框架的研究已经成为目前重点关注对象之一,虽然取得了一定的成绩,但计算机视觉理论框架构建还不够完善。因此,计算机视觉理论框架未来的发展,需要对计算实际理论、基于知识的视觉理论和主动视觉理论进行更深层次的研究,将理论和实践应用紧密结合在一起,从而使计算机视觉理论框架研究的成果可以更加辉煌。
参考文献:
[1]尹宏鹏.基于计算机视觉的运动目标跟踪算法研究[D].重庆大学,2009.
一、计算机视觉检测技术含义
计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。
二、计算机视觉检测的基本原理
要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computer vision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。
作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。
三、亚像素检测技术
随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。
边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。
四、计算机视觉检测技术在机加工零件检测中的应用要素与过程
(一)曲阵CCD相机
面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。
(二)工业定焦镜头
在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。
(三)数字图像采集卡
随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。
(四)标定板
为提高测量精度,需要进行摄像机标定。标定过程中,采用NANO公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。
(五)背光源
背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。
五、结语
随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。
【参考文献】
【关键词】动态图像序列;自动扶梯;客流量;测量
视频处理技术的产生和发展使得其应用范围越来越广泛,在这之中,动态图像序列处理技术因其在监控和管理方面的智能化特点,有着非常广泛的应用前景,其在自动扶梯客流量测量分析方面的应用为保证大型场所中自动扶梯的安全性提供了保障,对其进行研究是有着非常重要的意义的。
一、自动扶梯与其客流量
自动扶梯的定义是,由一台特种结构形式的链式输送机和两台特殊结构型式的胶带输送机所组合而成的,用以在建筑物的不同层高间运载人员上下的一种连续运输机械。其主要部件包括梯级、梯级驱动装置、驱动主机、传动部件、紧张装置、扶手装置、金属结构、梯级导轨、上下盖板、梳齿板、安全装置和电气控制系统等。自动扶梯具有连续性强,运输量大的特点,在人流集中的场所有着广泛的应用,比如在商场、飞机场、火车站、地铁站以及一些大型的娱乐场所中都可以看见人们利用自动扶梯来达到移动的目的。
自动扶梯的工作流程为:自动扶梯的梯级链作为扶梯的核心部件,一系列的梯级与两根牵引链条连接在一起,在按一定线路布置的导轨上运行即形成自动扶梯的梯路。牵引链条绕过上牵引链轮、下张紧装置并通过上、下分支的若干直线、曲线区段构成闭合环路。这一环路的上分支中的各梯级(也就是梯路)应严格保持水平,以供乘客站立。上牵引链轮(也就是主轴)通过减速器等于电动机相连以获得动力。扶梯两旁装有与梯路同步运行的扶手装置,以供乘客扶手之用。扶手装置同样由上述电动机驱动。为了保证自动扶梯乘客的绝对安全,在扶梯的主要部件处还装设多种安全装置,当扶梯有发生意外的倾向时,电气系统能及时的制停扶梯。
自动扶梯作为一种凭借运输带进行人员运输的工具,在大型场所的人员运输方面发挥着不可或缺的作用。当行人在自动扶梯的任意一端踏上梯级,就能被自动带到自动扶梯的另一端。扶梯可以一直保持相同的行走方向,但是绝大多数的自动扶梯可以根据时段和人流的需求,由管理人员对其行走方向进行控制。
自动扶梯在实际应用中,由于乘客自身情况存在差异性,因此并不能保证自动扶梯的每节台阶上都能满足理论上的人数设计,另外,在自动扶梯连续运转时,也不能保证乘客都能准确站在台阶上。因此,自动扶梯的实际运送能力与理论水平还是存在一定的差距。因此,为了保证自动扶梯的安全性,就要采取一定的措施对自动扶梯的客流量进行测量和分析。
二、计算机视觉系统
随着计算机技术的发展,计算机视觉研究的技术也越发成熟,目标检查和跟踪技术作为其中一个十分重要的部分引起了人们的广泛关注。
人类通过多种感觉器官形成对外界环境的感知,而在这些感知信息中,绝大多数的信息都是通过视觉,即通过人眼获得的。视觉作为一种高清晰度的媒介,能够在外界环境中实现信息的获得,还能对获得的信息进行处理、存储和传输。而为了填补智能机器在这个领域中的空白,从而实现捕获图像并对图像的属性进行描述及理解的目的,计算机视觉这门学科便应运而生。
计算机视觉的原理就是利用成像系统来代替视觉器官作为输入手段,利用计算机来代替人脑作为处理和解释的系统,从而使计算机能够实现如人一样的功能,通过视觉上观察到的事物和状况来理解、解释当前的事项,并依据视觉系统观察到的不同状况,自动做出适合当前状况的处理。但是要想达到这个目标,是要经过长久努力的,因此,人们在实现最终目标之前,首先确立了一个中期目标,这个中期目标就是建立起一种视觉系统。此视觉系统能够达到一定程度上的智能化,依据视觉敏感度和反馈完成一定的任务。自主车辆的直觉导航系统就是计算机视觉的一个重要的应用实例,然而,截止目前,还未能实现同人一致的对于任何环境都能进行识别和理解的能力,对于自主导航系统的实现还存在一定的差距。基于此,人们又将研究目标转向了高速公路上的道路跟踪能力,从而实现视觉辅助驾驶系统的开发,避免车辆在行驶的过程中与前方车辆发生碰撞。
需要特别指出的是,在这种计算机视觉系统中,计算机在其中的作用只是代替人脑的作用,但并不代表计算机就一定要按照人类视觉方法来处理视觉信息。计算机在处理视觉信息时,还是应该依据计算机系统本身的特点来进行,但是人类视觉系统作为目前为止人们所知的、功能最为强大和完善的视觉系统,还是应该作为计算机视觉研究的指导方向和启发方向。而这种由计算机信息处理的方法来研究人类视觉并建立起人类视觉的研究,被称为计算视觉,也是计算机研究中一个重要的研究领域。
随着人们逐渐步入信息时代,计算机技术广泛渗透于各个领域。究其原因,主要是因为很多没有经过专业计算机训练的人也要使用计算机,同时,计算机随着科学技术的不断发展,其功能性也在不断地增强。然而,这也相应为计算机的使用带来了一定的弊端,比如,计算机的使用方法也变得越来越复杂,这就在一定程度上导致了人本身的灵活性与计算机使用时的死板要求形成了强烈的反差和矛盾。前者可以通过听觉、视觉等各种感官知觉与外界进行信息交换,还可以通过大脑的处理,用不同的方式传达相同的意义,而计算机却只能依照之前编写的程序语言来运行程序来实现运行的目的。因此,为了能方便更多的人应用复杂的计算机,就必须要通过一些有效的措施来改变从前计算机为主体,人去适应计算机的状况,而应该以人为本,交换主体,让计算机来适应其使用者的需求和习惯,以人的习惯为要求指向,让计算机具有听觉、视觉等能力。同时,计算机还需要具有一定的逻辑推理能力和决策能力。而这种计算机即智能计算机。智能计算机的出现,使计算机的使用更加方便和人性化,以智能计算机为基础的系统也为各个领域的发展带来了巨大的促进作用,替代了很多繁重的工作,提高了工作效率,并且保证了工作人员的作业安全。
同时,在计算机视觉研究领域,运动目标的检测识别和跟踪技术一直都是一个热点问题,其对识别精度和实时性要求更高,其算法的好坏会给结果的稳定性和精准度带来直接的影响。而这些方法的实现都是基于动态图像序列。
三、基于改进型Hausdorff距离的人体检测
自动扶梯客流量的测量工作是极具现实意义的,通过对大型场所内自动扶梯的客流量进行测量,可以有效对客流量进行控制,提高人员和建筑的安全。而测量工作的实现是基于摄像头获得的动态图像序列,并通过序列进而识别出人数和即时速度。为了能够准确识别出自动扶梯上的各个人体,可以采用Hausdorff距离识别方法。这种方法即使在有光线问题或者遮挡问题导致人体特征现象发生时,也能完成对人体的识别。而Hausdorff距离模板又具有适应性强且计算量小的优点。但是在很多应用场合中,一旦被测图像中有些边缘信息消失或者存在大大量与人体特征无关的点时,这种距离模板的匹配就不能达到令人满意的效果。
Hausdorff距离的模板匹配及其缺陷
Hausdorff距离是用来描述两组点集间相似度的量度,是一种集合之间的定义形式。若设A、B为两个有限点集,则Hausdorff距离则可表示为:
H(A,B)=max(h(A,B),h(B,A)) (1)
h(B,A)=max{mina-b} (2)
当Hausdorff距离用于二值模板与图像之间的匹配时,首先要计算这两个二值图像的距离变换。由(2)计算出有向距离,再由(1)得出Hausdorff距离的值,从而判断出匹配情况。但是需要特别指出的是,一旦图像中存在突发的噪声时,Hausdorff距离值也可能变得很大,从而造成目标物体不能被有效检测。另外,当所测目标物因为光线的问题或者遮挡问题只有部分物体特征呈现出来时,Hausdorff距离的值也可能会很大,也就是说目标物体还是得不到检测。
针对以上方法存在的缺陷,为了进一步提高此方法的稳定性,对(2)进行了改进,有相距离表示为:
从而通过对不同区域下的界定就可以有效去除二值匹配过程中干扰因素的影响。
基于滤波的目标预测跟踪
可以采用滤波器进行预测和跟踪匹配位置中心点。此处滤波器将被用于匹配中心点在下一图像中的位置,假设这两个坐标之间不相关,则就可以实现对这两个中心点的分别预测和跟踪,极大提高了算法的执行效率。而在下一帧中检测目标时,就可以缩小搜索范围。这不仅使得该算法的执行速度得到了提高,还使之更适于自动扶梯客流量状况测量的实时操作。
四、结语
自动扶梯客流量的测量对于扶梯的安全使用有着重要的意义,相信随着科学技术的不断发展和科研人员的不懈努力,在不久的将来,一定会出现更为方便、准确的测量方法,并在各个领域上得到有效应用,为计算机视觉系统的发展提供坚实的基础。
参考文献
[1]贤云得.机器视觉[M].北京:科学出版社,2004.
[2]张强.动态图像序列中目标检测与跟踪技术研究[D].华北电力大学,2012.
关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物
中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3
计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。
1 计算机视觉中与摄像机定标解析
计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。
2 传统的摄影机定标方法及应用特点
传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。
2.1 基于3D立体靶标的摄像机定标
这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。
这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。
2.2 基于2D平面靶标的摄像机定标
基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。
这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。
2.3 基于径向约束的摄像机定标
基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。
总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。
3 摄像机自定标方法及其应用特点
摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。
3.1 基于主动视觉的自定标法
目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。
这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。
3.2 基于Kruppa方程的自定标方法
基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。
这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。
3.3 分层逐步定标法
分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。
这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。
3.4 基于二次曲面的自定标方法
基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。
在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。
4 传统摄像机定标方法与自定标方法优缺点分析
从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。
4.1 传统的摄像机定标方法弊端
传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。
总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。
4.2 摄像机自定标方法相关问题
目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。
5 结束语
随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。
参考文献
[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.
[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.
[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.
[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.
[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.
[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.
[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.
[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.
【关键词】平面测量技术;铅球项目;成绩测量
0 引言
随着计算机处理能力的提高和传感器技术的发展,近年来基于视频图像处理的计算机视觉技术已成为图像处理领域的研究热点,该技术在众多的领域中都有十分广泛的应用[1]。
视觉是人类认识世界、观察世界的重要手段。人类从外界获取的信息量约有 75%来自视觉系统,这表明视觉信息量十分巨大以及人类对视觉信息有较高的利用率。人类利用视觉的过程可看作是一个从感觉到知觉的复杂过程,即从感受到的对三维世界的投影图像到依据投影图像去认知三维世界的内容和含义[2]。
计算机视觉技术是指利用计算机实现人的视觉功能,既对客观世界的三维场景的识别、感知和理解。该技术包括是仿生学方法及工程方法,仿生学方法是模仿人类视觉功能的结构及原理,建立相应的处理系统,完成类似的工作和功能;工程方法是从分析人类视觉系统着手,并采用任何现有的可行手段实现人类视觉系统的功能[3],该方法的特点是只关心系统的输入和输出。计算机视觉的主要研究目标是建成计算机视觉系统,完成各种视觉功能。也就是说,即要能借助各种视觉传感器(如 CMOS 摄像器件、CCD等)获取现实世界的图像,而感知和恢复 3D 环境中物体的几何性质、运动情况、姿态结构、相互位置等,并且要对客观场景进行识别、解释、描述、进而做出决断。目前,计算机视觉技术在体育运动中也得到了广泛的应用,利用该技术不仅可以从不同的视角观察运动员的动作,而且能将运动员速度、加速度、所在位置等数据进行量化处理,使体育训练及比赛摆脱依靠传统经验分析及判别的状态,从而进入科学化、数字化的状态,而且还可以完成竞技体育项目的成绩测试[4-5]。
在测试项目中铅球成绩的测量仍采用皮尺丈量法。这种方法存在着三个方面的缺陷,一是皮尺本身具有弹性以及易折叠特性,二是受场地的凹凸不平,三是人为因素影响较大。由于这三方面的作用, 故在铅球成绩的测量精确度受到极大的限制。针对这一问题本课题提出了一种基于同视场(铅球场地)测量地平面坐标的单摄像机模型[6-7]。该模型利用透视投影几何关系,对摄像机内部参数进行标定,然后,建立相应的网格匹配数学模型,通过单目CCD摄像机像面坐标,测量铅球落点的地平面坐标[8]。成功的解决了铅球着点测量在双目视觉交汇组合测量存在的死角影响系统的测量范围的问题,另外,单目视觉测量系统也避免了双目视觉系统存在对应特征点匹配问题。
1 平面测量原理
图1 铅球的2D场景坐标系
铅球场地是一个扇形区域(如图1)。假设建立一个如图1的2D场景坐标系,首先要做的事是要确定场地上指定点的真实坐标与采集到的图片的指定点象素坐标之间的对应关系,即要找到这两种坐标系之间的转换关系。而这种转换关系可以用平面测量的相关技术获得。在计算机视觉中,所谓的平面测量,就是从图像中获得2D场景信息。在实际的测量中,我们可以通过在图像上标定一定数量的坐标点来确定图像中场地指定点的象素坐标和真实世界中的指定点的现实坐标之间的单应矩阵。
我们获取一幅2D场景S的图像I,通过S与I之间的N(N>=4)对对应点,就可以确定它们之间的单应矩阵H。
令:
H=h■,h■,h■=h■,h■,h■h■,h■,h■h■,h■,h■(1)
在H的九个元素中,有八个独立比率,即一个单应有八个自由度变量,一个常数1。因此,在H中,往往设置h■=1。
令(x■,y■)∈I,x■■,y■■∈S为一对对应点,i=1,2,…N。由每一对对应点,根据图像与场景之间的单应关系,我们可以得到两个线性方程:
其中,h是矩阵H的向量形式,
于是我们可以得到2N个方程,写成矩阵形式为:
AH=0(3)
其中
因此,要求得8个参数的单应矩阵,至少需要4个对应点。在实际的测量中,为了提高精度,每个模板平面上提供的对应点数目都会超过4个。
当N>4时,我们可以用奇异值分解法(SVD)[14]求最小二乘解h。
求得单应矩阵后,利用公式(2),就可以计算出图像上指定点对应的真实坐标值,从而计算出铅球投掷的距离。
2 实验结果与分析
表1
2.1 实验结论(下转第38页)
(上接第21页)经实际测量的6个标定点(如图1)的坐标分别为A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639) 。为了测试本文提出的测量模型,在反复测量铅球投掷实验中选取了典型的10个测试样本,其中铅球落点10个。
2.2 误差分析
从表1中我们可以看到人工测量值和系统测量值有一定的误差,分析误差产生的原因有如下几种:
1)数字 CCD 镜头的光学性能引起的误差,如焦距、畸变和光学中心误差等通过摄像机内部参数校正来解决。
2)摄像机的支架及底座一定要有足够的稳定性和刚度,在视频图像获取过程中应保证摄像机的相对位置稳定不动,由意外情况所造成的误差在计算中应予以剔除。
3)环境的变化将对测量结果产生影响,因此测量中要及时修正背景图像。
4)人工测量本身就会与真实值产生一定的误差。
3 总结
本论文首先介绍了课题背景,对单目视觉测量的研究现状和测量建模在国内外的研究现状进行了分析和归纳,同时分析了视频图像处理技术在体育项目应用现状,将基于单目视频图像处理技术的铅球成绩测量作为切入点,对数字图像处理技术在田径运动中应用的关键技术进行了研究。结合铅球场地的特点,提出一种基于视频图像的铅球测量方法,并通过实际应用证明了该方法的可行性。
【参考文献】
[1]Criminisi A,Reid I,Zisserman A. A plane measuring device[J].Image and VisionComputing,1999,17(8), 625-634.
[2]Lorenzo Bruzzone, Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).
[3]L Sajó, Z Ruttkay, A Fazekas. Turk-2, a multi-modal chess player[J]. International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.
[4]Lichtenberg, D.B., Wills, J.G., Maximizing the range of the shot-put[J]. American Journal of Physics,1978,46:546-549.
[5]Maheras, A.V.. The relationship between the angle of release and the velocity of release in the shot-put, and the application of a theoretical model to estimate the optimum angle of release (throwing)[D].University of Kansas., 1995.
[6]Antonio Plaza, Jon Atli Benediktsson, Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment,2009,9,113(1):S110-S112.
关键词:果品;无损检测;品质
我国水果产量居世界第一,果品出口成为我国外贸的重要组成部分。但是我国大多数农产品国际市场竞争力弱,出口价格低廉。其中品质因素是重要原因之一,这是由于检测技术、评判标准等限制,所以对果品进行合适的品质检测对提高经济效益和市场竞争力具有重要意义。对农产品品质的无损检测,已引起国内外广泛关注。
所谓无损检测,又称非破坏检测,是不破坏被检对象却能评价其品质的方法。它利用自身力学、光学、电学及声学等物理性质对评价对象品质进行非破坏检测,并按照一定标准进行分级分选的新兴技术,广泛应用于工业和农业。农业中的无损检测技术是利用农产品的物理性质如光学性质、声学性质、电磁学性质和热学性质等的变化而实现。目前,无损检测技术主要包括:近红外技术、声学检测技术、软X射线技术、计算机视觉技术、核磁共振检测技术、力学特性检测技术等。
1.果品无损检测技术
1.1新型可见、近红外光谱无损检测技术
可见、近红外光谱法是农产品内部成分无损检测的有效方法,是利用农产品吸收、散射、反射和透射光的特性,进而确定内部成分的方法。近红外分析技术作为一种高新分析技术,能改造我国传统农业,提高农产品质量,尤其是农产品加工的质量控制,将产生巨大作用。为改造我国的传统行业,企业迫切需要对原料进行质量监测、生产过程监控的设备和技术。国际经验来看,近红外技术是首选。
韩东海等[1]利用柑橘正常及损伤部位在紫外光源下的差异发射性,可有效确定柑橘损伤果。Slaugther DC[2]鉴于近红外和可见光的分光光度技术,建立完好的桃及油桃内部品质的无损关系式,能够预测完好无损的桃与油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通过研究近红外光谱和可见光谱对红玉苹果质量的无损测量,进而得到双叉光纤记录的反射光谱与苹果参数之间的关系。Ali Moghimi[4]等用近红外光谱技术结合化学计量学建立猕猴桃SSC和pH的校正模型,比较多元散射校正、变量标准化、中值滤波和一阶导数光谱预处理对所建猕猴桃SSC和pH校正模型的影响,表明变量标准化结合中值滤波和一阶倒数预处理光谱后,用PCR-PLS法建立的SSC和pH的校正模型精度较高。
目前,分光检测技术在果蔬品质检测中的应用广泛,因为这种方法具有适应性强、高检测灵敏度、人体无害性、灵活使用性、成本低廉和自动化易实现性等优势。利用这种技术能自动分级果品,而合理的分级标准,便于果品深加工和远销售。近红外光谱的研究虽起步较晚,但是其应用广,特别是在农产品的品质检测和分级领域取得较大的进展,开发应用前景广阔。
1.2声学无损检测技术
声学无损检测技术是利用果品声学特性与内部组织变化的关系,例如结构、成分、物理状态等物化特性信息来检测果品品质。声学特性是指在声波作用下农产品的反射、散射和吸收特性、衰减系数和传播速度及其本身的声阻抗与固有频率等,它们均反映声波与农产品相互作用的规律,这些特性随农产品内部组织变化而变化。一般使用低能超声波来检测,因为低能超声波在被检测物中传播不会引起物理或化学特性变化。超声方法检测果品品质始于近年,国内外研究集中针对水果成熟度、硬度和内部质量缺陷等无损检测。
与光学、电学及其他无损检测技术相比,声学无损检测技术具有适应性强、投资较低、操作简便快捷等有死,特别适用于在线检测,在农产品检测领域应用前景良好[5]。
1.3软X射线技术
适用性极强的X射线成像能够与图像识别、人工智能、现代通信技术等相联系。若待检测物体的密度和厚度不同,则不同的透射X射线量产生。鉴于分析穿透量,进而判断果品内部品质。软X射线拥有巨大优势,特别是在农产品的内部品质检测上,因软X射线具有穿透物料的特性,所以检测那种易损坏的农产品,能无损检测内部的品质。所需X射线强度方面,农产品检测弱于工业,所以称为低能X射线或软X射线。这种X射线成像技术来检测农产品内部品质方法已经受到研究者关注,例如基于X射线成像技术的检测核桃果核与果肉厚度,基于X射线图像的评价牛肉嫩度,以及评价红毛丹内部品质等。韩东海[6]用X射线来检测柑橘皱皮果,结果表明射线与激光分析法在果实品质检测中的可行性。然而目前国内此方面的技术开发较落后,期待学者们进一步的研究和探索。
1.4计算机视觉技术
伴随专业化的图像处理技术以及下降的计算机硬件成本和高速度特性,计算机视觉技术对农产品品质自动识别和分级的应用日益广泛。计算机视觉技术即以各种成象系统代替视觉器官作为输入敏感手段,借助于计算机替代大脑完成处理和解释。计算机视觉的最终研究目标是使计算机可以像人一样,通过视觉观察来理解世界,具有自主适应环境的能力。
基于机器视觉的果品无损检测的技术,一般是借助于CCD摄像头获取果品图像,图像信息输入计算机,进而应用检测方法和算法得到果品在大小、缺陷、外部损伤、内部品质等方面的特质值,从而来分级果品[7]。这种方法通常是由CCD摄像头、配备图像采集卡的计算机、光照系统和专用图像处理软件组成。在一定光源照射情况下,利用CCD摄像头得到水果形状、颜色、缺陷等视觉方面的图像信息,凭借图像采集卡转换为数字信号传输到电脑,分隔图像、提取特征值,从而得到特征值参数和水果颜色、质量状况、破损程度等品质指标间模型关系,进而确定内外品质等级。这种方法快速、准确、无损,使用一次能同时检测多项品质指标,方便设计自动分级流水线,自动识别水果外在品质(外形、缺陷、颜色、大小等)和内在品质(成熟度、坚实度、含糖量、含水率等),因此具有广阔的应用前景[8]。
我国利用计算机视觉系统,检测农产品品质和分类农产品的研究方法开展较晚,始于20世纪90年代,但逐渐受到重视。与国际先进水平相比,在农业领域的应用我国计算机视觉技术研究具有一定程度的差距,我国目前处于实验研究以及理论探索阶段,实用化和商品化的程度还未达到。这项项目基于数码摄像技术,通过电脑直接处理图像信息,其研发促使使我国获得最快速、最便利的视觉技术。
1.5核磁共振检测技术
1946年,核磁共振现象由美国科学家F.Bloch和E.M.Purcell发现,这一技术广泛应用于研究物质结构。核磁共振可以便利地生成果实内部组织结构的高清图像。方便检测果品压伤、虫害以及成熟度,因此在检测苹果、香蕉糖度等方面潜在价值极高。而那些因采收成熟度而影响品质的品种,鉴于核磁共振技术,能提高收获和运输可靠性。现阶段,这种技术要想真正应用于果品检测和评价果品质量,还存在诸多问题,然而其优势明显,这种技术无疑是一种良好的果品无损检测方法[9]。
1.6力学特性检测技术
基于动力学原理测度农产品硬度的检测方法是力学特性检测技术。采用振动频率分析法以及冲击力检测法,检测果品坚实度来判断果实成熟度。力学特性检测技术方便判断果品的采收期,依照成熟度分级、贮藏果品,确定果品的保鲜期和贮存期。尽管这种技术具有较为坚实的实践应用基础及历史,但介于果品品质和物理参数间的复杂关系,实际应用是一个漫长的研究过程[10]。
关键词:农业机械自动化;技术要点;优化措施
0引言
所谓农业机械自动化技术,指的是将控制论、计算机技术、液气压技术等应用到农业机械的设计当中,使农业机械可以独立完成田间耕作。随着科学技术的不断发展以及为了响应政府高效农业的号召,我国农业正逐步朝着机械自动化的方向发展。农业机械的自动化,不仅能够使劳动的生产效率得到提高,还能减轻农民的劳动强度,并且提高劳动舒适度,在一定程度上缓解农村劳动力短缺的问题。在科技高速发展的今天,世界各国都加大了对农业机械自动化技术的研究。很多科研成果已经从实验室走向了实用阶段。
1农业机械自动化对农村建设的意义
对社会主义新农村进行建设,是我国构建社会主义和谐社会的基本要求。社会主义的和谐与广大农村地区的和谐是不可分割的。虽然从整体上看,社会主义新农村处于较为稳定和谐的状态,但不可否认的是,社会主义新农村的建设也存在着一定的问题。其中,最主要的问题是农民收入过低。因此,我国要大力推行农业机械自动化建设,为减轻农民的劳动强度、提高农民的经济收入提供保障。
2农业机械的分类
通常来说,农业机械是由动力设备和与之配套的农机器具组成的。这两者之间主要是以牵引悬挂或者是半悬挂的方式进行连接。也有的农业机械将这两者制造成一个统一的整体。动力设备和与之配套的农机器具这两者在耕作的过程中,互相配合,缺一不可。
3农业机械自动化发展中存在的问题
我国农业机械技术在发展的过程中,并不是一帆风顺的,而是遇到了很多问题。首先,我国大型农业自动化机械在推广的过程中难度较大。很多农民没有意识到机械化生产的重要性,导致了他们不愿意在农业生产的机械方面进行投入,最终造成了我国大型农业自动化机械供大于求的尴尬。第二,我国的农业机械制造水平较低。与西方国家相比,我国农业机械制造的起步较晚,在很多方面,科技水平还不够成熟。第三,我国对农业机械自动化技术的研究缺乏足够的动力。我国大型农业机械的制造企业,以及科院院所存在着资金不足、科研环境较差的问题。对农业机械进行设计,不仅需要耗费大量的时间和精力,还需要一定的技术条件作为依托。我国大部分科研院所和农业机械制造企业,由于资金不足,并没有完成对实验室的配套建设,使得科研人员在进行工作时困难重重,这一现状也严重影响了科研人员的工作积极性。第四,自动化技术在农业机械的应用中还处于起步阶段。对自动化技术的应用,需要很高的科技水平作为依托,但是我国科技基础薄弱的现实,使自动化技术的应用变得困难。
4农业机械自动化技术要点及优化应用措施
4.1实现计算机技术应用于农业生产
计算机视觉技术,作为新时期重点研究和应用性广泛的新科技,很多西方国家先后展开了对计算机视觉技术的研究。计算机视觉技术在农产品质量的鉴定方面,以及在记录农产品生长的信息等方面有着十分重要的作用。英国对计算机视觉技术的应用进行了首次尝试,利用该技术研制了专业性的采蘑菇机器人。采蘑菇机器人在采蘑菇的过程中,不仅能够对蘑菇的位置进行精准的定位,而且能够对所采的蘑菇进行合理化的分类。受到英国的影响和启发,我国国内也开始尝试在农业机械自动化技术中,加入计算机控制技术的内容。但是由于我国的经济技术发展还不够成熟,要实现对计算机视觉技术的应用,还需要科学家们进行努力。
4.2实现农业施肥和灌溉技术的自动化
我国水资源总量虽然比较大,但是人均资源占有量却很小,而且我国水资源分配的不够合理,使得我国水资源长期处于短缺的状态。要促进农业的发展,充足的水资源是必要的条件。在保证农业生产用水的同时,保证对水资源的节约,是我国农业发展过程中必须要面对的问题。农业自动化灌溉技术的应用可以很好地解决这一问题。所谓农业自动化灌溉技术,是把传感器与电子计算机进行有机结合,把农作物生长过程中对环境的需求及对用水量的需求,通过软件的形式加以呈现,从而避免水资源的浪费。对农业施肥技术来说也是如此,实现农业施肥和灌溉技术的自动化,是节约水资源、降低农业生产成本、避免浪费以及保护环境的必然选择。
4.3实现农业的精准化
农业精准化是指将我国的传统农业与农业机械自动化技术相结合,实现农业生产管理的科技化。精准农业是未来农业发展的主要方向之一。农业生产自动化,是一项以计算机网络和控制器等为基础的技术。我国对精准农业的研究,已经取得了一定的科技成果。世界上第一台观测农业气象的自动化仪器,已经在我国郑州气象站开始投入使用。农业气象观测仪,可以对农业生产的小环境进行合理化监测,并且通过网络把监测到的信息及时反映给当地农业部门。总之,在经济全球化进程不断加快和城市化进程高速发展的今天,给各个行业带来机遇的同时,也带来了挑战。为了在经济发展的大潮中处于不败的地位,加强科技创新是一项必不可少的选择,同时也是长远发展的根本要求。对于农业产业而言,为了使我国农业能够更好更快的发展,政府要提高对农业机械自动化技术研究的投入,并将新的科技成果不断应用到农业生产中。作为科技工作者要努力钻研农业机械自动化技术,并且要对农业机械自动化技术的应用措施进行优化,从而实现农业的智能化时代,创造出我国农科发展的新道路。
参考文献:
[1]刘洋.我国农业机械自动化应用现状和推进模式探讨[J].化工中间体,2015(11):11-19.
[2]罗小锋,刘清民.我国农业机械化与农业现代化协调发展研究[J].中州学刊,2010(02):17-22.
诞生于20世纪40年代的电子计算机是人类最伟大的发明之一。并且一直以飞快的速度发展着。进入21世纪的现代社会,计算机已经进入各个行业,并成为各行业必不可少的工具。如今的计算机发展的更加智能化,就如今来说,人们最什么事情都非常重视信息,人类和社会的发展,时刻都离不开信息。计算机如今重视的方面就是对信息的阅读和控制,人脸检测与识别技术也是应运而生。
人脸识别的论述
人脸识别是人类视觉中的一大特色,因为能对身边的人进行识别,才不会对身边的信息进行混淆,简单来说,根据人脸可以对人的年龄,性别进行初步判断。随着计算机技术的智能化,计算机业已经通过视觉能进行人脸的识别。其中在对人脸识别的同时进行有关信息的收集、识别、提取、变换、存储、传递、处理、检索、检测、分析和利用等技术。如今人脸识别已经应用于很多的领域,但是要人脸检测与识别是需要基于本来已经收集和整理的信息本库才能进行。再加上现在计算机技术虽然已经接近成熟,然而在人脸识别方面的表情传达出什么信息还是无从下手进行编程和设计。所以,基于计算机视觉的人脸检测与识别技术还是会有很广的发展空间,再加上人脸识别还可以维护人们的财产安全和隐私保护,必然会引起社会各界人士的广泛关注。
从19世纪末开始就已经有人对人脸识别进行了研究,因为当时没有先进的科学技术做后盾,所以经过了数百年的研究仍然没有什么显著的进展和成果。直到20世纪90年代人脸识别才成立了自己的学科,在加上当时的科技发展水平已经达到了不错的水平,人脸识别这个学科得到了快速的发展。如今,我国的计算机技术也已经居于世界的前列,我国也已经拥有比较完善的一套东方面孔的人脸数据库。
人脸识别在发展过程中大概经历了三个阶段:第一阶段就是对人脸特征进行整理,整理出所需要的数据库,并且应用当时的计算机技术做出一套质量不错的人脸灰度模型,这个阶段的识别工作全部由操作人员来完成;第二阶段比第一阶段要先进,有了基础人机互交,将人脸的特征经过多维度的矢量在模型上表示出来,并也可以设计出一套人脸识别的系统,这个阶段的识别不再是仅仅依靠操作人员,而是操作者和计算机一起完成;第三个阶段是计算机智能识别的最高峰,一切操作和识别都依靠机器全自动化进行,在人脸识别过程中也不再是每台计算机都需要完成一整套的工作,也实现了计算机与计算机之间的互联,多台计算机一起完成人脸识别的过程,都人力也是一种解放。
积极践行人脸检测识别技术
人脸检测识别技术是计算机实现智能化特征后的又一重要发展方向之一,它已经在世界范围内得到了广泛的普及与应用。人们可以通过人脸识别来进行定位,来起到保护人们财产安全的作用,通过人脸识别来抵制社会中的造假率,之前曾经有一些不法分子利用假身份来做损害公共利益和侵犯人们隐私权的事情,有了人脸识别让不法分子没有可乘之机,也应用人脸识别来对财务密码进行联系,起到对人们的财产有绝对的保护作用,对社会的安定何尝不是一项有意义的发明。
人脸识别一直是计算机智能化发展过程中的一个重要领域,因为人脸的识别与检测是一个很难做到完善的项目,由于人类的面部表情丰富,要对人类的面部表情做出判断和分析会存在一定的困难。再加上人脸识别的过程中,每个独立存在的个体都有一张专属于自己的脸。它的轮廓没有明显的特征界限,同时对眼、鼻子、嘴等器官在脸上的分布情况也没有明确的界限,这就使得对人脸识别来进行算法设计有一定的困难,所以只有通过轮廓特征来进行初步的判断,分辩出各种器官,再根据器官来完成人脸的分布情况设计灰度模型的完成工作。