前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉理论与方法主题范文,仅供参考,欢迎阅读并收藏。
随着计算机技术以及图像处理技术的快速发展,计算机视觉技术作为一种新兴的技术,其被广泛应用在军事、医学、工业以及农业等领域[1]。一般而言,计算机及视觉技术应用在农业的生产前、生产中以及生产后等各个环节,其主要就是鉴别植物种类,分级和检测农产品的品质。计算机视觉相较于人类视觉而言,其具有更多的优点,能够有效提高农业的生产率,实现农业生产与管理的智能化和自动化,促进农业的可持续发展。
一、计算机视觉技术概述
计算机视觉主要是指利用计算机来对图像进行分析,从而控制某种动作或者获取某描述景物的数据,是人工智能与模式识别的重要领域。计算机视觉兴起于20世纪70年代,其涉及的学科范围较为广泛,包括视觉学、CCD技术、自动化、人工智能、模式识别、数字图像处理以及计算机等。就目前而言,计算机视觉技术主要以图像处理技术为核心,是通过计算机视觉模拟人眼,并利用光谱对作物进行近距离拍摄,运用数字图像处理以及人工智能等技术,对图像信息进行分析和研究。计算机视觉技术主要步骤包括采集图像、分割图像、预处理、特征提取、处理和分析提取的特征等[2]。
二、农业机械中计算机视觉技术的应用分析
一般而言,农业机械中计算机视觉技术的应用,主要表现在以下三个方面:一是田间作业机械中的应用;二是农产品加工机械中的应用;三是农产品分选机械中的应用。
(一)田间作业机械中的应用
在田间作业机械中,计算机视觉技术的应用较晚。近年来,由于环境保护政策的提出,在农田作业的播种、植保以及施肥机械中的应用越来越广泛。在田间作业的过程中应用计算机视觉技术时,主要应用在苗木嫁接、田间锄草、农药喷洒、施肥以及播种等方面[3]。为了有效识别杂草,对除草剂进行精确喷洒,相关研究人员分析了美国中西部地区常见的大豆、玉米以及杂草二值图像的形态学特征,发现植物长出后14~23天内能够有效区别双子叶和单子叶的效果,准确率最高达到90%。在1998年开发出Detectspary除草剂喷洒器,其能够有效识别杂草,在休耕季节时,其相较于播撒而言,能够减少19%~60%的除草剂用量。在农业生产中,农药的粗放式喷洒是污染严重,效率低下的环节,为了有效改变这种现状,Giler D.K.等研制出能够精量喷雾成行作物的装置。该系统主要是利用机器视觉导向系统,使喷头能够与每行作物上方进行对准,并结合作物的宽度,对喷头进行自动调节,确保作物的宽度与雾滴分布宽度具有一致性,从而有效节省农药。一般而言,该系统能够促使药量减少66%,提高雾滴沉降效率和施药效率,减少农药对环境产生的影响。
(二)农产品加工机械中的应用
随着信息技术以及计算机技术的快速发展,计算机视觉技术被广泛应用在农产品加工的自动化中。如Jia P等提出了图像处理算法,该算法主要是以鲇鱼水平方向与主轴的形心位置和夹角为依据,检测鲇鱼的方位以及背鳍、腹鳍、头、尾的位置,从而确定最佳的下刀位置。此外,我国的黄星奕等人在研究胚芽米的生产过程时,在不经过染色的情况下,对胚芽米的颜色特性等进行分析,得出胚芽米颜色特征的参数为饱和度S。同时利用计算机视觉系统,自动无损检测胚芽精米的留胚率,其结果与人工评定的结果大体一致。
(三)农产品分选机械中的应用
在分级和鉴定农产品的品质时,可以利用计算机视觉技术对其进行无损检测。一般计算机视觉技术不需对测定对象进行接触,可以直接利用农产品的表面图像,分级和评估其质量,其具有标准统一、识别率高一级效率高等优势。计算机视觉技术在检测农产品时,主要集中在谷物、蔬菜以及水果等方面。Chtioui Y等人提出了结合Rough sets理论,利用计算机视觉技术对蚕豆品质的方法进行评价。该理论通过不同的离散方法对石头、异类蚕豆、过小、破损以及合格等进行有效区分,并利用影色图像,对其特征参数进行分类,最终分类的结果相比于统计分类结果,两者具有较好的一致性。
1.1自动化程度高
计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。
1.2实现无损检测
由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。
1.3稳定的检测精度
设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。
2计算机视觉技术在食品检测中的应用
20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。
2.1计算机视觉技术在果蔬分级中的应用研究
计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。
2.2计算机视觉技术在禽蛋检测中的应用研究
禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。
2.3计算机视觉技术在检测食品中微生物含量的应用研究
计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。
2.4计算机视觉技术在其他食品产业中的应用研究
里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。
3展望
新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。
3.1检测指标有限
计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。
3.2兼容性差
计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。
3.3检测性能受环境制约
【关键词】摄影测量;计算机视觉;数字化
科技迅速发展,摄影测量技术经过多次改革,到目前已经进入数字化的摄影测量技术阶段,这个新技术对整个摄影测量专业理论知识教学、科学研究和企业生产都有重要的影响,这些影响不仅仅是表现在表面,它已经使摄影测量的概念和涉及到的专业的知识都有影响。从测绘学科的角度来说,数字测量技术已经从传统的摄影测量技术发展到现在新型数字化测量技术,简便快捷;从摄影测量学科来说,数字摄影测量技术已经从经典的摄影测量转化到现在与计算机相结合的高科技技术。数字测量技术既给人们带来机遇,又给技术人员带来挑战,但是其在发展中还存在很多问题。作为新时代的我们,应努力抓住机遇,勇敢的面对挑战,提高自身的知识储备量和技术,使自己能在快速发展的经济市场中站住脚步。
一、摄影测量发展现状
由于摄影测量生产的转型,影像扫描仪已被大量地应用,全国扫描仪数量已超过100台。同时航空摄影机(如RC30)也在加速引进。应用于航空摄影过程中的GPS/IMU系统也已引进,Z/I公司的数字航空摄影机DMC已开始在中国应用。与此同时,高分辨率的遥感影像以及其定位参数(RPC)文件的应用,只要极少量的外业控制点,就能迅速生成正射影像图,它已在城市、土地的变迁、规划中得到愈来愈广泛的应用。航空激光扫描Lidar也愈来愈成熟。
由于新一代传感器、定位系统的迅速发展与应用,以及数字摄影测量工作站的发展及其大规模的推广,这样对摄影测量自身发展提出一个非常严峻而又现实的问题:摄影测量向何处去,除了摄影测量与新一代遥感传感器、GIS、GPS 更进一步地结合外, 摄影测量自身从理论到实际将如何发展,还有没有发展前景,在国际上同样对摄影测量发展提出了疑虑,美国Ohio大学Schenk教授在其著作“数字摄影测量学”的序言中指出:摄影测量与猫一样,他们有一个共同的特点,他们都有几次生命,摄影测量的终结已经被多次预测。但是他对此问题作了明确的回答:数字摄影测量是一门相对年轻的、并且迅速发展的学科。它的许多基本概念与方法来自影像处理与计算机视觉。但是不管它们对它的影响有多强烈, 数字摄影测量还是一门有自己特色的学科。
二、数字摄影测量给学科带来的机遇与挑战
摄影测量与遥感是一门“从影像重建被摄物体表面”的学科,摄影测量侧重于重建物体的几何表面,并进行“量测”;而遥感则侧重于重建物体的物理表面,恢复问题表面的物理属性。因此,从本质而言, 摄影测量与遥感是研究影像的获取、理解、加工、处理的科学与技术,使人们更容易直观地理解与应用有关信息。从测绘学科的角度来理解,摄影测量是一门“量测的学科”,著名的摄影测量学者HeIva (1995)就认为“摄影测量的范畴是量测”;而从信息科学和计算机视觉科学来看,它是从影像来重建三维表面模型的科学与技术―计算机立体视觉。但是,人们一般并没有将摄影测量与计算机立体视觉联系在一起。这是由于摄影测量在上世纪摄影技术出现不久就被学者发现其测量功能,并被使用,而计算机立体视觉实在新世纪环境下创造并被使用的,因此摄影测量的历史要比计算机立体视觉的历史长得多,并早已成为测绘产业的重要组成部分;而且,长期以来,摄影测量是依赖于精密的光学机械仪器,特别是在模拟摄影测量时代, 摄影测量以模拟摄影测量仪器为代表, 与计算机没有任何联系。我们必须清楚地认识到,摄影测量发展到今天,已经超越了传统摄影测量的范畴,它已经不属于摄影测量工作者“独家所有”。这是摄影测量工作者面临的最严峻的挑战。
同时,数字摄影测量也为我们带来了发展机遇。在模拟摄影测量时代, 摄影测量的教学、科研以及生产的组织与流程,一切均以模拟摄影测量仪器的制造者为中心。摄影测量仪器的理论、结构,各种控制器、仪器的定向理论与操作方法,变换光束测图的理论等,均以相应的仪器为中心。进人了解析摄影测量时代,由于计算机引人了摄影测量,大大地拓宽了摄影测量教学、科研的领域,这也提供给学者们更多的研究方向。
三、数字近景摄影测量――摄影测量发展的崭新领域
到目前为止数字摄影测量的发展,无论在理论上还是在实际上,,主要还是围绕着利用航空(航天)摄影测量测绘地形图展开的,而对于数字近景(地面)摄影测量的研究甚少。同时随着数码相机的广泛应用,价格愈来愈低廉。数码相机在测量中的应用将是摄影测量发展的必然趋势。
在此领域数字近景摄影测量与计算机视觉有着天然的密切联系,因为计算机视觉的研究目标是使计算机具有通过2维图像认知3维环境信息的能力,这种能力将不仅使机器感知3维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储, 识别与理解,两者之间有很多相似之处,但两者间又有明显的差异。不论差异大小,不可否认的是,数字近景摄影测量已成为数字摄影测量发展的必然趋势。
四、结束语
数字摄影测量在目前还是一个较为年轻的学科,主要采用计算机技术,将获取到到信息数字化,通过计算机进行测绘和分析,提取出对人们有用的信息,这一改变,使数字摄影测量很快被企业所接受并得到快速发展。总而言之,数字摄影测量技术的出现不能仅视为简单的科学进步而已,应该透过现象看本质,深刻认识到他已经从概念开始改变,并影响到科学研究领域,正在逐渐改变企业的生产产品水平。面对这些情况,我们应该努力提高自己的理论知识储备量,提升专业素养,及时抓住一闪而过的机会,迎接各种挑战,在激烈的竞争不断进步。
参考文献
[1] 李利,马颂德. 从2维轮廓线重构3维二次曲面形状[J].计算机学报,1996,19(6):401.
[2] 马颂德,张正友.计算机视觉-计算理论与算法基础[J].北京:科学出版社1998.
关键词:计算机视觉分析;微小尺寸;精密校正;阈值;图像分割
中图分类号:TP274.4
计算机视觉分析理论是基于精密模式识别和人工智能程序化校验技能进行综合整编的方法,利用光学信息对真实物理结构的实时反映,配合人机协调手段进行二维图像的呈现。在工件表面进行质量检测和图片制备要素分析的系统环节中,阐述物体在空间环境之间的关系样式,争取三维场景的科学搭建。集合要素内容包括边缘、线条和曲面的配备,建立以工业部件为中心的坐标体系,并适当运用不同符号表现模式实现必要三维结构和空间关系的调整,促进精密仪器细节检验工作质量的不断提高。
1 计算机视觉检测技术的相关理论研究
1.1 技术原理分析
渗透性计算机辅助支持结构的视觉鉴定技术在被测实体中的图像显示支持功能基础形势上进行质量状况的把控,这其实就是根据既定的偏差标准实现规模物件的逐个排查。细致的检测工作在深度零件的诱导性特征和完整性配件的支持下,对整体完好效果的几何制备模型进行测量[1]。近阶段的视觉规范系统利用电耦合器件和摄像机进行主题元素的捕捉,并利用计算机内部程序的数字信号转化工具实现图像的并行处理。采用目标图像的特殊坐标记录,利用灰度分布图内的多种综合功能处理系统改善的要务。常规视觉下的检测过程相对比较繁琐,主要是将被检测物体放置于照明效果相对均匀的可控制背景环境中,联结CCD技术和图像卡实现被测部件和数字图像的共性要素融合,保证计算机自动化处理程序的录入。当然,这类研究系统是需要利用相关软体进行放大的,其主要必备功能就是进行图像的预处理、识别和有效分析,将整个过程内部的实际结果数值,包括被测部件的自身缺陷、尺寸等进行整理。
1.2 计算机视觉微小尺寸精密检测工业应用技术的现状
在科学设计信息内容和工业加工制备要领集成化对待的环节中,通常不会直接进行部件表面的接触,一般运用计算机程序下的扫描认知和图像即时呈现功能进行快速的比对检测,整体信号抗干扰能力较强,因此在现代工业生产技术领域内部广受好评。电子工业是在建立计算机视觉分析工艺之后表现最为活跃的行业类型,在此基础上衍生的印刷电板路和集成电路芯片就是利用标准模型的整改,实现规模工序的紧密排列。目前,时下流行的汽车生产、纺织、商品包装等也逐渐向这类手段靠拢,全面改善了现代化工业制备的应用效果。
2 应用视觉微小尺寸分析技术内部拓展机能的补充
灰度图像的主要分割方法包括灰度阈值校正、边缘检测制备等手段。
2.1 灰度阈值校正
这是区域分割方法中一种常见的手段,主要配合多个或单个阈值将图像自身的灰度级别划分为几个项目组,对相同像素的单位数据进行整编。根据实效范围进行分类,包括局部和全局阈值探究两种手段,全局规模下的阈值分析方法就是利用整幅图的灰度直方分布图进行内部最优阈值分割,包括单阈值和多阈值两种形式;同时还可以将初始分析的图像进行子元素的拆解,之后利用单个子图像的既定阈值范围进行最优化分割[2]。分割的基本原理公式为:
其中,合理阈值的选取是非常重要的,目前阈值确定的手段主要包括直方图双峰对照法和最大类间方差累积法等。这种利用灰度阈值实现精准质量的划分手段,计算执行工作相对比较简单,并且实际工作效率水平较高,即便是实际需要分割的物体与图像背景对比深度较强也可以收放自如,但唯一的缺点就是缺少对空间信息的掌控,涉及亮度不足的图像问题,这种阈值分割技术的施工质量往往不会太高。
2.2 边缘检测制备工序
图像内部元素的分割其实就是进行部件边界效益的提取,而边缘检测制备工序则是利用像元及邻域的整体状态进行物体边界相关结构的搭建。边缘检测分割制备技术具体包括并行和串行两种模式,并行手法是运用梯度信息的提取实现不同类别算子的整理;串行边界分割原理则是根据适当强度标准和相似走向的两个边缘端点位置实现连接,主要代表算法包括启发式智能搜索手段等。这种串行算法较并行边界积累统计原则来说具有更强的抗干扰能力,但实际的边缘检测同样不能完好地维持连续效果,需要利用其余技术内容进行边缘制备技巧的修复。
(1)原始图像 (2)Robert算子边缘检测 (3)Sobel算子边缘检测
(4)Prewitt算子边缘检测 (5)Kirsch算子边缘检测 (6)Gauss-Laplace算子检测
图1 微小双联齿轮边缘检测
3 视觉检测系统的创新性改进
根据以上现状问题,创新式视觉整改校验系统利用照明光源、摄像机和图像采集卡等结构实现计算机输出结果质量的补充。其主要运行过程如下:利用被测部件在均匀照明背景的全面优化控制基础,实现物体结构的全面清晰呈现,使用摄像机对相关图像信号进行梳理并转化为电荷信号,配合相关的图像资源采集卡进行部件数字化图像的格式转化;计算机内部软体操作程序将得到的数字图像进行处理和识别,并将最终结果数据输出,实现现代工业技术整体质量规模控制的既定要求。
系统硬件在实现部件转化图像信息的环节中,连接检测机理下的连续软件规划和照明光源等相关设备进行图像适当分辨率的调整,维持图像较为清晰的对比效果。全面控制获取数字图像的时间,抵抗不良因素的干扰影响,维持内部成本经济规模的合理控制,促进科技应用和可持续发展经济战略双重价值标准的同步进展。其中,光源设备的选择必须落实到部件既定的几何形状条件下,利用相关性能参数进行实际工作要求的提供,包括光源位置、亮度、寿命特性等因素的堆积,常用的可见光源包括水银灯、荧光灯等,但这类光源使用寿命有限,因此现下多配用LED光源进行快捷反应、小功耗标准的补充,并且长期使用后的照明效果比较稳定[3]。而摄像机等结构主要还是校正参数的表达方式,进行图像合理分辨率的整改,促进图像采集数字化协调功能的发展,提高系统工作速度等。
4 结束语
计算机视觉检测系统在进行一定部件性能评比的活动中有着很高的贡献,不仅配合硬件的照明、参数制备要领制备功能,同时促进数字化图像对比的速度,使得工业生产环节中的部件检查工序得到大范围整改,满足可持续发展战略规模的视觉意义,促进现代智能化分析处理技术的全面覆盖。
参考文献:
[1]陆春梅.基于数字图像处理技术的接杆激光环焊焊缝视觉检测系统研究[D].上海交通大学,2008.
[2]罗敏.基于机器视觉的黑片缺陷检测图像边缘提取算法研究[D].沈阳理工大学,2010.
关键词:农业机械;新技术;发展
1.农业机械新技术的应用和发展的重要性
我国是一个农业大国,农业是我国国民经济的基础,农业机械新技术的应用和发展具有重要的意义。
第一,提高机械的运作效率。目前在农业机械的使用方面,有的机械在使用过程中不能清晰地识别农作物的位置,比如,在收割小麦的过程中,有的小麦受到大风影响产生倒伏,对这些倒伏区域,机械在收割过程中很容易漏掉。所以在农业机械中使用新技术有利于弥补农业机械的漏洞,提高机械的运作效率。
第二,解放劳动力,促进经济发展。农业是一个需要大量年轻劳动力的行业,农业机械新技术的应用有利于实现农业种植、收割的自动化,解放劳动力。这些年轻的劳动力投入到其他的领域,有利于促进我国经济的发展。
2.农业机械新技术的应用
21世纪是个科技迅速翻新的时代,目前农业机械领域的新技术也层出不穷,下面介绍几种最新出现的农业机械新技术。
(1)计算机视觉技术。计算机视觉技术出现于20世纪70年代末,主要利用计算机视觉技术进行农产品品质和农产品等级的检查。计算机视觉是一种以图像处理为基础而兴起的学科,主要对视觉信息处理的计算理论、表达与计算方法进行研究。[1]随着计算机视觉技术应用领域的不断扩展,目前在农业机械生产方面,计算机视觉技术不仅能够用于检查农产品品质和分级,还可以用于播种和收割。但是由于计算机视觉技术在农业机械方面的使用时间比较短,一些技术难题还没有得到解决,所以计算机视觉技术在农业机械方面的应用还需要继续研究。
(2)人工智能技术。随着智能化的发展,智能技术在农业机械方面的应用也得以实现。美国运用人工智能技术发明了激光拖拉机,不仅可以控制拖拉机的行进方向,还能够对拖拉机进行具体的定位。[2]通过人工智能技术,人们建立了一个庞大的数据库,通过这个数据库可以对土地的具体情况进行掌握,以设计出具体的农业生产所需的化肥、种子、农药、水等原料的用量。
(3)机器人技术。比智能化更进步的就是机器人技术,机器人技术在农业机械中的应用,这是计算机信息网络和计算机视觉技术以及自动化控制等技术的结合的产物。目前研发出了除草机器人、播种机器人、浇水机器人、施肥机器人等,利用机器人进行农业生产活动,可以节省人工费用,解放劳动力,避免有些农业生产活动,对人体产生危害。
(4)自动控制技术。在农业机械中运用自动控制技术,可以帮助操作者降低操作难度,同时可以根据地势的高低和秸秆的长短来调节高度,保证机械使用过程中的安全性,提高农业机械使用的可靠性,提高农业生产效率。
3.农业机械新技术的发展
农业机械新技术的应用和发展都是为了提高农业的生产率服务的,所以农业机械新技术的发展主要表现为以下几点:
第一,加速新技术的使用和推广。科学技术是第一生产力,加速计算机视觉技术、自动控制技术、智能化技术等新技术在农业机械中的使用,同时引进国外先进的机械新技术,对推动我国农业的发展,提高农业的生产效率具有重大的意义。
第二,政府补贴。新型机械的购买都是生产个体自行组织的,资金压力大,使得机械新技术难以推广,所以对于农业机械新技术的推广使用,政府要在物质上予以补贴,拓展新机械的使用范围。
第三,提高农业资源利用效率。机械使用的目的就是为了提高农业的生产效率,提高农业资源的利用率。例如,在传统的农业生产过程中,对农作物秸秆的处理方式,绝大多数情况就是焚烧,不仅浪费资源,而且污染空气。但是农业机械新技术的使用通过将农作物的秸秆进行粉碎处理,将农作物秸秆转化为肥料,不仅提高了农作物资源的使用效率,也减小了空气的污染程度。
4.结语
随着科技的发展,计算机视觉技术、自动控制技术、智能化技术等新技术在农业机械方面的应用越来越广,农业机械新技术的应用和推广将大大提高我国农业的生产效率,提高农业资源的利用率,促进国民经济的发展。
参考文献:
[1]田 静.探讨农业机械新技术的应用与发展[J].中国农资,2013(36): 74.
【关键词】 运动目标检测 视频图像 OpenCV
一、绪论
随着计算机技术日新月异的发展,计算机视觉,模式识别,人工智能,多媒体技术,越来越受到人们的重视的快速发展。广泛地被定位对象使用运动跟踪和检测,监测和智能人机交互和分析他们的行为,一旦发现有异常行为的对象,监控系统发出警报,提醒人们注意和及时的治疗,改善人类的人工监督注意力浪费资源等问题。计算机视觉是通过计算机代替人的眼睛和大脑感知外部环境,分析和理解。
1.1 OpenCV技术介绍
视觉处理算法的OpenCV提供了非常丰富的,它部分是用C写的,有它的开源特性,妥善处理,无需添加新的外部支持进行编译和链接,生成程序的完整实现,所以很多人们用它做算术移植,OpenCV的可正常运行的系统DSP和MCU系统正常重写代码。
二、运动目标检测
运动目标的检测在整个视频监控系统的底层,各种高级应用,如目标跟踪,目标分类,目标行为的随访,了解互惠的基础。运动对象检测装置,从在实时目标视频流中提取,目标通常设置面积和颜色特性。结果运动目标检测是描述一些静态功能的“静态”的目标前景。根据上下文,其中环境可分为两大类静态背景下运动目标检测和动态背景运动目标检测,本章与实际纸工作主摄像机静态背景运动目标运动结合,不会发生前景对象的运动目标检测检测算法。
2.1运动目标检测的基本方法
目标检测和提取已在目标跟踪应用程序中的重要地位。目标检测和提取的精度直接影响结果和准确性的跟踪。一个良好的各种环境动目标检测算法的应能适用于监测,在正常情况下,移动体检测算法可以根据场景被监视在室内或室外监测算法被分成室内和室外监视算法,则可以按照使用特定算法的方法分为连续帧差分方法,背景减除法和光流法。
2.1.1帧间差分法
对于许多应用,图像的连续帧之间的差检测出图像的顺序是非常重要的一步。场景中的任何可观察到的运动将反映在场景图像序列的变化,如果能检测到这种变化,我们可以分析的运动特性。
2.1.2背景差法
基于该原理的背景差分方法非常简单,基本操作过程示于(4.2)如下:首先使用式(4.3)来计算背景图像之间的差fbk当前帧fk,然后根据下式(4.4)是差分图像的Dk值化和形态学滤波处理,并获得当该区域的通信区域比给定的阈值RK进行连通区域分析的结果,它成为检测对象,并且该区域是区域目标在区间的,你能确定的最小边界矩形的目标。
其中T 是二值化设定阀值。
2.1.3光流法
光流是指在图像模式(或表观的)运动的表观亮度。用“表观运动”,主要是由于光流的运动图像不能有部分信息只以确定,例如,区域性或亮度轮廓点更均匀的亮度不能唯一确定的运动对应的点,但观察到的运动。这解释了光流和该流不一定是由物体的运动所产生的光,而运动的主体不一定会产生光流体育场不一定是唯一的。
三、目标跟踪算法的研究
目标对象的运动信息的条件的先验知识下跟踪,通过从信息源的实时数据来估计所述目标状态,以实现所述目标位置和运动趋势判定。运动目标跟踪问题是一个复杂的估计。研究精度高,性能稳定,目标跟踪方法的适用性仍面临巨大挑战,具有重要的理论意义和实用价值。
3.1图像匹配法
通过图像匹配方法可以识别要跟踪的运动对象,并确定它们的相对位置。早期跟踪涉及的目标位置的变化的两个图像之间的测量计算出的相关函数,跟踪点是,这两个图象相匹配的最佳位置,这是相关函数的峰值。
3.2基于团块的目标跟踪
基于团块(BLOB)的基本原理是用于图像分割候选像素跟踪算法,它决定像素是否属于背景或属于定位或属于其他区域。基于跟踪算法的质量也可称为基于图像分割的跟踪,分割结果刚够目标和背景之间的区分,而传统的图像分割算法需要目标轮廓的精确显示。分裂台球在目标,纹理特征和图像的深度信息的一般特性。
四、结语
随着在军事领域的计算机视觉,智能交通监控,视频运动目标检测与跟踪的发展必将得到更广泛的应用和发展。在本文中,历时四个月中,主要研究的OpenCV实现运动目标检测与跟踪的应用,实验结果表明,该系统具有良好的鲁棒性和准确性,实现毕业设计的预期目标,在工作和问题结合起来实际应用中。
参 考 文 献
[1]刘瑞祯, 于仕琪. OpenCV教程基础篇[M]. 北京: 北京航空航天大学出版社,2007.
[2]彭达. Visual C++多媒体编程技术[M]. 北京: 人民邮电出版社, 1999.
[3]丁金铸. 基于图像处理的运动目标检测跟踪系统的设计与实现[D]. 华中师范大学, 2007.
[4]王建中, 姜昱明. 基于块匹配的运动对象检测算法[J]. 微电子与计算机, 2005, 22(1): 10-12.
[5]林少丹. VC++程序设计基础[M]. 北京: 人民交通出版社, 2009.
[6]唐双发. 基于OpenCV的车辆视频检测技术研究[D]. 华中科技大学, 2009.
[7]李庆忠,陈显华,王立红. 视频监视中运动目标检测与识别方法[J]. 计算机工程, 2004, 30(16):30-33.
[8]胡晓峰, 吴玲达, 老松杨, 司光亚. 多媒体技术教程[M]. 北京: 人民邮电出版社, 2002.
[9]韩鸿哲, 王志良, 刘冀伟, 李郴, 韩忠涛. 阴影消除的自适应背景建模[C]. 第二届全国智能视觉监控学术会议论文集, 2003, 35-39.[10]张玲, 叶海炳, 何伟. 一种基于边缘信息的改进车辆检测方法[J]. 重庆大学学报(自然科学版), 2004, 27(11): 56-58.
[11] J.B.Kim, H.J.Kim. Efficient Region―based Motion Segmentation for Video Monitoring System [J]. Pattern Recognition Letters, 2003, 3(24):113-128.
[12]王春平, 朱元昌,黄允华. 基于图像信息的跟踪算法分析[J]. 火力与指挥控制, 2000, 25(1): 64-67.
[13]杨枝灵, 王开. Visual C++数字图像获取处理及实践应用[M].北京: 人民邮电出版社, 2003.
关键词:多源图像;融合技术;棉花;病虫害;识别诊断
中图分类号:TP391.43;S435.6 文献标识码:A 文章编号:0439-8114(2013)11-2555-03
随着城市化进程不断加快,从事农业劳作的劳动力总数急剧减少,农业生产与加工的逐步自动化是社会发展和进步的需求。特别是对于农作物病虫害监测从传统的根据农业部的病虫害监测调查规范进行调查,通过人工调查、人工记录,到微小昆虫自动计数技术、昆虫诱捕自动记录装置来对农作物病虫害进行监测,这些信息收集和数据管理都存在劳动量大、效率低、数据误差大的问题。随着计算机技术和传感器技术的快速发展,图像融合技术在军事、气象、医学、土地资源管理等方面得到了广泛的应用,而如何将图像融合技术应用在农作物病虫害中是极具有研究价值的课题。
1 棉花病虫害诊断技术研究意义及发展趋势
棉花作为主要的经济作物一直在中国和湖北省农业生产中占有重要地位,但由于品种、栽培制度、生态环境等变化及棉花生长环境日益恶化,病虫害有不断加重趋势。危害棉花的主要病害有炭疽病、黑斑病、枯萎病、黄萎病等,炭疽病在长江流域棉区的发生尤为严重,一般苗期发病率为20%~70%,严重时可达90%;黑斑病在阴湿多雨年份往往猖獗流行,给棉花生产造成毁灭性灾害;而枯萎病在棉区一直发生较多,死苗严重,造成的危害主要表现在产量降低,品质变劣方面;自上世纪80年代末枯萎病得到控制后,黄萎病上升为棉花第一病害。目前黄萎病发病面积达到全国棉田面积的50%以上,发病后棉苗减产30%~70%,有的甚至绝产,而且严重影响棉花品质。采用先进技术提高棉花病虫害有效防治及控制已迫在眉睫。
1.1 棉花病虫害诊断技术的研究意义
在进行植物保护和防治农作物病虫害的各类方法中,化学防治是投入少、见效快、收效大的有效方法,特别是针对在大生态区域内可能暴发成灾的重要病虫草害,化学防治迄今仍是最快速而有效的方法,一般可以挽回15%~30%的农作物产量损失。使用农药(各种杀菌剂、除草剂等)进行化学防治在世界各国一直占主导地位,它投入较少,防治迅速,特别是当大面积、暴发性病害发生时,只有化学防治才能取得较好的防治效果。同样,在棉花病虫害综合防治中,化学防治仍然是及时有效地控制病虫对棉花危害的最后一道把关防治措施。但长期大量使用农药不仅污染环境,而且这些农药会通过空气、水等途径进入人体,对人类的身体健康构成危害;又由于棉花病虫害症状的复杂性和模糊性,农业生产者受个体素质和人为主观因素的影响,往往不能正确合理地判断病情,导致滥用农药、化肥等引起更大的危害;此外,由于中国正步入老龄化社会,从事农业劳动的人口在减少,由劳动力不足带来的农业减产问题已日趋严重。所以,精确作物病虫害管理和机械化变量施药技术的研究和应用势在必行。为实现精确的棉花病虫害管理和变量施药,首先要能够准确地识别棉花病虫害种类及其危害程度。传统的方法主要依靠生产者或专家经验来判断病虫害原因及其危害程度,由于个体素质的差异以及其他因素的影响,往往很难做到对病虫害做出精确定量分析和判断,因而容易造成不合理的病虫害防治,也对生产管理者的农技水平要求较高。一些智能决策支持系统虽然能识别诊断棉花病虫害,但是过程复杂,不能进行实时处理。随着信息技术、光谱技术和计算机视觉技术的发展使基于生物信息的作物病虫害智能识别诊断成为可能。通过多源图像融合技术快速准确地获取棉花病虫害信息,对已发生病虫害的棉花区域根据病虫害程度实行定量喷施农药。这样既可大量节省农药,提高效率,降低成本,降低对劳动力的依赖,同时大幅度减轻农药对农业生态环境的污染,提高棉花病虫害防治水平。研究多源图像融合技术对农作物病虫害诊断具有重要的学术意义和经济价值。
1.2 棉花病虫害诊断技术发展趋势
纵观近几年国内对作物病虫害智能识别诊断的研究,目前对棉花作物病虫害识别诊断主要集中在以专家系统为代表的智能化信息技术和光谱技术上,应用计算机视觉技术对棉花作物病虫害识别的研究报道较少[1,2],而结合光谱技术和计算机视觉技术进行研究的则未见报道。目标的高分辨率和高识别率是对获取目标信息的基本要求,仅仅利用可见光范围或在近红外范围的计算机视觉技术进行作物病虫害识别诊断,其单一光谱不足以准确、全面反映作物病虫害的差异,还需利用其他生物信息对其补充和加强,以达到全面地反映作物病虫害的差异[3]。
为了实现对低探测性目标的探测和识别,必须大力发展先进的目标探测系统,而由多源传感器组成的光电成像系统是最为常见的目标探测系统。图像融合就是利用各种成像传感器得到的同一目标或同一场景的图像,综合这些不同图像的冗余信息和互补信息,以获得更为全面准确的图像描述。为此,针对湖北省主要经济作物棉花,综合利用光谱技术、计算机视觉技术及多源信息融合技术,基于多源图像信息(可见光和近红外视觉图像信息)融合棉花病害(炭疽病和黑斑病)识别诊断技术。深入研究作物在不同病虫害危害下的反射光谱特性及变化规律,确定光谱敏感波段及其特征表现,提取可以有效表征作物不同病虫害条件、不同危害程度下的计算机视觉图像的灰度、纹理、形态特征信息和近地光谱特征信息,探索基于多传感信息融合的病虫害识别诊断方法,构建病虫害智能识别系统,为精确作物病虫害管理和机械化变量施药技术提供理论基础。
2 多源图像融合技术
图像融合[4]是对多幅源自同一场景的图像进行综合,以获得更好的视觉效果和易于机器识别为目的,产生比单一信息源更为精确、更完善、更可靠的图像。多源传感器图像是由成像机理不同的多种传感器获得的图像。由于每种成像传感器都是为了适应某些特定的环境和使用范围而设计的,具有不同成像机理的多种传感器获得的图像之间存在信息的冗余性和互补性,通过对其进行融合,能够提高系统可靠性和图像信息的利用率。随着科学发展和技术进步,采集图像数据的手段不断完善,出现了各种新图像获取技术。如今图像融合技术广泛应用于图像处理、遥感、计算机视觉以及军事等领域[5]。利用图像融合技术可以准确地获取检测数据,如在医学图像分析中的超声成像、核磁共振、计算机层析、血液细胞自动分类计数、癌细胞识别等极大地提高了准确率[6,7];图像融合技术在遥感雷达卫星的发展后,已成为遥感图像处理和分析的重要研究热点,应用于土地资源调查、环境监测、地形测绘等[8]。图像融合技术应用在农业生产中,目前研究方向主要集中在对农产品的无损检测和农作物生长态势及产量评估方面。如采用互信息最佳阈值迭代优化分割法对可见光和近红外图像进行融合来对番茄成熟度进行无损检测研究[9];通过加权平均融合法对红外和可见光图像实现对苹果进行无损检测研究[10];采用蚁群算法的模糊C均值聚类图像分割算法的图像融合技术对作物几何参数进行测量。
多源传感器图像融合系统一般有3种类型:像素级融合、特征级融合和决策级融合。
2.1 像素级图像融合
像素级图像融合是通过对源图像进行预处理和空间配准,对处理后的图像采取适当的算法进行融合,得到融合图像后再进行显示和后续处理。简单的像素级融合方法主要有:像素灰度值平均或加权平均,像素灰度值选大,像素灰度值选小。简单的像素级融合方法结构简单、易于实现,但应用范围有限,融合结果不理想。故现在的融合方法多采用基于对源图像的多尺度分解。这种分解方法是一种多尺度、多分辨率的图像融合方法,是在不同尺度、不同空间分辨率、不同分解层上分别进行融合。这种融合方法能明显改进融合效果[11]。
2.2 特征级图像融合
特征级图像融合是从不同的成像传感器所获得的同一对象图像中提取一些特征,产生特征矢量,然后对这些特征矢量进行融合。特征级图像融合是中间层的图像融合,精度一般。其融合方法有基于假设前提及统计分析的方法和基于知识的方法。
2.3 决策级图像融合
决策级图像融合是最高层次的融合,是首先依据每一个成像传感器所获得的同一对象图像各自进行预处理、特征提取、识别和判决后,做出独立的决策,然后将这些独立的决策综合起来,给出最终决策。决策级图像融合适合于多类不同传感器图像的融合,但融合结果精度较差。其融合方法有多重逻辑推理方法、统计方法、信息论方法等都可用于决策层的图像融合。
特征级图像融合和决策级图像融合方法通常应用于某些特殊场合,像素级图像融合的应用更普及,融合所得图像更有利于人眼的判读、欣赏和机器识别。对于已经配准好的图像,像素级图像融合方法不需要显式地提取图像特征,在速度和鲁棒性上有明显优势。为此采取像素级图像融合方法对农作物病虫害的可见光和近红外图像进行融合处理,使其符合人类视觉特征,融合结果更有利于对图像作进一步分析、理解和识别。
3 多源图像融合技术对棉花病虫害诊断的方法
1)在特定栽培条件下,培育不同棉花病虫害的试验样本及正常的对比样本。
2)对棉花病虫害样品的叶片和冠层进行光谱分析。利用便捷式光谱仪测量叶片和冠层的光谱,寻找棉花病虫害种类的敏感光谱波段及其反射率特征,分析不同病虫害种类和病虫害程度的敏感光谱波段反射率特征的变化规律。
3)根据光谱分析结果,构建多源图像计算机视觉采集系统,采集棉花作物样本多光谱图像,用VC或MATLAB编写计算机图像处理软件对图像进行处理和特征提取。
4)对所获取的特征应用模糊特征优选、主成分分析(PCA)和独立分量分析(ICA)进行优化组合和筛选,通过各种统计方法寻求作物病症与特征对应关系。建立图像特征与病种、病虫害程度的关系模型,利用模式识别方法进行棉花病虫害种类及程度的模式识别检测试验[12]。
4 展望
棉花是中国和湖北省主要的经济作物,长期以来棉田病虫害对棉花生产带来极大危害,因此,对棉花病虫害防治方法与技术的研究至关重要。对棉花作物病虫害防治的各种方法中,传统的方法是依靠人们的经验确认病虫害的发生时间、区域、种类和发生程度等,且是进行手工或机械喷洒农药,这不仅劳动效率低,劳动成本高,而且常规施药技术会带来农药利用率低下、水资源浪费、环境污染、农药在作物及其产品中的残留导致对人类的危害等。所以,结合光谱技术和计算机技术开展棉花病虫害的识别诊断研究具有重要的学术意义和经济价值。
参考文献:
[1] 周小燕,史 岩,李道亮,等.棉花病虫害诊断专家系统的研究与设计[J].莱阳农学院学报,2005,22(1):9-11.
[2] 严智燕,廖桂平,高必达.植物病虫害防治中农业专家系统的研究进展[J].中国农学通报,2005,21(5): 415-417.
[3] YUTAKA S,TSUGUO O.Automatic diagnosis of plant disease recognition between healthy and diseased leaf[J].农业机械学会杂志,1999,61(2):119-126.
[4] 何 友,王国宏,陆大金,等.多传感器信息融合及应用[M].北京:电子工业出版社,2000.
[5] 王 宏,敬忠良,李建勋.多分辨率图像融合的研究与进展[J].控制理论与应用,2004,21(1):145-151.
[6] ZHENG Y F, ESSOCK E A, HANSEN B C.Advanced discrete wavelet transform fusion algorithm and its optimization by using the metric of image quality index[J].Optical Engineering,2005,44(3):1-12.
[7] 李秋华.基于红外图像信息融合的目标检测和识别技术研究[D].长沙:国防科学技术大学,2002.
[8] 吉 微.多源气象卫星图像融合技术应用研究[D].南京:南京信息工程大学,2009.
[9] 李明喜.基于多源图像融合的收获目标准确定位研究[D].江苏镇江:江苏大学,2008.
[10] 杨万利,沈明霞,严 君.红外图像处理技术在苹果早期淤伤检测中的应用[J].计算机工程与设计,2010(1):149-152.
[关键词]数字图像处理 OpenCV 实验教学 项目教学
[中图分类号] G642.423 [文献标识码] A [文章编号] 2095-3437(2013)09-0042-02
一、引言
目前,大多数高校的数字图像处理课程都是在引入Matlab集成的工具箱及其自带函数的基础上进行实验教学[1]。由于Matlab程序的移植性较差,学生学习完成后不能直接面对实际的软件开发和应用,难以真正提高学生的工程实践动手能力。
为了让学生既能掌握基本理论和技术,又能较容易编写算法的程序,我们在数字图像处理的教学中引入了开源的计算机视觉库OpenCV(Open Source Computer Vision Library)。该软件是以C 函数和C++类的形式实现大量图像处理算法,学生可以方便地利用OpenCV 进行图像处理算法的编程和验证,进而在VC中开发功能更强大的应用程序。相对于Matlab而言,学生不仅可以利用OpenCV 开放的源代码,以函数进行图像处理,而且可以查看算法的代码实现,更好地培养学生的编程能力[2]。
二、OpenCV概述
OpenCV是Intel公司资助的面向广大研究人员和学生的开源计算机视觉库,它由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉方面很多通用算法,同时提供了MatLab等语言的接口,因此极大地方便了图像处理和视频技术的二次开发[3]。
OpenCV主要包含六大模块,其具体功能分别是[3]:(1) CV模块:包含基本的图形处理函数和高级的计算机视觉算法;(2) CVAUX模块:包含辅助的OpenCV函数,一般存放一些被淘汰的算法和函数,同时也包含一些新出现的实验性的算法和函数;(3) CXCORE模块:包含OpenCV的基本数据结构和线性代数支持;(4) HIGHGUI模块包含图像和视频的界面函数;(5) ML模块:包含一些基于统计的分类和聚类工具,模式识别算法和回归分析等;(6) CVCAM模块:负责读取摄像头数据的模块。
利用OpenCV进行程序开发具有以下几个特点[4]:(1) 独立性。OpenCV中大量的函数和类库既可以独立运行,也可以在加入其它外部库的情况下运行;(2) 跨平台性。构成OpenCV的API函数具有跨平台性,不仅能很好的支持各种不同的操作系统,也可以很好地在不同公司的C/C++编译器下工作;(3) 功能强大。OpenCV包含了线性表、树、图等基本数据结构,也包含图像滤波、边缘检测和数字形态学等数字图像处理的基本操作以及一些图像高级处理功能;(4) 高效性。OpenCV的算法都是基于动态数据结构,使用Intel处理器指令集开发的优化代码,运行速度快,处理效率高;(5) 开放性。OpenCV的源代码是开放的,程序设计者可以直接修改它的源代码,也可以将新的函数或类集成到它的库中。
三、数字图像处理的实验设置
实验是理论教学的有效辅助,对于数字图像处理这类实践性很强的课程就更加重要。通过阅读和调试算法源代码、体验算法的处理效果,学生可以加深对基础理论的理解。根据理论教学的重点难点内容,我们设计了相应的实验项目,每个项目都要求学生运用OpenCV和Visual C++编程语言框架来编写数字图像处理基本算法。
项目教学法是针对课程体系结构设计出一系列学习单元项目,项目设计围绕着具有典型性、启发性的关键问题,学生通过参与项目完成的全过程实现对课程内容系统而深入的掌握[5]。项目教学法真正实现了以学生为中心、以教学目标为中心,实现理论方法学习与实践动手能力培养的紧密结合。
本文基于项目教学法的研究,针对“数字图像处理”课程教学体系结构,并结合教学大纲与教学目标要求,同时参考国外大学的相关课程,设置了以下实验项目:
(1) 图像变换。
(2) 图像直方图均衡化。
(3) 频域图像增强。
(4) 图像边缘检测。
(5) 图像分割。
(6) 人脸检测。
通常,学生完成一个项目需要4个过程[6]:(1) 项目原理分析;(2) 项目具体流程设计;(3) 基于OpenCV的软件设计;(4) 结果展示与分析。以上每个阶段都要求学生提交阶段报告,根据学生报告反映出的问题,老师有针对性地进行指导,在解决问题中帮助学生真正掌握所学的知识,并提高动手能力。在项目法教学过程中,我们特别要注意克服项目无法完全覆盖全部知识点的局限,因此,要在项目选择与设计中综合考虑,并结合项目原理研究建立对教学体系框架和全部知识点的整体把握。
四、OpenCV处理图像的应用实例
(一)图像变换
OpenCV提供多个图像变换函数。函数cvWarpAffine利用指定的矩阵对输入图像进行仿射变换,这类变换可以用一个3×3的矩阵来表示,其最后一行为(0, 0, 1)。典型的仿射变换包括平移变换、缩放变换、剪切变换、旋转变换等。此外,函数cvWarpPerspective对图像进行透视变换,函数cvLogPolar将图像从直角坐标映射到极坐标,核心代码如下:
IplImage* dst = cvCreateImage( cvSize(256,256), 8, 3 );
cvLogPolar( src, dst, cvPoint2D32f(src->width/2,src->height/2), 40 );
图1给出了图像映射到极坐标的结果实例。
(二)图像边缘检测
图像的边缘是图像最基本的特征,是灰度不连续的结果,因而边缘检测是图像处理中的重要问题。OpenCV提供了cvSobel函数、cvLaplace函数和cvCanny等函数进行边缘检测,下面以cvLaplace函数进行举例,其边缘检测的代码为:
IplImage *result_img = cvCreateImage(cvSize(img->width, img->height), IPL_DEPTH_8U, 1);
cvLaplace (img, result_img);
cvNamedWindow(“Result”, 0);
cvShowImage(“Result”, result_img);
第一句是创建一幅与原始图像img同样大小的通道数为1的图像result_img;第二句是使用Laplace算子对图像进行边缘检测,并将结果存放在result_img中,后面两句是在窗口中显示result_img。程序的处理结果如图2 所示。
五、结束语
OpenCV中的函数几乎能够覆盖到所有的数字图像处理的基本功能,而且其代码又是免费的和开放的。实践证明,通过将OpenCV引入数字图像处理的实验教学中,既能简化图像处理的编程,又能切实地提高学生的实践能力,使学生深入理解图像处理的基础理论和典型算法,获得了良好的实验教学效果。
[ 参 考 文 献 ]
[1] 赵敏.Matlab用于数字图像处理的教学实践研究[J].电脑知识与技术,2012,8(31):75397540.
[2] 李树涛,胡秋伟.OpenCV在“数字图像处理”课程教学中的应用[J].电气电子教学学报,2010,32(6):2628.
[3] 刘瑞祯,于仕琪.OpenCV教程[M].北京:北京航空航天大学出版社,2008.
[4] 方玫.OpenCV技术在数字图像处理中的应用[J].北京教育学院学报(自然科学版),2011,6(1):711.
关键词:计算机技术;视觉识别技术;交互技术;会议展示;智能办公环境
在日常的企业办公管理活动中,有很多时候需要可视化地展示企业市场计划、新产品设计、数据分析报告等。尽管这些活动所需要的材料在事前可以经由办公自动化软件处理,但处理结果却很大程度上只能由静态的PPT展示和说明。但很多时候,这些展示和说明往往是多个部门不同专业背景的人员参与,于是展示材料制作的水平和质量就很大程度上影响到了参与者对所展示内容的理解和吸收程度。很多复杂的问题或者设计的展示,如果能采用互动交互的方式展示,在很大程度上能够帮助问题讨论的参与者对所讨论问题更好的理解。这一点在常规的教育过程中已经获得了充分的证实,相关的数据和结果可以从多媒体教学的优势的相关研究中得到。同样,企业中很多方案的讨论,数据分析报告的说明其实对于企业而言也是一个方案设计者或数据研究分析者对相关人员类似教学的过程。采用现有企业常规会议设备诸如投影仪、普通笔记本电脑、电脑摄像头配合相应的计算机视觉识别程序,我们可以将交互的投影演示引入到企业日常的展示讨论活动中,增强沟通效果,提高工作效率,并且在技术上同样的识别交互的程序配合上相应的员工面部特征的数据库,还能扩展延伸到考勤或门禁系统中提供更加智能化的办公环境。对于以展示沟通为主的教育培训企业,通过配合一般人脸数据特征,可以通过摄像头捕捉现场视频并识别其中人脸识别,记录现场关注展示内容的人员的数量,作为日后教学效果的自然客观的评估参考。
1目前办公信息化中存在的问题
1.1会议演示文稿展示时多人交互型差
目前主流的演示文稿制作及展示软件主要大多都集成在套装的办公软件中,其中主要常见的种类分别是MicrosoftOffice系列中的PowerPoint、MacOS系统下的KeyNote、基于Linux操作系统的Openoffice中的Impress。它们主要的功能都是对输入的文字、图片声音等多媒体进行编辑制作最后生成电脑上播放的多媒体幻灯片,尽管它们都具有强大的多媒体数据的处理能力,但最终制作的多媒体幻灯片在演示时都是“单向交互”的,即由播放者播放,而其中的内容及动画按预先设计好的模式显示。如果使用Adobe公司的Captivate或Authware这样的多媒体交互制作软件则会需要有专人进行操作,浪费大量的时间和精力,但如果是配置专门的多点触摸屏幕,则一来屏幕尺寸有所限制,二来费用相对较高容易造成设备的浪费。
1.2传统办公考勤与门禁系统的弱势
目前企业常规的门禁系统与日常考勤系统往往是分离的,两个系统使用了各自独立的软硬件环境,其中门禁系统使用的是摄像监控设备采集信息并通过专人24小时值班,其主要职能仅仅是监控办公环境的人员进出并记录下相应的影像资料。而企业日常的考勤系统则要么采用人工签到的方式,要么采用人工打卡或者指纹打卡方式。如果采用打卡方式管理则需要添置专门的打卡机,这些打卡机多数是独立工作,对于员工的考勤则需要人工根据卡片记录情况统计。无论是员工自身打卡或者是统计考勤都是人工完成,有时还会出现错误和疏漏,同时主要的问题还在于容易出现代人打卡等作假的情况。所以,在传统的办公考勤与门禁系统独立的情况下,两个系统各自记录各自的相关数据,同时投入两套不同的软硬件环境,有时这样的办公环境的信息化反而没有给人员带来便利,而是增加一项打卡签到的日常任务。
2对存在的部分问题的分析和讨论
2.1传统演示设备缺乏交互型功能
由于很长一段时间硬件以及软件的条件约束,电脑的键盘、鼠标完成了95%以上的数据输入工作,单一显示功能的显示器投影仪也成了最主要的信息输出设备。所以常规软件设计和开发时都是把键盘、鼠标、显示器/投影仪的输入输出组合当做几乎所有使用情况下的模式。但随着触摸屏与多点触控硬件的出现,多点触控、屏幕的直接交互输入输出操作成了未来发展的一个趋势,并且相对普通鼠标和单一显示功能的显示器用户交互体验明显提升,人机交互界面更友好直观。但是对于普通办公中使用的投影仪,由于其投影的目标位置情况多样,如果一体化的设计制造具有交互功能的互动投影仪其成本要比普通投影仪更高,对于解决互动操作的问题经济上不是最优的。而大面积的多点触控屏幕由于设备体积和重量的因素无法在需要灵活移动的新产品推广谈判等活动中使用,如果只是企业自身办公环境中做普通会议展示的效果改进,其投入产出的效率也不理想。
2.2基于传统输入输出设备的开发
由于长期以来人机交互都是以鼠标键盘为主,所以绝大多数程序开发设计都只考虑这种单一的输入方式。但对于目前多媒体数据增多的趋势,这样传统的输入输出模式就存在着很多弊端,其中最明显的是对于多媒体数据的采集就需要单独使用设备,采集后再人工处理。而为了简化系统设计的复杂度,很多管理信息系统的数据采集和录入主要基于键盘鼠标的录入,如果出现非键盘鼠标录入的数据则被要求人工进行数据格式的转换,所以从一个侧面也反映出一些企业排斥信息化,因为原本带来效率提升与管理便利的信息系统,反而由于一些数据格式的录入要求增加了人工劳动。如果直接使用现实当中的多媒体类的数据则系统又缺少相应转换的功能。因为系统在考虑使用键盘鼠标录入采集数据时已经默认了操作者来完成数据录入前的标准化工作。但是实际上随着现代计算机视觉以及人工智能、模式识别技术的发展和完善,过去无法识别的原始多媒体数据现在也可以由计算机识别并进行标准化的处理。
3运用计算机视觉技术改善人机交互
3.1低分辨率识别情况下改善会议演示交互效果
采用现代的计算机影像处理技术和方法,可以用普通的图像采集设备配合程序识别影像当中的特定颜色区域的移动轨迹,并对轨迹做出判断实现与计算机的交互。由于该识别只是需要识别图像中的特定颜色的区域的运动,而非具体的形状与细节,所以识别的难度相对不大,可以运用在会议的展示环境下,通过定位确定普通投影区域与特定颜色区域的位置关系,并通过图形图像的投影与变形运算,实现人与普通投影的交互。在环境背景比较清晰,图像采集设备分辨率与色彩分辨比较灵敏的情况下还能更进一步对人体肤色和手的几何特征进行识别,实现更加自然良好的人机互动交互,并且还能引入人工智能的模式识别算法,实现多人的互动交互,从而大大改善互动展示效果,实现更加人性化有效的沟通。特别在教育培训行业,在现有普通硬件条件下能够实现更加生动的教学讲解演示,提高学生的课堂体验激发更多兴趣,改善教学效果。
3.2运用计算机视觉与模式识别技术整合企业门禁与考勤系统
应用计算机视觉技术配合相对高分辨率的识别与人像数据库,企业可以采用现有的门禁系统的硬件设备配合相应的软件实现门禁与考勤系统的整合,以此提高企业办公环境的智能化人性化的效果,并对员工进行更加精细化的管理。重要的是,通过人机接口的改进改变以往服务信息系统的面貌,让人在自然的环境下工作提高系统的人性化程度。同时整合门禁与考勤系统可以通过识别企业内部员工与外来人员加强办公环境的管理,而且在硬件上可以利用现有的设备,软件方面可以与前面提到的交互演示系统共用相同的图形图像处理内核,减少代码的冗余降低系统复杂度提高可靠性。就目前的人像识别技术而言,已经在个人电脑的安全保护上得到了应用,所以在技术上是可行的,并且也有了实际应用的例子。将该技术移植到普通的门禁管理系统与考勤系统中,只需要解决接口的数据交换就能实现,并且随着现代企业办公环境的要求,应用该技术能大大提高企业的办公环境的智能化程度,并且通过门禁系统提取的企业员工考勤信息更加自然和真实,能够更加准确地掌握和管理企业员工的日常工作情况提高管理精度。
3.3具体实现方法与原理
为了能充分利用企业现有的硬件设备,并使得附加的程序简单化,这里针对类似会议互动展示这样不需要细节识别的情况采用的是颜色识别的方法,即统计场景中的图像直方图,然后探测直方图上的变化,由于特定颜色的待识别区域的引入可以对整体直方图的特定区域产生峰值的变化,并且通过反向的直方图运算又可以确定特定区域的位置。而直方图的运算属于比较简单的图像运算处理所以能够在很多图像处理的开发工具中直接找到。并且对于细节识别要求比较高的人像的模式识别,采用以上的运算也能缩小待检测区域的大小,提高识别效率,并且人的面部特征采用色识别也能很快找到特征点(眼睛、鼻孔、嘴唇、头发以及头像边缘)。在前面通过色彩识别找到的检测区域中,识别出特征点,并测量特征点的位置关系比例,进而在和数据库中数据对比模式匹配找到最终结果。
4结语
在越南河内的机场,为了使乘客能在等待航班时有比较轻松的环境,在旅客的候机大厅专门安放了一台具有互动功能的投影仪,并将互动内容投影在地面,乘客可以在候机时与地面上的互动投影交互,缓解候机带来的单调乏味感。同样我们可以把它引入到日常企业办公会议或者是培训教育类企业的日常教学中,运用现有的投影屏幕和现有的设备实现多人的在投影屏幕上的互动交互讨论。而人像识别系统在单机上的应用也在很多商用笔记本电脑上得到了应用,在一些科研院所和高科技企业人像识别的门禁系统也被应用到了办公环境当中,提高了办公环境的智能化程度;将人像识别技术结合考勤系统则在教育行业能够实现更为方便的考勤管理防止目前比较严重的代签逃课等情况的发生。随着现在对数据挖掘技术的研究,从日常情况采集到的数据积累到一定程度还能为今后分析员工/学生行为做出数据的积累。这里所讨论和解决的问题主要只是集中在人机交互界面的一些改进,其实对于IT技术而言这只是一小部分,对于企业而言需要使用IT技术真正提高企业的工作效率还需要其他很多方面的配合和集成。
作者:赵磊 邓世翔 刘德飞 单位:云南机电职业技术学院
参考文献:
[1]黎松,平西建,丁益洪.开放源代码的计算机视觉类库OpenCv的应用[J].计算机应用与软件,2005,22(8).
[2]陈雪松.基于图像势能理论的特征提取方法研究[D].华中科技大学,2011.
[3]李超,许春耀,潘林,余轮.面向投影环境的计算机视觉交互信息获取[J].电视技术,2013,37(11).