前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的机器视觉概念主题范文,仅供参考,欢迎阅读并收藏。
[关键词]机器视觉技术;机械制造自动化;应用
中图分类号:T01文献标识码:A文章编号:1009-914X(2017)28-0061-01
机器视觉技术是科学技术在机械设备上的一种应用,其从拟人角度入手,通过模仿人类思维形成机械思维过程,以人工智能的方式来实现与“人眼”相同的功能,进而在人类无法适应的恶劣环境下进行作业。如果说机械臂是模仿人类外部器官所制成的机械设备,那么机器视觉则是模仿人眼所操纵的智能摄像机、照相机设备,目前,机器视觉技术在机械制造自动化领域可以实现数据采集与信息判断的目标,对推动机械生产自动化有着非常重要的意义。
一、何为机器视觉技术
所谓机器视觉技术,是利用机械来模拟人眼以获取图像信息,在摄取图像后,机械会借助其内部设置的计算机进行读图,对图像中含有的信息进行判断。目前,摄取图像的技术有很多,摄取难度也不大,电子摄像器材更是种类繁多且价格便宜,对于机器视觉技术而言,难点在于对图像的判断与解析。大部分图像都具有线条、颜色等基本元素,人眼可以通过大脑来分析与判断上述基本元素,而机器视觉技术虽然可以与人眼一样摄取图像,在一定程度上模仿人类的思维,但是其思维原理依然与人类有所不同,就工作原理而言,机器视觉技术是将收集而来的图片信息进行处理,将其整理后使其变为简化图,再将简化图中含有的信息转化为数字信号,计算机基于模型将特定的片段筛选识别出来,再转化为人类所能理解的信息。单纯看笔者的描述,机器视觉技术的处理过程具有很大的负载,而在实际指向时仅需要不到0.1s的反应时间。而在机械制造自动化领域,机器视觉系统仅需要处理少量信息,因此具有极高的效率,其较高的灵敏度与稳定的工作状态使得其在机械制造领域具有非常好的应用效果。
二、机器视觉技术的现实应用
(一)应用方向之一——质量检测
机器视觉技术可以安装在检测装置之上,用于检测产品外观是否存在瑕疵甚至是故障。对于轮船、飞机、汽车的制造而言,在制造大型机械零件时虽然可以依靠人工进行流水线生产的质量检测,但是人的精力有限,可能因精力不足而出现注意力不集中的状况,这时很容易导致外观问题被忽略。而使用机器视觉技术便可以避免这类问题的出现,机器并不存在困倦和注意力不集中的问题,只要供给其足够的能量便可以一直工作,借助高精度的摄像、照相设备,可以清晰识别零件表面存在的缺陷。再以曲轴的弯曲度为例,这类部件对于参数的精度有很高的要求,正所谓“差之毫厘,谬以千里”,即使曲轴的弯曲度有一丝不合格,也有可能导致部件无法安装的结果,而人眼很难清晰辨别出这种细微的“偏差”,而机器视觉技术可以清晰辨别出来,通过机器视觉技术的高细节检测,即使零件的误差只有几毫米甚至几微米,也可以被清晰查出。可以说,在机器视觉的精细检测下,可以实现零件的完美筛选结果,不合格产品退出了生产线,不会流入市场,间接避免了安全事故的发生。
(二)应用方向之二——精密测量
1.精密测量零件尺寸
机器视觉系统由圖像采集系统与图像识别系统两部分组成,检测系统包括CCD摄像头、光学系统以及计算机处理系统。由光源向被检测零件发射平行光束,被检测部位在光线的照射下反射、折射出光芒,借助内置于摄像机中的CCD摄像头,由显微光学镜进行成像,再由计算机系统进行图像的处理,以获得零件的相关信息。若是被检测零件移位,则可以重复测量2次零件的边缘轮廓,两次测量结果相减即为位移量。基于上述原理可以为形状简单、尺寸较小的在线工件进行精密测量。例如,电子接插件的生产速度至少为300件/分钟,使用机器视觉技术可以实现0.01mm级别的精密测量。
2.逆向工程
如果说测量零件尺寸、减少误差值、避免不达标零件流入市场是机器视觉技术的正向应用,那么机器视觉技术还能应用于机械制造的逆向工程,即通过摄像头测得标准价的轮廓坐标值,构建曲面并转换为图形,经由只能系统输送到加工机器中进行产品的制作。简而言之,其实就是借助机器视觉技术的测量系统测得标准件的三维尺寸与各个位置的精确数据,给予曲面处理并最终加工成型。目前,CCD光电器件发展非常迅速,可以基于三角法对零件表面轮廓进行快速的视觉测量,由激光穿过而产生的条纹结构光辉投射到零件表面,基于零件表面因深度、曲率不同而形成的条纹,由CCD摄像机来获得条纹的变化,计算机将图像信息转变为模拟信号,再将模拟信号转变为数字信号,最后将信号还原至图像处理系统中,获得三维轮廓图像。
(三)应用方向之三——自动焊接机器人
自动焊接机器人是机械制造自动化发展到一定程度的产物,在机器人身上安装红外摄像仪与CCD摄像机可以使其具有视觉功能,机器人内部安装有模拟工人生产行为模式的人工智能,再加上视觉感知功能,可以在抢弧光与飞溅条件下完成人工无法进行的焊接操作。当然,这一方向的应用在我国目前较为少见,受技术所限,我国在焊接精度上依然难以得到保证。
结语
本文首先介绍了机器视觉技术的概念与特点,随后介绍了机器视觉技术在机械制造自动化领域的三大应用方向,旨在点明机器视觉技术的美好发展前景,使机器视觉技术得以在机械制造自动化领域得到更加广泛的应用。
参考文献
[1] 何勇,孙钊,李华厦.机器视觉技术及其在机械制造自动化中的应用[J].黑龙江科技信息,2016,(24).
[2] 杨刚.机器视觉技术及其在机械制造自动化中的应用分析[J].科技创新与应用,2015,(24).
[3] 吴继方.浅谈机器视觉技术在自动化制造业中的应用[J].山东工业技术,2016(11).
[4] 王晖.机器视觉技术及其在机械制造自动化中的应用分析[J].黑龙江科技信息,2017(11).
关键词 学科交叉教学 应用数学 机器视觉
中图分类号:G643.0 文献标识码:A DOI:10.16400/ki.kjdkz.2015.12.016
Abstract Interdisciplinary teaching is teaching model advocated by most schools, graduate students for cultivating compound talents can promote. In this paper, "Applied Mathematics" teaching in machine vision applications courses for example, by building cross-disciplinary courseware and experimental platform to build, will dull mathematical theory and practical application together. In theory study, to enhance engineering practice ability, innovation ability of students.
Key words interdisciplinary teaching; applied mathematics; machine vision
0 前言
21世纪是世界经济、文化、科技迅猛发展的时期,由此派生了一系列复杂的问题,所以需要的人才也是复合型的人才。交叉学科教学是教育部提出的深化研究生教育改革的意见,鼓励多学科交叉培养可以拓宽学术视野,激发创新思维。
国内的国防科技大学,以“微机电系统分析与设计”课程为例,分析了交叉学科研究生课程的特点,并从基础知识教学、专题研讨和实践能力等进行了教学方法的探索与实践。①南京航空航天大学开展了交叉学科课程教学方法的研究,积极引导研究生探索和主动学习,促进其思维发散。②美国政府颁布了新修订的学科目录,交叉学科的数量从1985年的9个增至2000年的21个,反映出美国增设交叉学科专业,加大学科交叉人才培养力度的趋势。③
机器视觉是一门多学科交叉的课程,涉及到应用数学、光学、图像处理等相关内容。这门课程中的数学应用颇多,并且涉及到的算法抽象,概念较多,学习后并不具备实际的应用能力。由于大多数应用数学的算法可以以图像处理的形式表现出来,为此,研究了一种基于机器视觉设备的计算机应用数学基础试验教学方法,将枯燥的数学理论与实践应用结合起来,使得学生可以在理论学习过程中,了解每个数学理论的实际应用效果,应用到研究生的创新实验中,提升学生的学习兴趣和主动性。
1 教学课件的主要构成
该系统教学课件是根据作者前期国家自然科学基金研究成果和多年教学经验总结的软硬件结合的系统,④软件主要包括:数学基础课件模块,曲线绘图构件,程序开发环境。硬件主要包括:计算机、图像采集与光源,运动控制机构。
1.1 硬件系统组成
1.1.1 工业摄像机和投射光源
为了进行更好的图像采集,系统采用了畸变率较小的工业摄像机和工业镜头。工业摄像机采用千兆以太网技术,通过TCP/IP 技术完成图像的传输和采集。 摄像机的驱动开发成可以直接使用的课件模块,可以直接进行数字图像采集。以双目摄像机为中心建立了一个世界坐标系,坐标系的参数已经经过系统自动标定。
数字图像采用1280?024 pixel的分辨率,在这种分辨率下,图像可以将比较复杂的函数离散化表示出来。
投影光源采用DLP技术的LED投影光源,该光源可以通过程序设计投射出彩色图像和黑白图像,投射图像可以投射出预订的光强变化函数,如图1所示。
1.1.2 运动控制系统
运动控制结构包括平移台和转台,主要用于提供坐标的旋转、平移和坐标变换。系统通过步进电机和脉冲发生控制来完成,上位机通过RS-232与控制器进行连接。
1.2软件结构
系统的软件由以下几个部分构成:
操作系统:Windows操作系统
程序开发环境:VISUAL STUDIO 2008
三维显示与接口:基于OPENGL开发的三维显示接口控件。
教学基本课件:自行开发的基本插值方法、向量空间演示、矩阵运算等基本课件。
应用开放接口:图像处理中的最常用二值化、阈值分割、边缘提取、特征匹配等,还包括摄像机的自标定、采集、光源投射等。
根据以上软件的开放接口,利用已经设计好的程序和算法,可完成对图像的初步处理作业。
2教学课件的搭建
根据搭建的教学平台可以组成多种教学课件,根据我们常用的实验方式,完成几种常用的应用数学课程的教学:
2.1应用机器视觉进行矩阵运算教学
矩阵运算在机器视觉中应用最为广泛,较为典型的就是摄像机的标定的旋转平移矩阵,物空间到像空间的变换矩阵和坐标变换矩阵。
在矩阵运算中,基本的物空间到像空间旋转平移矩阵如公式(1)所示:
= + (1)
旋转矩阵R为一个3?的矩阵,平移矩阵T为3?的向量,通过对简单的旋转平移矩阵的计算,验证坐标转换关系。利用摄像机的三自由度调节云台,在三个方向上给出已知的旋转角度,求出实际的旋转平移矩阵。经过这个教学,同学们理解了矩阵运算的应用领域,也对矩阵运算有了深刻的印象。
2.2赋范线性空间的教学
应用数学基础教学中最为枯燥的就是赋范线性空间,而图像处理和三维点阵的处理可以为赋范线性空间提供一个非常好的实例。
如图2所示,由教师在机器视觉系统中给出一个含有带有空间坐标信息的三维点阵,这个三维点阵是实测的一位教师的手指尖的三维点云图。该点阵的每一个点都带有的三维坐标以及灰度信息。另外,三维点阵还存在一些测量的噪声,一些较小的孤立点集。
这个教学课件主要通过学习如何去除点云的噪声来学习赋范线性空间。教师首先通过设计好的软件来显示距离、范数、度量、开集、收敛等一系列概念,由同学们根据点云之间的性质,判断出开集、闭集,从而通过编写程序判断出噪声点和孤立点群并加以去除,理解有界赋范线性空间等概念。
3 结论
通过机器视觉这门课程的教学,很好的将应用数学基础中枯燥的概念转换为生动的实例,并具有较强的程序实现性。较之传统的学习方法,提高了学生的兴趣。此教学方法理论与实践相结合,是响应国家“卓越计划”的教学改革新方法。不但可应用于本科生、研究生的教学过程中,也可应用到教师的科学实验中。
基金项目:国家自然科学基金《单目高精度大型物体彩色三维数字化测量原理研究》(编号:60808020)和《基于视觉的织物疵点三维检测和三维识别原理研究》(编号:61078041)
注释
① 肖定邦,辛华,吴学忠等.交叉学科研究生课程教学的探索与实践[J].高等教育研究学报,2012.3:115-117.
② 李修建,孔迪,刘菊,等.注重学科交叉融合 实现个性化教学[J].学位与研究生教育,2014.5:24-27.
关键字:计算机视觉;作物病害诊断;进展;模式识别
中图分类号:TP311 文献标识号:A 文章编号:2095-2163(2015)02-
The Research Development of Computer Vision in the Plant Disease Diagnosis
PU Yongxian
(Computer Science Dept .Dehong Teachers'college, Dehong Yunnan 678400, China)
Abstract: according to the statistics, crop yield loss caused by disease in more than 12% on average, disease occurs not only affect the production, also decreased the quality of the product. Research by computer vision technology realizes fast and accurate diagnosis of crop disease, and provides scientific basis for disease prevention and control, which is the urgent demand of agricultural informatization development. Articles on computer vision technology is applied to the crop disease diagnosis has carried on the detailed analysis and research, in order to get these new technologies in the current situation of crop disease diagnosis each link, points out the shortages of computer vision in the diagnosis of crop diseases and research direction. The study on the development of crop disease intelligent detection technology will play an important role.
Key words:Computer Vision; Crop Disease Diagnosis; Progress; Pattern Recognition
0引言
在作物生产中,病害是制约作物质与量的重要因素。病害发生,往往致使作物的使用价值降低,甚至还会导致大面积减产,乃至绝收,造成巨大的经济损失。因此,在作物生长过程中,病害防治是个关键的问题之一。因各种原因植保人员匮乏,而种植户个体素质差异及受一些主观人为因素的影响,对作物病害诊断存在主观性、局限性、模糊性等,不能对作物病害的类型及受害程度做出客观、定量的分析与判断,结果要么是药量不对、要么是药不对症,严重影响了作物的质与量。
计算机视觉也称为机器视觉,是研究如何用计算机来模拟和再现人类视觉功能的科学,也被称为图像理解和图像分析,是人工智能领域的一个重要分支。随着计算机技术、图像处理和人工智能等学科的发展,以及数码相机、手机等摄像工具像素的提高,将机器视觉用于作物病害诊断,实现作物病害的无损检测、快速诊断提供了新的途径和方法[1]。报道最早的是在1989年穗波信雄等人[2]对采集的缺乏钙、铁、镁营养元素的茨菇叶片图像进行研究,在RGB模型中,利用直方图分析了正常和病态的颜色特征。为适应农业信息化的迫切需求,国内外学者对机器视觉用于作物病害诊断进行了研究和实践,而取得进展主要集中在近10年,涉及的作物有水稻、玉米、小麦、葡萄、黄瓜、甘蔗、蔬菜等病害[3-14],这些研究针对不同作物,从不同侧面为作物病害实现自动化诊断提供了理论和实践基础。因机器视觉比人眼能更早发现作物因病虫危害所表现的颜色、纹理、形状等细微变化,所以利用这种技术病害病害与人工方式相比,提高了诊断的效率和精准度,为作物保护智能化、变量喷药等提供了科学依据。
本文综述和归纳了机器视觉诊断作物病害的主要技术:病害图像采集、增强处理、病斑分割、特征提取、特征优化、病害识别等各环节的方法及现状,指出了机器视觉诊断作物病害存在的不足和研究方向。该研究对实现作物病害的机器视觉诊断技术的发展将起到重要的推动作用。
1机器视觉识别作物病害的技术路线与进展
作物病害因其病原物种类不同会产生形状、颜色、纹理等不同的病斑,通常专业植保技术人员就是根据这些特征判断病害的。机器视觉诊断作物病害是通过无损采集病害图像,利用图像处理技术对图像增强处理、分割病斑,提取病斑特征、优化特征,用模式识别技术诊断病害类别及危害程度,从而为病害的防治提供科学依据。图1为机器视觉诊断作物病害的技术路线图。
图1机器视觉识别作物病害技术路线图
Fig 1 Technology roadmap of machine vision recognition crop diseases
1.1病害图像采集与增强处理
(1)病害图像采集方法。图像采集是病害识别的第一步,采集的质量会直接影响识别结果。常用采集设备有数码摄像机、扫描仪、数码相机、手机等。其中,数码相机便于携带,能满足图像清晰度要求,符合野外作业等特点,因此病害图像采集中用得较多。依据采集环境氛围分为室内采集和室外(田间)采集两种。室内采集是将田间采摘到的病害标本经密封保湿后使用CCD摄像机或数码相机在室内摄取病害的标本图像。在田间采集图像中,有学者为了采集到高质量的图像,采取了一系列措施以减少外界因素的影响。如陈佳娟[5]采用便携式扫描仪采集图像,以减少自然光照对图像质量的影响。徐贵力等人[6]设计了活体采光箱,使照射光变成反射光,从而避免了阴影,以减少误差。这种规范图像采集方式虽简化了后期图像处理和识别的难度,但基层生产单位可能缺乏配套的技术设备,且会使病害识别过度依赖图像。为扩展应用范围和通用性,有学者对在田间自然光照射下直接获取的病害图像,用图像处理和模式识别技术诊断病害进行了研究,如李宗儒[7]用手机拍摄了苹果的圆斑病、花叶病等5种病害图像,对病害图像增强处理、分割病斑,提取病斑特征,用BP神经网络识别病害,获得了较好效果。姜武[8]用Canon EOS 50D相机在阳光充足的早晨拍摄山茶叶片图像,进行颜色分形和RGB强度值提取,用支持向量机对山茶分类识别,取得了较好效果。
(2)图像增强方法。在采集图像过程中,因受设备、环境等因素影响,往往使采集到的图像含有噪声,若不对其增强处理会影响到病害的正确识别率。病害图像增强是为病斑分割,特征提取做准备,所以应确保在去除噪声的同时,保证病斑边缘不模糊。图像增强处理根据其处理的空间不同,分为空域法和频域法。空域法是对图像本身直接进行滤波操作,而频域法是对图像进行转化,将其转化到频率域中去噪处理,之后再还原到图像的空间域。图像增强处理常用方法有:直方图均衡化、对比度增强、均值滤波、中值滤波、高斯滤波、锐化等。王静[9]利用数码相机采集了赤星病与野火病两种病害图像80幅,采用灰度图像直方图均衡化及中值滤波两种方法对图像增强处理,实验表明,中值滤波去噪效果最好,在保留图像病斑边缘信息的同时,使病斑轮廓与细节更加清晰,便于后期病斑分割及特征提取。刘芝京[10]采集黄瓜早、中、晚期的角斑病病害图像,分别用均值滤波、中值滤波、高斯滤波等对图像处理,实验表明这些去噪方法中,高斯滤波效果最好。
1.2病斑特征获取
(1)病斑分割
计算机视觉主要是依据病斑的特征信息诊断病害类别及危害程度的。因此,彩色病斑的准确分割,是后期提取病斑特征,病害类别的客观、准确诊断的关键环节之一。当前针对作物病害图像分割算法有阈值分割、空间聚类、区域分割、边缘检测分割、计算智能方法等。由于作物病害图像存在背景复杂、病斑区域排列无序、颜色、纹理分布不均、病斑边界模糊、叶片表面纹理噪声等干扰,因此尚无一种鲁棒性好,且简单适用的通用方法,也还没有一种判断分割是否成功的客观标准。近年来学者们对作物病害图像的分割进行了大量研究,试图寻找一种更具潜力的分割算法,以期获得更完美,通用的分割方法。赵进辉等人[11]分析了甘蔗病害图像的颜色与形状特征,采用面积阈值及链码分割赤腐病和环斑病病斑,收到了较好的效果。管泽鑫等人[12]提取水稻病斑与斑点外轮廓颜色,用最大类间方差法(Otsu[13])分割病斑,取得了较好的效果。邵庆等人[14]以小麦条锈病为例,对获取的小麦病害图像采用迭代阈值分割和微分边缘检测分割病斑。温长吉等人[15].用改进蜂群算法优化神经网络实现玉米病害图像分割。祁广云等[16]采用改进的遗传算法及BP神经网络对大豆叶片病斑分割,能有效提取病斑区域。毛罕平等人[17-18]利用模糊C均值聚类对棉花、玉米病害图像的病斑进行分割。张飞云[19]采用K-means硬聚类算法对玉米叶部病害图像分割,得到彩色病斑。张芳、仁玉刚[20-21]用采分水岭算法分割黄瓜病害图像,正确率均在90%以上。刘立波[22]对水稻叶部病害图像的分割进行研究,结果证明,模糊C均值聚类法的分割效果较好,但速度欠佳,Otsu法分割效果略差,但速度较快。濮永仙[23]利用支持向量机检测烟草病斑边缘,以分割彩色病斑。石凤梅等人[24]利用支持向量机分割水稻稻瘟病彩色图像病斑,其分割效果优于Otsu法。
(2)病斑特征提取
计算机视觉识别作物病害用到的特征主要有颜色、纹理、形状等特征。颜色是区分病害类别的重要特征,有RGB、HSI、Lab、YUV等7种颜色空间模型,可得到颜色特征值和颜色特征差异,而模型的选择会影响到病害识别效果。纹理是指图像中反复出现的局部模式及排列规则。作物病害图像正常与病变部分的纹理在粗细、走向上有较大差异。纹理特征有基于灰度直方图的统计测度,基于灰度共生矩阵的纹理特征和基于游程的纹理描述特征。提取纹理特征的方法有分形维数、小波变换、Gabor小波变换、局域二值模式,以及Gabor分块局域二值模式方法等。形状常与目标联系在一起,形状特征可以看作是比颜色和纹理更高层的特征,它能直观描述目标和背景之间的区别,不同病害的病斑在尺寸大小、似圆性、长短轴等方面有不同特性,对旋转、平移有很强的稳定性。提取病斑形状特征的方法有弗里曼链码法,傅里叶描述子,多尺度曲率空间方法等。王美丽等人[25] 在HSV颜色空间提取小麦白粉病和锈病病害图像的颜色和形状特征,对病害进行识别,识别率达96%以上。蔡清等人[26]对虫食菜叶图像处理后,提取其形状的圆形度、复杂度、球形度等7个特征,用BP神经网络识别病害。王克如[27]提取玉米病害图像中纹理特征的能量、熵及惯性矩作为识别病害的特征,实验得出,以单个特征识别正确识别率达90%,综合应用三个纹理特征,识别率达100%。田有文等人[28]提取葡萄叶部病斑的颜色、纹理、形状特征,用支持向量机识别,实验表明,综合应用三种特征的识别率比只用单一特征的识别高。李旺[29]以黄瓜叶部3种常见病害图像为研究对象,提取病斑颜色、纹理和形态特征总共14个特征,用支持向量机识别,实验表明,分别以颜色、纹理、形状特征识别,识别率分别为72.23%、90.70%、90.24%,综合3种特征识别率为96.00%。
(3)特征优化
特征优化是指在特征提取完成后,将特征因子中对识别病害贡献低的因子丢弃,以确保在降低特征维度的同时,能提高病害的识别率。常用的特征优化方法有:逐步判别法、主成分分析法、遗传算法等。实践证明,优化后的特征能更好的表征病害,能在特征减少的情况下提高诊断的正确率。管泽鑫等人[12]提取水稻3种常见病害图像的形态、颜色、纹理共63个特征,用逐步判别法对特征优化,用贝叶斯判别法识别病害,可使特征数减少到原来的35.2%,而病害准确识别率达97.2%。柴洋等人[30]提取了番茄早疫病、晚疫病等4种叶部病害图像的颜色、纹理和形状共18个特征,用逐步判别法优化,最终选取12个特征,用主成分优化后综合成2个新变量,分别用贝叶斯判别法和用费歇尔判别函数识别病害,均取得了较好的效果。陈丽等人[31]提取了玉米5种叶部病害图像病斑特征,用遗传算法优化特征,用概率神经网络识别病害,识别率为90.4%。彭占武[32]提取了黄瓜6种常见病害图像的颜色、纹理、形状特征14个,用遗传算法优化得到8个特征,用模糊识别模式识别病害,其识别率达93.3%。濮永仙[33]提取了烟草常见病害图像的颜色、纹理及形态共26个特征,用双编码遗传算法与支持向量机结合优化特征,最后得到16个特征,该方法与没有采用遗传算法的支持向量机识别相比,在同等条件下,特征向量减少了38%,正确率提高了6.29%。所谓双编码遗传算法,即二进制编码和实数编码结合,支持向量机作为底层分类器,分类精度作为遗传算法的适应度对个体进行评估,在去除冗余特征的同时为保留的特征赋予权重,如图2所示。韩瑞珍[34]提取了害虫的颜色、纹理特征共35个,用蚁群算法对特征优化,将35个特征降低到29个,识别准确率从87.4%提高到89.5%。
图2双编码遗传算法中的个体
Fig 2 Individual in the double coding genetic algorithm
1.3病害模式识别
模式识别也叫模式分类,指依据输入的原始数据,判断其类别并采取相应的行为[35]。病害模式识别的任务是依据特征数据由分类器完成分类的,分类器设计和特征描述共同决定了模式识别系统的性能。用于病害识别的模式可分为统计模式、句法结构模式、模糊模式和机器学习方法四类。其中,统计模式识别是用概率统计原理,获取满足某种已知分布的特征向量,然后通过决策函数来分类,不同的决策函数能够产生不同的分类方法。常见的统计模式识别方法有两种:一是由Neyman决策和贝叶斯决策等构成的基于似然函数的分类方法,另一种是基于距离函数的分类识别方法。模糊模式识别是基于模糊理论利用模糊信息进行模糊分类的,主要方法有最大隶属原则识别法、接近原则识别法和模糊聚类分析法三种。机器学习指计算机模拟或者实现人类的某些行为,它的应用已涉及很多领域。目前常用于作物病害识别的机器学习方法有人工神经网络、支持向量机(SVM)、移动中心超球分类器等。其中,支持向量机分类器是目前机器学习领域的研究热点之一,它能够较好地解决小样本、非线性、高维数的分类问题,且具有良好的推广和泛化能力。神经网络是基于经验风险最小化原则,以训练误差最小化为优化目标,而SVM以训练误差作为优化问题的约束条件,以置信范围最小化为优化目标,所以SVM的解具有唯一性,也是全局最优[36]。移动中心超球分类器是近年来新提出的一种分类器,它是一种对参考样本进行压缩的方法,可以节省空间,但其识别率不如人工神经网络高。以下是在作物病害诊断中较成功的几种识别模式及技术进展。
1.3.1 贝叶斯判断法
贝叶斯判别法是一种典型的基于统计方法的分类器。它的基本原理是将代表模式的特征向量X分到m个类别(C1,C2,…,Cm)中的某一类。操作步骤为:
(1)设样本有n个属性(W1,W2,…Wn),每个样本可看作是n维空间的一个点X=(x1,x2,…,xn);
(2)设有m个不同的类(C1,C2,…,Cm),X是一个未知类别的样本,预测X的类别为后验概率最大的那个类别;3)用贝叶斯后验概率公式计算,并进行比较,依据后验概率可将样本X归到Ci类中,当且仅当>,成立。贝叶斯分类器因其结构简单、易于扩展等特点,被广泛用于作物病害诊断。杨昕薇等人[37]对3种寒地水稻常见病害图像处理、提取特征,用贝叶斯判别法识别病害,其识别率达97.5%。赵玉霞等人[38]提取玉米锈病、灰斑病等5种病斑图像的特征,利用朴素贝叶斯分类器识别,其识别精度在83%以上。柴阿丽等人[39]提取了番茄早疫病、晚疫病等4种叶部病害图像病斑的颜色、纹理和形状特征,优化特征后,用贝叶斯判别法识别病害,其识别率达94.71%。
1.3.2 人工神经网络识别法
神经网络技术是目前广泛使用的一种机器学习方法,其研究工作始于19世纪末20世纪初[40],因具有并行处理、非线性映射、自适应学习、鲁棒容错性等优点,以及采用数据驱动模式,故在模式识别领域得到广泛应用。人工神经网络诊断作物病害的基本步骤是:构建神经网络识别模型,将已提取并优化好的病害图像特征数据作为分类器的输入特征矢量对模型训练,经过训练后的模型可实现作物病害的分类识别。目前应用于作物病害识别的人工神经网络主要有:BP神经网络、概率神经网络、自组织特征映射网络,并衍生出模糊神经网络、量子神经网络等。BP神经网络具有较好的自学习性、自适应性、鲁棒性和泛化性。概率神经网络是径向基网络的一个重要分支,其分类器是一种有监督的网络分类器,在识别过程中随着训练病害种类的增加[41],其运算速度会减慢。自组织特征映射网络分类器是于1981年提出的一种由全连接的神经元阵列组成的自组织自学习网络[42],可以直接或间接地完成数据压缩、概念表示和分类的任务,多项实验表明它的病害图像识别率都在90%以上。模糊神经网络是模糊理论同神经网络相结合的产物,它汇集了神经网络与模糊理论的优点,集学习、联想、识别、信息处理于一体。量子神经网络是量子计算理论和人工神经网络结合的产物,并集成了两者的优点。王军英[43]以葡萄发病部位、病斑形状、病斑颜色和主要症状为特征,用改进的BP神经网络识别病害,识别率达95.36%。谭克竹等人[44]用BP神经网络识别大豆的灰斑病、霜霉病和斑点病的特征与病害的关系,其轻度病害的识别精度为87.19%,中度病害的识别精度为90.31%,重度病害的识别精度为93.13%。魏清凤等人[45]利用模糊神经网络诊断模型以诊断蔬菜病害,其病害识别率达85.5%。张飞云[19]提取了玉米灰斑病、锈病和小斑病病害图像的颜色、纹理、形状特征,用量子神经网络进行病害识别,其平均识别率达94.5%。陈丽等人[31]对田间采集的玉米叶部病害图像,对图像分割、特征提取,利用概率神经网络识别病害,其识别率为90.4%,同样条件下高于BP神经网络。
1.3.3 支持向量机识别法
支持向量机[46](Support Vector Machine,简称SVM)是Vapnik等人提出的一款新型的机器学习方法。SVM有线性可分和线性不可分两种情况,采用不同的核函数会有不同的SVM 算法。常用的核函数有:线性核函数、多项式核函数、径向基核函数、Sigmoid核函数等。SVM在基于数据的机器学习领域,它兼顾训练误差和泛化能力,在解决小样本、非线性、高维数、局部极小值等模式识别问题中表现出许多特有的优势[47-48],在基于图像诊断作物病害领域应用越来越多。宋凯等人[49]提取了玉米叶部病害图像特征,选择基于SVM的不同的核函数识别病害,其中径向基核函数的正确识别率为89.6%,多项式核函数为79.2%,Sigmoid核函数的识别性能最差。刘鹏[50]提取甜柿病害图像的纹理特征和颜色特征采用SVM识别病害,结果表明,当SVM类型为nu-SVR,核函数为Sigmoid,参数C=26、ξ=24时识别效果最好。田有文等人[51]用支持向量机识别黄瓜病害,实验表明,SVM方法在处理小样本问题中具有良好的分类效果,线性核函数和径向基核函数的SVM分类方法在黄瓜病害的识别方面优于其他类型核函数的SVM。越鲜梅[52]提取了向日葵叶部的叶斑病、黑斑病、霜霉病3种病害图像的颜色矩、纹理特征共9个特征,采用一对一投票决策的SVM多分类模型识别病害,取得了较好的效果。刘立波[22]提取了水稻常见叶部病害图像的颜色、纹理、形状等特征,对特征优化后,分别用最近邻域、BP神经网络和SVM方法识别病害,其中识别率最高的是SVM,BP神经网络居中,最近邻域法最差,BP神经网络的训练速度最慢。
2机器视觉识别作物病害存在的问题与进一步研究重点
将计算机视觉用于作物病害诊断,以改变传统的诊断方式,为种植户准确诊断病害,以及变量施药提供了决策支持。目前,计算机视觉诊断作物病害虽然取得了一定的进展,但从研究的深度、应用的范围和实用化角度看,还存在许多不足,还需进一步深入研究。
2.1机器视觉诊断作物病害存在的问题
笔者查阅了大量文献,对目前常用的机器视觉识别作物病害的技术进行了研读,目前机器视觉识别作物病害的技术还不够成熟,存在以下问题:
(1)在实验室条件下计算机视觉诊断作物病害正确率高,但应用到田间,难度较大,主要原因是大多研究是在简单背景下、对少数几种病害图像诊断,而对大田复杂背景下诊断多种病害的研究还比较少。
(2)病害图像分割背景简单,对于自然状态和复杂背景下的病害图像分割有待进一步的研究。
(3)因作物病斑的大小、颜色等图像特征在不同时期有差异,对于某一发病时期建立的作物病害诊断系统,用于不同发病时期诊断识别率会有所不同。
(4)许多分类算法和分类器都存在各自的优缺点,不能适合所有作物病害识别,没有统一的评价标准,难以实现各诊断系统之间的客观比较。
(5)不同研究者使用的病害图像各不相同,难以比较不同。
(6)机器视觉诊断作物病还是少数专家对某类作物在局部范围内的研究,很难满足现实生产的多种作物、不同区域同时诊断的要求。
2.2进一步研究重点
根据以上存在的问题,今后的研究方向和重点为:
(1)机器视觉识别作物病害技术从实验室向大田扩展时,需综合考虑所提取的病害图像特征在复杂背景下的可获取性、稳定性、可操作性等。
(2)机器视觉诊断作物病害系统应充分考虑不同发病时期,识别特征的变化规律。
(3)研究适合多种作物在复杂背景下实现病斑分割、特征提取等高效的图像处理算法,在模式识别方面要侧重于模糊数学、支持向量机、神经网络、遗传算法、组合优化等理论与技术的研究。
(4)建立规范统一的作物病害图像数据库,图像可普遍获取,建立合理完善的病害分割、特征提取、病害种类识别等系统,以及病害评价标准。
(5)模式识别病害中的算法需进一步发展和优化,建立统一的评判标准,评价方法适合所有的识别算法和各应用领域,采用定量和客观评价准则,可精确描述算法性能,评判应摆脱人为因素。
参考文献:
[1]GEORGIEVA K, GEORGIEVA Y, DASKALOV D.Theoretical substantiation of model of system for evaluation a state of vine plants and taking a decision for plant protection activities[J]. Trakia Journal of Sciences (Series Social Sciences),2003,1:30-32.
[2]穗波信雄.图像处理在植物生长信息提取中的应用[R].日本:农业机械学会关西支部研究会资,1992:63-46.
[3]SASAKI Y , OKAMOTO T. Automatic diagnosis of plantdisease-recognition between healthy and diseased leaf[J]. Journal of the Japanese Society of Agricultural Machinery,1999,61(2):119-126.
[4]陈佳娟,纪寿文,李娟,等.采用计算机视觉进行棉花虫害程度的自动测定[J].农业工程学报,2001,17(2):157-160.
[5]贾浩.基于计算机视觉的玉米叶部病害识别技术研究[D]. 泰安:山东农业大学,2013.
[6]徐贵力,毛罕平,李萍萍,等.差分百分率直方图法提取缺素叶片纹理特征[J].农业机械学报,2003,34(2):76-79.
[7]李宗儒.基于图像分析的苹果病害识别技术研究[D].杨凌:西北农林科技大学,2010.
[8]姜武.模式识别技术在山茶属植物数值分类学和叶绿素含量预测中的应用研究[D]. 金华:浙江师范大学,2013.
[9]王静.基于图像处理技术的烟叶病害自动识别研究[D]. 昆明:昆明理工大学,2009.
[10]刘芝京.基于图像处理的黄瓜细菌性角斑病的识别研究[D]. 成都:西华大学.2012.
[11]赵进辉,罗锡文,周志艳.基于颜色与形状特征的甘蔗病害图像分割方法[J].农业机械学报,2008,39(9).
[12]管泽鑫,唐健,杨保军,等.基于图像的水稻病害识别方法研究[J].中国水稻科学,2010,24(5):497~502.
[13]OTSU N A. Threshold selection method from gray-level histo-gram[J]. IEEE Trans Syst Man Cybenet, 1979, 15: 652-655.
[14]邵庆,张楠,路阳.小麦病害图像识别处理及形状特征提取研究[J].农机化研究,2013,35(8):35-37.
[15]温长吉,王生生,于合龙,等.基于改进蜂群算法优化神经网络的玉米病害图像分割[J].农业工程学报,2013,29(13):142-147.
[16]祁广云,马晓丹,关海鸥.采用改进的遗传算法提取大豆叶片病斑图像[J].农业工程学报.2009,25(5).
[17]毛罕平,张艳诚,胡波.基于模糊C均值聚类的作物病害叶片图像分割方法研究[J].农业工程学报.2008,24.
[18]张柏毅,朱景福,刘勇.基于模糊C-均值聚类的作物叶部病斑图像分割[J].智能计算机与应用.2011,3(10).
[19]张云飞.基于量子神经网络和组合特征参数的玉米叶部病害识别[J].南方农业学报,2013,44(8):1286-1290.
[20]张芳.复杂背景下黄瓜叶部病害识别方法研究[D]. 沈阳:沈阳农业大学,2014.
[21]任玉刚,张建,李淼,等.基于分水岭算法的作物病害叶片图像分割方法[J].计算机应用,2012,32(3):752-755.
[22]刘立波.基于图像的水稻叶部病害诊断技术研究[D]. 北京:中国农业科学院,2010.
[23]濮永仙.基于支持向量机与多特征选择的作物彩色病斑边缘检测[J].计算机应用系统,2014,9(23):118-123.
[24]石凤梅,赵开才,孟庆林,等.基于支持向量机的水稻稻瘟病图像分割研究[J].东北农业大学学报,44(2):128-135.
[25]王美丽,牛晓静,张宏鸣,等.小麦叶部常见病害特征提取及识别技术研究[J].计算机工程与应用, 2014,50(7):154-157.
[26]蔡清,何东健.基于图像分析的蔬菜食叶害虫识别技术[J].计算机应用, 2010,7(30):1870-1872.
[27]王克如.基于图像识别的作物病虫草害诊断研究[D]. 北京:中国农业科学院,2005.
[28]田有文,李天来,李成华,等.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-179.
[29]李旺.基于图像处理的黄瓜叶部病害识别研究[D]. 长沙:湖南农业大学,2013.
[30]柴洋,王向东.基于图像处理的温室大棚中番茄的病害识别[J].模式识别与仿真,2013,32(9):83-88.
[31]陈丽,王兰英.概率神经网络在玉米叶部病害识别中的应用[J].农机化研究,2011,(6):145-148.
[32]彭占武.基于图像处理和模式识别技术的黄瓜病害识别研究[D].长春:吉林农业大学,2007.
[33]濮永仙,余翠兰.基于双编码遗传算法的支持向量机作物病害图像识别方法[J].贵州农业科学,2013,7(41)187-191.
[34]韩瑞珍.基于机器视觉的农田害虫快速枪测与识别研究[D].杭州:浙江大学,2014.
[35]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2002:284-304.
[36]奉国和.基于聚类的大样本支持向量研究[J].计算机科学,2006,33(4):145-147.
[37]杨昕薇,谭峰.基于贝叶斯分类器的水稻病害识别处理的研究[J].黑龙江八一农垦大学学报,2012,24(3):64-67.
[38]赵玉霞,王克如,白中英等.基于图像识别的玉米叶部病害诊断研究[J].中国农业科学 2007,40(4):698-703
[39]柴阿丽,李宝聚等.基于计算机视觉技术的番茄叶部病害识别[J].园艺学报,2010,37(9):1423-1430.
[40]Han Jiawei,Kamber M.数据挖掘概念与技术[M].第二版. 范明,孟小峰,译.北京:机械工业出社,2007:251-306.
[41]贺鹏,黄林.植物叶片特征提取及识别[J].农机化研究,2008(6):168-170.
[42]杨占华,杨燕.SOM神经网络算法的研究与进展[J].计算机工程,2006,32(16):201-228.
[43]王军英.基于BP神经网络的葡萄病害诊断系统研究[J].农业信息网,2013,8:30-33.
[44]谭克竹,沈维政.基于BP神经网络的大豆叶片病害诊断模型的研究[J].控制理论与应用,2013,32(12):5-7.
[45]魏清凤,罗长寿,曹承忠,等.基于模糊神经网络的蔬菜病害诊断模型研究[J].河南农业科学,2013,(9):4224-4227.
[46]BURGOS-ARTIST X P, RIBERA A, TELLAECHE A, et al. Improving weed pressure assessment using digital images from an experience-based reasoning approach [J]. Computers and Electronics in Agriculture, 2009, 65(2): 176-185.
[47] BURGES C J C. A tutorial on support vector machines for pattern recognition [J].Data Mining and Knowledge Discovery, 1998, 2(2):121-169.
[48]Steve R Gunn. Support vector machines for classification and regression [R].Southampton: University of Southampton, 1998:1-28.
[49]宋凯,孙晓艳,纪建伟.基于支持向量机的玉米叶部病害识别[J].农业工程学报,2007,23(1):155-157.
[50]刘鹏,屠康,徐洪蕊,等.基于支持向量机的甜柿表面病害识别[J].现代食品科技,2011,27(3):349-353.
[51]田有文,牛妍.支持向量机在黄瓜病害识别中的应用研究[J].农机化研究,2009,(3):36-38.
[52]越鲜梅.基于图像识别的向日葵叶部病害诊断技术研究[D].呼和浩特:内蒙古工业大学,2013.
1 项目基金:云南省科学研究基金子课题(2013Y571)。
作者简介:濮永仙( 1976-),女,云南腾冲人,硕士,副教授,主要研究方向:机器视觉诊断作物病害,智能农业方面的研究。
??
??
美国研究机构Gartner日前《2015新兴技术炒作周期报告》(Hype Cycle for Emerging Technologies, 2015)。报告评估了112个领域超过2000项新兴技术的市场类型、成熟度和商业价值。跟去年一样,今年的报告依然以通往数字化企业之路作为报告的主题,不过今年新引入了一个概念:数字化人本主义(Digital Humanism),即人是数字化商业与工作场所的关注焦点。
无人驾驶车和物联网最热门
炒作周期又名技术成熟度曲线,是Gartner发明用来对众多行业发展周期进行预测和判断的一种手段,它描述了一项技术从诞生到成熟的过程,并将现有各种技术所处的发展阶段标注在图上,为一些行业的发展做出很好的预测。Gartner认为,任何一项技术的发展通常都会经历上升期、快速发展期、下降期、爬坡期、稳定应用期等几个阶段,技术的成熟度会逐步增加,而受关注程度则会经历迅速走上巅峰,然后又迅速被遗忘,再到随着应用推广而逐步再受关注的变化。
今年最受期望的技术是无人驾驶汽车和物联网。随着Google、苹果等技术巨头相继推进自己的无人驾驶汽车计划,以及众多汽车厂商将之纳入自己的近期路线图,去年处在巅峰前期的无人驾驶汽车今年被炒作到了顶峰。类似的,在层出不穷的智能家居解决方案的推动下,物联网技术也进入到了炒作的高峰。
企业数字化之路
Gartner认为,企业走向数字化之路一般要经历6个阶段:模拟、Web、电子商务、数字化营销、数字化企业以及自治。其中新兴技术主要集中在后三个阶段。
数字化营销(Digital Marketing)阶段强调力量的连结(移动、社交、云、信息),聚焦于以新的更复杂的方式抵达消费者。今年值得关注的技术包括手势控制、混合云计算、物联网、机器学习、理解人(People-Literate)的技术、语音翻译。
数字化企业(Digital Business)阶段的焦点将转移到人、企业与事物的融合,物联网以及显示与虚拟边界的模糊是该阶段的强烈特征。物理资产实现数字化,成为企业价值链中与既有数字化内容如系统、应用等并列的内容。值得关注的技术包括3D生物打印、人类技能增强、情感计算、增强现实、生物声学感应、生物芯片、脑机接口、居民数据科学、数字家庭一体化、加密货币与交换、数字安全、智能机器人、智能顾问、手势控制、物联网、机器学习、微数据中心、自然语言问答、量子计算、软件定义安全、虚拟现实、可穿戴技术等。
自治(Autonomous)阶段是后关系时代的最高级阶段。该阶段的企业将利用技术提供类人或替代人类的能力。使用无人驾驶汽车运送人或物品,使用认知系统答复邮件、顾客问题,都是这一阶段的典型案例。值得关注的技术包括自动汽车、生物声学感应、脑机接口、人类技能增强、机器学习、理解人技术、量子计算、智能顾问、智能微尘、智能机器人、虚拟个人助理、虚拟现实、全息显示等。
资本市场的关注方向
Gartner炒作周期展示了各创新技术的行业认知和发展趋势,也为一级和二级市场的投资方向和阶段指出道路。
技术周期逐渐在缩短,相对于2014年,2015年炒作周期幻灭期和爬坡期的技术数量大幅减少。在过去的一年,不仅是A股市场对于TMT产业尤其是电子产业的迷茫期,也是全球对于TMT行业走向的重新思考,如机器间通讯、移动健康监测、NFC已经快速实现,从幻灭期中消除。3D扫描技术也不再属于爬坡期。技术研究进步速度越来越快,导致技术周期也逐渐在缩短,证实证伪也可能在一年内发生。
关键词:视觉概念 图像集 检测技术
中图分类号:TP391.41 文献标识码:A 文章编号:1672-3791(2012)07(b)-0027-01
近年来,随着图像检索技术的快速发展,图像视觉内容信息作为一种直观形象、完整复现场景的信息表达形式产生着越来越重要的影响,可以说机器视觉的应用范围几乎涵盖了国民经济的各个行业,主要包括:工业、农业、医药、军事、航天、气象、天文、公安等。
面对如此大规模的图像视觉内容信息量,如何实现合理有效地组织、表达及搜索,已成为现阶段信息检索领域研究的热点问题。视觉概念检测技术是一种对大量图像进行自动检测、管理及分类的有效方法,它通过合理的算法对获取的图像进行检测、识别、分类,从而达到用机器代替人来做图像测量和判断的目的。若要使图像检测及分类准确性高,就需要使用高质量的图像集作为训练集,来验证算法的可行性及精确性。
1 理想的图像测试集应具备的特性[1]
1.1 图像集应在图像检索领域具有代表性及整体性
过去,研究人员使用的图像集常常是分散的,甚至可能自己的私人图像收藏,这样的测试集难免会具有片面性,理想情况是测试集包含许多不同的样本点,能够涵盖图像源的整个频谱,图像足够多到能够代表整个领域。
1.2 图像集应具备标准化的测试基准,以便执行客观的评价
在目前的文献中,经常发生不同的研究人员在同一个图像集下执行不同的性能测试,这就使得无法执行比较基准。标准化的测试基准应该至少包括典型的搜索概念、统一的图像信息,以及统一的绩效测量和报告的详细指引。
1.3 图像集应该便于用户访问及使用,而不必担心版权等问题
有些图像集,如MPEG7测试集,被科学界使用已经有一些年了,但是现在却基本找不到,并且也不能随意的了。对使用者来说,能够容易的访问并且在需要的时候可以再发表是必不可少的。
2 MIR FLICKR图像集[2]
在基于内容的图像检索里,MIR Flickr提供的图像集是一个被广泛应用,且评价较高的测试集。2008年,图像集包含25000个图像,到2010年,图像集已经扩展到了1百万个图像,这些图像具有很高的品质,且在相应领域上具有代表性和较高的关注度。如果仅是用于研究目的的话,用户可以自由使用这些图片而无需顾虑版权的问题。
Flickr还为用户提供基于图像标记的搜索和共享照片,以及两种形式的图像标签:图像的原始形式和由FLICKR清理了原始数据的处理形式,这个过程包括例如消除大写,空间,和各种各样的特殊字符等,每幅图像的标签的平均数为8.94。这些标签有的是明确描述图像的,能直接关系到图像的视觉内容,例如雪地、日落、建筑物、聚会等,有的标签表述的是一些抽象的概念,例如爱情、旅行、陈旧、可爱等。
此外,图像集还提供了图像的EXIF(可交换图像文件格式)元数据,并将其转换成易于访问的文本文件。EXIF元数据代表的数码相机在拍照时的属性和设置,包括相机的品牌、相机的设置参数(曝光,光圈,焦距,ISO感光度等)和图像的设置(方向,分辨率,日期等),Flickr从图像中分离出来EXIF元数据,而不再是嵌入在图像文件的信息。最近的一些文献已经研究了这些用于图像分类和检索的元数据的有用性,如文献[3],[4]中所示,通过考虑一个图片中所带有的元数据信息,可以使图像检测性能有明显的改善。
利用图像集对检测算法进行训练之后,使用者可以得出算法的准确性及可行性,达到对图像进行分类及检测的目的。
3 结语
从目前的调查来看,在世界范围内,虽然许多机构提供了相对成熟的图像集,但还没有发现哪个是完全满足理想图像集的特性的,希望通过图像提供者的无私帮助及组织机构的不懈努力,能够克服以前测试集的局限性,在图像质量、代表性、主题、标签信息等方面有进一步的发展。
参考文献
[1] The MIR Flickr Retrieval Evaluation.The MIRFLICKR Image Collection[EB/OL].press.liacs.nl/mirflickr,2011.
[2] M.J.Huiskes,M.S.Lew(2008).The MIR Flickr Retrieval Evaluation.ACM International Conference on Multimedia Information Retrieval(MIR''08),Vancouver,Canada.
[3] P.SINHA AND R.JAIN(2008).Classification and annotation of digital photos using optical context data.ACM International Conference on Content-Based Image and Video Retrieval(CIVR 08),Niagara Falls,Canada.309-318.
关键词:四元数小波变换;多分形;纹理分类;机器视觉;纹理图像
中图分类号: TP391.4 文献标志码:A
Texture classification based on
quaternion wavelet transform and multifractal characteristics
GAO Zhi1*, ZHU Zhihao2, XU Yonghong1, HONG Wenxue1
(
1.Institute of Electrical Engineering, Yanshan University, Qinhuangdao Hebei 066004, China;
2.Qinhuangdao Tianye Tolian Heavy Industry Company Limited, Qinhuangdao Hebei 066004, China
)
Abstract:
The paper incorporated the multifractal analysis method into the idea of Quaternion Wavelet Transform (QWT), which took advantage of the rotationinvariant properties and multifractal properties of texture image, and could make up for the lacks of ability to decompose input image into multiple orientation in texture classification when using wavelet transform. The experiment of texture classification using the images from UIUC shows the method has higher classification accuracy and the average correct classification rate is 96.69%. It proves this texture classification method is reasonable and effective.
Key words:
Quaternion Wavelet Transform (QWT); multifractal; texture classification; machine vision;texture image
0 引言
纹理是多数图像的基本特性,在机器视觉和模式识别中起着关键性的作用[1]。纹理分类包含两个重要的基本问题:一是如何描述纹理的特征;二是如何在纹理之间定义合适的距离或相似度测量[2]。基于以上两个问题,纹理图像的特征必须具有旋转不变性,同时还要在有效的内部空间定义纹理。目前针对纹理分析的特征提取及分类方法有很多。然而,这些方法都仅限于在小邻域的单一范围内的空间相互作用分析。因此,这些方法往往只适用于显微纹理的分析,此外这些方法的单分辨率技术也导致了纹理分析结果并不理想。
近年来,小波变换作为一种多尺度分析工具,被应用于纹理分析[3]、基于小波框架的纹理分类[4]等。 虽然小波变换在纹理分类中已经取得了显著成果,但小波变换仅仅是把给定图像分解成0°,45°,135°方向上的水平、对角线和垂直方向上的3个定向平滑子带。这就限制了小波变换对于旋转不变纹理图像的分析[5]。
由于2D实值信号可以用四元数表示,因此相对应的四元数小波尺度函数和小波函数的构造就成为分析2D信号的关键。四元数小波变换(Quaternion Wavelet Transform, QWT)理论是四元数理论和小波分析理论相结合产生的,可以为2D图像提供具体的相位信息。相对于传统小波变换,QWT具有旋转不变的特性,并且能对图像进行局部幅值相位分析。这些都可以弥补小波变换在图像处理中的一些不足。目前国内外已有将QWT应用到图像处理上的研究。文献[6]提出了基于QWT理论的图像多分辨率视差估计方法。文献[7]充分利用了QWT的平移不变性、旋转不变性进行图像分析及处理。而文献[8]首次将QWT应用于纹理分类,并证明了其方法的可行性。
分形概念是数学家Mandelbort[9]于20世纪70年代为了表征复杂图形和复杂过程率先引入自然科学领域的,之后得到了迅速的发展。分形又分为单分形和多分形,对于简单分形,用一个分形维数就可以描述它的特征。但是对于许多复杂的现象,它们包含了多个尺度与多个层次,每个层次之间具有不同的统计特征。因此,多分形理论就成为研究复杂结构和系统的有力工具。多分形理论研究的对象是局部不规则而整体自相似的结构,这与纹理结构的复杂性和规律性有共同之处。目前已有将多分形理论应用到纹理图像的分析和分类上的研究,文献[10]通过实验表明分形维数可以用来描述纹理模型,并可以作为纹理特征;文献[11]提出了一种基于分形的自然纹理描述方法;文献[12]应用多分形特征进行图像分割。然而应用分形理论进行纹理分析时也有不足,比如尽管有些纹理图像直观上存在很大的差异但是它们的分形维数却是基本相同的。如图1所示的两幅纹理图片,这两幅图片显然存在很大的差异,但是通过计算它们的分形维数(Fractal Dimension, FD)却很接近。
摘要:介绍了数据融合技术的基本概念和内容,分析了该技术在森林防火、森林蓄积特征的估计和更新、森林资源调查等方面的应用,提出该技术可应用于木材无损检测及精确林业。融合机器视觉、X射线等单一传感器技术检测木材及木制品,可以更准确地实时检测出木材的各种缺陷;集成GPS、GIS、RS及各种实时传感器信息,利用智能决策支持系统以及可变量技术,能够实现基于自然界生物及其赖以生存的环境资源的时空变异性的客观现实,建立基于信息流融合的精确林业系统。
多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。
一、数据融合
1.1概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。
1.2基本内容
信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。
1.3处理模型
美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
二、多传感器在林业中的应用
2.1在森林防火中的应用
在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2森林蓄积特征的估计
HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。
KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3用非垂直航空摄像数据融合GIS信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。
TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
三、数据融合在林业中的应用展望
3.1在木材检测中的应用
3.1.1木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。
X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。
基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。
目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。
南京林业大学提出了“精确林业工程系统”。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。
[参考文献]
[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.
[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.
[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.
[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.
点评:阿里巴巴集团CEO张勇表示,数字商业和实体商业充分融合,新零售正在重构一切商业要素,也重构了网商概念。在供应链、全渠道、线上线下融合、物流、金融支付等各个领域,今天的网商已经无处不在,成为全球最大的商业群体,也是商业社会进步的积极力量。近期包括华泰证券、东兴证券、安信证券、信达证券、国金证券等在内的12家券商累计20份研报看好无人零售主题性投资机会,后市表现值得期待。其中,华泰证券表示,无人零售市场空间巨大,互联网巨头加入提升行业趋势确定性,亚马逊和阿里将持续推进线上线下融合,其他互联网巨头也有望跟进。无人零售作为线上线下融合的场景之一,主题性投资机会凸显。无人零售实体店相关的机器视觉、传感器、自动售货机等硬件供货商将受益于无人零售未来推广带来的增量市场,建议关注大冷股份、远望谷、汇纳科技等。
上-上涨概率
轨道线来看,目前中轨为3196.19,指数未能形成向上的有效突破,但中轨支撑仍在,结论:中轨线未破则行情仍为震荡性质。
量能上来看,成交量稍有下降,但仍保持在二千亿水平。结论:进攻量的标准得到保持,市场活跃度总体尚可。
关键词:双语教学;智能控制课程;教材选用;教学效率;学习兴趣
由于我国高等教育,特别是工科教学过分偏重理论、脱离工程实际、内容比较陈旧;英语语言教学也采用低效的应试教育方式,因而教育部和科技专家都提出了在高校开设双语专业课程[1],选用英语原版教材,甚至引进外国专家授课的建议。从2008年起,教育部连续3年推出了双语教学示范课程。
我国现阶段开展大学双语教学非常有意义,有助于学习国外先进的高等教育理念和人才培养理念,使教学内容务实、结合工程实际,适应科学技术的发展[2];也出现一些问题,如效率低,学生掌握慢、兴趣降低等[3],教学管理难,教学难度大,很多学校主动愿望不强,一些非顶尖的应用型、教学型高校,一般每专业只选择1~3门简单的基础课程进行双语教学。
现在,各层次科研、技术人员的工作与国际科学技术的交流、合作越来越密不可分[4]。因此,教师应逐渐加强双语课程的比例。首先是专业导论课,其次是发展快的新技术课程,太过宽泛的基础课程反而不是首选,因为专业词汇少、新概念少。比如对自动化专业,我们的开设选择顺序是:自动化导论、计算机控制、智能控制技术。相反,电路分析、信号与系统并不适宜作为首选。
1双语教学的问题
目前,智能控制课双语教学中的问题表现在教与学两方面:
1) 教师教学难度大、教学效率低。目前的双语教学主体基本都是国内老师,英语水平有限,交流能力不强。智能控制课需要理解理论,更需要掌握应用技术,内容本身就有一定难度。同时,英语讲解慢,课堂传授的信息量减少,按原来的教学课时无法完成教学任务。表1是双语教改前采用全双语教学与未使用双语教学的普通班教学效果对比。
2) 学生学习兴趣低。学生开始学习的兴趣还是很高的,但由于英语水平不够、学习效率低、理解差,会导致很快失去兴趣。作为专业选修课,开始选课学生人数还很多,最后坚持下来的人数少。表2是教改前学生选课人数变化对比。
从表中的数据也可以看到,采用双语教学后,虽然学生的英语水平有提高,但专业学习反而受到影响,教学效果不好,学生意见也很大。
2教学内容和教材选择
结合学生情况和意见进行分析,我们学校是地方高校,以培养应用型人才为主,学生英语水平比较差。为此,我们在教学内容和双语比例上进行了改革。
目前,国内还找不到很满意的双语教学教材,而直接选用国外教材,难度太大,学习效率低。值得借鉴的是,清华大学出版社的《机器视觉算法与应用》教材[5]直接译自德语原著,同时双语对照,虽然占用版面,但学生的学习效果好。
在尚未有好教材的情况下,采用教师自编讲义是一个比较好的选择。自编讲义基本采用双语对照方式,核心概念、新技术内容完全采用国外原版教材内容,同时介绍一些最新技术文献,供学生自学阅读,介绍相关计算机软件英语版的使用。
由于智能控制学科起源于西方,很多基本概念、理论都翻译自国外文献,直接使用原文的概念定义、理论解释、应用举例,对于更准确地理解概念、掌握基础理论是很有帮助的。
3英语讲授比例掌握
在双语教学中,英语讲授比例一直是困扰双语教师的问题。过去只强调英语教学,口语、课本几乎全是英语,教学效率低、学生兴趣差,教学效果很不好。结合双语教学的目的、学生和课程的实际情况,我们提出了“汉语入门、英语加深、双语互助、师洋根本”的教学思想。不把英语在教学中所占的比例数据作为开设双语课程教学的一个指标,而是根据需要采用英语教学。具体措施如下:
1) 新概念、新课程入门时先使用中文介绍,使学生有基本概念,能先入门。
2) 再学习英语材料,对关键概念、知识进行加深理解和正确理解。
3) 对最新技术和发展快的技术知识,较多地使用英语材料,并侧重于阅读,使学生掌握智能控制技术的核心根本,并能灵活应用。
4) 淡化口语、听力教学。绝大多数学生以后主要是阅读英语文字资料,所以双语教学应以专业教学为核心,英语是教学辅助,学习国际最新的先进技术知识是根本。
4教学方法改革
智能控制课教学内容的专业性很强;相关技术发展很快,不断有新的研究突破和技术进步;而且该课程的工程应用性很强,是一门技术应用型课程。在双语教学实践中,结合课程特点,我们在教学方法上进行了改革。
4.1结合英文原著阅读
智能控制的基本概念和基本理论是比较复杂的,照本宣科的讲解不仅使学生没有兴趣,而且也难以准确理解。在教学中,我通过中文介绍,使学生对基本理论先有一个简单了解,然后直接选用著名学者的经典原著、代表性的研究论文作为学习材料。西方学者的研究原著、科技论文是深入浅出的,而且结合理论的图解、实例非常丰富。通过教师讲授,专业词汇学习,学生可以很快看懂、理解这些英语材料,而且对专业基础知识的理解更准确。
例如,学生对模糊集合、模糊推理等概念的理解不好,我在教学中讲授了模糊逻辑创始人扎德教授标志性的研究论文《Fuzzy Sets》[6]。论文中对模糊逻辑的研究背景、思想起源、概念定义、结论推导的翔实介绍,使学生对整个技术的起源、发展都有了了解,对概念理解和知识掌握很有帮助。
为了使教学内容与最新技术成果联系得更紧密,我们还从IEEE数据库下载了很多最新研究论文,布置给学生课后阅读,并进行讨论。
4.2知识讲授结合工程设计应用
智能控制课是技术应用型课程,要培养学生应用开发智能控制系统的能力。美国Matrix公司的MATLAB软件有专门的智能控制技术相关软件工具箱,如模糊逻辑、神经网络、遗传算法等,而且有很好的仿真平台,用户可以利用该软件开展设计和仿真实验。在教学中,我们就是结合MATLAB专业工具箱的智能控制系统开展设计开发和仿真实验。MATLAB软件目前还是英文版,对英语专业词汇的学习有助于学生使用该软件。
在学习了模糊控制技术后,学生可以使用MATLAB的模糊逻辑工具箱设计水箱液位模糊控制器、倒立摆模糊控制器,而且进行仿真实验。动态仿真显示实验效果、曲线显示控制数据,使教学形象生动,既提高了学生的学习兴趣,又培养了他们的实际工程设计应用能力。
在学习遗传算法工具箱时,如果不学习专业词汇,学生根本无法看懂大量的参数设置,更无法使用该工具进行应用开发[7]。图1是MATLAB的遗传算法图形用户界面,可见参数设置要看懂大量的专业词汇。
5教学效果
双语教学改革后,我们在2006级自动化专业同样开设了双语班和传统全中文教学普通班,对表1和2的统计项目重新进行了统计对比,如表3和表4所示。
从表中数据可以看到,经过双语教学改革后,学生不仅英语能力提高了,而且专业成绩大大提高,学习兴趣也提高了,教学效果大大改善。
6结语
由于我国在科学技术和高等教育领域与西方国家存在一定差距,因此双语教学是教育改革的一项很有意义的措施。对双语教学中的具体问题,还必须结合实际进行教学改革,适当掌握双语讲授比例,注意双语教学的根本。随着高等教育的发展,双语教学水平会不断提高,教学效果会更好。
参考文献:
[1] 教育部. 教育部财政部关于实施高等学校本科教学质量与教学改革工程的意见[EB/OL]. [2007-01-22]. edu. cn/gao_deng_781/20070205/t20070205_217843.shtml.
[2] 韩秋. 高校专业课双语教学的思考[J]. 中国高等教育,2009(19):37-38.
[3] 吴平. 五年来的双语教学研究综述[J]. 中国大学教学,2007(1):37-45.
[4] 黄明. 我国高校双语教学与国外双语教育之比较[J]. 西南交通大学学报:社会科学版,2006,7(3):49-54.
[5]C. Steger, M. Ulrich, C. Wiedemann. 机器视觉算法与应用[M]. 杨少荣,吴迪靖,段德山,译. 北京:清华大学出版社,2008:1-21.
[6]L. A. Zadeh. Fuzzy Sets[J]. Information Control,1965,8(3):338-353.
[7] 雷英杰,善文,李续武,等. Matlab遗传算法工具箱及应用[M]. 西安:西安电子科技大学出版社,2006:160-172.
Reform on Bilingual Teaching of Intelligent Control
LUO Bing, GAN Jun-ying, ZHANG Jian-min
(School of Information Engineering, Wuyi University, Jiangmen 529020, China)