公务员期刊网 精选范文 计算机视觉研究领域范文

计算机视觉研究领域精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉研究领域主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉研究领域

第1篇:计算机视觉研究领域范文

关键词:计算机视觉;定标方法;应用特点

中图分类号:TP319文献标识码:A文章编号:16727800(2012)007014902

作者简介:许志雄(1968-),男,浙江绍兴人,江汉石油钻头股份有限公司工程师,研究方向为计算机多媒体。

0引言

计算机技术的应用在诸多领域占据了主要位置,并得到了人们的极大重视。在此形势下,摄像机的高清晰度亦成为了人们追逐的目标,而在计算机视觉中的定标方法有各种不同的处理方式,从而为摄像机的发展提供了一个绝好的机会。由此,计算机视觉中的摄像机定标方法成为当今世界摄像机研究领域里至关重要的一个方面,以摄像机得到的图像信息作为出发点来计算三维空间中自然场景的几何信息成为计算机视觉的基本任务之一,并且它的应用特点也得到了人们的密切关注。

1摄像机视觉投影原理

透镜成像的原理利用了光的折射现象,而摄像机的视觉投影原理和透镜的成像原理相差无几,只不过在一些细节上进行了相应的改变,使成像更加清晰,以更好地满足人们的需求。摄像机视觉投影原理就是利用镜头的光学原理进行视觉成像,而其中又有许多理论支持,包含镜头与焦距和视角。焦距是指镜头的焦点之间的距离,对于摄像机而言,就是指从镜头的中心位置到摄像管,也可以说是成像的位置之间的距离就是摄像机镜头的焦距,只有调整好了这两者之间的距离,才能保证摄像机的摄像效果,这也是保证摄像机正常工作的首要任务。视角要受到镜头焦距的限制,由镜头焦距对摄像的大小情况而决定,摄影师们就是通过对焦距的不断变换来改变对任务的造型,从而改变人们的视觉效果。对于拍摄相同距离的目标而言,镜头焦距越大,摄像的水平视角就会变得越窄,这样带来的后果就是拍摄到的目标的范围就越小,使得拍摄效果大打折扣,从而给摄像机带来不利的使用效益。因此,必须在两者达到一个较好的组合效果之时,才能够充分发挥摄像机的作用,并将摄像艺术发挥到极致。由此可见,计算机视觉中的摄像机定标方法将会给摄像机的拍摄效果带来巨大的转变。

2计算机视觉中的摄像机定标方法

2.1三维定标法

在人们的平常思维中,凡是物体的影像必定是三维的,本文的理论研究也同样基于这样的想法。在讨论单幅图像的设计标定之时,我们所追求的理论基础就是需要摄像机的定标物是人们所追求的那种三维的效果,在此基础上再进行相关的理论研究,以达到相得益彰的效果。在此过程中,首先要准确定位定标物上一些比较重要的点的三维坐标,这样才能够为后来的工作提供方便;然后在与定标物相对应的成像上找到相应的点的位置,这是至关重要的一步,这也决定了后面成像的具体设计方法;最后在那些比较重要的点的图像上标出其具体的三维坐标,达到定标物的实际成像效果图,这样就可以完全解决摄像机的成像问题了。这种定标方法的基本原理就是充分分析定标物的三维信息,同时与它的具体成像位置相关联,在这两者之间形成一种具体的相对应关系。由此我们可以充分利用计算机的快速运算,实现摄像的功能,并适时进行程序功能改进,优化定标物参数的获取方法,从而达到增加摄像机清晰度的目标。

2.2平面定标法

与上面的定标方法相对立的一种方法就是多幅图像的设计标定。在这样的时代背景下,人们的要求应尽可能得到满足,因而理论研究者会在这个方面下足功夫,弄懂这里面的个中玄机,利用多幅图像对平面的定标物来进行物体的标定工作,以达到摄像机定标的目的。这样的平面定标方法就是充分利用平面物体的运动特性,在它和摄像机之间找到一个平衡点,观察两者的相对运动,这样的定标方法也给拍摄运动中的物体带来了生机。此方法在实施之余也会带给人们不一样的感受,让人们充分体会到摄像的魅力。当然这种考虑运动的平面定标法会受到特征点的增多的影响,随着点的不断增加,定标情况就会越来越好,定标物的精度也会不断提高,于是在定标物相同的前提下,平面定标法自然就可以从定标物上获得更多的数据信息,为准确对定标物进行定位测量提供了更多的依据。因此,这种方法的效果要比前面的方法好很多,得到推广的力度也会大大增加,所得到的经济效益也会增加,设备的成本在原来的基础上还有降低的趋势。所以,理论研究者的研究领域就会逐渐向这一方面进行转变。

2.3两步定标法

有了前面的研究成果作支撑,摄像机定标方法的进一步研究就会显得异常容易,人们的进一步要求也会得到满足,可谓一举两得。理论研究者们在有了丰富的理论和实践基础之后,利用直接线性的定标方法进行摄像机参数的进一步优化提高,通过透视原理来修改以前的参数,然后将修正的参数进行初始值的确认,把它们作为现在研究阶段的起点,在这样的起点之上综合考虑各种外界因素,利用最优化的计算机算法进行摄像机成像程序的改进,把原来的程序进行升级处理,使得定标物的精确度得到进一步的提高,这就是我们所提到的两步定标法。它的基本原理其实很简单,只不过是充分利用了原有的理论,并进行了一定的创新而已。但就是这样的创新步伐的迈出,给计算机视觉中的摄像机定标方法带来了新的生机,也给摄像机镜头的优化带来了很多指导方法。在图像中心到图像点的距离保持不变的前提下,参数的数量会显著减少,这样不仅节省了材料的用量,而且还进一步提高了摄像机的摄像清晰度,有效弥补了以前清晰度不高的缺点。这样一来,摄像机的成像效果大大改进,于是才有了现代摄像机的高清效果,确实让人们享受到了科技带来的福音。

3计算机视觉中的摄像机定标方法的应用特点

3.1建立于主动视觉上的自我标定

由于计算机视觉中摄像机定标方法的不断推广,一些计算机技术在摄像机的制作过程中得到了较好的应用。但是在这之中必不可少地存在一些制作人员或设计人员的主观因素,这样摄像机的标定方法中就会形成形色各异的特点,而且彼此之间可能会出现较大的不同,特别是在主动视觉上的自我标定。在主动视觉中,我们所用到的摄像机可以在一个被控制的平台上被人们固定,利用计算机的高运算能力,计算机可以把平台上所出现的参数精确地读出来,我们只需要利用控制摄像机的运转顺序,让摄像机作一定的周期运动,就可以在这个过程中得到更多的图像,然后再利用所成的图像和固定的摄像机的运动参数来确定摄像机的运动情况。这种自我标定方法比较简单,但是必须为人们提供精确控制摄像机运动的平台,这种以主观意识为主的标定特点强化了个人的主观能动性,让人们更加易于接受。

3.2进行有层次划分的逐步标定

近年来,人们对摄像技术的理论研究已经日趋成熟,并根据自己的意愿进行相关的研究工作,把自己的想法融入到摄像机的设计中,真正做到有层次的逐步标定,把所要的标定物以逐个击破的方式实现有层次的程序算法,从而让人们在逻辑上能够有所认识,并且易于接受,从而达到有层次划分的逐步标定的目的。分层逐步标定法已为标定研究领域中普遍认同的方法之一,在实际的应用中逐渐取代了直接标定的方法。因为进行有层次划分的逐步标定是符合人们的想法的,而且这种方法的特点是以射影标定作为基础,以某一幅图像作为基准图像,进行其它图像的射影对齐工作,从而将摄相机中成像未知参数的数量减少,更易于为人们所接受。可以说,进行有层次划分的逐步标定是人们在实践中得出的一套符合大势所趋的标定方法,为世人所推崇。

4结语

综上所述,计算机视觉中摄像机定标方法在人们的不断认识中得以应用和推广,在时代的不断进步中逐渐向前发展。同时,摄像机标定方法的应用特点也大相径庭,各有千秋,从而实现百家争鸣的态势,进一步推动计算机视觉中的摄像机研究工作的向前发展。

参考文献:

第2篇:计算机视觉研究领域范文

【关键字】非线性滤波 概率密度 重采样 粒子退化

一、引言

粒子滤波(PF)是一种在处理非线性非高斯系统状态估计问题时具有较好估计效果的方法,其原理是通过非参数蒙特卡洛方法实现贝叶斯滤波。其最早起源于Hammersley等人在20实际50年代末提出的顺序重要性采样(SIS)滤波思想。

但由于上述方法存在严重的样本权值退化从而导致的粒子数匮乏现象,直到1993年Gordon等人将重采样技术引入蒙特卡洛重要性采样过程,提出一种Bootstrap滤波方法,从而奠定了粒子滤波算法的基础。

二、基本粒子滤波算法

三、粒子滤波算法存在的主要问题及改进

对于SIS算法来说,容易出现粒子的退化问题,目前存在的诸多对SIS算法的改进中,能够降低该现象影响的有效方法是选择合适的重要性函数和采用重采样方法。

针对状态空间模型的改进算法,如辅助变量粒子滤波算法(APF),局部线性化方法,代表的算法主要有EKF,UKF等。针对重采样改进方法,文献通过将遗传算法和进化算法引入粒子滤波算法中,增加重采样过程中粒子的多样性。

然APF算法在过程噪声较小时,可获得比标准粒子滤波更高的滤波精度,在过程噪声较大时,其效果则大大降低。采用局部线性化的方法EKF,UKF都是针对非线性系统的线性卡尔曼滤波方法的变形和改进,因此受到线性卡尔曼滤波算法的条件制约,而对于非高斯分布的状态模型,其滤波性能变差。

将遗传算法和进化算法与粒子滤波结合的改进粒子滤波算法,虽取得了较好的滤波效果,然而是以消耗过多计算资源为代价的。

四、粒子滤波的应用

4.1 目标跟踪

对目标进行定位和跟踪是典型的动态系统状态估计问题,在诸如纯角度跟踪的运动模型中,采用粒子滤波方法进行实现目标跟踪已获得了较好的跟踪精度,文献研究了多目标跟踪与数据融合问题,文献给出了基于粒子滤波的群目标跟踪算法。

4.2 计算机视觉

近年来,通过序列图像对感兴趣的区域进行持续跟踪问题引起人们广泛关注,Isard M率先将粒子滤波算法引用了计算机视觉领域,Maccormick J较系统的总结了粒子滤波方法在计算机视觉中的应用,从中可了解粒子滤波算法在该领域中的应用成果和发展趋势。

第3篇:计算机视觉研究领域范文

【关键词】自动控制技术;农业自动化

由于历史、观念和技术等方面的原因, 我国传统农业机械与发达国家相比有很大差距,已远远不能适应农业的科技进步。近些年来, 自动化的研究逐渐被人们所认识, 自动控制在农业上的应用越来越受到重视。例如,把计算机技术、微处理技术、传感与检测技术、信息处理技术结合起来, 应用于传统农业机械, 极大地促进了产品性能的提高。我国农业部门总结了一些地区的农业自动化先进经验(如台湾地区的农业生产自动化、渔业生产自动化、畜牧业生产自动化及农产品贸易自动化)的开发与应用情况, 同时也汲取了国外一些国家的先进经验、技术,如日本的四行半喂人联合收割机是计算机控制的自动化装置在半喂人联合收割机中的应用,英国通过对施肥机散播肥料的动力测量来控制肥料的精确使用量。这些技术和方法是我国农业机械的自动化装置得到了补充和新的发展,从而形成了一系列适合我国农业特点的自动化控制技术。

1.已有的农业机械及装置的部分自动化控制

自动化技术提高了已有农业机械及装置的作业性能和操作性能。浙江省把自动化技术应用于茶叶机械上,成功研制出6CRK-55型可编程控制加压茶叶揉捻机,它利用计算机控制电功加压机构,能根据茶叶的具体情况编制最佳揉捻程序实现揉捻过程的自动控制,是机电一体化技术在茶叶机械上的首次成功应用。

1.1应用于拖拉机

在农用拖拉机上已广泛使用了机械油压式三点联结的位调节和力调节系统装置, 现又在开发和采用性能更完善的电子油压式三点联结装置。

1.2应用于施肥播种机

根据行驶速度和检测种子粒数来确定播种量是否符合要求的装置, 以及将马铃薯种子割成瓣后播种的装置等。

1.3应用于谷物干燥机

不受外界条件干扰, 能自动维持热风温度的装置停电或干燥机过热引起火灾时,自动掐断燃料供给的装置。

2.微灌自动控制技术

我国从20世纪年50代就开始进行节水灌溉的研究与推广据统计。到1992年,全国共有节水灌溉工程面积0.133亿m2,其中喷灌面积80万m2, 农业节水工程取得了巨大的进展。灌溉管理自动化是发展高效农业的重要手段,高效农业和精细农业要求必须实现水资源的高效利用。采用遥感遥测等新技术监测土壤墒性和作物生长情况,对灌溉用水进行动态监测预报,实现灌溉用水管理的自动化和动态管理。在微灌技术领域,我国先后研制和改进了等流量滴灌设备、微喷灌设备、微灌带、孔口滴头、压力补偿式滴头、折射式和旋转式微喷头、过滤器和进排气阀等设备,总结出了一套基本适合我国国情的微灌设计参数和计算方法,建立了一批新的试验示范基地。在一些地区实现了自动化灌溉系统,可以长时间地自动启闭水泵和自动按一定的轮灌顺序进行灌溉。这种系统中应用了灌水器、土壤水分传感器、温度传感器、压力传感器、水位传感器和雨量传感器、电线等。

3.自动控制技术在精准农业中的应用

第4篇:计算机视觉研究领域范文

提起数字媒体,人们通常会想到传媒行业,其实数字媒体的应用绝不局限于传媒。随着宽带网络的普及,人们在日常业务处理过程中,正面对越来越丰富的网上媒体和内容,包括各种视频、音频、文本、图像等。下面,就让我们跟着诸位数字媒体方面的专家一起来分享这个缤纷的世界。

三维几何建模与形状表示

北京大学视觉与听觉信息处理国家重点实验室主任教育部长江学者奖励计划特聘教授 查红彬

精彩问答

在背景比较复杂、有干扰的情况下模型检索的效果怎么样?

在模型检索的时候并没有考虑背景,因为这是做模型检索比较容易的部分。模型检索一般是没有背景的,但也可以做,但是要推广到背景比较复杂的物体上识别可能有很大的问题,因为这时候匹配不仅仅是局部匹配,而是两个子集和子集的匹配问题,到目前为止,我们只是做没有背景的模型检索。

为什么要重新谈论三维形状表示问题?在多媒体信息处理领域里面,有两个比较重要的方向,这也是计算机科学技术领域里两个重要的方向,一个是计算机视觉,一个是计算机图形学。计算机视觉是从图像中通过识别或重建处理,得到一个对对象物的描述。反过来说图形学,是对一个对象和场景的描述,通过绘制和动画生成图像和视频。它们从处理过程来说是逆过程,这两个领域之间有密切的关联。

我们现在考虑计算机三维建模或模型的描述,考虑的不仅仅是计算机视觉或计算机图形学所包含的内容。这里面简单列举一下,比如基于模型的三维物体识别和场景识别,这两个应该是典型的计算机视觉里面考虑的应用。除了这以外还可以用模型干别的事情,比如绘制,还包括基于这样模型的设计、变形、动画等等。除了两个单独研究的应用之外,还要想怎么把两者结合起来,把虚拟和真实的东西无缝连接到一起,这些都牵涉到三维模型。

我们考虑的三维模型跟以前相比,应用领域大了很多,要达到这个要求,对模型的表达、形状的表达也都有了更高的要求。

怎样找到一些更新更有效地表达形式来符合这些要求呢?这里有四个方面,现在能不能建立一个形状空间,把考虑的对象完整地在形状空间里面表达出来。第二点就是针对形状的特性,表达要具有柔性,对象物的表面不都是连续的,也有一些非连续性和不规律性,这些特性怎样能够进行柔性处理。第三个是需要一些描述是局部性的,另外一些要求描述是整体性的,这两者之间如何有一个很好的结合方法。第四是在大量的计算当中,包括变形和动画中有很多编辑的工具,所以我们要求对现在的形状表达有一些比较高的要求。

在计算机视觉里面有一个老大难就是识别,已有模型,但是眼前看到的是一部分三维数据,怎么用这部分数据和模型数据匹配来识别它呢?这就牵涉到局部匹配,我们要解决局部匹配需要什么描述?我们要有一个模型,从大量的数据中建立一个模型库,并从中抽取很多特征,把这些特征进行组织。这里面牵涉三个比较大的问题,第一个是形状空间怎么构造,没有很好的特征表达或整理的形式,后面的匹配以及其他的工作就很难做。第二个是怎么定义基于这种特征的相似度。第三个是怎样在形状空间当中搜索到最优的匹配。

针对这些问题我们最近一两年做了一些工作,最近提出一个广义形状分布(Generalized Shape Distributions)描述方式,主要目的有两点,能不能在三维形状表示过程当中,找到一些最关键的描述指令,并从中找到相互关系,把整体和局部结合起来。如果把之间的关系描述出来,就能把局部结构性的信息用整体观点加进去,这两件工作就是我们做这件事情的主要目的。

在形状描述问题上,我们还有很多工作要做,除了局部、整体描述之外,我们要想办法把他们结合到一起。今后几年要用更多的模式识别的办法,来解决面临的图形学或虚拟现实和计算机视觉当中的很多问题。

生活中的计算机视觉

香港中文大学信息工程系终身教授

微软亚洲研究院视觉计算组负责人 汤晓欧

精彩问答

微软亚洲研究院视觉计算组在原创思想这一块,引领下一个方向有没有什么考虑,您谈到很多对人们日常生活影响很大的应用,但是在背后的更深层的考虑,更新的创意在哪里呢?

我们的研究者都很年轻,我本人也才工作七年的时间,很多的算法已经发展这么多年了,所以在开始的时候比较容易想出来的方法,现在已经很难有那么多的原创内容。我们的工作是去找一些非常原创的内容,有的是理论上的,有的是新的发明,这可以有很大的影响。

图像通过闪光灯的分割,前景和背景深度差会不会影响分割效果,距离会不会影响分割效果呢?

我们这个通过闪光灯对图像进行分割的技术,会一定程度上受到光的强度和距离的影响。

我们主要的研究领域包括计算机视觉、模式识别、图像处理和视频处理。下面就为大家介绍几个比较典型的应用。

如何将图片的前景和后景分离?我们现在照两张图片,一张打闪光灯,一张没有打闪光灯,这样拍出来的照片背景没有变化,但前景变化很厉害。在开闪光灯的情况下拍的照片,前景和后景可以利用一些技术很容易地分开来。

把一个图片的前景切割出来放入另一张图后,那剩下的图片缺一块的怎么办呢?如何修复剩下的图片呢?在例举的图片上,大家可以看到不同的区域,我们可以由一个算法,从其他的地方借过来,再贴上去,经过这样的处理后,图像基本上和原来没有太大的区别。

如此的修修补补又有什么用呢?比如说,你对这张图像不是很满意,你可以把图片上不喜欢的部分划出来,然后利用一些技术将划出来的空白部分填上。更有用的地方在于,你照了不想被别人看到的照片后,除了删除,你多了一个选择。你可以把不想让别人看到的照片部分去掉,并利用一些算法把空白的地方填补上,而且让别人看不出来。

现在大家的电脑上都会有很多照片,怎么快速地浏览这些照片呢?我们可以把这些图像都放在一个屏幕上,可屏幕毕竟有限,怎么才能把照片放得更多一些呢?我们现在做的是可以随机把照片放到桌面上,但是电脑会对每张照片上的重要信息进行筛选,在放尽可能多的照片的同时,让每张照片上最重要的信息不被遮掩,而且均匀地分布在桌面上。这样大家看起来就更清楚了。这个算法就是怎么让所有图像均匀分布,同时把所有背景都要盖上。我们可以对图像进行各种处理,同时我们也可以利用一些技术知道别人有没有处理图像,对图像有没有做过手脚。

现在我们来说说视频方面。比如说抖动很厉害的图像,怎么把物体移到中间?一个办法是把除移动图像外的公共部分切出来,但是移动越大,公共部分就会越来越小,更好的办法是用一些技术把空处填上。

现在MSN的功能已经越来越丰富。比如说一段电影,你看到一件比较中意的衣服,只要你把鼠标移动衣服的覆盖范围,你就能很清楚地知道这件衣服的品牌及价格。如果你把鼠标在那件衣服上轻点,电脑就会直接跳转到这个衣服的相关网站。

你在视频聊天的时候如果不想让对方看到你所处的环境,你就可以很轻松地把背景模糊掉。如果大家对自己的长相不是那么有信心,我们可以帮你改变一下你的长相。为自己添一幅酷酷的墨镜,换上一个性感的大嘴巴,这些都能轻而易举地完成。

多媒体传感器网络

北京邮电大学教授、博士生导师

智能通信软件与多媒体北京市重点实验室主任 马华东

传感器研究是IT非常热门的话题, 首先我为大家介绍一下多媒体传感器网络的基本概念。从早期的巨型机到今天的小型机,生物芯片尺寸越来越小,但是效率越来越高;网络设备联网和数据交换的需求越来越大,设备之间的传输量也越来越大;从信息处理的角度来看,内容逐渐占据了主导地位,由数据为中心转到以内容处理为中心。这三方面的演化是今天讨论多媒体传感器的背景。

传感器网络是一组传感器节点,由组织方式协作地感知采集和处理感知对象的信息,它的基本特点是造价低、能量敏感、通信能力有限、计算能力弱、动态变化。现在的需求是要求通信能力越来越强,计算能力应付节点的处理的要求。

右图是目前主流的传感器节点的配置,从配置来讲还是比较低的,现在信息处理侧重压力、温度、光、震动等简单的数据或者是标量数据。人类获取信息80%是视觉信息,10%左右是听觉信息,也就是说90%左右的信息是多媒体信息。传感器网络就是对音频、视频信息获取后提供给使用者,使其对环境信息有一个全方位的了解,对传感器网络的应用是非常广泛的。

从网络的结构来讲,基本结构和原来传感器网络差别不是很大,这里面强调增加音频、视频获取处理,网络传输整个过程的各个环节,同时这里面最好可以交互。有了这个概念以后,深入分析一下主要特点,首先是网络能力的增强,这样一个传感器网络应该集信息的采集、处理传输、转发、能量供应等方面,除了传统的标量数据,音频、视频的图像数据,都可以进行采集处理。

现在多媒体传感器网络目前有哪些问题呢?从需求来看,现在网络是异构的信息,媒体信息的格式,种类很多,并且差异非常大,数据量比较大,特别是音频、视频信息,格式比较复杂。这些信息传输过程中需要高速实时地传输,对网络传输速率也提出了比较高的要求。媒体信息的安全问题,也是网络需要考虑的,还有服务质量的问题。针对这些需求,我们可以看到,通信资源和计算资源这两者之间存在非常大的矛盾,或者非常大的鸿沟,如何解决这两者之间的差距就是我们研究的问题所在。

最后谈一下多媒体传感器网络研究的挑战,首先是节点的芯片设计,这是基础,这里面需要采用多种技术,包括软硬件协同设计的技术,各种技术结合,降低成本、能耗、体积、提高运算速度和可靠性。第二是三维场景的覆盖问题,方向性传感模型是一个简单的二维图形,实际上是三维图形监测,这是一个三维场景方向的问题,研究这个就复杂多了。还有一个问题是服务质量保证问题,在新的网络当中服务质量体系是什么样,也是研究的方向。再一个是信息处理,为了使网络传输数据量比较快,能不能在节点做信息处理的计算。当然信息的安全也比较重要,用这些节点获取多媒体信息怎么保证安全的质量,使应该看到的人看到这些信息,不应该看到的人看不到这些信息。

在多媒体传感器网络中,我们还是做了一些工作,和一些同行学者也有一些交流,这里面也有一些质疑,说多媒体传感网络和原来传感器网络设计初衷是不是吻合的,原来没有想让它处理这么多信息,原来体积比较小,加上这些信息以后,无疑使它的体积增大,这里面和初衷之间是不是有矛盾,传感器网络研究有没有必要性,如果有必要性可行不可行,这都是我们目前研究的问题。

第5篇:计算机视觉研究领域范文

关键词: 人工智能 发展过程 研究热点 应用领域 未来发展

一、人工智能概述

人工智能(Artificial Intelligence,简称AI),也称机器智能,它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的一门综合性学科。从计算机应用系统角度来看,人工智能是研究如何制造出智能机器或智能系统,实现模拟人类智能活动的能力,以延伸人们智能的科学。人工智能是一门交叉学科,是一门涉及心理学、认知科学、思维科学、信息科学、系统科学和生物科学等多学科的综合性技术学科,目前已在知识处理、模式识别、自然语言处理、博弈、自动定理证明、自动程序设计、专家系统、知识库、智能机器人等多个领域取得举世瞩目的成果,并形成了多元化的发展方向。

二、人工智能的发展过程

人工智能经历了三次飞跃阶段:第一次是实现问题求解,代替人完成部分逻辑推理工作,如机器定理证明和专家系统;第二次是智能系统能够和环境交互,从运行的环境中获取信息,代替人完成包括不确定性在内的部分思维工作,通过自身的动作,对环境施加影响,并适应环境的变化,如智能机器人;第三次是智能系统,具有类人的认知和思维能力,能够发现新的知识,去完成面临的任务,如基于数据挖掘的系统。

三、人工智能的研究热点

AI研究出现了新的,这一方面是因为在人工智能理论方面有了新的进展,另一方面是因为计算机硬件突飞猛进地发展。随着计算机速度的不断提高、存储容量的不断扩大、价格的不断降低,以及网络技术的不断发展,许多原来无法完成的工作现在已经能够实现。目前人工智能研究的三个热点是:智能接口、数据挖掘、主体及多主体系统。

1.智能接口技术是研究如何使人们能够方便自然地与计算机交流。为了实现这一目标,要求计算机能够看懂文字、听懂语言、说话表达,甚至能够进行不同语言之间的翻译,而这些功能的实现又依赖于知识表示方法的研究。因此,智能接口技术的研究既有巨大的应用价值,又有基础的理论意义。目前,智能接口技术已经取得了显著成果,文字识别、语音识别、语音合成、图像识别、机器翻译及自然语言理解等技术已经开始实用化。

2.数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但是又潜在有用的信息和知识的过程。数据挖掘和知识发现的研究目前已经形成了三根强大的技术支柱:数据库、人工智能和数理统计。主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现及网上数据挖掘等。

3.主体系统是具有信念、愿望、意图、能力、选择、承诺等心智状态的实体,比对象的粒度更大,智能性更高,而且具有一定的自主性。主体试图自治、独立地完成任务,而且可以和环境交互,与其他主体通信,通过规划达到目标。多主体系统主要研究在逻辑上或物理上分离的多个主体之间进行协调智能行为,最终实现问题求解。多主体系统试图用主体来模拟人的理,主要应用在对现实世界和社会的模拟、机器人及智能机械等领域。目前对主体和多主体系统的研究主要集中在主体和多主体理论、主体的体系结构和组织、主体语言、主体之间的协作和协调、通信和交互技术、多主体学习及多主体系统应用等方面。

四、人工智能的应用领域

1.专家系统

专家系统是一个具有大量专门知识与经验的程序系统,专家系统存储着某个专门领域中经过事先总结、分析并按某种模式表示的专家知识,以及拥有类似于领域专家解决实际问题的推理机制。专家系统的开发和研究是人工智能中最活跃的一个应用研究领域,涉及社会各个方面。

2.知识库系统

知识库系统也叫数据库系统,是储存某学科大量事实的计算机软件系统,它可以回答用户提出的有关该学科的各种问题。知识库系统的设计是计算机科学的一个活跃的分支。为了有效地表示、储存和检索大量事实,已经发展出了许多技术。但是在设计智能信息检索系统时还是遇到很多问题,包括对自然语言的理解,根据储存的事实演绎答案的问题、理解询问和演绎答案所需要的知识都可能超出该学科领域数据库所表示的知识。

3.物景分析

计算机视觉已从模式识别的一个研究领域发展为一门独立的学科。视觉是感知问题之一。整个感知问题的要点是形成一个精练的表示,以表示难以处理的、极其庞大的未经加工的输入数据。最终表示的性质和质量取决于感知系统的目标。机器视觉的前沿研究领域包括实时并行处理、主动式定性视觉、动态和时变视觉、三维景物的建模与识别、实时图像压缩传送和复原、多光谱和彩色图像的处理与解释等。机器视觉已在机器人装配、卫星图像处理、工业过程监控、飞行器跟踪和制导及电视实况转播等领域获得极为广泛的应用。

4.模式识别

模式识别就是识别出给定物体所模仿的标本或标识。计算机模式识别系统能够弥补计算机对外部世界感知能力低下的缺陷,使计算机能够通过感官接受外界信息,识别和理解周围环境。模式识别在二维的文字、图形和图像的识别方面已取得许多成果,在三维景物、活动目标的识别和分析方面是目前研究的热点,同时它还是智能计算机和智能机器人研究的十分重要的基础。此外,人工智能还在机器视觉、组合调度问题、自然语言理解、机器学习、博弈、定理证明等研究应用领域发挥着重要作用。可以说人工智能已深入各行各业,对人类社会作出了巨大的贡献。

5.机器人

机器人学所研究的问题,从机器人手臂的最佳移动到实现机器人目标的动作序列的规划方法,无所不包。尽管已经建立了一些比较复杂的机器人系统,但是现在工业上运行的机器人都是一些按预先编好的程序执行某些重复作业的简单装置,大多数工业机器人是“盲人”。机器人和机器人学的研究促进了许多人工智能思想的发展。智能机器人的研究和应用体现出广泛的学科交叉,涉及众多课题。机器人已在工业、农业、商业、旅游业、空中和海洋及国防等多个领域获得越来越普遍的应用。

五、人工智能的未来发展

目前绝大多数人工智能系统都是建立在物理符号系统假设之上的。在尚未出现能与物理符号系统假设相抗衡的新的人工智能理论之前,无论从设计原理还是从已取得的实验结果来看,Soar在探讨智能行为的一般特征和人类认知的具体特征的艰难征途上都取得了有特色的进展或成就,处在人工智能研究的前沿。上世纪80年代,以NewellA为代表的研究学者总结了专家系统的成功经验,吸收了认知科学研究的最新成果,提出了作为通用智能基础的体系结构Soar。目前的Soar已经显示出强大的问题求解能力。在Soar中已实现了30多种搜索方法,实现了若干知识密集型任务(专家系统),如RI等。对于人工智能未来的发展方向,专家们通过一些前瞻性研究可以看出未来人工智能可能会向以下几个方面发展:模糊处理、并行化、神经网络及其情感。

目前,人工智能的推理功能已获突破,学习及联想功能正在研究之中,下一步就是模仿人类右脑的模糊处理功能和整个大脑的并行化处理功能。人工神经网络是未来人工智能应用的新领域。未来智能计算机的构成,可能就是作为主机的冯・诺依曼型机与作为智能的人工神经网络的结合。研究表明:情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。

根据这些前瞻性研究我们也可以通过想象模拟勾画出人工智能未来发展的三个阶段。

1.融合时期(2010―2020年)

(1)用语言操纵和控制的智能化设备十分普及,像远程医疗这样的服务也更为完善。

(2)以计算机和互联网为基础的远程教育十分普及,在家就可以上大学。

(3)在身体里植入许多不同功能的芯片已不新奇。

(4)量子计算机和DNA计算机会有更大发展,新材料不断问世。

(5)抗病毒程序可以防止各种非自然因素引发灾难。

2.自信时期(2020―2030年)

(1)智能化计算机和互联网既能自我修复,也能自行进行研究、生产产品。

(2)一些新型材料的出现,促使智能化向更高层次发展。

(3)有了高水准智能化技术的协助,人们“定居火星梦”可能性大增。

3.非神秘时期(2030―2040年)

(1)新的全息模式世界将取代原有几何模式的世界。

(2)人们对一些目前无法解释的自然现象会有更完善的解释。

(3)人工智能可以模仿人类的智能,因此会出现有关法律来规范这些行为。

第6篇:计算机视觉研究领域范文

爱尔兰都柏林大学(UCD)教授孙大文(Da-Wen Sun)的经历无疑就是这句话的具体诠释。

2010年5月,孙大文当选爱尔兰皇家科学院院士。成立于1785的爱尔兰皇家科学院是爱尔兰自然科学、人文和社会科学的最高学术机构。

2010年6月,国际农业工程委员会(CIGR)第十七届世界大会上,来自全球40多个国家的近1000位专家学者代表与会。会上,孙大文当选为国际农业工程委员会候任主席,任期从2011年1月开始,并将于2013年起接任主席,为期2年。他成为国际农业工程委员会自成立80年以来的首位华人主席。在这次大会上,孙大文还被授予国际农业工程委员会会士荣誉称号(CIGR Fellow Award),这是CIGR对国际农业与生物系统工程领域获得公认卓越地位和作出杰出科学贡献者的一项殊荣。

丰硕的成果是多年奋斗的收获,从广东潮安县一路走来,孙大文对于事业、人生都有自己的体会。

我的大学

2010年秋,在一个都柏林典型的阴天、大风、细雨交替的日子,我们来到都柏林大学采访孙大文教授。尽管前一天晚上他才从国外出差回来,但早就订好了会议室,并准备了茶点。打开电脑,题为《谈谈我在海外的奋斗经历和体会》的PPT文档图文并茂地为我们一一细说从前。

从当年参加高考的准考证、成绩单,到出国留学的很多审批文件,再到后来获得的多项奖励……这些无不透着孙大文的严谨和认真,以及对于自己人生经历的珍视。

尽管我们曾经采访过很多恢复高考后考上大学的留学人员,但真正看到一张1978年的高等学校准考证、成绩单,以及诸多的出国审批手续等批件,这还是第一次。

孙大文出生于广东省潮安县,读书时他的学习成绩一直名列全校前茅。1977年恢复高考时,还在上高一的孙大文就被学校破格推荐参加全国高考。1978年,孙大文以优异成绩被全国重点大学华南工学院(现华南理工大学)录取。

为了对比当年高考的难度,孙大文特地选用一组数据说明:1978年全国参加高考人数为610万人,录取人数40.2万,录取率为7%。而2009年全国参加高考人数1020万人,录取人数629万人,录取率高达62%。

恢复高考后,几乎所有进入大学的学子都如饥似渴地汲取着知识的营养,因为他们深深地懂得机会的来之不易,孙大文说:“我们的大学生活就是‘宿舍―饭堂―课室’,‘三点一线’是对我们那时候生活的真实写照。”

和很多同学一样,孙大文也缺乏英语基础,英语成为他学习上的瓶颈之一,为了学好英语,他口袋里总是装着单词本,甚至连在饭堂排队打饭以及晚饭后散步的时间都在用功地背英语,只是当时的他并不知道英语将在今后为他打开一扇更大的门,让他进入一个更广阔的世界。

回首往事,孙大文感慨道:“在我们那个年代,所有人都崇拜陈景润,羡慕中国科技大学少年班的学生,家长也以此来激励自家孩子读书。那时候上大学,就是用心学习知识,并且我们有一定要把知识学好的精神。”

在华南工学院本科毕业时,按照当时的政策,所有大学生毕业后都要服从分配。一直在南方长大的孙大文没想到自己竟然被分配到佳木斯,他当时甚至不知道佳木斯在哪里,而研究生的入学通知书又让他的命运轨迹有了改变。1982年,孙大文以专业第一名的成绩考上华南工学院的硕士研究生,研究方向为高聚物流变工程原理。当年全国在校硕士研究生为2.58万人,博士生约550人,博士生人数与硕士生人数之比为1∶47.2。

今天说来,这成了孙大文在广州求学的一件轶事!“连我们老师也笑我,要是我当时没有考研并且成功考上的话,我就要去遥远的佳木斯了。”

到了研究生学习阶段,孙大文的刻苦钻研有了更多收获,获得多项科研奖项。上个世纪80年代中期,国内物价飞涨,脑体倒挂现象突出,“搞导弹的收入不如卖茶叶蛋的,拿手术刀的不如拿剃头刀的”,这使得全国刮起下海经商的风,很多人的价值取向由此也发生了巨大变化。1985年,硕士毕业的孙大文迎来了自己人生中的第一次选择:工作还是继续深造?几经考量,孙大文选择了继续在华南工学院攻读博士研究生。那一年华南工学院总共招收5名博士生,孙大文是其中之一,他的研究方向转为传热与节能。

在攻读博士期间,他先后在《稀有金属》等国际权威性杂志上发表了7篇论文并全部由科学引文索引(SCl)收录,他的博士成果后来还相继获得广州市和广东省自然科学奖。这在当时,对很多科研人员来说,也是有很大难度的。孙大文说:“我当时看很多英文科研文章就想,这样的文章我也可以写,于是就将自己的科研成果写成文章投稿,没想到都发表了。”

跨出国门

1988年,孙大文博士毕业,他又一次面临着人生的重要选择:是毕业留校?还是出国深造?

当时出国要历经多项环节,其过程是耐力、实力、心理的多项考验:给国外写信联系导师,向学校申请留学,经过政审、国家教委审批,然后集训,再办理护照和签证,换取外汇……

孙大文说:“去海外深造是当时很多人的向往,我也希望去国外进一步深造。我已经拿到了德国和日本的邀请函。但是,去德国还是日本?这个问题让我非常矛盾。鉴于当时的国际形势和意识形态差异,我还是选择了去德国深造。”由于当时很多情况不断变化,孙大文临时变更了机票,当时他甚至来不及确认自己在国外的联系人是否收到了早先发去的电传。带着仅有的50美元,1989年6月,孙大文前往德国斯图加特大学继续深造,从事储氢材料研究工作。

“国外的一切对我来说都是那么新鲜。在德国,我第一次接触到Macintosh计算机,第一次使用word软件,第一次使用E-mail……”太多的第一次让他甚至来不及适应。在体验着新鲜刺激的国外生活的同时,孙大文努力让自己适应新的环境,克服语言和文化上的障碍,潜心从事科研工作,在研究所,他是在那里学习的中国人中第一个的研究人员。

到德国工作1年后,由于需要在工作中用德语交流。孙大文想放弃学习了那么久的英语很可惜,考虑再三。1990年底,他在导师的指引下,前往英国贝尔法斯特女王大学担任研究员。

此后几年,孙大文先后于英国纽卡斯尔大学和谢菲尔德大学担任研究员,也正是在纽卡斯尔大学,孙大文的研究进入了全新的领域。在那里,他还认识了一位退休的中学校长,校长很想学中文,于是孙大文每周一个晚上到他家里教他中文,也向他学习英文口语,从不间断,孙大文的英语口语水平有了很大的提高。孙大文说:“在纽克斯尔大学进行的谷物干燥研究工作,为我日后在食品工程领域发展打下了坚实的基础。我改造了那里现有的实验设备并实现数据采集自动化,并发表了6篇SCI论文。”

在科研之余,孙大文特别喜欢到英国的乡村种菜,租一块地,种上自己喜欢的蔬菜,耕作打理,期待着农耕收获的喜悦。没想到有一次来到自己的菜地,发现上次离开时已经郁郁葱葱的菜地却一片狼籍,孙大文心想难道是有人破坏?一次碰巧遇到一位在他旁边种地的本地人,那位英国绅士慢条斯理地说:“你知道你的菜地出什么问题了么?是蛞蝓(slug)搞得鬼……”孙大文才知道这种虫子专吃蔬菜,赶忙灭虫。

事业在都柏林腾飞

孙大事情喜欢制定明确的目标和详细的计划,通过计划,合理安排时间和任务,从而达到目标,同时也使自己明确每一个任务的目的。他经常跟学生说做事情要通过制定计划,脚踏实地、有步骤地去实现它。在学习、工作中不断努力,不断修正自己的行动,直到达成目标。

在英国,孙大文给自己定下的目标是45岁之前要做到教授,但在英国的教育机制下,这并不容易。孙大文开始留意别的机会,1995年秋,他在英国的《卫报》上看到爱尔兰都柏林大学正在招聘大学教师,当时爱尔兰处于发展期,经济环境不断好转,高技术产业,特别是信息技术和软件业发展很快,急需大量科研人员。孙大文决定离开英国,他顺利在爱尔兰都柏林大学找到职位。

正应了中国那句古话“万事开头难”,当时,爱尔兰的中国人很少,作为爱尔兰都柏林大学第一位获得教席的华人,诸多来自欧美等发达国家的学者、教授对孙大文的出现感到有些异样。都柏林大学的同事甚至问孙大文:“你为什么跑到这里来教书?你上课学生能听懂吗?”孙大文知道自己必须尽快找到突破口并做出成绩来,安顿下来的孙大文开始寻找研究方向和合作者,他一边组建自己的科研团队,一边申请课题和科研经费。

孙大文决定在食品工程方面找突破口,考虑到自己初来乍到,必须要有合适的合作伙伴以及团队,他几经周折,拿着自己写好的项目建议,到爱尔兰国家食品中心找合作者。他说:“因为如果我单独申请,成功率肯定比较低,但如果找到当地比较权威的专家,让他做项目主持人,成功率会比较高。”

看到孙大文翔实的资料准备以及项目建议,国家食品中心的专家同意合作,于是两个人联名申请的第一笔科研经费顺利通过审批,这奠定了孙大文随后科研的基础。孙大文说:“在国外搞研究,你必须有好的课题。缺少经费的研究是非常艰难的,在申请到了经费后,一切就走向正规,顺利运行起来了。”

此后十几年间,孙大文一直奋战在食品工程研究领域,在新兴食品加工技术,食品冷却、冷冻、冷藏和保鲜技术,食品快速检测计算机视觉技术,食品加工过程模拟、优化和控制等多个领域走在全球食品工程研究领域的前沿。由于有着宽广的学术积累,孙大文能从材料、加工、农业工程等诸多领域进行分析研究,并密切关注科研成果的社会转化等,使得他可以从不同角度看待研究课题,从而找到最佳对接点。

孙大文在爱尔兰这片陌生的土地上逐渐确立了自己的科研地位,他先后从欧盟、爱尔兰政府的有关部门和企业界获得了超过100万欧元的科研经费,组建了自己的科研队伍,并成立了食品冷冻及计算机化食品技术研究所。该研究所目前拥有4个专业实验室,配备有门类齐全的现代化科研设备与测试系统,承担着欧盟、爱尔兰政府及企业的多项科研项目。

在欧洲,熟肉制品是以鲜畜禽肉为主要原料,经选料、修整、腌制、调味、成型、熟化和包装等工艺制成的肉类加工食品,为欧洲主要日常食品。欧洲食品安全条例极其严格,欧洲工业界为了减少浪费和提高效率,通常加工生产重约5~7公斤的超大产品。由于肉制品具有极低的导热系数,采用目前通用的风冷或水冷的冷却方法根本无法达到欧洲食品安全条例的要求。于是,孙大文首次采用冷却机理完全不同的真空冷却方法,以蒸发相变传热过程取代传统方法中以热传导传热模式为主的传热过程。由于水分蒸发潜热很大,他所开发的新型真空冷却技术可以达到超快速冷却效果,从根本上克服了传统热传导传热模式所存在的低效率问题。近年来,由于即食食品具有方便和大众化的优点,适合现代人快节奏生活,即食食品产业在欧洲得到大规模发展,因此欧盟对其冷却时间具有极为严格的规定,孙大文开发的真空冷却技术对即食食品及其所含的众多配料都具有极其明显的超快速冻效果。

在计算机视觉领域,孙大文的研究也取得了世界领先的原创性成果。计算机视觉技术正越来越广泛地用于食品工业产品质量检测和生产控制,它能有效地提高生产自动化程度,提高产品质量和生产效率。比萨饼是欧洲最主要的方便食品之一,顾客对外观品质尤为重视。但目前通用的外观品质检测手段仍然采用费时和客观性差的肉眼观察方法,从而导致产品质量的波动。比萨饼表面饰料多种多样且分布复杂,孙大文提出了一种基于区域的图象分割算法,汲取了常见的门限化、边界分割法和区域分割法的优点,极大地改进了传统区域增长算法,研制出适用于比萨饼外观品质快速检测计算机图像处理识别系统。这一系统很适合像比萨饼表面复杂的图像处理,在对表面饰料包括青椒、火腿、番茄酱等数十种比萨饼和糕点的图像分析表明,该视觉系统对饼基表面各种饰料的识别准确率达到95%以上。在此基础上,孙大文还把计算机视觉技术成功地运用于干酪熔化特性量化测定和肉品品质检测与控制,以代替传统的仪器测量与感官评定手段。这一系列研究开创了对食品,特别是比萨饼生产质量和属性进行自动检测的应用先例。英国著名的《新科学家》杂志等多家世界新闻媒体纷纷报道了这一最新成就。

为国效力

虽然在国外多年,但孙大文一直希望能有机会为祖国服务。近年来,孙大文经常利用自己的休假时间,回国讲学,与国内科研机构建立了长期和密切的合作关系,他与华南理工大学共同建立研究基地,双方联手共同开拓食品冷冻方面的科研新课题。孙大文与哈尔滨工业大学签订了5年的合作合同,每年为哈工大招收培养博士生,期间以哈工大为第一作者单位联合发表了8篇SCI论文,并多次推荐和邀请该校老师参加国际学术活动。

孙大文与江南大学联合培养的一位博士生,攻读博士学位期间共在国际知名期刊上发表6篇论文并全部由SCI收录。他与江南大学联合开发的基于豆类蛋白质的无色无味透明的可食用膜用于水果和蔬菜保鲜可使产品的货架期延长了好几个星期。如对猕猴桃的实验结果,显示使用该涂膜保鲜可使猕猴桃货架期从原先的2周延长至37天,这一成果再次引起了工业界的高度重视。英国著名的《新科学家》杂志对这一成果报道后,世界各地传媒也相继报道了这一技术。

第7篇:计算机视觉研究领域范文

关键词:数据处理;数据挖掘;特征提取;聚类分析

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)31-0164-04

Abstract:With the rapid development of computer technology and Internet technology, the amount of data accumulated in the human gradually increased dramatically. For the vast amounts of data into useful information for the user to provide decision support, clustering algorithm has been widely attention and applied to all types of data processing and data mining applications. The project based on the analysis of visual features on the image, through the effective integration of color, texture and shape features of the image information, the use of K-Means algorithm to cluster. The proposed method can be carried out experiments on the acquired image data set, and has a good clustering effect .

Key words: data processing; data mining;feature extraction;cluster analysis

F今,互联网上的图像信息数量如海洋般庞大,我们虽可以通过眼睛获取十分丰富的信息,然而人类可以接受的范围是有限的,如何从海量的数据之中准确、快速地将图像进行聚类,最终为人类社会的发展服务,是当前图像特征提取领域的一个研究焦点。

图像聚类就是运用计算机对图像库中图像进行定量分析,再把图像划分到某一种特征类别中,以代替人类对图像的视觉判别。图像聚类的过程实质上就是一个基于知识的图像理解过程,同时也是人类对图像的视觉判别的延续与发展。

基于视觉特征的图像聚类研究是解决视觉图像问题的一条重要途径,也是一个聚集了计算机视觉、图像处理、数据挖掘等多个研究领域的交叉研究方向。现如今,基于视觉特征的图像分类研究已越来越受到国内外研究者的关注,在近几年举办的与该领域研究相关的一些顶级国际会议,如计算机视觉与图像处理国际会议CVPR、数据挖掘国际会议KDD、ICDM等等,都有相关文献发表。

文献[2]中,孙君顶等人在形状特征提取中提出一种新的图像分块形状特征的描述方法,对图像采用固定块的分割方法。文献[4]中,刘丽等人介绍了关于纹理特征的所有研究方法。文献[6]中,赵书莲在应用研究过程中使用Hu不变矩算法进行形状特征的提取。在博士论文[11]中,朱蓉论述了所有视觉特征的提取方法。

随着研究者在聚类技术上的不断改进和创新,许多新奇且高效的聚类算法层出不穷,针对特定的问题和用户,许多学者研究出了多种具有代表性的聚类算法,并且广泛地应用于模式识别、生物信息、图像处理以及数据挖掘等领域。

文献[7]中,臧少杰介绍了所有聚类算法,并且将这些算法进行了比较。文献[8]中,路晶等人针对非监督学习,在基于EM算法启发式迭代优化算法的框架下,提出了6种多例聚类算法。文献[9]中,周俊祥对模糊C-均值聚类(FCM,全称为Fuzzy C-Means Algorithm)算法进行改进,有效地降低了孤立点对图像数据聚类结果的影响。

1 特征提取

基于视觉特征的网络图像特征有三个,分别为颜色、纹理、形状。特征提取是将某一模式的一组测量值进行变换,用以表现这一模式具有代表性特征的方法。通过影像分析和变换,以提取所需特征的方法。

1.1 颜色特征的提取

颜色特征的提取主要有四种方法,为颜色直方图、颜色矩与颜色熵的研究、颜色相关图的研究、

颜色聚合向量的研究。在这四种方法中,颜色矩与颜色熵的研究方法的分辨能力比较低,所以通常也必须和其他图像特征结合起来进行检索。颜色相关图的研究计算量很大,近些年来对于颜色相关图的研究才刚刚起步,主要是结合其他方法一起来研究,在文献[3]中作者介绍了一种基于颜色相关图和小波变换的算法。颜色聚合向量的研究当前也主要集中于与其他方法结合来进行效果的改进上,比如该文中作者在颜色直方图的基础之上采用了一种基于颜色聚合向量的方法从而提高了检索的精度。而颜色直方图具有相似度计算,有特征提取简洁和不随图像尺度、旋转等变化而变化的特点。所以颜色直方图相较于其他方法更适合于颜色特征的提取。具体方法如下:

1.2纹理特征的提取

纹理是指在图像中重复出现的局部模式及其排列规则。纹理特征与颜色特征相似,同样也是一个整体性的特征。近年来,对纹理分析方法的种种理论或者方法在纹理特征提取中的实践已然基本成形,Tuceryan和Jain将纹理特征提取的方法归纳为五大类,即结构统计、 模型、信号处理、几何和结构家族。这种分类方法被大多学者所采纳。

模型家族的方法能兼顾纹理局部的随机性与整体上的规律性,而且有很强大的灵活性;主要优势是提供了用来表示空间上相关的随机变量之间的相互作用的模型。它的不足在于模型系数的求解有难度,需要相当大的计算量,往往需要迭代了数百次才能达到收敛。信号处理家族对纹理进行多分辨描述,可以在更精准的尺度之上分析纹理。但有有效性不佳和计算量大的缺陷。

而本文推荐使用的统计家族方法简便,容易实现,特别是灰度共生矩阵(GLCM,全称为Gray Level Co-occurrence Matrix)方法是世界公认的有效方法,具有比较强的适应性。

灰度共生矩阵是被广泛使用的纹理提取的算法,也是分析图像的基础,它运用统计学当中的概率来反映图像灰度的有关方向和间隔等整体信息。其算法描述如下:

是图像中任意一点,是图像中移动后的另一点,因此形成一个点对, 是该点对的灰度值,即m是点的灰度值, n是点的灰度值。然后固定和,通过点的改动,来明确相应的值,所以相应灰度值的组合为(灰度值的级数为L)。对于研究的图像,计算出值出现的频率,化其积分为1,它的概率为,则灰度共生矩阵(灰度联合概率密度)为。

对于有区别的纹理周期分布,就有不一样的离差分值,即不一样的与值。在纹理比较细致的情况下,选取(1,0),(0,1),(1,1),(-1,1)等小的差分值是非常有效果的。若与取值比较小,则表明纹理图像变化情况迟缓,那么在灰度联合概率矩阵对角线上的数值就相对较大,适合于做对角线分布;若与取值比较大,那么说明纹理变化愈快,则在灰度联合概率矩阵对角线上的数值就愈小,适合于做均匀分布。一系列的纹理特征的y计量能够通过灰度共生矩阵而得到,其中常用的有以下8个纹理特征值。

(1)角二阶矩

(2)对比度其中。

(3)灰度相关其中分别为与的标准差和准值。

(4)熵

(5)逆差矩其中k为常数且。

(6)最大概率

(7)相异

(8)反差

1.3 形状特征的提取

形状特征提取表示方法有2种,一种是区域特性,它主要是针对于图像的整个形状区域;另一种是轮廓特性,它主要针对于物体的外边界。前人关于形状特征提取的典型方法有:边界特征值法、几何参数法、形状不变矩法、傅里叶形状描述法等。本文采用Hu不变矩算法来提取形状特征。

Hu不变矩是由Hu在1962年提出来的。不变矩是一种经过提取具有平移、旋转与比例不变性的图像特征,不变矩的中心思想是使用对变换不敏感的基于区域的几个矩阵作为形状特征,从而进行图像识别的方法。矩不变量因为具有不随图像的位置、大小与方向而变化的特点,对于提取图像中的形状特征而言,是一个很常用的工具。

2 聚类分析

聚类是依据事物的某些属性特性,将事物划分成为不同类的过程,其目的是使得类间的相似性尽可能小,类内的相似性尽可能大。在许多应用当中,聚类分析是一种数据预处理的过程,同时也是进一步分析和处理数据的基础。经过恰当的聚类算法,对事物的特征数据进行预处理,从而事物才便于研究,事物的内部规律才可能被人类所掌握。

聚类算法大致可以分为以下几种:划分、层次、基于密度、基于网格和基于模型的聚类。

基于层次的聚类是将既定数据对象集合进行层次的分解,虽然适用于任意形状和任意属性的数据集,但算法执行时间长,不能回溯处理;基于密度的聚类是基于发现所有形状的聚类结果,能够用来过滤“噪声”孤立点数据,发现所有形状的不同簇,但处理时间与每维空间所划分的单元数相关,一定程度上降低了聚类的质量和准确性;基于网格的聚类能够处理所有类型的数据,但这是以降低聚类的质量和准确度为代价的;基于模型的方法对每个簇假设了一个固定的模型,继而找到对给定模型最佳拟合的数据。基于模型的算法能够经过搭建反映数据点空间分布的密度函数来确定聚类。

基于划分的算法首先构建一个初始的划分,确定需要构建的划分数目k。之后使用一种迭代的重定位技术,通过对象在划分间变动来改进划分,使在相同的类中对象之间尽可能接近或相近,相反不同类中的对象尽可能阔别或有差别。为了能够达到全局的最优,基于划分的聚类会需要列举所有可能的划分。实际上,大部分应用采用了K-均值算法(K-Means)和K-中心点算法这两种较流行的启发式算法。

这两种启发式聚类算法对在中小规模的数据库中找到球状簇非常适用。下面主要介绍本文所采用的K-均值算法。

2.1 K-均值算法

K-均值算法的过程:

1.随机选取k个数据点作为初始的种子聚类中心。

2.计算每个数据点与各个中资聚类中心之间的距离,把每个数据点分配给距离它最近的聚类中心。聚类中心以及分配给它的数据点就代表一个聚类。

3.重复以上步骤,直至达到以下任一条件便会终止:

(1)没有(或最小数目)数据点被重新分配给不同的聚类。

(2)没有(或最小数目)聚类中心再发生变化。

3.2 特征提取实验

纹理特征提取:从图像库中选取100幅花朵类图像,用统计家族的灰度共生矩阵(GLCM)提取其8维纹理特征。

形状特征提取:从图像库中选取100幅花朵类图像,选择Hu不变矩方法提取其形状特征。

3.3 具体分析过程

第一步:从图像库中选取两组不同图像,使用灰度共生矩阵和Hu不变矩提取各自的纹理和形状特征;

第二步:利用K均值算法将这两组图像分别基于纹理和形状特征进行聚类,再从中分别选取60幅得到聚类中心的范围,求出平均值;

第三步:分别从花朵类和美食类图像中选取40幅图像,将每幅图像的纹理和形状特征数值与平均值进行欧式距离计算,距离较小时可认为属于该类,而后计算两组数据的准确率。

1)纹理特征的聚类结果

测试集中40幅花朵类图像的纹理特征数据与训练集中花朵类图像纹理特征数据平均值的欧式距离全都小于和训练集中美食类图像纹理特征数据平均值的欧式距离,故实验准确率达到100.0%;测试集中40幅美食类图像的纹理特征数据与训练集中美食类图像纹理特征数据平均值的欧式距离全都小于和训练集中花朵类图像纹理特征数据平均值的欧式距离,故实验准确率达到100.0%。纹理特征的比较结果如表1所示:

2)形状特征的聚类结果

测试集中40幅花朵类图像的形状特征数据与训练集中花朵类图像形状特征数据平均值的欧式距离有28幅图像的数值小于和训练集中美食类图像形状特征数据平均值的欧式距离,故实验准确率达到70.0%。测试集中40幅美食类图像的形状特征数据与训练集中美食类图像形状特征数据平均值的欧式距离有30幅图像的数值小于和训练集中花朵类图像形状特征数据平均值的欧式距离,故实验准确率达到75.0%。形状特征的比较结果如表2所示:

综上所述:

1)花朵类图像和美食类图像在纹理上的有很大的相似性,因为花朵类图像的纹理较细致,其基元较小,因而空间频率较高,而美食类图像的纹理较粗糙,其基元较大,空间频率较低。

2)花朵类图像和美食类图像在形状上的^别比较小,由于某些花朵的形状与某些美食的形状有相似性,如带有花边图案的盘子所盛的美食的图像和摆盘呈花型的美食图像与花朵类图像有很大的相似度,如图1中的(a)图与图2中的(c)图,会有较低的准确率。而图2中(a)图的美食呈长方形,则会与花朵类图像有很大的区别。

4 总结

基于视觉特征的图像聚类研究中,花朵类图像和美食类图像在纹理和形状上的聚类都有一定的准确率,特别是在纹理的聚类上本次研究有着100.0%的准确率。同时也有不足之处,本次研究并未融入颜色特征,针对特定的图像也还需要进一步研究具有区分度的特征。本文所用的K-均值算法只能应用于那些均值能够被定义的数据上。因此,它很难应用到范畴数据上,且对于异常值异常敏感。所以现在所用的聚类算法未来要继续改进,比如聚类中心的计算能够实现自适应等。

基于视觉特征的图像聚类方法研究涉及图像搜索引擎、数字照片的个性化管理、敏感图像的识别与过滤、艺术图像鉴别等等,具有十分重要的现实意义,相关研究领域的最新知识与研究成果都可以创新性地应用到解决各方面的问题中,以促进图像聚类技术的快速发展。

参考文献:

[1] 高进乐,康耀红,伍小芹.基于颜色特征图像检索方法的研究[J] .信息技术,2008(11):4-7.

[2] 孙君顶,赵珊.图像底层特征提取与检索技术[M].北京:电子工业出版社,2009:49-85.

[3] 张笃振.基于颜色特征与LBP的图像检索算法研究[J] .微计算机应用,2009,30(6):35-38.

[4] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报,2009(4).

[5] 王志瑞,闫彩良.图像特征提取方法的综述[J].吉首大学学报:自然科学版,2011(6).

[6] 赵书莲.形状分类及其在图像检索系统中的应用研究[D].山东:山东师范大学,2006.

[7] 臧少杰.基于视觉的聚类算法研究及应用[D].山东.山东师范大学,2008:1-49.

[8] 路晶等.基于多例学习的WEB图像聚类[J].计算机研究与发展,2009,46(9):1462-1470.

[9] 周俊祥.改进FCM的图像聚类方法[J].计算机系统应用,2011,20(7).

[10] 刘康苗.基于视觉与语义融合特征的阶段式图像聚类[J].浙江大学学报:工学版,2008,42(12).

[11] 朱蓉.基于语义的WEB图像分类研究[D].浙江大学,2011.

[12] 张建萍,刘希玉.基于聚类分析的K-means算法研究及应用[J].计算机应用,2007(5).

[13] 张讲社,徐宗本.基于视觉系统的聚类:原理与算法[J].工程数学学报,2000(5).

第8篇:计算机视觉研究领域范文

关键词:人机大战;人工智能;发展前景

中图分类号:TP391 文献标识码:A

0.引言

2016年3月15日,备受瞩目的“人机大战”终于落下帷幕,最终Google公司开发的“AlphaGo”以4∶1战胜了韩国九段棋手李世h。毫无疑问,这是人工智能历史上一个具有里程碑式的大事件。大家一致认为,人工智能已经上升到了一个新的高度。

这次胜利与1997年IBM公司的“深蓝”战胜国际象棋世界冠军卡斯帕罗不同。主要表现在两个方面:

(1)AlphaGo的胜利并非仅仅依赖强悍的计算能力和庞大的棋谱数据库取胜,而是AlphaGo已经拥有了深度学习的能力,能够学习已经对弈过的棋盘,并在练习和实战中不断学习和积累经验。

(2)围棋比国际象棋更加复杂,围棋棋盘有361个点,其分支因子无穷无尽,19×19格围棋的合法棋局数的所有可能性是幂为171的指数,这样的计算量相当巨大。英国围棋联盟裁判托比表示:“围棋是世界上最为复杂的智力游戏,它简单的规则加深了棋局的复杂性”。因此,进入围棋领域一直被认为是目前人工智能的最大挑战。

简而言之,AlphaGo取得胜利的一个很重要的方面就是它拥有强大的“学习”能力。深度学习是源于人工神经网络的研究,得益于大数据和互联网技术。本文就从人工智能的发展历程与现状入手,在此基础上分析了人工智能的未来发展前景。

1.人工智能的发展历程

AlphaGo的胜利表明,人工智能发展到今天,已经取得了很多卓越的成果。但是,其发展不是一帆风顺的,人工智能是一个不断进步,并且至今仍在取得不断突破的学科。回顾人工智能的发展历程,可大致分为孕育、形成、暗淡、知识应用和集成发展五大时期。

孕育期:1956年以前,数学、逻辑、计算机等理论和技术方面的研究为人工智能的出现奠定了基础。德国数学家和哲学家莱布尼茨把形式逻辑符号化,奠定了数理逻辑的基础。英国数学家图灵在1936年创立了自动机理论(亦称图灵机),1950年在其著作《计算机与智能》中首次提出“机器也能思维”,被誉为“人工智能之父”。总之,这些人为人工智能的孕育和产生做出了巨大的贡献。

形成期:1956年夏季,在美国达特茅斯大学举办了长达2个多月的研讨会,热烈地讨论用机器模拟人类智能的问题。该次会议首次使用了“人工智能”这一术语。这是人类历史上第一次人工智能研讨会,标志着人工智能学科的诞生。其后的十几年是人工智能的黄金时期。在接下来的几年中,在众多科学家的努力下,人工智能取得了瞩目的突破,也在当时形成了广泛的乐观思潮。

暗淡期:20世纪70年代初,即使最杰出的AI程序也只能解决问题中最简单的部分,发展遇到瓶颈也就是说所有的AI程序都只是“玩具”,无法解决更为复杂的问题。随着AI遭遇批评,对AI提供资助的机构也逐渐停止了部分AI的资助。资金上的困难使得AI的研究方向缩窄,缺少了以往的自由探索。

知识应用期:在80年代,“专家系统”(Expect System)成为了人工智能中一个非常主流的分支。“专家系统”是一种程序,为计算机提供特定领域的专门知识和经验,计算机就能够依据一组从专门知识中推演出的逻辑规则在某一特定领域回答或解决问题。不同领域的专家系统基本都是由知识库、数据库、推理机、解释机制、知识获取等部分组成。

集成发展期:得益于互联网的蓬勃发展、计算机性能的突飞猛进、分布式系统的广泛应用以及人工智能多分支的协同发展,人工智能在这一阶段飞速发展。尤其是随着深度学习和人工神经网络研究的不断深入,人工智能在近几十年中取得了长足的进步,取得了令人瞩目的成就。

人工智能发展到今天,出现了很多令人瞩目的研究成果。AlphaGo的胜利就是基于这些研究成果的一个里程碑。当前人工智能的研究热点主要集中在自然语言处理、机器学习、人工神经网络等领域。

2.人工智能l展现状与前景

人工智能当前有很多重要的研究领域和分支。目前,越来越多的AI项目依赖于分布式系统,而当前研究的普遍热点则集中于自然语言处理、机器学习和人工神经网络等领域。

自然语言处理:自然语言处理(Natural Language Processing,简称NLP),是语言学与人工智能的交叉学科,其主要功能就是实现让机器明白人类的语言,这需要将人类的自然语言转化为计算机能够处理的机器语言。

自然语言处理主要包括词法分析、句法分析和语义分析三大部分。词法分析的核心就是分词处理,即单词的边界处理。句法分析就是对自然语言中句子的结构、语法进行分析如辨别疑问句和感叹句等。而语义分析则注重情感分析和整个段落的上下文分析,辨别一些字词在不同的上下文定的语义和情感态度。

当前自然语言的处理主要有两大方向。一种是基于句法-语义规则的理性主义理论,该理论认为需要为计算机制定一系列的规则,计算机在规则下进行推理与判断。因此其技术路线是一系列的人为的语料建设与规则制定。第二种是基于统计学习的经验主义理论,这种理论在最近受到普遍推崇。该理论让计算机自己通过学习并进行统计推断的方式不停地从数据中“学习”语言,试图刻画真实世界的语言现象,从数据中统计语言的规律。

机器学习:机器学习(Machine Learning)是近20年来兴起的人工智能一大重要领域。其主要是指通过让计算机在数据中自动分析获得规律,从而获取“自我学习”的能力,并利用规律对未知数据进行判断和预测的方法。

机器学致可以分为有监督的学习和无监督的学习。有监督的学习是从给定的训练数据集中练出一个函数和目标,当有新的数据到来时,可以由训练得到函数预测目标。有监督的学习要求训练集同时有输入和输出,也就是所谓的特征和目标。而依据预测的结果是离散的还是连续的,将有监督的学习分为两大问题,即统计分类问题和回归分析问题。统计分类的预测结果是离散的,如肿瘤是良性还是恶性等;而回归分析问题目标是连续的,如天气、股价等的预测。

无监督学习的训练集则没有人为标注的结果,这就需要计算机去发现数据间的联系并用来分类等。一种常见的无监督学习是聚类分析(Cluster Analysis),它是将相似的对象通过静态分类的方法分成不同的组别或者是特定的子集,让同一个子集中的数据对象都有一些相似的属性,比较常用的聚类方法是简洁并快速的“K-均值”聚类算法。它基于K个中心并对距离这些中心最近的数据对象进行分类。

机器学习还包括如半监督学习和增强学习等类别。总而言之,机器学习是研究如何使用机器来模拟人类学习活动的一门学科,而其应用随着人工智能研究领域的深入也变得越来越广泛,如模式识别、计算机视觉、语音识别、推荐算法等领域越来越广泛地应用到了机器学习中。

人工神经网络:在脑神经科学领域,人们认为人类的意识及智能行为,都是通过巨大的神经网络传递的,每个神经细胞通过突出与其他神经细胞连接,当通过突触的信号强度超过某个阈值时,神经细胞便会进入激活状态,向所连接的神经细胞一层层传递信号。于1943年提出的基于生物神经元的M-P模型的主要思想就是将神经元抽象为一个多输入单输出的信息处理单元,并通过传递函数f对输入x1,x2…,xn进行处理并模拟神经细胞的激活模式。主要的传递函数有阶跃型、线性型和S型。

在此基础上,对神经网络算法的研究又有诸多进展。日本的福岛教授于1983年基于视觉认知模型提出了卷积神经网络计算模型。通过学习训练获取到卷积运算中所使用的卷积系数,并通过不同层次与自由度的变化,可以得到较为优化的计算结果。而AlphaGo也正是采用了这种深度卷积神经网络(DCNN)模型,提高了AlphaGo的视觉分类能力,也就是所谓的“棋感”,增强了其对全盘决策和把握的能力。

3.人工智能的发展前景

总体来看,人工智能的应用经历了博弈、感知、决策和反馈这几个里程碑。在以上4个领域中,既是纵向发展的过程,也是横向不断改进的过程。

人工智能在博弈阶段,主要是实现逻辑推理等功能,随着计算机处理能力的进步以及深度学习等算法的改进,机器拥有了越来越强的逻辑与对弈能力。在感知领域,随着自然语言处理的进步,机器已经基本能对人类的语音与语言进行感知,并且能够已经对现实世界进行视觉上的感知。基于大数据的处理和机器学习的发展,机器已经能够对周围的环境进行认知,例如微软的Kinect就能够准确的对人的肢体动作进行判断。该领域的主要实现还包括苹果的Siri,谷歌大脑以及无人驾驶汽车中的各种传感器等。在以上两个阶段的基础上,机器拥有了一定的决策和反馈的能力。无人驾驶汽车的蓬勃发展就是这两个里程碑很好的例证。Google的无人驾驶汽车通过各种传感器对周围的环境进行感知并处理人类的语言等指令,利用所收集的信息进行最后的决策,比如操作方向盘、刹车等。

人工智能已经渗透到生活中的各个领域。机器已经能识别语音、人脸以及视频内容等,从而实现各种人际交互的场景。在医学领域,人工智能可以实现自动读片和辅助诊断以及个性化t疗和基因排序等功能。在教育领域,机器也承担了越来越多的辅助教育,智能交互的功能。在交通领域,一方面无人车的发展表明无人驾驶是一个可以期待的未来,另一方面人工智能能够带来更加通畅和智能的交通。另外人工智能在安防、金融等领域也有非常广阔的发展前景。总之,人工智能在一些具有重复性的和具备简单决策的领域已经是一种非常重要的工具,用来帮助人们解决问题,创造价值。

参考文献

[1]阮晓东.从AlphaGo的胜利看人工智能的未来[J].新经济导刊,2016 (6):69-74.

第9篇:计算机视觉研究领域范文

关键词:PCB;图像处理;视觉检测

中图分类号:TP277文献标识码:A文章编号:1009-3044(2012)07-1648-06

当今世界科技发展日新月异,电子产业的发展直接制约着国民经济的腾飞与否,而PCB电路板制作工艺的提高对促进电子产业的发展至关重要,能否有效精确地检测PCB电路板的缺陷一直都是电子行业的研究热点。国外的印刷电路板自动检测技术一直领先于国内,国内的很多厂家不得不采用昂贵的外国技术,虽然近年国内的印刷电路板自动检测技术发展迅速,但大都没有取得令人非常满意的结果。加入研究这一领域的热潮,赶超外国的先进技技水平,打断外国垄断技术,对于发展国民经济具有十分重要的意义。

1 PCB检测系统的硬件设计

1.1 PCB检测系统的硬件组成框图

虽然本文所做的工作主要是软件方面,但对于硬件系统的设计也是至关重要的,它对于建立有效的计算机视觉识别检测系统,起着决定性作用。因此,必须在综合考虑系统性价比和系统性能的基础上,设计出合理的硬件系统[9]。PCB检测系统的硬件组成框图如图1所示:图1 PCB检测系统硬件组成框图

1.2系统的硬件组成

系统的硬件组成[10]主要包括:计算机主机、CCD摄像机、图像采集卡、照明系统及相关的设备。

2 PCB电路板缺陷检测识别

PCB电路板在电子工业中的应用越来越广泛,如何降低电路板的故障率、提高电路板的质量直接影响到整个产业的发展。因此,对于PCB电路板缺陷的识别技术的发展至关重要。PCB电路板的缺陷很多[16],主要有短路、断路、划痕、凸起、空洞、缺焊、过焊等等,由于实验室设备限制和个人水平所限,本文主要研究的内容是PCB电路板短路与断路的检测识别

近年来出现了很多图像检测算法,这些算法大致可分为三大类:有参考算法、无参考算法以及混合型算法。有参考算法分为两大类:图像对比法和模型对比法。无参考算法是一种不需要标准图像的检测算法,它是基于一定的设计规则来进行检测的。混合型方法是将有参考算法与无参考算法混合使用,从而发挥出各自的优点。比如,模板匹配法与数学形态学方法结合使用,或者连接表方法与数学形态学方法结合使用等。本文中短路与断路的检测识别采取了图像对比法,即将经过一定处理后的图像进行相减,从而分析相应的结果;而对焊点缺陷的识别主要采用模板匹配法与数学形态学方法结合使用。

2.1 PCB电路板缺陷检测识别的主要流程图

图2为子程序流程图;图3为主程序流程图。

2.2 PCB电路板短路与断路的检测识别

2.2.1边缘检测

在对图像进行基本的处理过后可以将图像与背景分割开来。边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。

这些包括:深度上的不连续;表面方向不连续;物质属性变化;场景照明变化。边缘检测是图像处理和计算机视觉中,尤其是特征提取中的一个研究领域。

图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。有许多方法用于边缘检测,它们的绝大部分可以划分为两类[17]:基于查找一类和基于零穿越的一类。基于查找的方法通过寻找图像一阶导数中的最大和最小值来检测边界,通常是将边界定位在梯度最大的方向。基于零穿越的方法通过寻找图像二阶导数零穿越来寻找边界,通常是Laplacian过零点或者非线性差分表示的过零点。

1)Roberts算子

边缘,是指周围像素灰度有阶跃变化或屋顶等变化的那些像素的集合。图像的边缘对应着图像灰度的不连续性。显然图像的边缘很少是从一个灰度跳到另一个灰度这样的理想状况。真实图像的边缘通常都具有有限的宽度呈现出陡峭的斜坡状。边缘的锐利程度由图像灰度的梯度决定。梯度是一个向量,?f指出灰度变化的最快的方向和数量,如式2-1所示。

?f=(决定的。

因此最简单的边缘检测算子是用图像的垂直和水平差分来逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)

因此当我们想寻找边缘的时候,最简单的方法是对每一个像素计算出(2,4)的向量,然后求出他的绝对值,然后进行阀值操作就可以了。利用这种思想就得到了Roberts算子,由式2-5所示。

R(i,j)=

(式2-5)

它是一个两个2×2模板作用的结果。

2)Sobel算子

该算法通过2个3*3的模板,对选定的二维图像中同样大小窗口进行卷积,通常是一个模板对一个边缘响应大,另一个模板对水平边缘响应大,两个卷积值对最大值作为该点对输出。对于图像上的任意点(i,j)进行卷积,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)则输出图像公式如式2-8所示。

用sobel算子检测阶跃边缘得到的边缘宽度至少为两个宽度。3)Laplacian边缘检测算子

Laplacian算子定义由式2-9所示。

Δ2f(x,y)=

(式2-9)它的差分形式由式2-10所示。

Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}

=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)

Laplacian算子是一种各向同性算子,在只关心边缘的位置而不考虑其周围的灰度象素差值时时比较合适,Laplacian算子对孤立象素的响应要比对边缘或线的响应更要强烈,因此只适用于无噪声图像。

原图像与用三种边缘检测算子处理后的图像如下所示:图6 Sobel边缘检测图7 Laplacian边缘检测

从上面四幅图分析比较可得出结论:用Roberts边缘检测得出的图像较之其他方法更为清晰,噪点更少,图像更为连续,所以本文中采用Roberts算子来进行边缘检测。

2.2.2阈值分割

阈值分割法是一种基于区域的图像分割技术,其基本原理是:通过设定不同的特征阈值,把图像象素点分为若干类。常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始灰度或彩色值变换得到的特征。设原始图像为f(x,y),按照一定的准则f(x,y)中找到特征值T,将图像分割为两个部分,分割后的图像为:

若取:b0=0(黑),b1=1(白),即为我们通常所说的图像二值化。

在数字化的图像数据中,无用的背景数据和对象物的数据经常放在一起,同时,图像中还含有各种噪声,因此可以根据图像的统计性质,从概率的角度来选择合适的阈值。

1)最大方差阈值法

把待处理图像的直方图在某一阈值处分割为两组,当被分割成的两组间的方差最大时,便可以决定阈值了。

设灰度图像f(x,y)的灰度级为0-L,灰度级I的像素为Ni,则图中:

总象素数N=∑j=0 i=LNi(式2-11)灰度级i出现的概率Pi= 1-ω(K)(式2-16)则两组间的数学期望为ω0μ0ω1μ1=μ(式2-17)两组间的方差为ρ2(k)

ρ2(k)是K的函数,计算k取从0,1,2…L时ρ2(k)的值,当多的值为最大时,K即为阈值。

2)双峰法

根据图像的直方图具有背景和对象物的两个峰,分割两个区域的阈值由两个峰值之间的谷所对应的灰度值决定。设灰度图像f(x,y)的灰度级为0-L,灰度i的像素为Pi,分别计算

因为实际PCB电路板有着许多的划痕、污点等,使用最大方差阈值法时,会在处理后的图像上产生许多误点,而影响实际结果的分析,而双峰法能够顺利地滤除这些干扰,这个结论在分析对比以上图像时也可得出。所以本文选用了双峰法来进行阈值分割。

2.2.3粒子分析与图像对比

经过边缘检测和阈值分割的图像中会存在许多瑕点,这些点会影响到最后的图像识别与分析,有可能会增加多余的残留图像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能进行去除,如图11和图12所示。图11原图像图12粒子分析

将标准PCB图片减去缺陷缺陷PCB图片,便可以得到缺陷板的断路部分的图像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到断路部分的具体分析,如图13示。

将缺陷PCB图片减去标准PCB图片,便可以得到缺陷板的短路部分的图像,与上述相同的方法,便可以得到短路部分的具体分析,如图14所示。

3结束语

利用LABVIEW来进行PCB电路板缺陷的识别与检测是一项非常好的课题,它在近些年已经得到了一定的发展,并将得到更大的进步。限于本人能力和时间,本文的研究还未涉及很深的领域,可以在以下方面加以改进:

1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的设计可以再利用其他语言如VISUAL BASIC,C++等编程语言加以辅助设计,相信可以取得更加令人满意的结果。

2)由于实验设备等其他因素,本文中只重点研究了PCB电路板短路与断路的检测识别,PCB电路板的其他缺陷还有待于进一步的分析研究、分类和总结,并设计出更好的检测方法,以真正满足PCB电路板检测的需求。

3)照明设备的限制在很大程度上影响到了图像的检测效果,为取得PCB缺陷检测的进一步进展,在照明设备的选择上必须重视,并且设计出更好的图像采集系统。

4)在识别与检测手段上,可以引入更新更好的方法,而不要局限于在传统的方法中分析比较,例如基于BP神经网络的识别检测,图像的模糊决策等将有待于进一步研究。

总之,基于LABVIEW的机器视觉检测系统已经取得了不错的进展,高速发展的PCB制造技术和计算机技术对于PCB缺陷的检测提出了更高的要求,同时也大大地促进了PCB缺陷检测技术的发展。利用机器视觉检测在未来的较长的一段时间内将占据检测行业的半壁江山,相信在未来会取得更大的发展。

参考文献:

[1]程学庆,房晓溪.LabVIEW图形化编程与实例应用[M].北京:中国铁道出版社,2005.

[2]胡仲波.基于虚拟仪器技术的PCB视觉检测系统[D].南京:南京理工大学硕士学位论文,2006.

[3]段峰,王耀南.机器视觉技术及其应用综述[J].自动化博览,2002,19(3).

[4]周长发.精通Visual C++图像处理编程[M].北京:电子工业出版社,2004.

[5]陈锡辉,张银鸿.LabVIEW 8.20程序设计从入门到精通[M].北京:清华大学出版社,2007.

[6]郑伟.图像法检测印刷电路板缺陷[M].西安:西安理工大学,2002.

[7] National Instruments,IMAQ User Manual Concepts[Z].1999.

[8]李强.PCB板缺陷自动检测技术的分析研究[D].合肥:合肥工业大学,2002.

[9]傅茂名.基于形态边缘检测算法的一种改进[J].电子科技大学学报,2005(2).

[10]王思华.计算机视觉新技术及其在IC标记质量检验系统设计中的应用[J].电子技术应用,2000(9).

[11]岳永哲.图像处理技术在阅卷系统中的应用[D].北京:北京工业大学,2006.

[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.

[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.

[14]高育鹏,杨俊,何广军.基于图像识别的自动阅卷系统研究[J].现代电子期刊,2006(22).

[15]杨青燕,彭延军.基于灰度图像的答题卡识别技术[J].山东科技大学学报:自然科学版,2009(3).

[16]周海涛,韩晓军.基于数字图像处理的答题卡识别方法研究[J].电脑知识与技术,2008(28).

[17]周万珍,郑广,王建霞,等.数字图像处理技术在客观题阅卷中的应用[J].数学的实践与认识,2006(8).

[18]王胜春.基于SVM的信息卡识别系统[D].长沙:湖南师范大学,2008.

[19]吴志明.SMT系统中焊点位置的检测[D].哈尔滨:哈尔滨工业大学,2006.

[20]杨敏,王春青,邹增大,等.表面组装印刷电路板上焊点信息的自动获取[J].焊接学报,2005,39(6).