公务员期刊网 精选范文 卷积神经网络意义范文

卷积神经网络意义精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的卷积神经网络意义主题范文,仅供参考,欢迎阅读并收藏。

卷积神经网络意义

第1篇:卷积神经网络意义范文

关键词:卷积神经网络;深度学习;年龄分类

0引言

人脸作为人类个体鲜明显著的生物特征之一,包含着丰富的个人信息。随着计算机视觉和机器学习技术的发展,相关的人脸识别等技术已成为这些项目任务的热点课题,并在法医、电子化客户关系管理、安防、生物识别和娱乐影音等诸多领域中得到广泛应用。人脸除了可进行身份认证和识别外,还可以提取出性别、种族和年龄等信息,特别是可以将年龄及分布特征用于人机交互和商业智能等应用中,因此年龄估计研究具有重要的科学意义和实用价值。

相对于人脸识别,人脸所能表征的年龄信息要受到很多因素的影响,例如不同个体的基因差异、生活习惯、环境、抗压能力、健康情况和种族差别等有很大的关系。同时,相同个体因发型、化妆和表情的不同也会影响年龄的估计。因此,如果要基于传统的分类算法(如支持向量机)并利用人脸图像信息来进行年龄分类将很难得到理想的结果。针对这些问题,目前的研究还相对不足,如果能有效解决上述问题,对大部分潜在的应用领域也都将带来深刻的影响。

1相关工作

年龄分类的主要流程是先根据人脸图像获取特征,再通过机器学习方法构建模型,通过把年龄分为多个年龄区段,即每个年龄段对应一个类别(比如未成年或成年人等)。因此可以把年龄分类看成是一个二分类或者多分类的分类问题来进行求解。1994年,Kwon和Lobo则从人脸图像中获取年龄分类,把人分为3种不同的类别,也就是儿童、青年人和老年人,强调重要特征点的选择。2002年Lanitis等人提出了能自动对年龄实现估计的年龄量化方法。而且,王先梅等的综述中也整体梳理了相关年龄估计技术的研究发展。王绍宇等人还基于SMV采用生物特征对人进行分类,分为小孩和成人。此外在2016年,董远等人更将迁移学习和卷积神经网络用于人的年龄和性别分类。

第2篇:卷积神经网络意义范文

关键词:笔迹;性别识别;深度学习

0引言

近年来,由于在数据挖掘、取证分析、文档授权和判断真实历史笔迹等方面的应用,笔迹分析变得愈加重要。人类学习写字从模仿他人开始并逐渐形成自己的笔迹风格,在这个过程中,性别的影响是不容忽视的。Beech和Mackintosh研究了激素和笔迹风格的关系,由此发现产前激素对女性的笔迹风格有很大的影响。Mergl和Tigges的研究表明男性笔迹和女性笔迹存在明显差异,女性的笔迹更加易读,更加整洁和有组织性,而男性笔迹更加潦草,会出现更多的错误。

目前笔迹性别识别的方法有:基于梯度的识别算法GLBP,提取图像的HOG特征并结合根据LBP算子提取的梯度特征来支持处理识别,使用SVM进行分类,获得了75.45%的准确率:基于局部特征的识别算法,设计块特征计算密度并提取多种LBP特征和HOG特征加入研发识别,使用SVM进行分类,获得了70%的准确率;基于GMM的识别算法,将局部特征和全局特征融合进行分类,获得了67.57%的准确率。虽然现有的方法可以在一定程度上识别作者性别,但是由于这些特征表达的笔迹信息不准确,识别率一直并不理想。而深度神网络能够自主学习特征,并且在人脸识别、物体的检测识别系统方面取得了堪称优良的效果,因此本文研发设计了一个深度适中的网络对笔迹进行性别分类。

第3篇:卷积神经网络意义范文

【关键词】人脸识别;人脸检测;方法

Abstract:Face recognition system is one of the most popular current scientific research,In this paper,the process and prospects of face recognition system to do a simple review.The application of the system to do a simple analysis and the main method of face recognition for the corresponding category.For the future development of face recognition systems were mainly discussed.

Key words:Face Recognition;Face Detection;Methods

一、引言

随着科学技术的突飞猛进,计算机及网络的高速发展,信息的安全性、隐蔽性越来越重要,如何有效、方便的进行身份验证和识别,已经成为人们日益关心的问题。生物认证的方法,即利用人类自身的特征来进行身份认证,具有传统方法没有的有点,也解决了身份认证技术所面临的一大难题。其具有方便、强化安全、不会丢失、遗忘或转让等优点。现在人体生物识别技术的研究主要针对人脸、指纹、虹膜、手型、声音等物理或行为特征来进行。本文主要对人脸识别技术的介绍。

人脸识别是指给定一个静止或动态图像,利用已有的人脸数据库来确认图像中的一个或多个人。如同人的指纹一样,人脸也具有唯一性,也可用来鉴别一个人的身份。现在己有实用的计算机自动指纹识别系统面世,并在安检等部门得到应用,但还没有通用成熟的人脸自动识别系统出现。人脸图像的自动识别系统较之指纹识别系统、DNA鉴定等更具方便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义更大。另一方面,人脸表情的多样性;以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等给识别带来很大难度。因此在各种干扰条件下实现人脸图像的识别,也就更具有挑战性。

二、人脸识别系统流程

(1)人脸图像的获取:图像的获取都是通过摄像头摄取,但摄取的图像可以是真人,也可以是人脸的图片或者为了相对简单,可以不考虑通过摄像头来摄取头像,而是直接给定要识别的图像。

(2)人脸的检测:人脸检测的任务是判断静态图像中是否存在人脸。若存在人脸,给出其在图像中的坐标位置、人脸区域大小等信息。而人脸跟踪则需要进一步输出所检测到的人脸位置、大小等状态随时间的连续变化情况。

图1 人脸识别框架

(3)特征提取:通过人脸特征点的检测与标定可以确定人脸图像中显著特征点的位置(如眼睛、眉毛、鼻子、嘴巴等器官),同时还可以得到这些器官及其面部轮廓的形状信息的描述。根据人脸特征点检测与标定的结果,通过某些运算得到人脸特征的描述(这些特征包括:全局特征和局部特征,显式特征和统计特征等)。

(4)基于人脸图像比对的身份识别:即人脸识别问题。通过将输入人脸图像与人脸数据库中的所有已知原型人脸图像计算相似度并对其排序来给出输入人脸的身份信息。

(5)基于人脸图像比对的身份验证:即人脸确认问题。系统在输入人脸图像的同时输入一个用户宣称的该人脸的身份信息,系统要对该输入人脸图像的身份与宣称的身份是否相符作出判断。

三、人脸识别技术现状及发展前景

自1995年以来,国外一些公司看准了人脸识别系统广阔的应用前景,动用了大量人力和物力,自己独立研发或与高校合作,开发了多个实用的人脸识别系统,例如:加拿大Imagis公司的ID-2000面部识别软件,美国Identix公司1的FaceIt人脸识别系统,德国Human Scan公司的BioID身份识别系统,德国Cognitec Systems公司的Face VACS人脸识别系统等;美国A4vision公司的3D人脸识别产品;等等。

国内相关领域较为出名的公司有上海银晨智能识别科技有限公司(IS'vision),他们与中科院计算所联合开发了会议代表身份认证/识别系统、嫌疑人面像比对系统、面像识别考勤/门禁系统、出人口黑名单监控系统等多种自动人脸识别应用系统。2008年,北京奥运会开幕式正式使用了中国自主知识产权的人脸识别比对系统;2010年4月1日起,国际民航组织(ICAO)已确定其118个成员国家和地区必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准;2011年,Face book初次引入人脸识别技术,登陆人员可以免信息验证而激活页面;2012年3月6日,江苏省公安厅与南京理工大学日前签约共建“社会公共安全重点实验室”,开展“人脸识别”技术相关领域项目攻关。

到目前为止,虽然有关自动人脸识别的研究已经取得了一些可喜的成果,但在实际应用环境下仍面临着许多难以解决的问题:人脸的非刚体,表情、姿态、发型和化妆的多样性以及环境光照的复杂性都给正确的人脸识别带来了很大的困难。即使在大量来自模式识别、计算机视觉、生理学、心理学、神经认知科学等领域的研究人员对自动人脸识别艰苦工作40余年之后,其中不少问题至今仍然困绕着研究人员,始终找不到完善的解决办法。

在人脸识别市场,特别是在中国的市场,正经历着迅速的发展,而且发展的脚步也将越来越快。主要有三大原因:

1.是科技界和社会各个领域都认识到人脸识别技术的重要性,国家政策对人脸识别技术研究给予了很大支持,使得我国人脸识别技术取得了很大进展。国际上,美国国家标准技术局(NIST)举办的Face Recognition Vendor Test 2006(FRVT2006)通过大规模的人脸数据测试表明,当今世界上人脸识别方法的识别精度比2002年的FRVT2002至少提高了一个数量级(10倍)。其中一些方法的识别精度已经超过人类的平均水平。而对于高清晰、高质量人脸图像识别,机器的识别精度几乎达到100%。

2.各种应用需求不断出现。人脸识别市场的快速发展一方面归功于生物识别需求的多元化,另一方面则是由于人脸识别技术的进步。从需求上来说,除了传统的公司考勤、门禁等应用外,视频监控环境下的身份识别正成为一种迫切的需求,即在一个较复杂的场景中,在较远的距离上识别出特定人的身份,这显然是指纹识别的方法不能满足的,而人脸识别却是一个极佳的选择。

3.人口基数因素。人脸识别系统的市场大小,很大程度上是和人口的数量大小相关的。而我国有13亿人口,这从本质上说明了我国是世界上规模最大的生物识别市场。

四、常用的人脸识别方法

人脸识别技术和方法可分为两大类:基于几何特征的方法和基于模板匹配的方法。基于几何特征方法的思想是首先检测出嘴巴,鼻子,眼睛,眉毛等脸部主要部分的位置和大小,然后利用这些部件的总体几何分布关系以及相互之间的参数比例来识别人脸。基于模板的方法是利用模板和整个人脸图像的像素值之间的自相关性进行识别,这种方法也叫做基于表象的方法。

本文主要分析了常用的人脸识别方法为:几何特征的方法、模型的方法、神经网络的方法和多分类器集成方法。

1.几何特征的方法

最早的人脸识别方法就是Bledsoe提出的基于几何特征的方法,这种方法以面部特征点之间的距离和比率作为特征通过最近邻方法来识别人脸。该方法建立的人脸识别系统是一个半自动系统,其面部特征点必须由人手工定位,也正是由于人工的参与,该系统对光照变化和姿态变化不敏感。

Kanade首先计算眼角、鼻孔、嘴巴、下巴等面部特征之间的距离和它们之间的角度以及其它几何关系然后通过这些几何关系进行人脸的识别工作在一个20人的数据库上识别率为45%一75%。

Brunelli和Poggio通过计算鼻子的宽度和长度、嘴巴位置和下巴形状等进行识别,在一个47人的人脸库上的识别率为90%.然而,简单模板匹配方法在同一人脸库上的识别率为100%。

基于几何特征的方法比较直观,识别速度快,内存要求较少,提取的特征在一定程度上对光照变化不太敏感。但是,当人脸具有一定的表情或者姿态变化时,特征提取不精确,而且由于忽略了整个图像的很多细节信息且识别率较低,所以近年来已经很少有新的发展。

2.模型的方法

隐马尔可夫模型,是一种常用的模型,原HMM的方法首先被用于声音识别等身份识别上,之后被Nefian和Hayrs引人到人脸识别领域。它是用于描述信号统计特性的一组统计模型。

在人脸识别过程中,首先抽取人脸特征,得到后观察向量,构建HMM人脸模型,然后用EM算法训练利用该模型就可以算出每个待识别人脸观察向量的概率,从而完成识别,HMM方法的鲁棒性较好,对表情、姿态变化不太敏感,识别率高。

3.神经网络的方法

神经网络在人脸识别领域有很长的应用历史,1994年就出现了神经网络用于人脸处理的综述性文章。

动态链接结构(DLA)是用于人脸识别系统中最有影响的神经网络方法。DLA试图解决传统的神经网络中一些概念性问题,其中最突出的是网络中语法关系的表达。DLA利用突触的可塑性将神经元集合划分成若干个结构,同时保留了神经网络的优点。

自组织映射神经网络(SOM)与卷积神经网络相结合的混合神经网络方法进行人脸识别。SOM实现对图像的采样向量降维,且对图像样本的小幅度变形不敏感。卷积网络用来实现相邻像素间的相关性知识,在一定程度对图象的平移、旋转、尺度和局部变形也都不敏感。

神经网络方法较其他人脸识别方法有着特有的优势,通过对神经网络的训练可以获得其他方法难以实现的关于人脸图像的规则和特征的隐性表示,避免了复杂的特征抽取工作,并有利于硬件的实现。缺点主要在于其方法的可解释性较弱,且要求多张人脸图像作为训练集,所以只适合于小型人脸库。

4.多分类器集成方法

人脸的表象会因为光照方向、姿态、表情变化而产生较大的变化,每种特定的识别器只对其中一部分变化比较敏感,因此,将可以整合互补信息的多个分类器集成能够提高整个系统的分类准确率。

Gutta等人提出将集成的RBF与决策树结合起来进行人脸识别。结合了全局的模板匹配和离散特征的优点,在一个350人的人脸库上测试,取得了较好的实验结果。

五、总结及展望

随着图像处理、模式识别、人工智能以及生物心理学的研究进展,人脸识别技术也将会获得更大的发展。面对这种高新技术,人脸识别技术有着不可代替的优点。近几年对三维模型的人脸识别研究以成为一个热点。从二维模型到三维模型是一个阶跃性的发展,中间必须克服三维模型的开销大,所占空间大等因素。因此如何增强这类系统的保密性将是人脸识别系统要考虑的问题,它将是这种识别系统投入使用后人们最关心的问题,同时也是人脸识别领域需要研究的新课题。我们期待在不久的将来,人们将告别钥匙,迎来人脸开门的新时代。

参考文献

[1]李武军,王崇骏,张炜,等.人脸识别研究综述[J].模拟识别与人工智能,2006,19(1):58-65.

[2]李子青.人脸识别技术应用及市场分析[J].中国安防,2007,8:42-46.

[3]柴秀娟,山世光,卿来云,等.基于3D人脸重建的光照、姿态不变人脸识别[J] .软件学报,2006,17(3):525-534.

第4篇:卷积神经网络意义范文

关键词:图像分割 阈值分割 遗传算法 小波变换

中图分类号:TP391 文献标识码:A 文章编号:1002-2422(2010)02-0001-03

图像分割是按照一定的规则把图像划分成若干个互不相交、具有一定性质的区域,把人们关注的部分从图像中提取出来,进一步加以研究分析和处理。图像分割的结果是图像特征提取和识别等图像理解的基础,对图像分割的研究一直是数字图像处理技术研究中的热点和焦点。图像分割使得其后的图像分析,识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。图像分割在不同的领域也有其它名称,如目标轮廓技术、目标检测技术、阈值化技术、目标跟踪技术等,这些技术本身或其核心实际上也就是图像分割技术。

1 经典图像分割方法

1,1阈值分割方法

阈值分割是常见的直接对图像进行分割的算法,根据图像像素的灰度值的不同而定。对应单一目标图像,只需选取一个阈值,即可将图像分为目标和背景两大类,这个称为单阈值分割:如果目标图像复杂,选取多个阈值,才能将图像中的目标区域和背景被分割成多个,这个称为多阈值分割,此时还需要区分检测结果中的图像目标,对各个图像目标区域进行唯一的标识进行区分。阈值分割的显著优点,成本低廉,实现简单。当目标和背景区域的像素灰度值或其它特征存在明显差异的情况下,该算法能非常有效地实现对图像的分割。闽值分割方法的关键是如何取得一个合适的阈值,近年来的方法有:用最大相关性原则选择阈值的方法、基于图像拓扑稳定状态的方法、灰度共生矩阵方法、最大熵法和谷值分析法等,更多的情况下,阈值的选择会综合运用两种或两种以上的方法,这也是图像分割发展的一个趋势。

1,2基于边缘的图像分割方法

边缘总是以强度突变的形式出现,可以定义为图像局部特性的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始。对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。当今的边缘检测方法中,主要有一次微分、二次微分和模板操作等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果。但对于边缘复杂的图像效果不太理想,如边缘模糊、边缘丢失、边缘不连续等。噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,再用拟合光滑函数的导数来代替直接的数值导数,如Mart算子、canny算子等。在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取以及如何确认重要边缘以去除假边缘将变的非常重要。

1,3基于函数优化的分割方法

此方法是图像分割中另一大类常用的方法。其基本思路是给出一个目标函数,通过该目标函数的极大化或极小化来分割图像。GA.Hewer等人提出了一个具有广泛意义的目标函数。统计学分割方法、结合区域与边缘信息的方法、基于贝叶斯公式的分割方法等是目前几种活跃的函数优化方法。

统计学分割方法是把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,且观察到的实际物体是作了某种变换并加入噪声的结果。统计学分割方法包括基于马尔科夫随机场方法、标号法、混合分布法等。

区域增长法和分裂合并法是基于区域信息的图像分割的主要方法。区域增长有两种方式,一种是先将图像分割成很多的一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的。另一种实现是给定图像中要分割目标的一个种子区域,再在种子区域基础上将周围的像素点以一定的规则加入其中,最终达到目标与背景分离的目的;分裂合并法对图像的分割是按区域生长法沿相反方向进行的,无需设置种子点。其基本思想是给定相似测度和同质测度。从整幅图像开始,如果区域不满足同质测度,则分裂成任意大小的不重叠子区域,如果两个邻域的子区域满足相似测度则合并。

2 结合特定工具的图像分割算法

虽然图像分割目前尚无通用的理论,但是近年来大量学者致力于将新概念、新方法应用于图像分割,结合特定理论的图像分割方法在图像分割方面取得了较好的应用效果。如小波分析和小波变换、神经网络、遗传算法等数学工具的利用,有效地改善了分割效果。

2,1基于遗传算法的图像分割

遗传算法是模拟自然界生物进化过程与机制求解问题的一类自组织与自适应的人工智能技术。对此,科学家们进行了大量的研究工作,并成功地运用于各种类型的优化问题,在分割复杂的图像时,人们往往采用多参量进行信息融合,在多参量参与的最优值求取过程中,优化计算是最重要的,把自然进化的特征应用到计算机算法中,将能解决很多问题。遗传算法的出现为解决这类问题提供了新而有效的方法,不仅可以得到全局最优解,而且大量缩短了计算时间。王月兰等人提出的基于信息融合技术的彩色图像分割方法,该方法应用剥壳技术将问题的复杂度降低,然后将信息融合技术应用到彩色图像分割中,为彩色分割在不同领域中的应用提供了一种新的思路与解决办法。

2,2基于人工神经网络技术的图像分割

基于神经网络的分割方法的基本思想是先通过训练多层感知器来得到线性决策函数,然后用决策函数对像素进行分类来达到分割的目的。近年来,随着神经学的研究和进展,第三代脉冲耦合神经网络(PCNN)作为一种新型人工神经网络模型,其独特处理方式为图像分割提供了新的思路。脉冲耦合神经网络具有捕获特性,会产生点火脉冲传播,对输入图像具有时空整合作用,相邻的具有相似输入的神经元倾向于同时点火。因此对于灰度图象,PCNN具有天然的分割能力,与输入图像中不同目标区域对应的神经元在不同的时刻点火,从而将不同区域分割开来。如果目标区域灰度分布有重叠,由于PCNN的时空整合作用,如果灰度分布符合某种规律,PCNN也能克服灰度分布重叠所带来的不利影响,从而实现较完美的分割。这是其一个突出的优点,而这恰恰是其他的分割方法所欠缺的,其在未来的图像分割中将起主导作用。

2,3基于小波分析和变换的图像分割

近年来,小波理论得到了迅速的发展,而且由于其具有良好的时频局部化特性和多分辨率分析能力,在图像处理等领域得到了广泛的应用。小波变换是一种多尺度多通道分析工具,比较适合对图像进行多尺度的边缘检测。从图像处理角度看,小波变换具有“变焦”特性,在低频段可用高频率分辨率和低时间分辨率,在高频段可用低频率分辨率和高时间分辨率,小波变换在实现上有快速算法具有多分辨率,也叫多尺度的特点,可以由粗及精地逐步观察信号等优点。近年来多进制小波也开始用于边缘检测。另外,把小波变换和其它方法结合起来的图像分割技术也是现在研究的热点。

3 图像分割的应用现状

在图像处理中,图像分割是一种重要的技术,是图像分析的基础。随着图像分割技术研究的深入,其应用日趋广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。通常,图像分割是为了进一步对图像进行分析、识别、压缩、编码等,图像分割的准确性将直接影响后继的工作,因此,分割的方法和精确程度是至关重要的。目前,图像分割在图像工程中占据非常重要的位置,图像分割已在交通、医学、遥感、通信、军事和工业自动化等诸多领域得到广泛应用。表1是应用领域表。

第5篇:卷积神经网络意义范文

关键词:人工智能;引擎;大数据;CPU;FPGA

DOI:10.3969/j.jssn.1005-5517-2017-2.006

1 2016年人工智能迎来了春天

2016年人工智能(A1)进入了第三个。2016年3月9-15日,谷歌AlphaGo(阿尔法狗)以4:1的成绩击败世界围棋冠军李世石职业九段,意义非常重大。因为过去机器主要做感知,现在出现了认知,这是人工智能的关键所在。

8个月后,2016年12月29日~2017年1月4日,AlphaGo的升级版――谷歌Master(大师)在30秒快棋网测中,以60胜0负1和的成绩,横扫柯洁、古力、聂卫平、朴廷桓、井山裕太等数十位中日韩世界冠军与顶级高手。从此以后,也许人类以后就没有和Master进行围棋比赛的机会了!除了围棋,人工智能下一步将在国际象棋、中国象棋等棋类方面发展。

扑克牌方面,专家水平的人工智能首次战胜一对一无限注德州扑克人类职业玩家,而且DeepStack让机器拥有知觉。

人工智能还能玩游戏。其意义很重大,平时环境中很难得到一些数据,因为游戏相当于虚拟社会,例如“星际争霸2”是复杂的虚拟社会,如果人工智能在这个虚拟社会中能战胜人,这将是非常了不起的,未来可涉及到高级决策,在军事上很有用处。2016年11月5日,谷歌DeepMind宣布与暴雪合作开发人工智能,挑战实时战略视频游戏“星际争霸2”。这件事情的意义非常重大。下一步可以用于军事上的高级战略决策。

无人驾驶方面,2016年11月15日,“在第三届世界互联网大会”期间,18辆百度“云骁”亮相乌镇子夜路,在3.16公里的开放城区道路上自主行驶。2016年特斯拉Autopilot 2.0问世,该软件只需要八千美元,就可让软件驾驶汽车。所有特斯拉新车将安装“具有完全自动驾驶功能”的该硬件系统,并可通过OTA(空中下载技术)进行软件升级;自动驾驶功能从L2(二级,半无人驾驶)直接跳跃到L4/L5();2017年底之前,特斯拉车将以完全自动驾驶模式从洛杉矶开往纽约。Uber提出在城区大范围无人驾驶出租车试运行,Uber 2016年9月14日在美国匹兹堡市推出城区大范围无人驾驶出租车免费载客服务并试运行,先期已测试近2年,说明无人驾驶真正落地了。

为何无人驾驶很重要?因为人工智能是无人驾驶的核心。除了百度、特斯拉、Uber,谷歌Waymo也在做自动驾驶测试。此外,沃尔沃、福特、宝马、百度、英特尔等全球约20多家企业公开宣布,4年以后的2021年将会是无人驾驶/自动驾驶元年,部分5AE L4车将会实现量产。

计算机视觉

针对ImageNet ILSVRC测试比赛的1 000种物体识别,Deep CNN超过了人类的识别能力。人是5.1%(如图1),2016年2月23日谷歌人工识别的评测是3.08%。ImageNetILSVRC中有1000种物体,例如猴子、马、飞机、坦克等约1500万张照片、包含2.2万类种不同物体。深度学习一般能做到52层,极深度学习(very deep lea rning)现在已经做到1000层。

在ILSVRC 2016国际评测中,包括视觉物体检测、视觉物体定位、视频物体检测、场景分类、场景解析等性能均有提高。值得一提的是,在此次大会上,中国团队大放异彩,几乎包揽了各个项目的冠军(图2)。

人工智能语义分割

基于全卷积神经网络FCN的路面/场景像素级语义分割取得重要进展。为此,我们可以分割大部分道路。

人工智能唇语专家

看电视时把声音关掉,靠嘴唇说话的变化来识别谈话内容,这种能力机器识别率已经超过人类。例如2016年12月,英国牛津大学与谷歌DeepMind等研发的自动唇读系统LipNet,对GRID语料库实现了95.2%的准确率;对BBC电视节目嘉宾进行唇语解读,准确率为46.8%,远远超过专业的人类唇语专家(仅为12.4%)。

人工智能人脸识别

人脸识别可以达到产品级别,例如支付宝的刷脸成功率超过了人类。如图3,人的水平为97.40,百度为99.77。因此可以进行产品体验。2017年1月6日,百度人工智能机器人“小度”利用其超强人类识别能力,以3:2险胜人类最强大脑代表王峰。

语音识别

目前的社交新媒体和互动平台中,Al虚拟助手和Al聊天机器人正在崛起。一天,美国GIT(佐治亚理工大学)的一个课堂上来了一位助教,教师讲完课后说:“大家有问题就问助教吧”。这位助教原来是个会眨眼睛的机器人!这时学生们才知道每天网上给他们答疑解惑的是人工智能,此前学生们也感到很吃惊,这位助教非常敬业,晚上还在发Email。

人工智能语音合成

指从文本声音到真实声音,可以自动翻译成英文。2016年9月19日,谷歌DeepMind推出WaveNet,实现文本到美式英语或中国普通话的真实感语音合成。

人工智能速记员

包括语音识别和NLP(自然语言处理)。2016年10月17日,微软的语音识别系统实现了5.9%的词错率(WER),媲美人类专业速记员,且错误率更低;中国科大讯飞也有语音输入法。

人工智能翻译

中国人往往从小学到读博士都在学英语。现在,谷歌、微软和百度等公司在做人工智能翻译。以谷歌为例,2016年9月27日,谷歌的神经机器翻译系统(GNMT)实现了多语种翻译,较之传统方法,英译西班牙翻译错误率下降了87%,英译汉下降了58%,汉译英下降了60%,已接近人工翻译的水平。也许今后学外语没那么重要了,人们可戴着耳机,耳机能直接翻译成各语言。

人工智能对抗训练

Goodfellow(2014)提出的生成式对抗网络(GAN),为半监督学习/举一反三式的学习发展提供新思路,2016年发展迅速。目前是监督式学习,需要依靠大数据,因此大数据需要非常完备。而人是举一反三式的学习。例如人没有见过飞机,看过几张照片就可以把世界上所有飞机都认出;目前的大数据驱动的深度学习方式,是把世界上所有飞机照片都看过才行。现在进行举一反三的半监督或无监督式学习,思路是采用对抗的方法,一个网络造假,另一网络鉴别照片是真是假,通过对抗式的学习来共同进步(如图4)。

人工智能引擎

芯片三巨头

英特尔、英伟达和高通全部转到了人工智能上。为此英伟达的股票涨了几倍。英特尔也在大搞人工智能。高通为了进入人工智能领域,收购了恩智浦,恩智浦此前收购了飞思卡尔。

现在出现了基于超级GPU/TPU集群的离线训练,采用超级GPU/TPu集群服务器,例如英伟达的深度学习芯片Tesla P100及DGX-1深度学习计算机,谷歌数据中心的TPU。

终端应用采用GPU/FPGA-based DPU,例如英特尔Apollo Lake A3900的“智能互联驾驶舱平台”,高通骁龙的820A处理器。

通用人工智能与认知智能

1997年,lBM的超级电脑程序“深蓝”击败国际象棋大师加里・卡斯帕罗夫;2011年2月,IBM的自动问答系统在美国最受欢迎的智力竞答电视节目“危险边缘”中战胜了人类冠军:IBM的沃森医生在某些细分疾病领域已能提供顶级医生的医疗诊断水平,例如胃癌诊断。

可见,1.AlphaGo和Master等已可横扫人类围棋职业顶尖高手,下一步,将能下中国象棋等所有棋类,此外还可以打牌、炒股等,即什么都可以干,是强人工智能。2.人工智能已成为无人驾驶汽车商业落地的关键。3.视觉物体识别、人脸识别、唇语识别等在许多国际公开评测中,达到或超过人类的水平;4.速记等语音识别已可媲美人类;5.包括神经机器翻译在内的自然语言处理,性能也大幅度提升;6.生成式对抗网络得到极大关注。

目前,发展通用人工智能成为普遍共识。

2 社会极大关注

未来,可能很多工作就会消失了。

人工智能引起社会的极大关注和热议,人工智能发展很快;而且人工智能的学习速度快,很勤奋,未来可以达到人类所有的智能,这时到达了从强人工智能到超越人工智能的奇点;人工智能有超越人类智能的可能;理论上,人工智能还可以永生。

这也引起了很多人们的担忧。奇点到来、强人工智能、超人工智能、意识永生、人类灭绝等耸人听闻的观点出现,引起包括霍金、盖茨和马斯克等在内的世界名人对人工智能发展的担忧。在每年的世界人工智能大会上,专门有一个论坛探讨人工智能与法律、伦理及人类未来的会场。

现在,人工智能工业的OpenAI成立。

2016年全社会对人工智能的极大关注,可能是2016年AI的最大进展!

在半监督/无监督学习、通用人工智能方面,人工智能具有举一反三,并有常识、经验、记忆、知识学习、推理、规划、决策,甚至还有动机。这最后一点有点恐怖,人是有意识和动机的,机器做事也有动机,太可怕了。

智能学习进步很快,AIpha Go八个月后就可以战胜所有围棋手,因为它能每天24小时学习、不吃不喝地学习,比人强多了。

因此,在经历了60年“三起两落”的发展后,以深度学习为主要标志的人工智能正迎来第3次伟大复兴,这次引起社会尤其是产业界高强度的关注。因为上世纪60年代和80年代,人工智能没有达到这样的水平。

硅谷精神教父、预言家凯文・凯利说,未来人工智能会成为一种如同电力一样的基础服务。斯坦福大学推出了“人工智能百年研究”首份报告――《2030年的人工智能与生活》。

3人工智能上升为国家发展战略

有人认为第四次工业革命即将由人工智能与机器人等引爆。英国政府认为,人工智能有望像19世纪的蒸汽机革命那样彻底改变我们的生活,甚至人工智能给人类社会带来的变革与影响,有可能远远超过蒸汽机、电力和互联网带来的前三次工业革命。

智能制造、无人驾驶汽车、消费类智能机器人、虚拟助手、聊天机器人、智能金融、智能医疗、智能新闻写作、智能律师、智慧城市等可能被人工智能代替。人工智能将无处不在,可望替换人类的部分脑力劳动,一些职业会被取代或补充,一些新的行业又会诞生,例如18世纪出现了纺织工人,之后汽车代替了马车等。因此,我们将经历从“互联网+”到“人工智能+”。

中国“互联网+”与“中国制造2025”国家发展战略的实施,对人工智能的巨大需求在迅速增长。未来2-5年,人工智能应用与产业发展将迎来爆发期。

中国政府在《“互联网+”人工智能3年行动实施方案》提出:计划在2018年形成千亿级人工智能产业应用规模。201 7年1月10日,科技部部长万钢称,将编制完成人工智能专项规划,加快推进人工智能等重大项目的立项论证。

美国政府在2016年10月13日出台了《为人工智能的未来做好准备》的报告,提出了23条建议措施。同一天,美国政府又出台了《国家人工智能研发战略规划》,提出了7大重点战略方向。美国参议院于2016年11月30日召开了关于人工智能的首次国会听证会,主题是“人工智能的黎明”,认为中国是对美国人工智能全球领导地位的一个真正威胁。在2016年12月20日美国白宫了《人工智能、自动化与经济》报告,考察了人工智能驱动的自动化将会给经济带来的影响,并提出了国家的三大应对策略方向。可见,奥巴马把人工智能看作其政治遗产之一(注:另一个是Cyber空间)。

英国政府2016年12月了《人工智能:未来决策的机遇与影响》的报告,关注人工智能对社会创新与生产力的促进作用,论述如何利用英国人工智能的独特优势,增强英国国力。

日本政府2017年开始,要让人工智能与机器人推动第四次工业革命。

4 我国对策

应以深度卷积神经网络为核心,全面开展计算机视觉、语音识别和自然语言等人工智能产品的开发与大规模产业化应用。这需要大数据、计算平台/计算引擎、人工智能算法、应用场景等飞速发展,另外还需要资源、资金、人才。在方法上,选定垂直细分领域最重要。

面向若干细分垂直领域,建立大数据中心。实现大数据采集、清洗、标签、存储、管理与交易,建立大数据源公共基础设施与垂直领域知识库。专有大数据是人工智能产业制胜的关键和法宝。中国企业必须开始特别关注大数据的采集与利用。其重要性如同原油―样,跨国企业视之为战略资源!

强力开展人工智能芯片与硬件平台的研发。包括基于FPGA的深度学习芯片;类脑芯片与忆阻器件;建立国家级人工智能超算中心。

第6篇:卷积神经网络意义范文

关键词:发展趋势;研究应用;人工智能

DOI:10.16640/ki.37-1222/t.2017.07.119

0 简介

人工智能((Artificial Intelligence)),它是一门新的技术科学,主要用于模拟、延伸以及扩展人类的智能的方法、理论、技术以及应用系统。人工智能主要就是对人类的思维、意识的信息过程的合理化的模拟。人工智能它并不是人的智能,但是,它却能像人那样的思考,而且也可能会超过人类的智能。总的说来,人工智能研究的一个主要目标是使机器能够胜任一些复杂工作。

1 人工智能的运用现状

目前,在很多方面人工智能有着运用,其中一个主要表现就是全球人工智能公司数量在急剧的增加,专家系统在目前来看是在人工智能各领域中最为活跃,且最为有成效的一个领域。它是一类基于知识的系统,并可以解决那些一般仅有专家才能够解决的复杂问题。我们这样定义专家系统:专家系统是一种具有特定领域内大量知识与经验的程序系统,它是基于程序系统依靠人工智能技术,来模拟人类专家求解复杂问题的过程,大多情况下,专家系统的水平甚至可以超过人类专家。专家系统的基本结构图如下图所示:

2 人工智能的影响

人工智能对经济的影响:人工智能的的确确会影响到社会、生活、文化的方方面面,特别是对于实体经济将来会有巨大的影响。以后,每个行业几乎都会产生颠覆性的变化。在人工智能的研究上,中国并不落后,将来的中国一定可以从中获得非常大的收益。一成功的专家系统可以为它的用户带来很明显的经济效益。用比较经济的办法执行任务而不需要具有经验的专家,从而极大地减少开支。专家系统深入各行各业,带来巨大的宏观效益,促进了IT网络工业的发展。

人工智能对文化的影响:在人工智能原理的基础上,人们通常情况下会应用人工智能的概念来描述他们的日常状态和求解问题的过程。人工智能可以扩大人们知识交流的概念集合,描述我们所见所闻的方法以及描述我们信念的新方法;人工智能技术为人类的文化生活提供了巨大的便利。如图像处理技术必将会对图形艺术和社会教育部门等产生深远影响。比如现有的智力游戏机将会发展成具有更高智能的一种文化娱乐手段。随着技术的进步,这种影响会越来越明显地表现出来。当然,还有一些影响可能是我们目前难以预测的。但可以肯定,人工智能将对人类的物质文明以及精神文明产生更大的影响。

人工智能对社会的的影响:一方面,AI为人类文化生活提供了一种新的模式。现有的游戏将逐步发展为更高智能的交互式文化娱乐手段,今天,游戏中的人工智能应用已经深入到各大游戏制造商的开发中。另一方面,人工智能能够代替人类进行各种脑力劳动,所以,从某种意义上来讲,这将会使一部分人失去发展的机遇,甚至可能失业。由于人工智能在科技以及工程中的应用,一部分人可能会失去介入信息处理活动的机会,甚至不得已而改变自己的工作方式;人工智能还可能会威胁到人类的精神。一般人们觉得人类与机器的区别就是人类具有感知精神,但如果有一天,这些相信只有人才具有感知精神的人也开始相信机器能够思维和创作,那他们就会感到失望,甚至于感到威胁。他们会担心:有朝一日,智能机器的人工智能可能会超过人类的自然智能,从而使人类沦为智能机器的奴隶。

3 人工智能的发展趋势

有机构预测,2017年人工智能投资将同比增长300%以上,在技术上将会更迅猛发展,工控自动化商城的智能语音、智能图像、自然语言以及深度学习等技术越来越成熟,就像空气和水一样将会逐步地渗透到我们的日常生活。行业专家关于2017年人工智能的发展方向主要有以下几点:(1)机器学习目前正在被应用在更复杂的任务以及更多领域中,且被更多的人作为挖掘数据的方式。无监督的学习会取得更多进展,但也存在很大的挑战,故在这一方面离人类的能力还是差得很远的。计算机在理解和生成自然语言方面,预计最先会在聊天机器人和其他对话系统上落地。 (2)深度学习、其他的机器学习、人工智能技术的混用,是成熟技术的典型标志。将深度学习应用到医疗领域中(医疗图像、临床数据、基因组数据等),各种类型数据上的研究以及成果将会大大的增加。 (3)聊天机器人和自动驾驶汽车可能会取得较大的进展,预计更多人类基准将会被打破,特别是那些基于视觉以及适合卷积神经网络的挑战。而非视觉特征创建和时间感知方法将会变得更加频繁、更加富有成果。

4 结论

人工智能是人类长久以来的梦想,同时也是一门富有挑战性的学科。尽管人工智能带来很多问题,但当人类坚持把人工智能只用于造福人类,人工智能推动人类社会文明进步将毋庸置疑。就像所有的学科一样,人工智能也会经历各种挫折,但只要我们有信心、 有毅力,人工智能终将成为现实,融入到我们生活的方方面面,为我们的生活带来更大的改变。

参考文献:

[1]朱祝武.人工智能发展综述[J].中国西部科技,2011,10(17):8-10.

[2]肖斌.对人工智能发展新方向的思考[J].信息技术,2009,37(12):166-169.

第7篇:卷积神经网络意义范文

【关键词】图像复原;正则化;GMRES;约束最小二乘

1 国内外研究现状

用迭代方法处理各种反问题已有悠久的历史。但是研究表明,使用迭代方法求解反问题,有时会出现所谓的“半收敛”现象,即在迭代的早期阶段,近似解可稳定地得到改进,展现出“自正则化”效应,但当迭代次数超过某个阈值后便会趋向于发散。因而,使用迭代法求解的关键是要寻找一个恰当的终止原则,在迭代次数和原始数据误差水平之间找到平衡值。研究表明,迭代指数,即迭代步数正好起到正则化参数的作用,而这个终止准则对应着正则化参数的某种选择方法。并且使用迭代方法求解还有很多优点,因此,在正则化问题求解中通常选用迭代的方法,常用的迭代方法有:Landweber迭代法、VanCittert迭代方法、最速下降方法和迭代Tikhonov正则化的求解方法,以及正则化方法的快速数值实现。

2 基于解空间分解的GMRES 算法及图像复原应用

2.1 正则化模型与图像复原

设F和U分别表示度量空间,度量为ργ和ρμ,算子A:F到U映F到U,则该问题变为线性反问题(当A为线性算子时),或非线性反问题(当A为非线性算子时)。“不适定性”(病态性)是所有反问题所具有的一个共同的特性。一般情况下,不适定性是反问题本身的固有特征:如果问题的先验信息是未知的,那么就无法得到理想的结果。因此,我们应该尽可能多的收集先验信息,最大限度的复原原问题。通常,人们将求解反问题(不适定问题)的理论和方法称为正则化方法。对于图像处理问题,由于涉及到大规模的方程组求解,法方程的维数太大,此时再应用代数方法求解就会遇到一些难以实现的技术问题,而选用正则化方法不但可以克服上述缺点,还具有某些优点,当问题从无穷维度变到有限维度时,迭代求解不会影响系数结构,而且能够起到节约运算空间的效果。这些优势在大规模计算中非常有利。

对于图像恢复的病态性问题,利用正则化思想进行图像复原时,需要利用先验信息,构造某种约束条件,使用数理统计方法,将图像复原这一不适定问题转变成适定问题,进而使得近似解满足适定性的三项约束,这也是正则化方法的优势所在。

2.2 解空间分解的广义极小残量算法

在对线性方程组Ax=b,A紧算子,进行求解时,为了尽可能减少存储空间和计算开销,Krylov子空间迭代法是求行之有效的方法。当系数矩阵A对称正定,共扼梯度法(CG)或预共辘梯度法(PCG)可快速准确求解该方程组的近似解;当A对称但不正定时,极小残量法或预极小残量法则能有效求解方程组。对于一般的非对称矩阵,常采用广义极小残量法、共扼梯度法来求解。GMRES算法利用Arnold过程产生Krylov子空间Kj的正交基,Arnold过程中每次迭代运算,都要调用所有前面的迭代所产生的正交基来生成下一个正交基。

2.3 光学图像复原结果

对于方程Ax=b,利用基于解空间分解的加速GMRES 算法迭代求解。计算步骤如下:

Step1.置初始值x0=0,并令δ=10-8;

Step2.用解空间分解的加速GMRES 算法迭代求解式Ax=b,在第j步的值为xj;

Step3.若■≤σ,终止迭代;否则置 j=j+1,继续进行Step2。在迭代运算中,正则化参数αj=15,■随着迭代的进行自动更新。

图像复原实验中处理的是256*256尺寸的0-255灰度级的liftingbody图像。用改进信噪比来衡量算法的复原性能。从复原之后的对比效果看,共扼梯度法(CG)并不能有效的抑制模糊退化,复原结果仍然比较模糊,图像边缘有振铃波纹出现。解空间分解的加速GMRES算法复原结果的边界纹路比较清晰,很好的显示出原图像边缘细节部分,与此同时,振铃波纹因为加窗处理得到有效抑制,整体视觉效果很好。

3 线性代数方法与图像复原应用

在涉及到复杂矩阵和向量的离散图像复原模型中,可以从线性代数方法中得到一种效率较高的求解方法,常用的方法是约束最小二乘法。对约束最小二乘法进行改进,根据先验信息,把正则化思想和约束最小二乘法等有机结合在一起,并将其运用到离散图像复原中,得到的约束最小二乘的空域迭代法可以出色的抑制噪声,而且在噪声很强是也可以得到很好地复原结果。

将正则化思想与约束最小二乘法相结合,继而复原退化图像。通过对噪声能量的限制来使用正则化理论,运用空域迭代时很好的抑制了噪声放大现象,同时克服了病态性,而且计算速度得到了提升。实验数据表明,本方法更适合复原污染程度较大的图像,但不适合复原模糊程度较大的图像。

4 总结与展望

图像复原近年来受到了越来越广泛的关注,正则化方法理论的发展也越来越得到完善,许多学者从模型上、理论上、应用上分别展开了对于正则化的图像复原的深入研究,本文的研究虽然力求有较强的实用性,但是由于受到多方面的限制,在理论和工程应用等方面仍存在很多的待丰富和改进之处,需要在以后的工作中继续深入研究。

首先,要加深对观测图像的先验信息的挖掘,因为如果能够有效利用先验信息,就能极大的改善估计精度以及问题的病态性。要充分的利用各种先验知识,构造更加精确地目标泛函,设计出更加优良的算法,同时要充分分析现有正则化参数的选择方法,结合各个方法的优缺点,构造出更加高效的正则化算子;要注意噪声扩大与图像复原的平衡,充分利用成像时的分段平滑性质,去除图像边缘模糊和振铃现象。其次,要注重正则化图像复原方法与其他图像复原方法的有机结合。现阶段,神经网络、小波分析和遗传算法等新式的算法在图像复原方面取得了极大的进展,如果能够将这些理论结合在一起,形成优势互补,一定能得到性能更好的图像处理算法。

【参考文献】

[1]肖庭延,于慎根,王延飞.反问题的数值解法[M].北京:科学出版社,2003.

[2]邹谋炎.反卷积和信号复原[M].北京:国防工业出版社,2001.

第8篇:卷积神经网络意义范文

关键词:指纹识别;中值滤波;加权自适应;最小二乘支持向量机

0 引言

现代社会中,身份鉴定技术具有非常重要的应用价值。人类指纹的不变性和唯一性使得指纹识别技术成为目前应用最广泛、最可靠的身份验证技术。指纹识别[1]算法理论的研究,以及计算机硬件的高集成、低成本,使得利用指纹来完成身份鉴别和识别任务的系统得到大规模应用。典型的指纹识别系统主要由指纹图像采集、指纹图像预处理、指纹图像特征提取、指纹图像比对这4个部分组成。

图像去噪增强是指纹图像预处理中的一项重要环节。中值滤波[2]是一种去除噪声的非线性处理方法。中值滤波方法不但具有低通特性可以去除噪声,而且又可以保护图像边缘,保留细节部分。中值滤波方法在去噪复原中得到了较好的效果。

目前指纹分类方法大致有:语义分析法、几何法、随机法、神经网络方法和支持向量机(SVM)方法。支持向量机是在统计学习理论基础上发展出来的一种非常有效地新机器学习方法,它很好的解决了小样本、非线性、过学习、高维数、局部极小点等问题,并具有很强的泛化能力。学者不断对支持向量机进行深入研究,涌现出许多有效地改进算法,如C-SVM算法、v-SVM算法、加权支持向量机(WSVM)、最小二乘SVM算法(LS-SVM)等[3]。

本文研究了指纹图像的中值滤波方法,以及基于最小二乘支持向量机的图像分类识别。首先对指纹图像进行滤波预处理,然后提取特征,最后,采用最小二乘支持向量机进行训练分类识别。

1 指纹识别系统原理

指纹识别系统可分为两大模块:一是系统学习模块;二是指纹识别模块。学习模块包括采集指纹图像,对指纹图像进行预处理,把提取出的特征编码存入样本数据库。识别模块包括将待识别的指纹图像进行预处理,在提取特征后与数据库中的指纹模版进行匹配,判断是否匹配,得出结论。

2 噪声

2.1 指纹图像中噪声的来源

指纹图像中的噪声主要来源于指纹图像的获取(数字化过程)和传输过程。图像传感的工作情况受各种因素的影响,如图像获取中的环境条件和传感元器件自身的质量。例如,使用CCD指纹传感器获取图像,光照程度和传感器温度是生成图像中产生大量噪声的主要因素。图像在传输过程中主要由于所用的传输信道的干扰受到的噪声。比如通过无线电网络传输的图像可能会因为光或其他大气因素的干扰而被污染[4]。

常见噪声主要有高斯噪声,均值噪声,椒盐噪声,指数噪声,对数噪声等。

2.2 指纹图像去噪的意义

噪声在指纹图像预处理中是一个非常重要的问题,它对指纹图像的输入、采集、处理的各个环节以及最终的输出结果都会产生一定的影响。特别是在图像的输入、采集过程中,噪声是个十分关键的问题,若输入伴有较大噪声,必然影响之后的处理以及最终的处理效果。因此,去噪处理已成为指纹图像预处理中极其重要的步骤。

3 平滑滤波器

3.1 高斯滤波器

高斯平滑滤波是让原图像同高斯函数进行卷积,从而达到抑制噪声、平滑图像的目的。假设原图像为 ,经过高斯平滑滤波后的图像为 , 和 表示图像行、列坐标,则

式中: 表示高斯函数的方差。

3.2 中值滤波

指纹图像在经过高斯平滑处理后,大多数噪声被去除了,但仍可能存在少数孤立的噪声点,为进一步去除这些噪声,有必要图像进行中值滤波处理。中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性滤波器,它对消除椒盐噪声[5]非常有效,所以常被用来保留需要的图像结构的同时消除椒盐噪声。

3.2.1 标准中值滤波

标准中值滤波是一种基于快速排序的非线性滤波算法,不仅能去除或者减少随机噪声和脉冲干扰,还能较好地保留图像边缘的信息。

算法具体实现步骤[6-7]如下:

1)将模板在图中遍历,并将模板中心图中某个像素位置重合;

2)将模板下各对应像素的灰度值读取出来;

3)把这些灰度值从小到大排成一列;

4)找出值的中间值作为最终的输出结果;

5)将中间值赋给对应模板中心位置的像素。

通过以上的实现步骤,我们可以用一下公式来表示中值滤波:

式中: 表示坐标点 处的灰度值, 表示以为

中心滤波窗口中的所有坐标点, 表示进行中值处理,

表示滤波输出。

标准中值滤波需要进行大量的排序工作,计算量很大,同时去除脉冲噪声的性能受滤波窗口尺寸的影响较大,窗口越大,去噪效果越好,但图像变得越模糊,即在抑制图像噪声和保护细节方面存在一定的矛盾。

3.2.2 加权自适应中值滤波算法

为了改进现有中值滤波算法对于高密度噪声图像以及纹理细腻图像的边缘处理能力欠佳的缺陷,加权自适应中值滤波算法采用了通过扩大窗口来相对地减少冲激噪声空间密度这一策略。

算法的基本思想是:设 表示中心像素点 在滤波时所对应的掩膜窗口,窗口大小为 ,令 为 中的最小灰度值, 为 中的最大灰度值, 为 中的灰度中值, 为坐标 处的灰度值, 为 允许的最大窗口尺寸, 为阈值。

若满足 ,则转向5);

计算窗口内标准中值滤波结果记为SM,若满足

则转向4);

增大窗口尺寸 ,若 ,则重复1),否则转向4);

计算像素点与另外 个像素点灰度值差值的均值

若 ,则转向5),否则转向6);

若满足 ,则输出 ,否则转向6);

输出 。

其中 的计算方法结合了均值思想,把排序得到的中值与窗口中所有像素点的均值加权得到灰度中值,中值的权重为0.6,均值的权重为0.4。

含噪声图 标准中值滤波图 加权自适应中值滤波图

经过比较,可见这两种处理方法的效果差异,加权自适应中值滤波比标准中值滤波处理的效果好,噪声去除干净,且指纹图像中的细节保留较好。

4 最小二乘支持向量机

Suykens等提出的最小二乘支持向量机(LS-SVM),基本思想是对估计函数进行分段估计,然后再组合到一起以减小算法复杂度;构建新的核函数,使之能降低优化问题的维数。最小二乘支持向量机创造性地把标准SVM的线性不等式约束转化成等式约束,从而使得SVM的训练等价于一组线性方程组的求解。

LS-SVM类似于传统SVM,也是通过构造最优分类超平面实现分类的。但LS-SVM不同于SVM的是:SVM将每一个样本点 都添加了一个误差量,我们假设给定 个样本数据为

其中 为输入向量, 为输出变量,且

为待估计的未知函数。作输入空间到

维特征空间的内映射: , 是非线性的,且 的取值无上界,则被估计函数 ,其中 为空间

中的权向量, 为偏置。于是求解优化问题就变成一下问题:

若选取核函数

5 实验

指纹图像预处理过程包括:

图像归一化处理。将图像的平均灰度和对比度调整到一个固定的级别上,以消除传感器本身噪声或手指压力不同以及其它原因造成的灰度差异,使图像具有预定的均值与方差,为后续处理提供一个较为统一的图像规格。

图像分割。把图像的前景区域和背景区域分割开来,去除背景区域。这样一方面减少了后续处理步骤的数据量,另一方面也避免了因为部分图像区域不可靠而导致伪特征的产生。

图像滤波增强。在此分别采用标准中值滤波和加权自适应中值滤波算法,并对最后识别结果做出比较。

图像二值化[8]。将原始灰度图像转化为只有黑白两种灰度等级的二值图像,突出了图像特征,便于进行特征提取。

实验采用自建的组合指纹库,40个人,每人2张共80张指纹图片。每人取1张共40张图片作为实验的训练集,取另外1张共40张图片作为实验的测试集。分别把预处理阶段采用标准中值滤波算法和加权自适应中值滤波算法处理的指纹图像,做指纹识别实验。特征提取时,为使目标图像具有平移、旋转和比例不变性,用矩算法提取不变矩特征。采用最小二乘支持向量机对特征向量进行分类,选取样本点进行训练。

6 结束语

本文采用平滑滤波与最小二乘支持向量机方法,研究了指纹的图像识别。建立了一个完整的指纹识别系统,分为指纹图像预处理、特征提取、分类识别3个主要阶段,对经过预处理的指纹图像提取图像特征,通过实验实现了指纹识别。

从识别结果来看,预处理过程对识别效果影响很大,采用不同的滤波方法,图像的增强效果不同,最终在指纹识别率上体现出来。采用加权自适应中值滤波算法对图像进行去噪增强,效果比标准中值滤波好,识别率也高。

参考文献:

[1]陈阳、谭思云,基于DSP的指纹识别系统设计[J].计算机测量与控制,2005.13(12):1339-1341.

[2]冈萨雷斯,数字图像处理MATLAB版[M].北京:电子工业出版2005.9.

[3]胡学坤,改进支持向量机算法及其在图像分割中的应用[D].2009.12.

[4]索俊祺,一种新的基于中值滤波的优化滤波算法[D].2010.01.

[5]任洪海、纪玉波、张飞侠等,一种去除椒盐噪声中值滤波的改进算法[J].电脑开发与应用,2005(5).

[6]赵高长、张磊、武风波,改进的中值滤波算法在图像去噪中的应用[J].应用光学,2011.32(4).