前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的直方图均衡化的基本原理主题范文,仅供参考,欢迎阅读并收藏。
(平顶山学院计算机科学与技术学院,河南平顶山467000)
摘要:静脉识别是一种新兴的生物特征识别技术,为了满足静脉识别中的特征提取需求,对手背静脉提取方法进行了研究。首先采用CLAHE算法对手背静脉图像进行增强处理,然后针对传统NIBALCK二值化算法的不足,提出一种局部静态阈值与NIBLACK相结合的改进算法。实验证明,该方法能有效消除传统方法中噪声过多、纹络断裂的现象,克服光强因素对图像提取的影响,保持完整清晰的静脉纹络结构,从而满足后续识别工作的需要。
关键词 :静脉识别;NIBLACK改进算法;特征提取;噪声消除
中图分类号:TN911.73-34;TP391.14 文献标识码:A 文章编号:1004-373X(2015)12-0074-03
收稿日期:2014-12-21
基金项目:河南省科技攻关基金资助项目(132002210443)
生物特征识别技术作为物联网架构中感知层的重要组成部分,随着物联网概念的提出和快速发展,也得到了更广泛的应用。指纹识别、声音识别、虹膜识别等生物特征技术都已发展的比较成熟,而静脉识别作为一种新兴的生物特征识别技术,逐步凸显出新的优势。本文提出一种基于局部直方图均衡和NIBLACK分割的方法对静脉图像进行提取,实验证明可以得到轮廓清晰的静脉结构图。
1 静脉识别
静脉识别的基本原理是,普通人的手背静脉具有不随年龄变化的惟一性,当近红外光线入射光波长在0.72~1.10 μm 时,可以较好地穿透骨骼和肌肉,凸显手背血管的结构[1],从而进行有效的特征识别。手背静脉识别系统是通过对静脉的图像采集,然后提取出整个静脉的结构,再由一系列识别算法,达到对人的身份识别。在对图像的采集过程中,由于采用的是红外CCD摄像机,光强对图像影响较大,光照过强会使静脉偏亮而模糊,光照偏弱又会导致静脉和背景混淆,整体偏暗。同时每个人手背静脉的粗细,表面皮肤厚度不同,以及手背本身具有的弧度会使图像光照不均匀,都会对采集的静脉轮廓清晰度产生影响,因此需要对图像进行处理,提取比较清晰完整的手背静脉结构图,为下一步的准确识别创造条件。
2 基于CLAHE 的静脉图像增强
由于静脉隐藏在皮肤表层以下,静脉图像的对比度往往不高,直接提取静脉纹路进行二值化,将会导致丢失部分可用静脉信息或者误将背景作为静脉结构,对后续识别影响很大[2],因此需要对图像进行增强处理。图像增强的方法,一般分为空间域增强和频域增强,其中空间域增强法中的直方图均衡(HE)一直是简单实用的工具。直方图均衡简单有效,包括全局法和自适应法(AdaptiveHE,自适应直方图均衡化)。在实际的应用中,有些图像对比度比较低,全局法效果不佳。为了解决这一实际问题,Pizer等提出了局部直方图均衡化的方法(Local AdaptiveHE,LAHE)对图像的灰度增强[3-4]。但是该方法只考虑每一个局部窗口内像素,而窗口外的像素往往被忽略,为了进一步解决这种现象,Crom artie等又提出了对比度受限的局部直方图均衡法[5](Contrast-limited Adaptive Histogram Equalization,CLAHE) 。CLAHE结合了自适应直方图均衡和对比度受限2种方法,从整幅图像的视觉效果出发,既考虑了窗口内像素直方图又考虑了窗口外的像素,使图像增强效果适应性更好,效果也更突出。该方法表达式为:
hij (r) = αhW (r) + (1-α)hB (r) (1)
式中:hW (r) 是窗口的归一化直方图;hB (r) 是窗口外的归一化直方图;0 ≤α≤1 。设SW 和SB 分别代表区域W和区域B 的面积,如果α = SW (SW + SB ) ,则hW (r) = h(r) ,表示局部直方图与全局直方图相等;如果α > SW (SW + SB ) ,则局部直方图单独进行均衡化,从而强调局部信息。因此可以通过调节α 大小调节局部直方图来模拟周围环境对相关区域的影响。
CLAHE算法具体步骤如下:
(1)将图像分块。将目标图像分为不重叠的子区域,每个区域大小相等,都含有L 个像素,根据实际确定L 大小,L 越大增强效果越好,但同时丢失细节也相应增多。
(2)直方图的计算和均衡。根据式(1)计算窗口区域的直方图,hij (r) 表示子区域的直方图,k 代表灰度级。然后对子区域进行均衡化处理,处理后的子图用Cij (k) 表示。
(3)像素灰度值重构。将Cij (k) 中心像素点的灰度值作为参考点,采用双线性插值技术计算输出图像中各点的灰度值
(4)遍历目标图像。移动窗口至下一个子区域,重复上述步骤。
3 NIBLACK 改进算法的静脉图像分割
图像增强后,静脉图像的纹理和特征就比较清晰,这时还要对图像进行分割才能提取出整个静脉的结构纹理图。图像的分割提取主要利用阈值进行二值化分割,找到合适的阈值是图像分割的关键。而NIBLACK法由于其动态局部阈值的处理方法[6],对图像分割有较好的效果,本文根据手背静脉特殊的图像采集原理以及静脉图像的特点,采用改进的分块静态阈值和NIBLACK相结合的方法。
3.1 常规NIBLACK算法
在实际应用中,由于目标和背景对比度在同一图像中变化比较大,同时因为光照、噪声以及背景灰度梯度值突变等,为了更好地分割图像,必须在不同的图像区域自适应的确定阈值,NIBLACK法[7]就是一种常用的局部动态阈值法。算法确定中心坐标(x,y) 以及周围邻域r × r 范围,设g(x,y) 为中心坐标的灰度值,其二值化后的结果为b(x,y) ,具体可描述为:
(1)计算中心坐标r × r 范围均值灰度m(x,y) 和标准方差d(x,y) ,如式(2)和式(3)所示:
(2) 根据均值和方差计算出中心点的阈值,如式(4)所示:
t(x,y) = α × d(x,y) + m(x,y) (4)
(3) 根据步骤(2)计算出的阈值对中心点进行二值化:
(4)移动到下一个坐标,作为中心点,重复上述步骤,对图像逐点二值化。
3.2 改进的NIBLACK算法
常规的NIBLACK算法虽然可以动态地确定每个区域的阈值,但是也有其自身的不足:由于要利用r × r 模板遍历图像,导致边界区域(r - 1) 2 的像素范围内无法求取阈值;同时当进行图像遍历时,如果r × r 范围内都是背景,经NIBLACK计算后必有一部分被确定为目标,产生伪噪声[8]。针对此缺点,本文提出一种局部静态阈值与NIBLACK相结合的方法对图像二值化。其算法思想是对图像的边缘区域和纯背景区域采用静态阈值进行分割,对于其他区域采用NIBLACK 算法进行二值化。具体实现如下:
(1)对静脉图像进行分块,根据采集图像的像素大小以及模板r 的值,本文将图像分为6块,每块均包含了一部分边缘图像,利用Ostu 算法计算每块图像的静态阈值Tn(n=1,2,…,6)。
(2)判别像素范围,凡边缘范围即小于(r - 1) 2 范围的像素根据所在区域的静态子阈值Tn 进行二值化。
(3)对于非边缘区域的分块图像,按NIBLACK 法计算阈值t(x,y) ,将子静态阈值Tn 与t(x,y) 进行加权得到新阈值D(x,y) :
D(x,y) = (1 - β)t(x,y) + β × Tn (6)
式中β 为加权系数,根据实验测试,本文取β 为0.5 可以达到最好的效果。
(4)利用得到的阈值D(x,y) 对子图像进行二值化,移动到下一子图像,重复上述步骤直到完成对整幅图像的二值化。
经过改进算法处理的二值图像可以得到比较清晰的静脉纹络,但是仍然存在少量的噪声,利用形态学的黑top-hat运算[9],即经过闭运算的图像减去源图像,可以有效清除噪声,也可提取图像的暗特征,使静脉边缘纹络更加清晰。
4 实验分析
本文采用Mohamed Shahin博士提供的手背静脉图像数据库进行实验分析。为了消除静脉库原图像静脉周围背景对图像增强的影响,首先对静脉图像进行ROI(Regionof Interest)处理,提取出静脉区域图像,如图1(b)所示。
图1(c)采用全局静态直方图均衡法,可以看出因局部光强不同,静脉图像增强效果不均匀,这会使后期的二值化处理丢失大量信息。图1(d)采用CLAHE算法增强后,静脉图像灰度对比均匀,纹理和特征清晰,有利于在图像分割时保留大量的细节特征。如图2 对比发现,直接对静脉图像进行传统的NIBLACK 二值化会出现大量的噪声点和脉络断纹,同时丢失很多细节特征,如图2(b)所示。直接对图像进行直方图均衡增强,也会因光强不均丢失静脉部分结构特征,如图2(c)所示,图像右下方因局部光照过强使得增强后的图像在二值化后丢失一部分静脉纹络结构。本文采用基于CLAHE 的图像增强算法和改进的NIBLACK 二值化的方法,如图2(d)所示,得到的静脉结构纹理清晰,细节特征完整,脉络连续。改变传统的增强算法二值化后引起的伪噪声、断纹以及静脉图像特征丢失现象,消除传统方法的缺陷,有利于后续对于静脉的识别工作,提高整个静脉识别系统的准确率。
5 结语
在手背静脉提取过程中全局直方图均衡是比较常用的图像增强算法,但对于手背静脉图像光照不均匀的情况处理效果不好,传统的NIBLACK 二值化算法也存在着容易产生噪声块,结构断纹和无法确定图像边缘二值化阈值的缺陷。针对这种情况,本文提出利用CLAHE增强图像,并采用局部静态阈值与NIBLACK 相结合的改进算法对图像进行二值化。实验证明,本文算法提取的静脉图像脉络清晰,保留了因光照不均而易丢失的特征细节,消除了噪声块和脉络断纹的现象,因此本文算法是一套有效的静脉提取算法,对提高系统的识别率和正确率提供了可靠保证。
参考文献
[1] 林喜荣,庄波,苏晓生,等.人体手背血管图像的特征提取及匹配[J].清华大学学报:自然科学版,2003,43(2):164-167.
[2] 杨有,李波.CLAHE 和细节放大相结合的档案图像增强方法[J].中国图象图形学报,2011,16(4):522-527.
[3] 朱其刚,朱自强.基于自适应领域灰度直方图均衡的超声窥镜图像增强[J].山东科技大学学报,2004,23(3):120-123.
[4] 王龙,汪天富,郑昌琼.基于灰度直方图均衡的超声医学图像增强方法[J].四川大学学报,2012,34(1):105-108.
[5] CROM A R,PIZER S M. Structure sensitive adaptive contrastenhancement methods and their evaluation [J]. Image and Vi-sion Computer,1993(11):385-391.
[6] 郑伟,康朝红.基于梯度的低对比度X 线图像分割方法[J].通信技术,2009,42(1):292-294.
[7] NIBLACK W. An introduction to image processing [J]. AppliedComputing,1986,15(4):219-229.
[8] 王科俊,丁宇航,庄大燕,等.手背静脉图像阈值分割[J].自动化技术与应用,2011,24(8):19-21.
[9] 赵建军,熊馨,张磊,等.基于CLAHE 和TOPHAT 变换的手背静脉图像增强算法[J].激光与红外,2009,39(2):220-222.
关键词:煤矿安全生产;混沌信号;视频监控系统;图像增强
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2017)03-0187-02
1 概述
1)煤矿视频监控系统
在煤矿的安全生产中,国家安全生产管理部门已经明为规定,要求每一个煤矿生产企业必须安装好一套完整的视频监控系统,这是作为安全生产检测中的一项必备的指标。到目前为止,煤矿的视频监控系统已经得到了广泛的应用。但是,由于煤矿井下的环境和室外有很大的不同,煤矿井下比较黑暗,光线没有井上的条件好,而且还有厚厚的煤尘,井下比较潮湿等等一系列非常不利于获取清晰图像的条件,所以,一般情况下,直接从视频监控系统中获取的图像比较黑暗、模糊、不清晰,就不能给井上的监控工作人员提供非常清晰的画面,给安全检测部门的工作带来了很多的麻烦[1]。所以,如果能够找到使煤矿井下的视频监控图像更加清晰的方法,将是一件非常有价值和意义的研究项目 [2]。
2)混沌的定义和性质
混沌现象是自然界非常普遍的一种现象,可以认为是无处不在的。但是,到目前为止,科学界也没有谁给出一个严格而准确的定义。混沌理论的研究在很多领域都有所应用,其中,应用最为广泛的就是,应用混沌理论进行图像加密的研究[3]。近些年来,很多的研究者都在不断地探索着混沌的奥秘和用途。其中,混沌最大的特点就是就是对于初始条件的敏感性[4],即如果一个混沌系统当初始条件发生很小的变化时,其混沌系统的特性就会发生很大的变化。其次,混沌系统的运动轨迹具有非周期的特性,这一个特点让很多的研究者们在很多领域得到了广泛的应用和研究。
众所周知,混沌具有类随机性。但是,混沌的随机性和一般系统的随机性是有所不同的。因为,我们一般对于混沌产生的过程是可以用相应的算法和公式来表示的,但是,一般的随机过程则是不可能用公式和算法来表示的,是无法准确预算和估计的。这就是混沌的随机性和一般系统的随机性的最重要的差别[5]。所以,通过大量的研究者们的共同努力,研究发现,混沌是一种自发混沌,具有确定性的随机性等,它重点强调的就是混沌系统产生的根源在系统本身,并不关注外在的作用。所以,就是依据这个差别,把混沌的随机性定义为一种类随机性是非常合适的[6]。
正是基于混沌的伪随机特性,所以,在图像增强的直方图处理中技术中得到了广泛的应用。本文应用Chen系统混沌对煤矿视频图像的直方图进行均衡化处理,取得了良好的清晰化效果。
2 基于混沌的空间域图像增强方法
基于混沌的空间域图像增强方法的基本思想是:以煤矿视频图像中的像素为基础,然后直接处理它的图像像素,再修改原始图像中像素点的灰度值,基本原理可以表示为:
[h(x,y)=F(f(x,y))]
其中[f(x,y)]是输入图像(即原始图像),[h(x,y)]是输出图像,即增强处理后图像,[F(・)]是一种特定算法算子,在不同的情况下,这个算法算子是不同的,一般是要根据具体的系统特性来确定的。其中,比较常见的算法是灰度变换和直方图处理以及空间滤波 [7,8]。应用仿真软件的分析,特别是概率统计特性的分析,一般情况,普通图像的灰度级分布都是呈正态分布规律,而且,都灰度级都集中分布在比较窄的范围内,这样我们观察到的图像就是比较模糊,尤其是细节就不清晰了,这对于图像分析来讲就带来了很大的麻烦,不能做出科学和正确的分析和判断了。但是,如果,我们引入混沌序列,引进一定的合适算法,让煤矿视频图像的灰度级分布非常的均匀,这样处理以后,图像的直方图当然就非常平坦了,图像的细节也就看得更清楚了。在此,我们主要是结合混沌对直方图的均衡化处理进行深度研究。本文采用混沌S-box对煤矿视频图像的直方图进行处理。Chen系统的动力学方程一般用以下的三个不同的方程来表示:
[dxdt=a(y-x)dydt=x(c-a)-xz+cydzdt=xy-bz] [] [] (1)
其中,[a,b,c]这三个是参数,且都是正数。对于此系统,当参数取值为[a]=35,[b]=3,[c]=28时,系统有一个混沌吸引子。
Chen方程之所以可以应用于图像增强的领域中,是因为它有很多的优点:
Chen方程具有一般的微分方程所具有的如下的对称性:
[(x,y,z)(-x,-y,z)][] (2)
这种对称性对Chen方程所有的参数都是适用的。
其次Chen方程具有恒定性。
同时,它还具有平衡性。为了求出其平衡点,我们令
[x=f(x)=a(y-x)x(c-a)-xz+cyxy-bz] (3)
并且求解[f(x)=0],显而易见,其中一个平衡点就是[x0=(0,0,0)],通过计算,求得:
[xc1=(-b(2c-a),-b(2c-a),2c-a)] (4)
[xc2=(b(2c-a),b(2c-a),2c-a)] (5)
这是一些其他的平衡点,其中[c>a/2]。从产生的混沌序列来分析,此类混沌信号具有类噪声的特性,同时具有宽带连续频谱的性质,而且还具有高度的伪随机特性。再将此混沌信号经过某种非线性数字化处理后,就可以满足图像灰度值的要求,就可以对原始输入图像进行非线性处理。通过均衡化处理,可以大大改变原始图像的直方图的分布情况,使图像灰度级趋于均匀分布,大大提高了图像的对比度,整幅图像就会更清晰。
下面是混沌S-box对煤矿视频图像的直方图进行处理的结果。
在图1中,主要是对某一个煤矿井下的某一个巷道的源图像进行了处理。主要是应用用MATLAB 仿真软件对某一个煤矿巷道的源图进行直方图均衡化处理后。从下图中可以看出,煤矿巷道的源图中的图像像素点的灰度值的分布是非常集中的,图像比较模糊,不太清晰;但是,经过直方图均衡化处理后的图像的像素点的灰度值分布比较均匀,图像明显变得清晰了,所以,从视觉角度来观察,煤矿井下图像的清晰度大大提高了。
3 结束语
在煤矿井下,水、火、瓦斯、煤尘、顶板等一系列恶劣的环境时刻威胁着矿工的生命安全。随着科学技术的飞速发展,很多高科技的技术和手段已经应用到煤矿井下,其中,煤矿井下的视频监控系统就是一个非常重要的安全监测和安全防范手段。但是由于煤V井下,非常恶劣的环境状况使得视频图像的质量大大下降,视频图像中的很多细节特征都被覆盖或模糊。本文采用了Chen系统混沌对煤矿视频图像的直方图进行均衡化处理,可以有效地提高了视频图像的细节部分,提升图像的清晰度。从仿真分析的直方图分布效果图来看,煤矿井下获取的实物图像的对比度明显增强。
参考文献:
[1]谭得健.浅谈自动化、信息化与数字矿山[J].煤炭科学技术,2006,43(1):23-27.
[2]张谢华.煤矿智能视频监控系统关键技术的研究[D].徐州:中国矿业大学,2013.
[3]马红光,韩崇昭.电路中的混沌与故障诊断[M].北京:国防工业出版社,2007:5-16.
[4]黄润生.混沌及其应用[M],武汉:武汉大学出版社,2000.
[5]顾勤龙.混沌理论及其在信息安全和优化中的应用研究[D].杭州:浙江工业大学,2003.
[6]李辉.混沌数字通信[M].北京:清华大学出版社,2006:45-48.
(深圳信息职业技术学院电子与通信学院,广东 深圳 518172)
【摘 要】综述了独立分量分析(Independent Component Analysis, ICA)算法的基本原理,并详细阐述了ICA算法在人脸识别中的基本应用和扩展应用。扩展应用主要包括:分块ICA、ICA和PCA组合、ICA和LDA组合,ICA和GA组合、低通滤波降维、采用四阶统计信息的ICA算法进行人脸识别。最后,提出未来的研究可以从选择最优组合算法和寻找最佳分块方式两个方向着手。
关键词 独立分量分析;人脸识别;分块ICA;算法组合
基金项目:国家自然科学基金青年基金(81401539);广东省高等学校优秀青年教师培养计划资助(Yq2013193);深圳市战略新兴产业发展专项资金(JCYJ20130401100512995)。
通讯作者:王健(1985—),女,汉族,博士,深圳信息职业技术学院,讲师,主要研究方向为信号处理。
0 引言
ICA是人脸识别的经典方法之一。它对高阶统计信息进行分析,目的是为了找出人脸图像中相互独立的成分。本文将简要介绍ICA在人脸识别中的原理和应用。
1 ICA的基本原理
1.1 原理概述[1]
设有N个相互独立的非高斯分布的声音信号源si,经过M个麦克风后,得到M个观察信号xi(N<=M)。每个观察信号xi都是N个独立信号源的线性组合。这一过程如式(1)所示。
2 ICA在人脸识别中的应用
2.1 ICA在人脸识别中的基本应用
ICA用于人脸识别的一个根本假设是:人脸是由多个统计独立的非高斯分布的成分构成。当确定这些独立基后,即使引入新的人脸成员,这些独立基构成的投影矩阵仍然可以满足重构要求,不再需要重新计算新的独立基。
人脸图像进行ICA变换的步骤主要如下:
(1)图像预处理
图像预处理包括旋转、拉伸、缩放、裁剪、插值、直方图均衡化、白化等操作。
(2)图像向量化
图像向量化是将二维图像矩阵按列依次连接成一个向量。
(3)用联合熵极大值法或者快速固定点法求ICA变换的最优投影矩阵。
(4)训练样本和测试样本按照Y=()X进行投影。
(5)对投影结果进行分类。
2.2 ICA在人脸识别中的扩展应用
2.2.1 分块ICA
当人脸图像作为一个整体进行ICA变换时,不同器官的细微变化不一定能清晰地表现出来。为了有效抽取图像的局部特征,有必要采用分块ICA[4]。
分块ICA的思想是:将人脸分成2n个小块;对每个小块分别求取最优变换矩阵,并进行ICA变换;根据人脸不同器官的重要性确定各子块图像的重要性,并对不同子块的ICA特征赋以不同的权重,然后进行加权求和;最后采用最近邻分类器或余弦分类器分类。
研究表明:基于分块ICA的人脸识别性能要优于普通ICA。
2.2.2 PCA+ICA
由于PCA提取的特征是最小均方误差意义上的二阶统计信息,各分量之间互不相关;而ICA提取的是高阶统计信息,各分量之间相互独立。因此PCA的主分量特征与ICA的独立分量特征是对原数据的两类不同描述。如果将二者结合起来,那么必定使抽取到的信息更加全面,人脸识别的性能也将得到改善。PCA和ICA组合进行人脸识别的方法有三种。
(1)先对人脸图像进行PCA变换,在变换后的特征空间进行ICA变换[1,5-6]。
(2)分别对人脸图像进行PCA和ICA变换,得到的特征分别求余弦相似度和距离相似度,然后将相似度结果求和,用余弦分类器和最近邻分类器对两类特征联合进行分类[7]。研究表明:基于分类器组合的方法优于单独使用PCA或ICA的单分类器方法。
(3)分别对人脸进行PCA和ICA变换,对得到的PCA特征和ICA特征加权求和,并采用最近邻法或余弦法对加权特征值进行分类[8]。研究表明:PCA和ICA特征加权识别率高于单独的PCA或单独的ICA。
2.2.3 ICA+LDA
在人脸识别过程中,需要考虑很多因素,如光照、背景、角度、表情等。在这些复杂因素的制约下,单一的识别方法很难达到较理想的识别效果。因此,为了提高识别率和鲁棒性,有必要将不同的人脸识别方法结合起来。ICA侧重于分离独立信号源,但是没有考虑分类信息;而LDA的分类效果很好。因此将ICA和LDA结合起来[9]进行人脸识别的效果一般会优于单独的ICA或LDA。ICA和LDA联合进行人脸识别的步骤如下:
1)对训练样本进行ICA变换,得到ICA转换矩阵以及独立基向量;
2)对独立基向量张成的空间进行LDA变换,得到LDA变换矩阵。
3)训练样本和测试样本均通过式Y=TTX进行变换。
4)对变换后的特征向量进行分类。
研究表明:ICA和LDA组合进行人脸识别的效果优于单独的LDA和ICA。
2.2.4 ICA算法的改进
当ICA采用联合熵极大值法或者快速固定点迭代法计算投影矩阵时,计算量非常大。这两种方法对求得的独立基也没有较好的特征选取方法。因此,ICA人脸识别需要降低计算复杂度、选取优良特征。可以采用以下三种方法改进ICA。
1)低通滤波降维。原始人脸图像输入后,首先采用低通滤波器进行降维,这样不但减少了计算量,而且还能消除高频噪声。
2)采用四阶统计信息的ICA算法。研究表明:四阶ICA算法的计算复杂度低,基空间识别率高。
3)采用遗传算法GA对求得的独立基集合进行搜索,挑选优良特征。然后再对选择的特征进行分类。研究表明: ICA和GA联合进行人脸识别的方法比单独的ICA算法好[10]。
3 总结及展望
本文总结了ICA算法的基本原理,并详细阐述了PCA算法在人脸识别中的应用,包括:分块ICA、PCA和ICA进行组合、ICA和LDA进行组合,ICA和GA进行组合、低通滤波降维、采用四阶统计信息的ICA算法等。
未来的研究可以从如何选择最优组合算法和寻找最佳分块方式两个方向着手。
参考文献
[1]安高云,阮秋琦.基于独立分量分析的普适人脸识别系统[J].北京交通大学学报:自然科学版,2006,30(5):6-9.
[2]Liu C. Enhanced Independent Component Analysis and Its Application to Content Based Face Image Retrieval [J]. IEEE Trans on Systems, Man and Cybernetics, PartB, 2004,34(2):1117-1127.
[3]杨竹青,李勇,胡德文.独立成分分析方法综述[J].自动化学报,2002,28(5):762-770.
[4]姚雪梅,古丽拉.阿东别克.基于ICA和 SVM的局部人脸识别方法[J].现代计算机:专业版,2005(12):15-16.
[5]王宏漫,欧宗瑛.采用PCA/ICA特征和SVM分类的人脸识别[J].计算机辅助设计与图形学学报,2003,15(4):416:420.
[6]刘直芳,游志胜,王运琼.基于PCA和ICA的人脸识别[J].激光技术,2004,28 (1):78-81.
[7]徐勇,张重阳,杨静宇.基于主分量特征与独立分量特征的人脸识别实验[J].计算机工程与设计,2005,26(5):1155-1157.
[8]王展青,刘小双,张桂林,王仲君.基于PCA与ICA的人脸识别算法研究[J].华中师范大学学报:自然科学版,2007,41(3):373-376.
[9]赵明华,游志胜,吕学斌,穆万军.基于ICA和FLD相结合的人脸识别[J].计算机应用研究,2005,8:255-257.
【关键词】四帧差分 边缘检测 阈值分割
1 引言
运动目标检测处于智能视频监控系统的最底层,其检测结果的好坏将直接影响后续的处理效果,故其技术发展和应用前景受到广泛关注。目前常用的运功目标检测算法有:背景差分法、光流法及帧间差分法。背景差分法能够较完整的提取出运动目标,但对光照及外部条件引起的动态场景变化过于敏感;光流法是基于对光流场的估算进行检测分割的方法,计算复杂,须有特殊硬件设备支持,实时性差;帧差法是根据图像中像素点的灰度差计算出运动物体的位置和形状等信息,这种方法对于动态环境有很好的适应性,算法简单,易于实现,但不能提取出较完整的运动目标。
视频图像的边缘信息抗干扰性能好,其不易受亮度突变及噪声的影响,因此本文融合图像边缘信息与四帧差分对运动目标进行检测,计算简单,实验结果表明该算法可以有效改善传统帧间差分算法出现的空洞现象。
2 融合边缘检测的四帧差分运动目标检测
2.1 预处理
众所周知,灰度图像的处理效率高于彩色图像,因此首先对图像进行灰度化。另外,图像获取过程中不可避免的存在诸如斑点噪声及椒盐噪声等一系列噪声影响,为了有效抑制噪声影响,本文采用中值滤波法对原始图像进行滤波处理。最后本文采用直方图均衡化及梯度化操作,使得图像轮廓更为清晰,以增强抗干扰能力。
2.2 Canny 边缘检测算法
边缘作为图像的最基本特征广泛存在于目标物与背景之间、目标物与目标物之间,在图像处理中有着重要的作用和广泛的应用。目前常用的边缘检测算子包括 Robets 算子、Sobel算子、Prewwits 算子、 Log 算子、二阶Laplace 算子等。这些算子简单,易于实现且具有很好的实时性,但抗干扰性能差,对噪声较敏感且边缘的精度有待提高。基于最优化算法的 Canny 边缘检测算子,是先采用高斯函数对图像进行平滑处理,再进行边缘检测,提取的边缘线形连接较为完整,定位准确性较高,效果较好。本文采用此方法对序列帧图像进行边缘提取。.
Canny算子的基本原理是通过查找图像梯度强度局部的最大值的方法来得到边缘信息,图像梯度的计算采用Gauss滤波器。为了消除噪声干扰、提高边缘检测的精度,Canny采用双阈值来提取边缘像素点。如果梯度强度不满足高阈值的检测条件,但是与己检测出的较强边缘点相连接,并且满足低阈值条件,则确定为弱边缘点。双阈值法使得采用Canny算子提取边缘点更具有鲁棒性。
Canny算法的实现步骤如下:
(1)高斯滤波:选取合适的Gauss窗函数和尺度,用Gauss滤波器对需要处理的图像进行平滑滤波,得到平滑图像;
(2)梯度计算:用一阶偏导的有限差分来计算梯度的幅值和方向;
(3)量化梯度方向:对梯度方向进行量化,使其只有8个方向,即0?、45?、90?、135?、180?、225?、270?、315?;
(4)梯度非最大值抑制:对于每一个梯度强度非零的像素点,查找沿其量化后的梯度方向的两个相邻像素点,然后通过阈值判断为非边缘点还是候选边缘点;
(5)双阈值判决:设定双阂值,进一步判断候选边缘点为强边缘点、弱边缘点还是非边缘点;
(6)边缘连接:对于弱边缘点,如果它与强边缘点在8连通区域相连,则该点记为弱边缘点,同时将其边缘提取置为1,所有标记为1的点就成了最后的边缘。
2.3 连续四帧差分算法基本原理
传统的三帧差分算法虽然能够快速检测出运动目标的轮廓,但其所检测出的轮廓往往不连续且存在较大的空洞现象,同时传统三帧差分算法不能完整提取目标信息。本文采用如下改进帧间差分法,即连续四帧差分算法,可以在一定程度上克服传统三帧差分算法的不足。设预处理后的连续四帧图像f1(x,y)、f2(x,y)、f3(x,y)、f4(x,y),首先分别将f1(x,y)与f3(x,y)以及f2(x,y)与f4(x,y)做差分运算,得到差分结果:
(1)
(2)
然后将差分后的结果D1与D2二值化处理后进行“与”运算,得到结果DA=D1D2,“与”运算能够有效的克制目标重叠现象。
2.4 本文算法
本文算法融合图像边缘信息与四帧差分对运动目标进行检测,首先采用Canny边缘检测算法快速提取连续四帧图像的边缘图像,然后利用四帧差分算法得到较为完整的运动目标轮廓,最后通过后期一系列处理提取出准确完整的运动目标区域。本文算法整体流程如图1所示。
2.5 形态学处理
由于干扰因素的存在,导致我们得到的二值化图像中往往会出现噪声及空洞,可以通过数学形态学对其进行后处理。首先采用腐蚀运算消除二值图像中的孤立噪声点,再采用膨胀运算来填充运动目标的边缘空洞。
3 实验对比
本文采用 Matlab 进行仿真实验,为验证算法的有效性,分别利用传统三帧差分法、四帧差分法以及本文算法对同一组 AVI 视频序列图像进行测试。检测结果如图2所示。
分别采用传统三帧差分算法、四帧差分算法及本文算法对原始图像进行处理,原始图像中右边白色衣服人物是静止不动的,处理结果如图2所示。由图可知,采用传统三帧差分算法检测到的目标轮廓不连续,四帧差分法得到的图像目标轮廓更清晰,内容更为丰富,但轮廓依然不完整,而采用本文算法检测得到的目标轮廓更加完整清晰,结果准确。
4 结论
本文融合图像边缘信息与四帧差分对运动目标进行检测,首先采用Canny边缘检测算法快速提取连续四帧图像的边缘图像,然后利用四帧差分算法得到较为完整的运动目标轮廓,最后通过后期一系列处理提取出准确完整的运动目标区域。实验结果表明本文算法能够快速准确检测出运动目标,进一步改进了传统三帧差分目标轮廓不连续现象,计算简单,可满足实时性检测需求。
参考文献
[1]罗志升,王黎,高晓蓉,王泽勇,赵全轲.序列图像中运动目标检测与跟踪方法分析[J].现代电子技术,2009.
[2]蒋.人体运动目标检测与跟踪关系问题研究[D].中南林业科技大学,2013.
[3]刘辰飞.智能视频监控系统中运动目标的检测与跟踪[D].济南大学,2012.
[4]舒欣,李东新, 薛东伟.五帧差分和边缘检测的运动目标检测[J].计算机系统应用,2014,23(1).
[5]许录平.数字图像处理[M].北京:科学出版社,2007.
[6]张德丰.MATLAB 数字图像处理[M].北京:机械工业出版社,2009.
[7]邵广安.视频监控中运动目标检测与跟踪方法的研究[D].南昌大学,2013.
[8]赵洁,李玮,郝志鹏,彭慧卿.基于改进 Canny 算子与图像形态学融合的边缘检测方法[J].微型机与应用,2011,30(10)
作者简介
张鹏(1988-),男,现为西华大学电气信息学院硕士研究生。主要研究方向为信号与信息处理、图像处理。
李思岑(1989-),女,现为西华大学电气信息学院硕士研究生。主要研究方向为嵌入式技术及应用、图像处理。
杨燕翔(1963-),男,现为西华大学电气信息学院硕士生导师。主要研究方向为现代信号处理、嵌入式技术及应用。