前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的滤波器去噪原理和基本方法主题范文,仅供参考,欢迎阅读并收藏。
关键词:深度学习算法;视频图像;文本区域定位;形态学去噪;字符识别
DoI:10.15938/j.jhust.2016.06.012
中图分类号:TP391.43
文献标志码:A
文章编号:1007-2683(2016)06-0061-06
0.引言
视频中的文字检测与识别是视频图像检测领域的一项重要研究内容.在复杂背景下,视频文本的准确定位与识别有利于进行视频图像检测,只有准确的视频文本区域的定位,才能提高OcR字符识别系统的文本识别准确率,进而提高基于内容的视频图像的正确检测的效率,对视频定位与检索有十分重要的应用价值,一般的文本定位方法主要包括:边缘特征定位法、笔画宽度定位法、纹理特征定位法、机器学习法等,本文采用2D-Gabor滤波器与深度学习算法相结合的方法,实现对复杂背景视频中文本区域的定位,并研究了基于形态学的视频图像去噪方法,再通过OCR系统实现字符的识别,以提高OCR系统字符识别的准确率。
1.深度学习视频文本区域定位与识别流程
本文将深度学习算法理论应用于视频文本区域定位与识别过程,设计了一种基于纹理特征的逐层增量深度学习算法.该算法的处理流程如图1所示.首先,将视频图像通过Gabor滤波器滤波,获得视频图像文本中文字的纹理特征;接着,将纹理特征作为训练样本,利用受限玻尔兹曼机(restricted bolt-zmann machine,RBM)逐层对纹理图像进行增量学习,在学习过程中,用标记样本作为监督数据进行网络微调,构成深度置信网络(deep belief network,DBN),并标记文本区域和背景区域的二值图像;之后,利用形态学方法对二值图像去噪处理,再映射到定位图像上,得到仅包含文本区域而去除背景区域的文本图像,最后,再将图像进行二值化、灰度等后续处理,送入到OCR字符识别系统进行字符识别.
2.逐层增量深度学习视频文本定位算法
2.1视频图像纹理特征的提取
字符的纹理具有周期性,并且在一定的频率范围内能量相对集中,所以可以利用二维Gabor滤波器对视频图像在不同尺度和方向上进行滤波,Gabor滤波器理论最早由Daugman提出,能够很好地描述对应于空间频率(尺度)、空间位置及方向选择性的局部结构信息。
鉴于中文字符主要由横、撇、竖、捺4种基本笔画组成,所以Gabor滤波器要求能够在这4个方向上反映中文字符的笔画特征,并且要求能够保证对这4个方向纹理区域的频率分量均有很好的响应。Wang等研究了Gabor滤波器中心频率与汉字的笔画的关系,发现Gabor滤波器的中心频率与周期入成倒数关系,且周期入是笔画宽度η的一半,当笔画的方向与Gabor滤波器的方向处于正交时,Ga-bor滤波器输出最优,因此,可以通过笔画的宽度来确定Gabor滤波器的中心频率,本文中Gabor滤波器所选择的参数为低频中心频率U1,/sub>=0.2,高频中心频率U,sub>h0.4,方向数和尺度数分别为T=4,M=4。
图2(b)所示为图2(a)原视频图像在横、撇、竖、捺4个方向进行Gabor滤波后的结果.由图2(b)可知,Gabor滤器能够将文字纹理和背景纹理分离,并使文字在横、撇、竖、捺4个方向的纹理信息得到保持,同时背景区域的纹理被有效的抑制。
2.2深度学习算法基本原理
深度学习是机器学习研究领域中的一个新问题,其目的在于建立、模拟人脑进行分析学习的神经网络,深度学习算法是由深信度网络(depth be-lief network,DBN)上的一系列受限玻尔兹曼机(re-stricted bohzmann machine,RBM)的概率模型组成.深度学习算法一般描述过程如下:假设有一个系统s,它有n层,S1,S2....Sn设输入为I,输出为o,学习的一般过程表示为:I=S1=S2,…Sn=O,如果输出O等于输入I即输入I经过这个系统变化之后没有任何的信息损失或者损失很小,可以看作基本上保持不变,这意味着输入,经过每一层Si,都几乎没有信息的损失,即任何一层SI,都是原有信息(即输入i)的另外一种表示,深度学习算法的核心思路有:①无监督学习用于每一层网络的预训练;②每次用无监督学习只训练其中一层,将其训练结果作为其高一层的输入;③用自顶而下的监督算法去调整所有层。
2.3深度学习网络(DBN)的构建
本文采用的深度置信网络的深度学习算法,是通过一系列受限波尔兹曼机(RBM)的概率模型组成.Hinton和sejnowski等设计了一种能够用在机器学习中的随机循环网络一受限波尔兹曼机,它是一种如图3所示的两层无向图模型,包含可视层v和隐藏层h,同时限制同一层节点之间的连接,而不同的单元层之间有连接。
2.4网络训练与权值调整
DBN网络需要进行训练以获得最佳权值,通常DBN网络训练包括自底向上非监督学习和自顶向下的监督学习两个部分,其过程为先对纹理特征图像采用RBM进行逐层增量学习,应用最大似然估计法不断地调整网络中权值,使RBM达到能量平衡,再用监督数据,对整个DBN网络进行微调,
在非监督学习过程中,DBN网络中每一个状态值都对应一层的结点,计算的输入输出数据都是对应结点状态值为“1”的概率值,而Hn层的输入向量是每个文字区域的纹理样本,通过交替的吉布斯采雍螅作为DBN网络的输入.设深度学习网络结构包含n个隐藏层,每层的节点数分别是L1,L1,…,LN,纹理特征图像送入到DBN网络中的输入层Ho层,不断的调整Hn和H1,之间权值Wo,根据式(8)、(9)将调整得到的权值Wn与初始数据根据式(7)计算出一组新的概率送入H1层,作为H1层的输入数据.重复上述计算过程得到WS1,WS1,…,Wn-1最终得到DBN网络的初始权值Wi={Wo,w1,W2,…,Wn-1},DBN网络包含n+2层,即H0,H1,H2,…,Hn层和样本标签数据层,其中HSn作为输入层,其节点数为64,标签样本层为输出层,中间n层的节点数分别是L1,L2,LSn,…采用无标注的训练样本构建DBN网络,以HSo和H1之间的训练为例,HSn和Hn,层构成了一个RBM,HN与可见层移的节点数相同,H1,与隐藏层h的节点数相同,利用交替的吉布斯抽样来调整权值WSn,直到RBM收敛。
在非监督学习过程中,保存RBM调整得到的权值,并作为自顶向下的监督学习的初始权值,与监督学习过程一样,根据样本的标注,采用梯度下降法再次微调权值,这里,RBM网络和DBN网络采用同样的网络结构,都具有相同的输入层和隐藏层,包括每层的节点数目也都相同,只是DBN网络最后还有一个输出层.DBN网络训练过程如图4所示,
3.形态学视频图像去噪处理
通过深度置信网络法对文本区域准确定位后,再根据字符的特征,采用形态学处理方法实现对空洞区域和孤立点进行填充、去噪、腐蚀以及膨胀等操作,最后再将获得的标记二值图像映射到原图像,实现清晰背景的文本图像。
针对图像中存在的孤立点噪声问题,通过邻域背景区域形态学比较,修改标记二值图像中孤立点背景区域值,实现孤立点去噪处理,如在标记二值图像过程中,由于字符之间存在间隔和中文标点符号,经过DBN网络处理后,该区域易被判定为背景区域,此时需要根据形态学法进行背景填充,即将背景区域值“0”修改为文字区域值“1”,为消除视频图像中次要文本区域的定位,以达到对视频中主要文字信息的提取与识别,本文采用了基于形态学的图像腐蚀与膨胀方法。
选用原点位于中心的5×5对称结构元素作腐蚀和膨胀运算,由于腐蚀运算,在去除噪声点的同时,会对图像中文本区域的形状有影响,故在进行腐蚀运算,去除部分噪声点后,再进行膨胀运算以消除腐蚀运算之后对文本区域的影响。
经过DBN网络、形态学去噪处理以及图像映射后的效果如图5所示,由图5所示可见视频图像在经过训练的DBN网络处理后,可以有效定位出字符、文本区域信息,如图5(b)所示;而经过形态学处理后图像中的噪点和不连续点被有效去除,获得清晰的文本区域图像,如图5(c)所示。
4.OCR字符识别及结果分析
视频图像文本区域定位都是从最底层特征映射出相应的顶层特征,依次层层映射,直到得到最顶层的结果。
通过对DBN网络及经形态学处理后文本区域,进行二值化处理,去除与边界相连的区域,将文本域背景黑白反转,再送到OCR软件进行识别。图6所示为图5中视频帧图像中的一段文本区域的二值反转图像,图7为此二值反转图像经OCR识别后的结果。
将本文提出的逐层增量深度学习算法与神经网络、经典Kim方法以及SVM方法对文本区域的定位作对比.采用式(12)中的查全率(RR)、查准率(PR)以及系数F来综合评价这几种方法的使用效果。
其中:c为图像中正确检测到的文本区域个数;m为图像中检测到的文本区域总数;n为图像中实际存在的文本区域总数;F系数用来对各个算法性能进行综合排名,是将查全率和查准率这两个性能的指标线性合并而成。
4.1不同网络结构的比较
为研究不同DBN网络结构对算法性能的影响,故测试了不同DBN网络层数的性能,实验结果如表1所示,测试数据表明,随着网络层数的增加,DBN网络的正确率逐步提高,网络的逼近能力逐步增强,但是,随着网络层数的增加,网络的复杂度也会不断的增加,网络的泛化力会逐步降低,所以并不是网络层数越多越好,实验中,认为4-DBN网络能够满足文本区域的需求,因此后续实验选择4-DBN网络为基准。
4.2与其他方法的比较
通过选用100幅不同背景的视频帧图像、字体大小、字体颜色、单行或者多行等情况下,采用如上4种不同方法对文本区域进行定位和对比,测试结果如表2所示。
从表2的试验结果对比可以看出,DBN网络文字区域定位的效果要明显优于其它3种方法,其查全率和查准率均高于Kim和SVM法,并且其F系数也是最高的.针对表1中DBN网络正确定位的文本区域总数378个,总字符数为5059个,进行文本识别实验,经二值化和形态学去噪处理后再进行OCR识别,表2测试结果表明,DBN网络在文本定位方面与其他3种算法有着明显的优势.通过正确定位出文本区域,使对视频中的文本字符的正确识别率也明显提高,保障了后续文本识别的正确率.
【关键词】小波分析;小波去噪;非平稳信号;matlab仿真
Abstract:This paper describes the emergence and development of wavelet analysis, and its principle and mathematical description was given instructions, further illustrates the application principles and methods of wavelet analysis to eliminate noise, this paper focus on the residential noise of non-stationary signals study, carried out the algorithm and simulation results.Key words: wavelet analysis; wavelet denoising; non-stationary signals; matlab simulation
中图分类号:O29 文献标识码: A 文章编号:
小波分析是当前应用数学和工程学科中一个迅速发展的新领域,经过近10年的探索研究,重要的数学形式化体系已经建立,理论基础更加扎实。与Fourier变换相比,小波变换是空间(时间)和频率的局部变换,因而能有效地从信号中提取信息。通过伸缩和平移等运算功能可对函数或信号进行多尺度的细化分析,解决了Fourier变换不能解决的许多困难问题。
小波(Wavelet)这一术语,顾名思义,“小波”就是小的波形。所谓“小”是指它具有衰减性;而称之为“波”则是指它的波动性,其振幅正负相间的震荡形式。与Fourier变换相比,小波变换是时间(空间)频率的局部化分析,它通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了Fourier变换的困难问题,成为继Fourier变换以来在科学方法上的重大突破。有人把小波变换称为“数学显微镜”。
一、小波分析原理及其数学描述
小波分析是一种窗口大小(即窗口面积)固定但其形状可改变,时问和率窗都可改变的时频局部化分析方法。即在低频部分具有较高的频率分辨率较低的时间分辨率,即在高频部分具有较高的时间分辨率和较低的频率分辨使小波变换具有对信号的自适应性。
二、小波去噪原理
运用小波的多分辨分析特性进行信号、图像的去噪处理是小波分析的重要应用之一。
在实际工程中,有用信号通常表现为低频信号或是一些比较平稳的信号,而噪声信号通常表现为高频信号。
小波阈值去噪的处理方法一般有以下三种:
1)强制去噪处理。该方法把小波分解结构中的高频系数全部变为零,即基于小波分析的车牌识别系统研究把高频部分全部滤掉,然后在对信号进行重构处理;这种方法比较简单,重构后的去噪信号也比较平滑,但容易丢失信号的有用成分;
2)阈值去噪处理。该方法利用ddencmp函数产生信号的默认阈值,然后利用wdencmp函数进行去噪处理;
3)给定软(或硬)阈值去噪处理,阈值往往可以通过经验公式获得,而且这种阈值比默认阈值更具有可信度。
三 、小波去噪的研究
噪声通常被认为是有害信号,一般情况下应被抑制,然而,噪声中也可能包含许多有用信息,如机电一体化设备运行中所产生的噪声,就在一定程度上包含了反映其工作情况,状态信息或参数等内容,因为这些设备在运行时,其中力、速度、加速度的变化以及振动的振幅、频率等信息都会以噪声的形式表现出来。如果能采集、记录到这样的噪声信号并对其进行必要的处理,就能从中提取到机电设备的工作情况、状态参数等重要信息,还能以此作为我们对其进行监控的手段之一。利用噪声信号中的有用信息进行机电设备的故障诊断或状态监控,关键之处就是要对它进行合适的处理,因为在生产现场所采集到的噪声信号非常繁杂且数据量很大,这其中有不少是无用数据,若不进行处理的话,很难获得我们想要的信息。在实际的工程应用中,所分析的信号可能包含许多尖峰或突变部分,并且噪声也不是平衡的白噪声,对这种信号进行分析,首先需要作信号的预处理,将信号的噪声部分去除,提取有用信号。对这种信号的消噪,传统的傅里叶变换显得无能为力,因为傅里叶分析是将信号完全在频率域中进行的,它不能给出信号在某个时间点上的信号变化情况。而小波分析由于能同时在时、频域中对信号进行分析,所以它能有效地区分信号中的突变部分和噪声,从而实现信号的消噪。
1、小波分析用于降噪的过程
小波分析用于降噪的过程,可细分为如下几段。
1)分析过程:选定一种小波,对信号进行N层小波(小波包)分解;
2)作用阈值过程:对分解得到的各层系数选择一个阈值,并对细节系数作用软阈值处理;
3)重建过程:降处理后的系数通过小波(小波包)重建恢复原始信号。
这个过程基于下如基本假设,即携带信息的原始信号在频域或小波域的能量相对集中,表现为能量密集区域的信号分析系数的绝对值比较大,而噪声信号的能量谱相对分散,所以其系数的绝对值小,这样我们就可以通过作用阈值的方法过滤掉绝对值小于一定阈值的小波系数,从而达到降噪的效果。
2、用小波分析对非平稳信号消除噪声
在一个方波信号上加入一个高斯白噪声,再将其分别用小波分析和傅里叶变换进行信号噪声消除。
1)小波基的选择:
作为小波的函数,它一定要满足容许条件,在时域一定要是有限支撑的,同时,也希望在频域也是有限支撑的,但若时域越窄,其频域必然是越宽,反之亦然。在时域和频域的有限支撑方面往往只能取一个折中。此外,希望由母小波形成的是两两正交的;进一步希望有高阶的消失矩,希望与相关的滤波器具有线性相位等等。这里选择的是sym小波,又称为正交小波,它是双正交小波,并是紧支撑的,且接近对称(故所用的滤波器可接近于线性相位)。
2)小波多尺度分解各子带系数的特点及噪声影响
对图像的小波变换覆盖了图像频带90%的小波系数集中在21、22、23它们包含了大部分图像信息,所以可以只考虑这三个尺度的信息,而尺度2j> 23 的信息保留在图像的低频分量中。随着层数的增加,小波系数的范围越来越大,说明较低层的小波系数具有更重要的地位。分辨率最低时,该子带小波系数的范围比别的子带小波系数范围宽,值和方差都比别的要大,说明这些小波系数同样具有重要地位。
在各个子带做特征提取之前,应首先考虑图像中噪声对子带系数的影响。根据Donoho 的理论对含噪图像连续做几次小波分解之后,由空间分布不均匀的干净图像所对应的各尺度上小波系数在某些特定的位置有较大的值,这些点对应干净图像的畸变位置和重要信息,而其它大部分位置的值较小;对于白噪声而言,它对应的小波系数在每一尺度上的分布是均匀的,并随着尺度的增加,系数的幅值有所减小。可以看出,噪声的影响主要集中在最高频子带中。因此考虑消噪问题时,可根据噪声小波分解的系数的特点找一个合适阈值λ,把低于λ的小波系数视为主要由噪声引起的设为0,而高于λ的予以保留,对最高频子带可提高阈值以减少噪声影响。
参考文献
[1]胡广书,现代信号处理教程,清华大学出版社,2004
[2]徐长发、李国宽,实用小波方法,华中科技大学出版社,2001
[3]董长虹,Mablab小波分析工具箱原理与应用,国防工业出版社,2004
[4]小波分析理论与MATLAB实现,电子工业出版社,2005
[5]胡昌华、李国华,基于MATLAB6.X的系统分析与设计―小波分析,电子工业出版社,1999
[6]周利清译,信号处理引论,电子工业出版社,2005
[7]张建国、孙晓东、张礼勇,基于时频分析的信号特征提取方法研究,电测与仪表,Vol.42 No.474 Jun. 2005
关键词:噪声消除 Matlab Verilog
中图分类号:TP39 文献标识码:A 文章编号:1007-9416(2013)09-0139-02
1 常用的噪声消除基本原理
数字图像噪声处理方法大致可分为在空间域处理和在频率域处理。空间域噪声处理方法主要包括:邻域平均法、中值滤波、多图像平均法等。频率域处理方法从狭义上说是指图像经过傅立叶变换(FT),然后利用已设计好的低通滤波器滤除高频噪声;从广义上说是指图像经过DCT变换或Walsh变换或Wavelet变换后利用每种变换自身特点衰减噪声。
2 改进型领域平均法的MATLAB验证
本设计采用的是改进型领域平均法,确定其领域范围为四领域,也就是像素点周围任意设定的四个点作为处理对象。并且根据讨论的8领域阈值T的取值范围,在四领域中取其值为20—50之间的任意一数。
在实际的处理过程中,噪声的检测是将像素点的灰度值分别与相邻四个点的灰度值进行比较,如果它们的灰度差值存在大于阈值T的数(程序中阈值取为32),那么就认为该点为噪声点。
对改进型领域平均法,首先用MATLAB验证其正确性与可行性。MATLAB处理数字图像非常方便。
MATLAB验证的具体思路:
(1)首先用MATLAB中的rgb2gray将真彩色的图像转化成灰度图;
(2)然后利用imnoise函数给灰度图像加上椒盐噪声,并且将一些固定点值设定在[0:15]或[240:255]的范围内,认为其为坏点;
(3)使用函数dec2bin将加入椒盐噪声和固定坏点的图像的灰度值转化成二进制数据,以便Verilog的数据读入;
(4)编写程序用MATLAB实现其算法(消噪过程中的阈值取为32)。
从视觉效果来说由领域平均法处理后图1(a)几乎看不到有噪声点,而1(b)中还能看到几个明显的噪声点。由此可以得出的结论,该算法对加入噪声点的比例小的图像处理效果比加入噪声多的图像效果要好。下一步将利用Verilog语言来实现其算法。
3 领域平均法的Verilog实现
如(图2)模块端口功能说明:Rst——系统复位信号,在高电平有效;Clk——系统时钟信号,本实验中的频率为10MHz,同时也是数据采集信号,Clk的上升沿读入数据;Vsync——帧同步信号,在高电平有效;Hsync——行同步信号,在高电平有效;Data_in——输入图像数据;Flag_h——行计数器屏蔽信号,为了达到可综合的功能引入的屏蔽信号;Flag_l——列计数器屏蔽信号,为了达到可综合的功能引入的屏蔽信号;Flag_vh——帧计数器屏蔽信号,为了达到可综合的功能引入的屏蔽信号;Vsync_out——帧输出信号;Hsync_out——行输出信号;Data_out——处理完后输出图像数据;
几个寄存器变量:vcounter——帧计数变量;hcounter —— 行计数变量;lcounter —— 列计数变量。
本程序中对于vcounter,hcounter采用异步复位在rst的上升沿的时候置为0,而lcounter以及寄存器m,n,p,q,i,j采用的是同步复位。可以很清楚地明白每个信号上升沿时刻各变量的变化:在帧选择信号vsync和行选择信号hsync上升沿,分别对帧计数变量vcounter、行计数变量hcounter和列计数变量lcounter执行相应的变化;在时钟信号clk上升沿时,如果帧同步信号vsync和行同步信号hsync均有效,则读入数据,根据行计数变量hcounter的值不同,选择所读入数据的存储;并且在时钟信号clk上升沿,若在有效像素区域内,则执行所采用的消噪算法,进行邻域比较和邻域平均赋值。
由于4邻域平均法,只有知道三行的数据才能用邻域平均值替代中间行的原灰度值,因而设定两个行存储器mem_1和mem_2,而且随着处理的进行,这两个行存储器必须往下循环赋值:即在输出第二行数据时,mem_1记录第一行数据,mem_2记录第二行数据;输出第三行数据时,mem_1记录第二行数据,mem_2记录第三行数据;……直至输出第M行数据时,mem_1记录第M-1行数据,mem_2记录第M行数据。
当行计数变量hcounter=1时,将数据存入存储器mem_1;当行计数变量hcounter=2时,将数据存入存储器mem_2;当行计数变量hcounter>=3时,数据直接读入寄存器reg_x,处理完之后,将该寄存器的数据存入存储器mem_2,而mem_2中原来的数据存入存储器mem_1中。通过这样的赋值,可以一直记录下待处理行和上一行的数据,加之最新读入的下一行数据,就可以采用4邻域平均法进行处理了。
本文主要研究了图像识别在轴承孔径检测中的应用,通过对实验结果进行分析,找到有效提高传感器成像精度、减小噪声等方法来改进传感器采集数据质量和提升系统分辨率。通过实验分析出其中存在问题,并将其改进,从而获得更加准确和有价值信息。本课题的难点:由于机器视觉系统属于非线性体敏感元件,而传统意义上线性变换是非平稳随机过程;线性规划方法也无法解决非连续优化性问题。
1.1 轴承孔径检测系统的组成
在工程中,轴承孔径检测系统主要由三个部分组成:图像采集模块、背景信息提取模块和实验数据处理与分析平台。图像获取是指通过各种传感器来获得所需的运动参数。该过程可用于实时监测并对其进行量化研究;预处理包括滤波重建及边缘提取等操作;由于噪声干扰,在实际应用中通常需要将轴承孔径信号。本文研究的内容是图像识别在轴承孔径检测中,主要包括了预处理。将灰度变换、边缘提取和边缘定位等相关方法进行集成。二值化。对波峰产生过程进行分析,并确定阈值选择原则;根据噪声标准信号来判断是否有噪音出现;然后通过模板匹配技术实现图像的轮廓与特征分离以达到最佳识别效果,从而保证后续工作顺利进行。摄像机用于记录运动物体(如轴或盘)在空间中走势,并控制其向投影,拍摄所需要的图片,同时采集每个像素点对应于该载体上所有对象位置信息;镜头通过摄像头收集到数据后传送给处理器进行计算运算;计算机则将图像处理结果实时地存放在内存上以待识别系统分析的时间周期内。
1.2 孔径测量
孔径测量的方法有很多种,例如:光学传感器法、红外探测器技术和磁粉检测器法等等。但其应用范围比较广泛。光学传感器是用来对太阳光进行折射或反射的种非接触式测角仪器;光电转换器件将被转化为电信号输出;在一些特殊场合下也可以使用孔径测量仪来测量轴上或者偏心位置,如:激光探伤、电磁感应检测等都可用于孔径测定和精密度。孔径测量是一种对物体表面的径向或轴心进行无接触式称重方法。其工作原理为:首先由传感器获取待测零件在不同位置上的垂直方向和水平方向上两部分,并记录下数据,然后将这两个数值计算平均值得到该平面内任意点对应0-1m图像。根据测得结果确定出所需检测孔数及尺寸后即可测量径值或轴心直径等参数作为参考依据可进行定位、标定工作。为了提高孔径检测的精确度,需要对运动着、结构复杂且有严格要求工件加工位置进行准确测量。通常采用的是光学扫描方式来获取孔径信息。但是由于相机在拍摄过程中可能会存在曝光误差等因素导致其成像不够精确,所以通过图像处理方法获得了较好的精度和分辨率后就可以利用投影法或其他形态学方法实现孔径检测工作,即基于空间分析特征提取出有效地、完整且可描述的边缘区域并对这些轮廓进行准确识别以作为最终孔径信息。
1.3 图像成像
本文使用的图像预处理算法是基于Matlab软件开发平台所提供。该程序首先通过对运动目标进行测量,将采集得到的数据导入到计算机中,然后经过解算后获得了最终模型。在整个过程中采用的是变换域法来完成图像成像:①先把待拍摄物体分割成不同区域;②再根据轮廓形状特征选择相应像素点;③最后再扫描所有传感器获取完整图像并计算出投影面积和相干长度从而形成一个新图象。图像处理和成像的目的都是为了获得清晰、完整的目标信息。在实际应用中,我们通常采用两种方式实现:(1)将待测物体放在光学系统上。由于灰度分布是不均匀性因素存在于其中,所以一般情况下无法进行标定校准;(2)用一定半径长度或宽度比尺量出一个点或一组图像来表示图像对象特征信息的过程称为成像。在这个过程中可根据需要通过不同方法处理得到所需结果。在对不同的图像进行处理后,我们可以得到不同特征值对应其灰度级分布情况。通常,将待测样品按照一定比例放置于相应区域中。但是由于实际测量过程中会受到噪声干扰影响信号质量及边缘位置变化等信息难以获取时效性较差、同时成像效果也有很大差异:因此在这种情形下需要使用到的是基于特定方式来实现图像预处理的方法,一般常用特征值对应点表示为灰度级分布函数,即Q=1/XRL)*Str。
1.4 图像传感器与信号
目前,传感器技术已经在广泛的应用,其功能是向特定方向发展,包括从不同角度来收集信息。如:将图像信号转换成数字量进行处理;通过对传感器输出的模拟电压或电流变换到相应频率电路中所需形式等过程获得输入信号。在实际工作情况下通常采用两种方式实现传感器与待测物体之,间准确、快速地传递数据和实时响应速度以及准确性要求(即高精度),这就是常用的几种动态信息采集。由于不同的传感器,其工作原理也不相同。红外检测器:通过对红外光信号进行调制,使之成为红外线发射/接收装置所需要使用到的设备或器件(如测温仪、计算机),微波探头:由特殊材料制成且采用对称放置构成并能与外部电路连接而成一个整体结构系统。该探测元件可用于对不同波长和振动频率范围内物体的监测,也可以检测出内部温度变化及外部磁场强度等信号,具有较高灵敏度。信号处理的目的是为了获得有用信息,图像传感器则主要用来获取运动物体或振动系统中被测对象的外部特征。目前,国内外常用的是一种用于测量和控制图像采集设备。这种方法可以在一定程度上降低对灰度值变化敏感而引起噪声干扰等问题;但由于在某些场合下需要检测目标与背景之间距离较远时使用该方式会产生较大误差从而导致其精度不够高。
2图像识别在轴承孔径检测中的应用
2.1 图像识别实验
图像处理的硬件平台是整个系统中最重要部分,它主要由计算机和摄像头组成。机器视觉技术应用到了大量的理论知识。然而这些理论在实际生产生活中是不常用得。因此需要开发软件来帮助实现图像识别等问题上一步步进行解决,使其能够更好地服务于工程领域并为其他学科提供一定参考价值和实用性作用;同时也可以将一些基本概念引入硬件平台中去,如摄像机、投影仪与计算机网络等等设备都可成为实验数据采集的一部分用于检测系统误差信号。本文所设计的图像识别系统,硬件平台主要由RGB传感器。该设备是通过光电检测芯片和三极管组成。在这个装置中,我们可以看到三个元器件分别对准模进行放大、调制以及匹配处理后形成一个完整的波形信号通道,同时也会将其中一个元件作为输入参数添加到输出模块当中去并且输出相应的结果信息以供后续使用。图像处理技术是基于机器视觉的,通过数字信号处理和分析,利用计算机进行计算来提取所需要信息。在实验中用到了很多噪声检测算法:均值滤波法、线性卡尔曼滤波方法、神经网络等;其中FIRP滤波器可以直接对输入信号做差分运算来获得我们想要得到的样本数据;SCTI算法就是一种基于特征点跟踪技术而产生的图像处理模块,该系统采用的是一个训练好和适应能力强于传统计算机相比。
2.2 图像识别系统测量误差补偿
由于相机的尺寸和位置,图像采集装置采用了倾斜放置,虽然在一定程度上可以保证拍摄质量。但同时也带来一些问题。如相机与传感器之间距离过近或者存在耦合等都会造成噪声干扰;其次是对数据分析过程中产生偏差导致采样频率过高或不连续的现象等等;因此对于这些影响因素需要进行更严格地控制以达到最佳效果并确保实验结果准确可靠度和分辨率等性能指标,由于相机的分辨率在不同级别,所以采集到的图像质量会有所差异。因此需要对所拍摄得到得图像进行处理,首先是预处理。将镜头转换成两个低频信号(1)和中高频信号(2)两种频率分别对应于高通滤波器上;然后利用数字采样法先去除噪声后再去噪滤波;接着通过算法计算两幅图片在不同通道下输出时的信噪比,从而获得轴承孔径检测所需要的图像信息数据。在对采集到的实验样本进行了预处理之后,需要将图像中的噪声信号与待检测样品之间建立一个映射关系,这样能够方便我们获取所要研究的是什么样形信号。而这个映射是由滤波算法产生出来。一般情况下选取合适阈值来选择出最佳阈值从而达到目的效果;然后再使用滤波器把得到的匹配结果和目标函数求取其中最优参数作为参考函数进行计算处理。
2.3 轴承孔径图像质量检验
首先,通过图像处理软件进行预处理,得到的二维数组中有大量背景值。经过滤波和二值化操作后。先对噪声系数取一定范围内作为测试样本集(标准组)为2/3左右;然后再去去除最大值或者最小部分数据点(即阈值得大小)为零以及其他特征向量不为0或缺失的干扰信息之后,利用迭代算法确定出一个合适且稳定地时间间隔来进行性能测试实验。在高分辨率的测量设备中,边缘轮廓是图像处理和识别系统最关键的部分,同时也是提取特征参数、分类等过程所必需要考虑到问题。首先进行的是边缘轮廓提取。因为该实验需要对不同位置下对应目标区域内灰度值做两次扫描。由于背景噪声会影响待测零件表面信息点所在平面与边界处实际情况之间存在一定程度上的偏差,因此我们可以通过图像中边缘区域来识别出该部位的轮廓特征参数。通过对不同的图像处理算法进行对比,实验结果表明:本文提出了一种新的基于核函数滤波和阈值法相结合来检测孔径缺陷。这种方法能够在保证边缘信息质量前提下减少计算量。由于测试时采用的是双通道窗口成像方法,所以只需将两个灰度级上相同位置点作为目标区域即可;而对于两幅图片而言则需要通过不同算法中图像处理步骤进行分析比较。
3轴承孔径检测算法研究
3.1基于边缘检测的图像算子
通过上述实验可以看出,本文所提出的几种误差模型都各有自己存在的问题。对于图像处理中出现了噪声和背景度差值偏差等。为了提高检测时对运动目标轮廓进行识别而产生过采样频率这一不足之处,我们选择在主成分分析中用到线性平稳特征提取方法来消除噪声;其次是算法速度快、精确度高以及运算时间短等优点可以有效地降低这些缺点并减少误差;同时还考虑到本文所提出来的几种模型都各有优劣和缺点。本文利用Matlab中的T-P图像处理工具箱进行了实验,在MATLAB软件平台下,对所提方法与算法都有一定程度.上的仿真验证。首先通过图像分割和目标定位可以将待测轴承孔径检测分为两部分:第一是边缘提取。第二则是轴向灰度校正过程、最终得到粗确定值后就可利用中英文曲线平滑识别出该轴承孔径大小;而对于图像二值化处理之后再进行精减法便只需去除轮廓中心。
3.2基于边缘检测的孔径图像分割算法研究与改进
在实验中,由于图像处理技术的限制,对一些有缺陷(噪声)的物体进行识别时存在较大误差。比如说:边缘特征点可能与实际情况不符。这些现象产生原因是不同类型和层次上都会影响到目标信息提取结果;同时也是因为某些因素引起了灰度值变化导致最终得到的是一个个空洞信号而不是真实状态下所形成的所有图像信息等等问题,但在实验中却很少有被考虑过),由于图像处理过程中,所产生的缺陷与图片上存在畸变,所以在实际应用当中也会导致识别结果不准确。而这种问题是由不同程度的噪声引起。一般情况下都将其归结为两类:第一类为背景差错;第二类为伪目标物体边缘轮廓处附近像素点之间出现重叠现象或者图像区域内某一位置灰度值变化时该部位发生突变或产生模糊等一系列原因造成的。在图像处理过程中,由于一些非本质性的缺陷,或者是噪声干扰等。这也可能导致我们无法确定是否存在着某种特定缺陷。因此当这些具有明显特征物体被发现之后并不是很准确。但是通常情况下都会有一个重要参数叫做阈值(O、R或T)来表示目标区域的形状变化和其相对位置上图像所含信息量大小以及方向性等等性质。因为图像的灰度值不同,所以在实际应用中,对目标物体进行边缘检测时也会出现一定程度上的噪声干扰。因此为了消除这种影响通常采用去除背景和增强、消噪以及二值化等方法来处理。(1)先添加小波分解为前景基函数后再将其去除掉;(2)再加入与边界条件相同或一样的元素然后再次去预处理,从而达到目的图像中目标物体灰度值变化不大或者无明显波动。
3.3轴承孔径检测试的特点
在测试的过程中,我们会遇到不同大小、形状和角度的孔径检测结果。不同尺寸和深度,其对应于各个方面能力都有区别。因此需要对图像进行处理。首先是滤光圈参数测量:通过灰度值来判断是否存在噪声干扰;其次就是平滑镜窗口选择:使用边缘算子(LM)去噪后得到一个合适的标准函数;最后的是阈值确定与实际误差计算中常用到的方法一样。在实际检测过程中,由于图像的灰度值和噪声都会有一些变化,所以当我们使用传统方法去测定时就不能准确地确定图像中心。但是利用计算机成像技术可以精确识别出所需要特征的位置。可控性强:因为该算法是通过对待测信号进行参数估计来分析待检孔径尺寸并最终得到其大小与方向;而且它还能自动选择最佳阈值和最理想边缘点等,这使得检测过程中能够快速准确地确定测量结果。体积小,重量轻。检测时,只需将图像的中心位置改变一下就可以了。而且不用对整个过程进行拆卸和移动便可直接测量出孔径尺寸参数;效率高、便于实现自动化生产等特点均不需要借助专用工具或设备就能完成工作操作及自动校正性能强于传统人工测定精度水平上也很突出且显著优势之一。但由于不同形状和大小的物体之间存在着各种差异,所以检测结果肯定会有较大差别。
4总结与展望
4.1全文结论
本文通过研究图像识别在轴承孔径检测的应用,介绍了一种新的基于矢量量化特征提取方法一投影寻踪法。首先对传统轮廓定位和小波变换进行分析;然后用两种近景差分割算法分别处理两帧与多幅减运动目标下得到不同灰度值、不同方向(或线性)尺度上多个前景窗口大小及归一化后各个背景图像。利用高斯滤波消除前景中局部平坦区域的噪声,本文以图像识别和轴承孔径检测为研究对象,对运动的摄像机拍摄了彩色识别的运动镜头,并在MATLAB仿真软件中,使用Matlab进行编程实现了基于核函数法、核函数法以及矩量密度方法等基本理论。将背景差分变换与线性拟合相结合来处理背景信息。同时也考虑到不同相机所拍图像存在着边缘区域和畸变率范围内信号之间的差异性;在对摄像机运动状态估计时。
关键词:边缘检测;大壁虎脑组织切片;显微图像;检测算子
中图分类号:TP391 文献标识码:A
文章编号:1004-373X(2008)10-148-03
Study of Edge Detection Operators in Micrograph of Gecko′s Brain Tissue Slice
ZHU Suping1,2,DAI Zhendong1
(1.Institute of Bio-inspired Structure and Surface Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing,210016,China;
2.College of Mechanical and Electrical Engineering,Nanjing Univesity of Aeronautics and Astronautics,Nanjing,210016,China)
Abstract: In order to detect the edge of micrograph of Gecko′s brain tissue slice. Basic operators which are frequently used and studied,a micrograph of Gecko′s brain tissue slice edge processing by VC++6.0,and the characteristics of these methods on the image edge detection are compared.The result tells that Canny operator gets more accurate edge,but at the same time,it may slip some edge and detail.Considering synthesis,Canny operator is good for this kind of picture.
Keywords:edge detection;Gecko′s brain tissue slice;micrograph;detective operator
在研究壁虎仿生机器人的过程中,确定壁虎运动行为与脑部皮层区域的对应控制关系是关键,文中运用边缘检测技术对壁虎脑切片显微图像进行处理。图像边缘是图像基本特征之一,他蕴含了图像丰富的内在信息,并广泛应用于图像分割、图像分类、图像配准和模式识别中。边缘检测是数字图像处理中非常关键的组成部分,其目的是精确定位边缘同时较好地抑制噪声。传统的边缘方法常用的算子有 Roberts算子[1]、Sobel算子[2]、Prewitt算子[3]和Kirsch算子[4],LOG算子[5],此后又提出了许多新的技术,其中突出有Canny的最佳边缘检测[6-8]、统计滤波检测[9]、数学形态学[10]以及随断层技术兴起的三维边缘检测。但对不同图像没有一个通用最佳检测算子,应根据具体图像选用不同检测方法。
显微图像是指将组织、细胞制成染色切片或涂片在显微镜下所看到的图像。本文采用的切片是首先用苏木精加伊红将大壁虎脑组织染色,再用冷冻切片技术制作而成。人工处理显微图像不仅费时费力,而且采集数据的精度较低,数据不易保存和跟踪处理。电子显微图像的采集分析主要通过高倍显微镜获取原始图像,然后由图像采集系统(主要包括CCD 数码相机和图像采集卡) 把图像数据传入计算机,然后进行图像处理和识别。
对几种不同的边缘检测算子(Roberts算子、Sobel算子、Prewitt算子、LOG算子、Canny算子)进行研究,分析各算子的不同,并对显微图像进行边缘检测,总结出各种算子的精度及在检测中算子选定的参考条件。文中所有算法的实现与实验都用VC++6.0实现。
1 边缘检测
1.1 一阶微分算子
设图像灰度函数为f(x,y),x,y为像素坐标,f(x,y)为图像灰度的梯度见式(1)。则梯度的大小和方向由式(2)和(3)计算得到:
ИЙf=(f/x,f/y)(1)
f=(f/x)2+(f/y)2(2)
θ=tan-1f/yf/x(3)И
Roberts提出的算子在2×2邻域计算对角导数,图像上的点(x,y)的梯度的幅度是用方向差分的均方值来近似的:
[HT5",6]Йf=(f(x,y)-f(x+1,y+1))2+(f(x,y+1)-f(x+1,y))2(4)И
Sobel和Prewitt提出了类似的计算偏微分估计值的方法,用梯度算子计算每一像素点的8邻域内梯度估计值。Sobel算子和Prewitt算子分别计算水平方向x的梯度分量Sx和Px,以及垂直方向y的梯度分量Sy和Py,最后求出梯度S,P。
ИSx={f(x+1,y-1)+2f(x+1,y)+f(x+1,y+1)}
-{f(x-1,y-1)+2f(x-1,y)+f(x-1,y+1)}(5)
Sy={f(x-1,y+1) +2f(x,y+1)+f(x+1,y+1)}
-{f(x-1,y-1)+2f(x,y-1)+f(x+1,y-1)}(6)
S= S2x + S2y (7)И
取适当阈值T,当S>T,该点为边缘点。
ИPx={f(x+1,y-1)+f(x+1,y)+f(x+1,y+1)}
-{f(x-1,y-1)+f(x-1,y)+f(x-1,y+1)}(8)
Py={f(x-1,y+1)+f(x,y+1)+f(x+1,y+1)}
-{f(x-1,y-1)+f(x,y-1)+f(x+1,y-1)}(9)
P= P2x +P2y (10)И
取适当阈值T,当P>T,该点为边缘点。
在实际应用中,常用简单的卷积核来计算方向差分,不同算子对应不同的卷积核,如图1所示 (标注“•”的是当前像素的位置)。
[HT5”]И1.0
0-1 0.1
-10
[HT6](a) Roberts算子[HT5"SS]
Sx= -101
-20.2
-101,Sy= -1-2-1
00.0
121
[HT6](b) Sobel算子[HT5"SS]
Px= -101
-101
-101,Py= -1-1-1
000
111
[HT6](c) Prewitt算子И
[HT5"K]图1 一阶微分算子的卷积核
1.2 二阶微分算子
前面都是利用边缘处的梯度取得最大值(正的或者负的),也就是灰度图像的拐点位置是边缘。然而,在拐点位置二阶导数是0。所以也可以通过寻找二阶导数的零交叉点来寻找边缘。二元函数f(x,y)的Laplace变换定为:
ИЙ2f=(氮x2+氮y2)f(x,y)=f(x,y)x2+f(x,y)y2(11)И
与和前面的梯度算子一样,这里也是选择一个模板,然后利用模板进行卷积求离散Laplace 变换,然后通过寻找零交叉点寻找边缘点。在Laplace 变换之前先用高斯滤波进行图像平滑,图2为编成所用的5×5为Gauss-Laplace算子卷积核。
[HT5”]И00-100
0-1-2-10
-1-216.-2-1
0-1-2-10
00-100И
[HT5"K]图2 5×5高斯-拉普拉斯模板
1.3 Canny算子
Canny算子实现步骤如下:
(1) 在定位和检测前滤除噪声选用高斯滤波器,选择合适参数实现高斯平滑;
(2) 用梯度算子增强边缘:使用sobel梯度算子计算每一像素点的梯度估计值;
(3) 计算方向角:用Sobel梯度算子算得水平方向梯度分量Sx和垂直方向梯度分量Sy,方向角计算式为:
ИЕ=arctan(Sy/Sx)(12)И
(4) 方向角规范化:对图像中每个像素只有4个可能的方向与邻点相连:0°(水平方向)、45°(正对角线)、90°(垂直方向)、135°(负对角线),边缘方向必是这4种中最接近的一种。方向角被规范到以下4个角度:
0°: 0°~22.5 °,157.5 °~180 °
45 °: 22.5 °~67.5 °
90 °: 67.5 °~112.5 °
135 °: 112.5 °~157.5 °
(5) 非最大化抑制:遍历边缘点,若该点在方向角方向上是梯度值最大,则保留;否则将该点从边缘点集合中去除,运算结果将得到一幅细线图;
(6) 双阈值分割:选定2个梯度阈值,一个高阈值TH,一个低阈值TL,通常取TH为TL的2~3倍。先从边缘点集合中去除梯度值小于高阈值的像素点得边缘点集合F,再处理梯度介于高低阈值之间的像素点集合M,若F中一点在M中有邻点,则将该点加入F,最终得到的集合F就是边缘点集合。
2 大壁虎脑组织切片显微图像的实验结果及分析
Roberts算子定位比较精确,但由于直接计算图像差分不包含平滑,所以不能抑制噪声,对具有陡峭的低噪声图像有较好提取效果;Sobel算子和Prewitt算子都是对图像进行差分合乎滤波,只是平滑部分的权值有区别,这两个算子对灰度渐变低噪声的图像有较好的检测效果,但对于本文试验所用图染色不均匀,各种噪声混合的复杂情况,处理效果就不那么理想了;LOG算子对噪声的敏感性比一阶微分算子大,且不能提供边缘的方向信息,而主要用于抑制边缘像素;Canny算子是线性滤波边缘检测法中最具代表性的方法之一,也是检测阶跃型边缘效果较好的算子之一,他比上述其他几种算子的去噪能力都要强,但容易平滑掉一些有效的边缘和细节,其整体效果要优于其他算子。实验结果如图3所示。
图3 实验结果(最终结果经过去色处理转为灰度图)
3 结 语
由于本文采用的图片为染色组织的显微图像,染色效果与拍摄时噪声混入不可控的,所以无法理论上决策何种算法适合。各种不同的算子对同一幅图像会产生完全不同的边缘提取效果。通过试验发现针对这组图像,经典的微分算子算法相对简单,但精度不够高,其中Sobel算子和Prewitt算子的检测效果明显要优于Roberts算子,但边缘不够连续、细锐,LOG算子对噪声太敏感,而且常产生许多虚假边缘,故不适合该组图像的检测。Canny算子的精度明显优于经典微分算子,能检测出图像比较细的边缘,滤去虚假边缘。边缘检测在医学图像处理中占有极其重要的地位,由上面的实验分析可以知道,每种算子都有一定的优缺点,对不同的图像应分析具体情况,选用合适的算子。
参 考 文 献
[1]Roberts L D.Machine Perception of Three-Dimension Solids[C].Optical and Electro-Optimal Information Processing,Cambridge,MA:MIT Press,1965:157-197.
[2]Sobel L.Camera Models and Machine Perception[D].Stanford University,Standford,CA,1970.
[3]Prewitt J.Object Enhancement and Extraction[M].Picture Process. Psychopict,New York:Academic Press,1970.
[4]Kirsch puter Determination of the Constituent Structure of Biological Images[J].Computer and Biomedical Research,1971,18:113-125.
[5]Lunscher W H,Beddoes M P.Optimal Edge Detector Design I:Parameter Selection and Noise Effects[J].IEEE Trans.Pattern Analysis and Machine Intelligence,1986:164-177.
[6]Demigny D.On Optimal Linear Filtering for Edge Detection[J].IEEE Trans.Image Processing,2002,11(7):728-737.
[7]梅跃松,杨树兴,莫波.基于Canny算子的改进的图像边缘检测方法[J].激光与红外,2006,36(6):501-503.
[8]张斌,贺赛先.基于Canny算子的边缘提取改善方法[J].红外技术,2006,28(3):165-169.
[9]王新成.高级图像处理技术[M].北京:中国科学技术出版社,2000.
[10]薛继伟,张问银,陈冬芳,等.基于数学形态学的图像滤波方法[J].大庆石油学院学报,2003,27(4):48-50.
作者简介 诸素萍 女,1984年出生,江苏南通人,硕士研究生。研究方向为仿生机械设计。