前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的数字图像处理综述主题范文,仅供参考,欢迎阅读并收藏。
关键词:数字图像 图像处理 数字技术 应用
数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。
数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息,数字图像处理作为一门学科大约形成于20世纪60年代初期,早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。
首次获得实际成功应用的是美国喷气推进实验室(JPL),他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,医学技术中数字图像处理技术都发挥了巨大的作用。
从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展,人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。
二、国内外研究现状
目前,国内图像识别的算法研究多是关于数字、文字、人脸、以及医用病理方面的较多,对产品内表图像进行分析识别、分类的还很少。国内已研制出了具有先进水平的高精度内表检测系统和装置,如何对产品零部件的外形,尺寸进行较高精度测量的激光在线检测系统等,但迄今为止,尚无能对生产出的产品内表面进行自动检测和识别的系统。应用CCD、电子、计算机技术检测内表面的实时自动检测技术在国内正处于刚刚起步的阶段,对内表面图像进行分析识别、分类的软件系统还没有十分完善,现在的识别算法对图像中的疵病部分定位不是很准确,对疵病的范围、大小、方位不能做定量分析,只能作定性分析,精度低,采用的传统的最小距离等分类器在图像复杂且类别多时,很难表示和提取特征,进行图像识别十分困难。
国外关于图像识别中的图像分割,特征信号提取,边缘检测,纹理识别等的算法已经取得了一定的成果,提出了一些新方法,如利用直线分割来识别三维人脸,通过子图匹配法在相邻区域间识别不同目标,用双值微波仿射不变函数识别二维形形状等等,近年来,国外基于图像识别与分类技术的图像检索,人脸识别,字体识别发展十分迅速。
在国外,为提高自动目标识别能力而开发的算法现在正被引入许多侦测和成像系统之中,图像分割、特征信号探测和析取、静止目标的模式识别等方面已取得了很大进步,这一自动目标识别能力大大减轻了操作人员的工作负担。如美国正在加紧自动检测能力与自动目标识别的研究工作,并在硬件能力的基础上开发多种用于信号图像处理的算法和开展各种算法软件的研制,包括相关法(匹配滤波器技术)、自适应多维处理法、基于模型的方法等。
三、数字图像处理的应用
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面,随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。
1、航天和航空技术方面的应用
数字图像处理技术在航天和航空技术方面的应用,除了JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。现在世界各国都在利用陆地卫星所获取的图像进行资源调查,灾害检测,资源勘察,农业规划,城市规划,我国也陆续开展了以上诸方面的一些实际应用,并获得了良好的效果。在气象预报和对太空其它星球研究方面,数字图像处理技术也发挥了相当大的作用。
2、生物医学工程方面的应用
数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了一般的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等,此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。
3、通信工程方面的应用
当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。具体地讲是将电话、电视和计算机以三网合一的方式在数字通信网上传输。其中以图像通信最为复杂和困难,因图像的数据量十分巨大,如传送彩色电视信号的速率达100Mbit/s以上,要将这样高速率的数据实时传送出去,必须采用编码技术来压缩信息的比特量。在一定意义上讲,编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、DPCM编码、变换编码外,目前国内外正在大力开发研究新的编码方法,如分行编码、自适应网络编码、小波变换图像压缩编码等。
4、工业和工程方面的应用
在工业和工程领域中图像处理技术有着广泛的应用,如自动装配线中检测零件的质量、并对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件的自动分拣,在一些有毒、放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。其中值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的激励,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。
5、军事公安方面的应用
在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸鉴别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。
6、文化艺术方面的应用
目前这类应用有电视画面的数字编辑,动画的制作,电子图像游戏,纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等,现在已逐渐形成一门新的艺术——计算机美术。
参考文献:
[1]孙即祥 图像压缩与投影重建 北京:科学出版社;2005.7:第一章:1~2,63~64.
[2]韩金姝.基于分形的植物形态模拟与图像压缩技术研究:[硕士论文]. 青岛:中国海洋大学信号与信息处理专业,2005.
【Abstract】In the process of computer technology rapidly develop, people need to deal with all kinds of complex images. Image processing method presents diversity and complex characteristics, and the remind for CPU capability is higher, the traditional CPU image processing already can not satisfy the needs of people at present. In this paper, it research a high efficiency and fast image processing method. It makes full use of GPU parallel processing ability, using G++ language to complete the corresponding images. The image parallel processing algorithm method main contain the color negative film processing algorithms, transparent merging processing algorithms and so on, and comparing the performance of achieving the same effect with the GPU, to prove the efficiency of parallel image processing algorithm. based on GPU .
【关键词】GPU;图像处理;并行算法
【Keywords】GPU; image process; parallel algorithm
【中图分类号】TP301. 6 【文献标志码】A 【文章编号】1673-1069(2017)03-0071-02
1 引言
在目前业务逐渐复杂的情况下,人们需要进行各种形式的图像处理,其处理形式主要包括对数字图形进行模糊、锐化和合并并根据人们的实际需求将原始图形转化成人们所需要的图形。人们对应用系统图形方面处理质量要求越来越高,虽然CPU的整体运行速度无法满足人们的实际需求,这就需要利用GPU的快速计算能力,将其应用到图形计算当中,以此来形成相应的通用计算,并且能够通过C++语言解决和处理复杂问题。
2 基于GPU图像处理的相关技术
GPU技术。在计算机发展的过程中,人们对图像处理的要求还没有那么复杂,其中图像的运行和相关的计算方法都比较简单,所以说不用借助相应的硬件处理设备来对图像进行编辑处理,只需要借助GPU强大的计算能力就能蚨酝夹谓行处理。但是随着社会的不断进步和计算机技术的不断发展,人们需要更快的运算速度来进行更高质量的图像处理,这就促使GPU运算技术产生并不断发展。从目前来看,CPU一般指的是中央处理器,是一种超大规模的集成电路,其主要功能是对计算机的指令进行解释,并对相应的计算机软件数据进行处理,而对数字进行处理就主要依靠GPU来进行,通过指令来产生相应的操作控制信号,以此来进行相应的图像处理。而GPU主要指的是图形处理器,也可以被称为视觉处理器,其主要功能是将计算机系统所需要的现实信息进行转换驱动,并且向显示器提供相应的扫描信号,来对显示器的显示进行正确控制,另外,图形处理器也是显卡的处理器,是显卡中较为重要的一部分,与CPU相比来说,两者具有一定的相似之处,而GPU主要是执行复杂的数学计算和几何计算,也就是说如果CPU想要画一个图形,只需要结合想要图形的实际坐标和特征,来产生相应的信号,而GPU就能够对该图形的所有像素进行计算并且集成,并且在显示器的指定位置上画出相应的图形,并且对CPU进行图形完成的通知,等待后续的命令[1]。
CUDA。从上述可以知道,GPU主要是对图形进行编辑和处理,但是在计算机的众多应用领域当中,GPU仍旧不能发挥出其具体功能,其主要是由于API的编程较为复杂,同时由于GPU内部的内存量较小,不能支持较大的程序规模,另外GPU的编程灵活性较差,这就使GPU无法发挥出其主要功能。为了对上述问题进行解决,厂商NVIDIA推出了一种运算平台,也就是CUDA,这种运算平台能够并行计算架构,使GPU能够对相对较为复杂的问题进行解决,目前的CUDA已经能够支持C++语言的实际运行,这也就意味着GPU能够发挥出更为重要的作用。
数字图形处理算法。数字图像处理是根据实际的需求,来对图像进行相应的运算和设计,对数字图像进行处理主要目的体现以下方面:一是提高图像的整体视觉效果和质量;二是对图像中所包含的信息和资源进行提取和处理,三是对数字图像的格式和信息进行变化处理,以此来保证数字图像数据的安全快速传递[2]。
3 基于GPU的数字图像处理并行算法
3.1 高斯模糊算法并行化
高斯模糊也被称为高斯平滑,目前属于一种在各种图像处理软件中进行广泛使用的处理效果,对其进行应用的主要目的是减少图像噪声和降低细节层次,高斯模糊当中的模糊,可以被看成周边像素的平均值。高斯模糊算法并行化在串联的程序结构当中无法进行灵活变换,为了能够对GPU中的硬件多线程资料进行最大程度的利用,就需要按照CUDA多线程架构处理的思想来对程序进行重构。在利用GPU对图像进行高斯模糊变化的过程中,其主要前提是水平方向上的一维高斯矩阵变换和垂直方向上的一维高斯矩阵变换是不相关的,换个说法是可以对其进行分开处理,针对某一方向的处理,各个像素之间的处理也是不相关的,结合这样的特性,可以利用GPU中的多线程并行将像素的处理任务分为不同的模块,并且使GPU的线程来对其进行计算。基于CUDA的高斯模糊处理,首先是需要对需要处理的原始图形进行读入,然后将图像中的像素在水平和垂直方向中进行分块,使GPU的线程块能够对这些模块进行分开处理,在进行处理之后,将处理之后的结果进行合并,这样就达到了想要的原始图像高斯模糊效果。在这样的过程中,需要根据实际的不同需求,来提供相应的函数,使GPU中的线程块能够对不同的数据进行不同的理和操作,这也就是高斯模糊算法在CUDA基础上来进行图像处理的[3]。
3.2 彩色附页处理算法并行化
对于彩色附页的处理来说,属于一种特别耗费时间的图像处理过程,因为这种数字图像处理方法要求将整个图像中的每一个像素点都进行处理,但是从数字处理的角度来看彩色附页处理,其整体处理流程较为简单,首先是需要对图像进行处理,然后根据图像格式的不同来放入内存,并且对图像的所有像素点进行读取,对其中的r、g、b值进行取出,用255减去所取出的值,得出处理过后的数值,最后利用这些数值,就能够形成所需要的负片图像。在进行负片处理的过程中可以看出,针对图像中的每一个像素点的处理都是相对独立的,也就是说在对某一像素点进行处理的过程中,其中各种数值的取值是与其他像素值不相关的,针对这样的独立性特点,可以在图像处理的过程中,充分利用GPU多线程并行处理的优势,对所需要处理图像中进行一定程度的分割,然后对所分割图像中的所有像素点进行处理,最后进行统一的合并,就能够得出所需要的图像[4]。在对图像中各个像素点进行处理的过程中,需要注意这样像素点之间的运算必须保证相互独立,如果出现像素点不独立的情况,那么就需要在程序中编写大量的控制代码,而这样的控制代码的运行方式与GPU的处理方式不相匹配,不能达到最好的图像处理效果。
3.3 透明合并处理算法并行化
图像的透明合并处理也就是说需要实现图像的一种半透明效果,从这种处理方式的数学公式和函数当中可以看出,图像的透明合并处理并不复杂,并且能够在一定程度上实现各种形式的半透明效果,其中主要包括火光、烟雾和阴影等。在利用GPU多线程处理器来对图像进行透明合并处理的过程中,首先需要对两幅图像的位置进行确定,并且根据图像的实际大小,来对混合处理的范围进行确定,并且将所需要处理的范围进行分割,然后利用GPU的多线程处理器,来对所分割的单元进行处理,最后进行统一合并,来完成图像的透明化处理[5]。在对图像进行透明合并处理的过程中,不存在较为复杂的逻辑控制,也就是说对于不同的处理对象,其处理流程和方式都是保持一致的,而不同处理对象之间并不存在相应的联系。
4 结语
通过对以上算法的介绍可以发现,在利用CUDA编程框架,在基于GPU多线程处理器对图像进行处理的方式,具有较快的速度和较高的成像效果。
【参考文献】
【1】翟优,曾峦,熊伟.基于不变特征描述符实现星点匹配[J].光学精密工程,2012(11):56-57.
【2】陈庆奎,王海峰,那丽春,等.图形处理器通用计算的研究综述[J].黑龙江大学自然科学学报,2012(05):23-24.
【3】Giorgia Zucchelli.使用MATLAB轻松享受GPU的强大功能[J].电子设计技术,2012(03):44-45.
关键词:数字图像处理;车牌定位;字符分割;字符识别
中图分类号:TP391.41
随着世界经济全球化发展,人们生活和消费水平的日益提高,对汽车的需求量也越来越大,其结果是巨大的城市交通压力摆到了人们的面前,于是如何运用高新科学技术来解决城市交通管理的问题越来越受到人们的重视。智能交通系统(Intelligent Transportation System,ITS)的出现大大的缓解了城市交通所带来的巨大压力,它被认为是有效改善城市交通状况最有利的工具。如今,数字图像处理技术(Digital Image Processing)已发展成为城市生命体承载系统的健康识别和调控理论与方法的研究热点。它的应用范围已从传统的图像处理技术发展到人工智能和高新科技领域,如计算机视觉、数码变焦、机器人学和交通视频监测技术等,以数字图像处理技术为主的研究也成为智能交通系统中的重要前沿研究领域。本文根据数字图像处理技术的特点,详细的介绍了其在车牌识别系统中的应用。
1 车牌识别系统简介
数字图像处理技术在ITS中最令人感兴趣的便是车牌识别系统(License Plate Recognition System)。车牌识别是一个复杂的过程,包括图像采集、图像预处理、车牌定位与分割、字符识别、输出结果等阶段。图像采集多是由硬件来完成的,是抓取车牌输入到车牌识别系统中的过程;图像预处理是对车牌图像进行处理,减小其数据量和突出图像有价值信息的过程;定位与分割是从处理好的图像中只提取车牌信息,再将它们分隔成单个的字符;字符识别是将分割后的字符识别出来的过程。整个车牌识别过程如图1所示:
图1 车牌识别过程框图
2 车牌定位
车牌定位算法有很多,其核心都离不开车牌图像中车牌所在区域的特征。其中车牌的字符纹理特征、颜色特征以及几何特征是研究车牌定位的主要方向。围绕着这三个特征,车牌定位方法的主要思想即是如何突出车牌的纹理特征,怎样根据车牌的颜色特征以及如何运用车牌的几何特征来进行车牌定位。
2.1 基于纹理特征的车牌定位算法
车牌本身含有丰富的纹理信息,其主要体现在字符上面,因为字符纹理信息是非常有规则的,关于如何通过这个特征来进行定位的算法比较多,如Liu等[1]提出了一种基于纹理特征自动定位车牌的算法,该算法是通过一维周期算法来进行定位,该方法可以有效的过滤掉车牌周围的噪声,定位准确;全书海等[2]提出一种改进Sobel算子的来进行车牌定位,该方式是通过将传统的Sobel算子只利用水平和垂直方向算子来计算边缘信息改进为通过输出6个方向的算子计算出的值的最大值,最大值对用的模板表示的方向作为该点的边缘方向;Zheng等[3]利用奇异值特征来定位,即通过车牌灰度化后,利用灰度化后字符特征具有一定的跳变性,从而能够将车牌进行定位。此类算法对复杂背景下的图像,也有较好的定位效果,并且具有较好的适应性和鲁棒性;Anagnostopoulos等[4]提出了一种滑动同心窗口的方法来定位车牌,该方法认为图像中车牌的纹理是不规则的,因此,局部特征发生突变的区域即是可能的车牌区域;Caner等[5]利用Gabor滤波算法分析纹理信息,这个方法对于分析纹理的无限方向和尺度十分地有效;Zhang等[6]运用基于Adaboost学习算法结合Harr-like特征,并采用一种分级分类器的结构来进行车牌定位。Harr-like特征常用来进行目标检测,它可以利用分类器分类出车牌的亮度、颜色、尺寸和位置等不变量。
所有基于纹理特征的车牌定位算法即使是对车牌边缘发生畸变的情况都十分地有效。然而,这些方法在拥有较多边缘、复杂背景下和不同光照条件下时运算起来都比较复杂。
2.2 基于颜色特征的车牌定位算法
车牌是由特定的背景颜色组合和字符组成的,因此我们可以通过颜色特征对车牌进行定位。基于颜色特征来进行车牌定位算法大致可以概括为两种:一种是将提取出的车牌从RGB空间转换到HSV(或HSI)空间从而进行车牌定位;另一种则是利用彩色图像的颜色特征来检测图像边缘信息,以达到定位车牌的目的。
中国科技大学的陈锻生等[7]研究出了在丰富的背景下对于带有颜色的汽车图像牌照提取与分割技术。该算法通过车牌牌照自身标准模式的多种重要特征,综合了局部特征分布、形状、彩色等信息从而进行车牌定位;华中科技大学的任仙怡等[8]提出了一种利用颜色信息的车牌定位方法。该算法首先将RGB图像的颜色模型转化为HSI模型,再利用颜色信息对车牌图像进行彩色粗分割,然后将分割的候选车牌分为目标区域和伪车牌区域这两种类型,接着通过投影检测的方法对这两种类型进行处理,以获得精确的车牌区域;Yang等[9]运用车牌颜色与字符颜色的固定搭配生成一个边缘图像。对图像进行水平扫描,如果有任何一个像素的值出现在车牌颜色的范围内,接着继续水平扫描与之邻近的颜色值,若有两个或者更多邻近的值在同一个字符颜色的范围内,那么这个像素即被认为是一幅新的边缘图像的边缘像素,分析新图像中所有的这些边缘即可找出车牌所在的候选区域;Wang等[10]为了处理不同光照情况下基于颜色特征的车牌定位问题,提出了一种基于模糊逻辑的方法。运用HSV彩色空间模型,首先将色度、饱和度、亮度三个权值根据不同的隶属函数映射到模糊集合中,然后用这三个权值隶属度结合起来描述模糊分类函数用以定位车牌。
利用颜色特征有利于定位出产生倾斜和畸变的车牌,然而直接运用颜色投影的方法有时可能会造成检测出错,特别是当图像的某些部分,如车身与车牌部分颜色一样时。
2.3 基于几何特征的车牌定位算法
利用车牌的几何特征来进行车牌的定位,其基本原理就是在对车牌进行预处理后的基础上通过几何特征来进行定位。检测所得候选区域的几何特征,即长度和宽度,通过设定阈值去掉不适合的候选区域,可以很好的提取出真正的车牌区域。因为候选区域集中在车身中间,且高度比大致为140/440=0.318,这里选取[0.30,0.45]作为判断区间,据此几何特征,能够把干扰的区域剔除掉。
运用几何特征来进行车牌定位的算法有很多,如Nelson等[11]利用几何特征定位线形成一个矩形来检测出车牌的矩形位置;Zheng等[12]利用与垂直边缘的匹配程度选出车牌的候选区域,车牌的垂直边缘被看成是对车牌进行定位的一个至关重要的特征,因为只利用水平边缘容易检测到保险杠从而定位出错;基于块的车牌定位方法,具有高尖边缘的块被认为是可能的车牌所在区域,因为基于块的方法并不依赖于车牌边界的边缘,因此它也适用于车牌边界不清晰的图像;运用基于边界提取的Hough变换检测图像中的直线来进行定位车牌,Hough变换对多达30°的倾斜直线的检测都十分地有效,当结合形态学的方法消除不需要的边缘后,定位的准确率将得到了大幅的提高。
3 字符分割
定位出准确的车牌位置后,下一步则是将车牌字符识别出来。但是车牌里面的字符是由一连串字符组成的,直接对车牌进行识别十分地困难,因此就需要通过字符分割的方法对车牌进行处理,然后对车牌里面的7个字符进行提取,这样将使接下来的字符识别过程变得更容易一些。常用的字符分割方法主要有以下三种:基于投影特征的字符分割算法、基于字符先验知识的字符分割算法和基于字符轮廓的字符分割算法。
3.1 基于投影特征的字符分割算法
字符颜色与车牌背景颜色有所不同,它们在二值图像中往往呈现出完全相反的二进制值。因此,首先运用去噪处理结合字符序列分析,接着利用垂直投影分割出字;提出了一种对提取出的二值车牌图像进行垂直投影的方法,确定出起始和结束的字符位置,接着对提取出的字符进行水平投影分割出每个字符;利用投影后字符的颜色信息代替运用二值车牌图像进行投影的方法进行字符分割。综合以上文献中的方法,可以发现利用垂直和水平像素投影的方法明显的要更简单跟常见一些。
基于投影特征的字符分割算法的优点在于它并不依赖于字符所在的位置,车牌也可以存在一定角度的倾斜。不过,此方法取决于图像的质量,任何噪声都可能会影响投影值。
3.2 基于字符先验知识的字符分割算法
字符的先验知识可以用来帮助我们进行车牌的字符分割。利用行扫描二值图像的方法找出字符起始和结束的位置以进行字符分割,当扫描的某行中字符像素与背景像素的比例先超过某一特定的阈值然后接着低于该阈值,就认为此行是字符所在的起始位置;把定位出的车牌调整到一个已知的模板大小,在此模板中,所有的字符位置都是已知的。经过调整后,与模板中位置一致的即是字符所在的位置,此方法具有简单易现实的优点;首先采用颜色匹配的方法定位出车牌在图像中的位置,然后利用每个字符的尺寸进行字符分割操作;在文献中提到,台湾的车牌全都具有相同的颜色分布情况:白底黑字。如果采用行扫描的方法检测黑白点的跳变个数应为6~14个,运用Hough变换矫正可能存在的车牌倾斜,最后利用混合二值化技术可以分割出受污染的车牌字符。
3.3 基于字符轮廓的字符分割算法
字符的轮廓模型也可以用于进行车牌的字符分割。利用一种快速变化推进算法建立了一种以形状驱动的主动轮廓模型。此模型分为两步进行处理,首先运用一种普通的快速推进技术结合一个梯度依赖和曲率依赖的速度函数粗定位出每个字符的大致位置,然后利用一种特殊的快速推进方法获得字符所在位置的准确边界,进而分割出每个字符。
4 字符识别
准确分割出车牌的字符后,下一步则是将车牌字符识别出来。然而在车牌识别系统中字符识别可能存在以下一些困难:由于镜头的缩放,可能导致分割出的字符大小和厚度不一致;不同的国家所用的车牌字符的字体都不一样;分割出的车牌字符可能存在噪点和缺损;分割出的车牌字符可能存在一定角度的倾斜等。接下来,本文将把现有的一些常见的车牌字符识别算法根据他们的特点分成两类,以解决在进行字符识别时遇到的困难。
4.1 基于模板匹配的字符识别算法
在字符识别的算法中,模板匹配算法是一种既简单又容易的方法。该方法判断字符与模板之间匹配的相似度,与模板中的字符相似度最高的即为车牌的字符。大多数模板匹配算法都采用二值图像来进行处理,这是由于灰度跳变会受不同光照条件的影响。
在对字符进行归一化处理之后,都采用字符匹配算法来进行车牌的字符识别,文献中定义了几个相似性的度量技术,如马氏距离和贝叶斯决策定理,杰卡德值,豪斯多夫距离和汉明距离,利用归一化互相关系数作为模板匹配分割出的字符,每个模板逐列的扫描字符以计算归一化互相关系数,模板中的最大值即为最相似的字符。
模板匹配算法对识别单个字体、非旋转的、非缺损的和固定大小的字符十分地有效。但是,如果遇到因一个字符产生形变、旋转或有噪点等情况,就可能影响到模板匹配算法识别的准确率。
4.2 基于特征提取的字符识别算法
因为并不是每个字符的像素点都对区分字符具有相同的重要性,一种提取某些字符特征的特征提取方法是一个很好的可替代灰度级模板匹配的算法。这种算法降低了用模板匹配法来进行处理的时间,因为并不是所有的像素点都会涉及到。该方法也克服了模板匹配法无法做到的对产生了形变的字符进行识别的问题。
利用对二值图像进行水平和垂直投影获得特征向量,把二进制的字符分割成3×3的像素块以获取特征向量,然后统计每个像素块中黑色像素的值。在对字符进行细化操作之后把二进制的字符分割成3×3的像素块并统计它们在0°、45°、90°和135°倾斜角时的像素个数以获取特征向量;首先沿着中心轴扫描字符,该中心轴是上限水平中心矩和下限水平中心矩的连接,然后由字符到背景转换的数量和他们之间的间距形成了每个字符的特征向量。该方法对字符产生旋转的情况一样有效,因为所获得的特征向量是一致的;利用采样的字符轮廓所得到的波形量化为特征向量。该方法可用于识别多字体和多尺寸的字符,因为字符的轮廓并不受字体和尺寸改变的影响。
5 结论及发展趋势
本文综述了当前现有的一些比较成熟的车牌识别算法,并根据其在每个阶段不同的特征对这些算法进行了分类。总之,由于车牌识别系统是计算机视觉和数字图像处理技术在智能交通领域的重要研究内容,因此它对于现代智能交通有着十分重要的意义。接下来,车牌识别技术的发展趋势将主要集中在多风格的车牌识别系统、基于摄像头拍摄的实时信息的车牌识别系统、多车牌同时进行处理的识别系统、高清晰度的车牌图像处理系统以及模糊字符的车牌识别系统等方向。
参考文献:
[1]Liu CY,Chang FL.A novel algorithm of license plates automation location based on texture feature[C].Proceedings of the IEEE International Conference on Automation and Logistics.China:Shenyang,2009:1360-1363.
[2]王涛,全书海.基于改进Sobel算子的车牌定位方法[J].微计算机信息,2008(05):312-314.
[3]Zheng DN,Tao YN.An efficient method of license plate location[J].Pattern Reconiton Letters,2005(26):2431-2438.
[4]C.-N.E.Anagnostopoulos,I.E. Anagnostopoulos,V.Loumos,and E.Kayafas.A license plate-recognition algorithm for intelligent transportation system applications[C].IEEE Trans.Intell.Trans.Syst.,2006:377-392.
[5]H.Caner,H.S.Gecim, and A.Z.Alkar.Efficient embedded neural-network-based license plate recognition system[C].IEEE Trans.Veh.Tech.,2008:2675-2683.
[6]H.Zhang,W.Jia,X.He,and Q.Wu.Learning-based license plate detection using global and local features[C].In Proc.Int.Conf.Pattern Recognit.,2006:1102-1105.
[7]陈锻生,谢志鹏,刘政凯.复杂背景下彩色图像提取与字符分割技术[J].小型计算机系统,2002(09):1144-1148.
[8]任仙怡,周晓,张桂林等.彩色汽车牌照定位[J].红外与激光工程,2002(03):204-207.
[9]Y.-Q.Yang,J.B.R.-L.Tian,and N. Liu. A vehicle license plate recognition system based on fixed color collocation[C].In Proc. Int. Conf. Mach.Learning Cybern.,2005:5394-5397.
[10]F.Wang,L.Man,B.Wang,Y.Xiao,W.Pan,and X.Lu.Fuzzy-based algorithm for color recognition of license plates[J].Pattern Recognit.Lett.,2008:1007-1020.
[11]C.Nelson Kennedy Babu and K. Nallaperumal.An efficient geometric feature based license plate localization and recognition[C].Int.J.Imaging Sci.Eng.,2008:189-194.
[12]D.Zheng,Y.Zhao,and J.Wang.An efficient method of license plate location[J].Pattern Recognit.Lett.,2005:2431-2438.
【关键词】FPGA,Sobel,Verilog;
在图像处理中边缘蕴含了丰富的信息,是图像的基本特征之一。边缘检测不仅能减少图像处理的工作量,还能保留图像中物体的形状特性。所以研究边缘检测是非常有必要的。FPGA是利用硬件编程语言对图像进行处理,可以同一时间处理大量的数据,在此利用FPGA的并行结构特性和流水线技巧,快速实现了Sobel边缘检测算法 。为图像的后续处理打下了基础。
一、Sobel边缘检测算法
边缘检测算法都是通过梯度算子来实现的。经典的梯度算子有Sobel、Kirsch、Roberts等。在求边缘的梯度时需要对每个像素点进行计算,工作量是比较大的。在这些算法中Sobel具有计算简单、检测效果好的特点,是一种被广泛应用的算法。Sobel算子是一阶导数的边缘算子。是利用水平和垂直方向上3X3的Sobel算子模版,与选定图像中同样大小的窗口中的每个像素点做卷积求和运算,窗口中心点为待求的像素点。计算出图像水平和垂直方向的梯度值,然后对水平和垂直方向的梯度值的平方求和,再开方。与设定的阈值进行比较,如果结果大于阈值边视为边缘点,否者就不是边缘点。
图1为水平方向的Sobel矩阵算子,图2为垂直方向的Sobel矩阵算子。图3为3X3模版的像素灰度值。
利用Sobel算子对图3中的3X3模版做卷积和计算。就可以得到p5像素处水平和垂直方向的梯度值Gx和Gy。最后利用
(1)
算出p5处的灰度值,再与设定的阈值进行比较。若大于阈值就视为边缘点,不然就是普通点。
二、Sobel边缘检测算法的硬件系统实现
(一)Sobel实现方法选择
由于Quartus II 9.0自带有很多的IP核,可以调用IP核进行乘法、并行相加来实现Sobel边缘检测。但是这样就会涉及到补码、负数等。实现方法较为复杂。在本文中提出一种简单的算法实现边缘检测,把复杂的问题简单化。
对于水平模版,把图3中的第1列和第3列像素点分别与其相应的位置做卷积和,并且分别取第1列和第3列的卷积和的绝对值比较大小,把较大值认为Gx。
Gx=max{(p1+2p4+p7),(p3+2p6+p9)} (2)
对于垂直模版,把图2中的第1行和第3行像素点分别与其对应的位置做卷积和,并分别取第1行和第3行的卷积和的绝对值比较大小,把较大值认为Gy。
Gy=max{(p1+2p2+p3),(p7+2p8+p9)} (3)
(二)Sobel的硬件实现
由于Sobel的实现需要3X3的像素模版与水平方向和垂直方向的卷积因子进行卷积求和,所以这里利用Quartus II 9.0自带的IP核Shift Register(RAM-based)构建三行以此为基础获得3X3的像素模版。如图4所示
图4 移位寄存器
在得到3X3模版后利用(2)、(3)进行硬件实现,关键代码如下
begin
Gy1
Gy2
Gy Gy2? Gy1-Gy2 : Gy2-Gy1;
end
begin
Gx1
Gx2
Gx Gx2?Gx1-Gx2 : Gx2-Gx1;
end
经过一系列运算就得到Gx与Gy,再根据公式(1)与自己设置的阈值,就能实现Sobel边缘检测。
三、实验结果
在视频采集系统里面加入Sobel边缘检测模块,编译并下载程序,运行系统,实验结果如图5所示。
实验效果显示可以很好的进行边缘检测,经过边缘检测处理后也为后续更复杂的图像处理打下了基础。
四、结束语
通过利用FPGA的并行特性,完成了3X3模版像素的提取和Sobel边缘检测算子的处理。通过FPGA的流水线结构和并行特点处理了大量的数据,最终实现了Sobel边缘检测。为更加复杂的图像处理进行了铺垫。
参考文献:
[1]冈撒雷斯.数字图像处理.北京:电子工业出版社.
[2]王涛,全书海.基于改进Sobel算子的车牌定位方法.微计算机信息,2008,24(5):63―65.
[3]夏宇闻.Verilog数字系统设计教程[M].北京:北京航空航天大学出版社,2003.
关键词:嵌入式系统;机器视觉;测控系统;图像跟踪
中图分类号:TP391.41文献标识码:A文章编号:1009-3044(2010)08-1987-02
1 概述
随着科学技术的发展,更高速,更可靠,更低成本成为各种技术开发的要求。因此,设计能实现实时视觉图像采集、视觉图像处理控制,使其结构更紧凑,甚至完全不需要计算机的介入,提高处理速度,并能有效降低成本的专用机器视觉控制系统,使得该系统具有安装方便、配置灵活、便于携带等突出优点。为此,本课题提出了基于嵌入式机器视觉测控系统的研究,在嵌入式系统上实现实时视觉图像采集、视觉图像处理及控制,构成处理速度快,成本低,结构紧凑,不需要计算机介入的专用嵌入式机器视觉测控系统。
2 系统总体设计
2.1 设计方案
目前,用于图像采集处理系统的嵌入式核心器件一般有FPGA、DSP和ARM芯片,出于成本控制与测控系统性能要求的考虑,这里选用FPGA方案。
FPGA内嵌的NiosII软核处理器是32位的,主要包括CPU微处理器、I/O中断、计时器、UART串口及大量通用寄存器。选用FPGA方案的优点在于,在单个芯片上既可以完成图像采集等复杂逻辑的控制,又可以用内嵌的NiosII处理器完成对图像的处理和识别,电路设计简单,成本低。
对于机器视觉测控系统,在选用了嵌入式处理器实现图像采集的功能之后,需要将视频图像进行数字化处理,这里采用标准工业摄像机+视频图像数字化模块的方法实现。标准工业摄像机的输出信号一般是PAL制式或NTSC制式的模拟信号,信号在进行数字图像处理前必须经过刀D转换,即视频采集。视频采集是整个系统中的一个重要组成部分,它是对模拟视频信号实现数字图像处理的第一个步骤。该方案具有通用性好、成本低的优点。
2.2 总体结构设计
1) 硬件设计
硬件设计包括系统硬件电路的连接和FPGA内部逻辑电路的设计。
FPGA内部逻辑电路的设计是以QuartusII为开发环境,用VHDL语言编程实现图像采集、SRAM总线切换等模块的功能,用SOPC Builder配置、产生NiosII软核处理器及必要的外设(用户自定义外设用VHDL编程实现),然后一起编译并下载到FPGA的配置芯片中,再由配置芯片完成对FPGA的上电配置,由此形成硬件逻辑电路的连接,实现图像采集、处理、存储、显示、实时控制等功能模块。
2) 软件设计
用SOPC Builder生成NiosII处理器系统的同时,也会生成相应的SDK软件开发包。在这个软件包的基础上,开发者可以利用NiosII IDE,移植嵌入式实时操作系统μc/OS-II,编写C或者C++程序来完成对图像的二值化、区域分割、特征提取、模式识别等处理过程,最终实现对目标轨迹的跟踪,实时控制机器人沿规定轨迹运行。
3 关键技术问题探讨
3.1 图像采集CCD模块设计
图像信息的获取就是捕捉待处理目标的图像信息并将其转换成适合一体机处理的数字信号,这一过程主要包括图像捕获、光电转换及数字化等几个步骤。目前图像信息获取可以使用CCD、CMOS、CIS等传感器,其中以CCD的应用最为广泛。
本设计模块采用1/3寸逐行扫描型黑白面阵CCD图像传感器ICX424AL。ICX424AL有效光敏单元为659×494,灵敏度高、暗电流小,带有电子快门。由三相垂直脉冲(V1、V2、V3)和两相水平脉冲(H1、H2)驱动工作,水平驱动时钟频率为24.154MHz,驱动电压5V。曝光之后,每一列成像势阱中的电荷在脉冲的驱动作用下被移至势阱旁的垂直寄存器当中,然后垂直驱动脉冲发挥作用,每次脉冲驱动垂直寄存器组中的像素电荷向下移一行,而此时最下面一行的像素电荷则被移动到水平寄存器当中。之后水平驱动脉冲发挥作用,脉冲驱动水平寄存器中的像素的电荷向输出口移动。被移出像素电荷,经过放大器后形成电压信号输出。水平寄存器被移空后,剩余电荷再次向下移一行,在水平驱动脉冲作用下,水平寄存器的电荷再次被依次移出。上述过程一直重复直至所有像素电荷被移出。
ICX424AL的驱动时序由CCD信号处理器AD9929产生。AD9929有一个三线式串行接的串行通信接口,通过该接口可以对AD9929时序发生器的相位寄存器组进行操作,发送配置信息或读取AD9929的工作状态。AD9929可直接与CCD传感器相连接,CCD像素模拟电压信号在AD9929驱动脉冲的作用下,由CCD_IN引脚输入到AD9929中,经模拟前端采样、放大和A/D转换后,产生8位的数字信号由DOUT[0-11]引脚输出,这些数字信号即为CCD图像传感器捕捉到的待测目标的原始图像信息。
3.2 图像实时跟踪算法设计
由CCD模块负责采集图像,那么嵌入式系统必须要有完善的图像跟踪算法,才能够实现智能机器人对目标的跟踪,传统的图像跟踪算法由于运算量较大而存在实时性较差的问题,因此,有必要对图像跟踪算法进行实时性优化设计。
目标图像跟踪是一个序列图像处理、识别和测量过程。在跟踪过程中,目标可能出现大小、形状、姿态等变化,加上实际环境中的各种干扰,以及图像处理最小计量单位的精度问题,相关跟踪得不到绝对最佳的匹配位置,存在测量误差。因此,为了保证跟踪的稳定性,需要对图像跟踪模板进行自适应更新。图像跟踪模板的更新是目标跟踪中要解决的重要问题之一,图像跟踪模板更新过快或过慢,都有可能丢失所跟踪的目标。判断图像跟踪模板是否需要更新要根据相关的置信度信号,如果相关匹配的置信度高,就可以根据本帧图像的匹配点处的坐标来更新图像跟踪模板;如果置信度低,则说明匹配不稳定,要沿用以前的匹配图像跟踪模板对下一帧进行相关匹配。
相关置信度信号是在分析相关匹配算法的基础上设计出来的,它是一个非常重要的参数。经过分析可知:若匹配点处的峰值很大,且峰值与其它非匹配点的均值之差越大,则表明跟踪越可靠。定义帧内相关置信度为:
式中:C0是帧内相关置信度;maxR是当前帧匹配点处的误差累加次数;R是同一帧内M个依次比maxR小的误差累加次数的均值,如果maxR和R相差越大,则说明该匹配点越可靠。本算法可根据计算速度的需要对M取值,一般可以取M等于20~100的任何值。若C0大于阈值T0,则认为相关匹配值maxR符合帧内置信度,更新图像跟踪模板;否则,相关匹配不可靠,不更新图像跟踪模板。阈值T0根据图像的质量和经验来确定,这里我们取T0=0.6。
实践证明,在序列图像跟踪过程中,若单纯地利用当前图像的最佳匹配位置处的图像跟踪模板作为依据进行下一帧图像的匹配,则跟踪结果很容易受某一帧发生突变的图像的影响而偏离正确位置。因此,本系统采用基于置信度的加权自适应模板修正算法:如果当前帧匹配质量很差,则该帧图像数据不进行修正;而若当前帧匹配质量很好,则该帧图像数据进行修正,加权修正算法表示如下式:
上式中,T(i,j,t)为当前帧使用的图像跟踪模板,O(i,j,t)为当前帧最佳匹配位置的子图像,T(i,j,t+1)为预测得到的下一帧图像坐标,α为加权系数(0≤α≤1),该系数的大小根据帧内相关置信度C0,按照下式计算:
4 结束语
本文在嵌入式系统与机器视觉控制系统的交叉点展开研究,目的是将具有重要意义的机器视觉控制系统应用到具有广泛基础的嵌入式系统平台上,拓展机器视觉的应用范围。通过对机器视觉控制系统及嵌入式系统设计方案的选择,并对基于嵌入式机器视觉控制系统的关键技术问题展开研究,以此为依据,设计了相应的硬件系统和软件系统,并将其应用到智能机器人视觉的控制上。
参考文献:
[1] 王耀南,李树涛,毛建旭.计算机图像处理与识别技术[M].北京:高等教育出版社,2001.
[2] 段峰,王耀南,雷晓峰.机器视觉技术及其应用综述[J].自动化博览,2002,19(3):59-61.
关键词:
匹配算法;图像匹配;关键技术;图像评价
中图分类号:
F49
文献标识码:A
文章编号:16723198(2013)21017602
1基本概念
图像匹配是指通过特定的某种算法在某待测图像或待测图像的子图中(也就是搜索图像)寻找目标图像(也称为模板图像)的过程。一般情况下,待测图像比较大,目标图像稍小。由于视角不同、拍摄器材不同等都会造成同一物体在不同时间的成像也是不同的,再加上噪声、旋转、干扰、图像预处理等对图像的影响,无形地扩大了搜索图像和目标图像之间的差异,从而增加了增加匹配难度。因此,如何极速地检测出目标图像在搜索图像中的准确位置仍是图像匹配研究人员的重要研究方向。
2关键技术
大量优秀的国内外学者都将自己的精力投入到图像匹配研究中,因此产生了海量的图像匹配算法。这些算法各有优劣,推动着图像匹配技术的发展。就这些算法来说,图像匹配技术的研究及算法主要包含以下四个方面:
(1)相似度。相似度是相似性度量的简称,主要用来衡量待测图像和目标图像之间的相似程度。目前使用较多的相似性度量主要有:最小距离度量、相关函数度量及概率度量这三种。最小度量主要包含:Hausdorff距离、AD(绝对差)、SD(平方差)、MAD(平均绝对差)及MSD(平均平方差)等;归一化互相关函数、协方差函数、积相关函数等是主要的相关函数;概率度量则是一种相似比,它是用后验概率来估算的目标图像与潜在待测子图间的相似度。
(2)特征空间。提取待测图像及目标图像的部分特征或是主要特征构成特征空间,然后通过对比特征空间进行匹配。所以,构建合理而恰当的特征空间不但能提高图像匹配速度,也能提升匹配精度。目前常用的图像特征主要有空间位置、点特征、图像边缘、纹理、颜色形状等。
(3)搜索策略。搜索策略的优劣直接影响图像匹配的精度及速度。目前使用的搜索算法比较多也比较复杂,有单一的某种搜索算法,也有融合了几种算法的搜索算法,还有一些是基于基本算法的改进算法。常用的基本搜索算法有遗传算法、粒子群优化算法、金字塔分层搜索法、鱼群算法等。
(4)搜索空间。待测图像中所有的可能位置和变换后可能的匹配位置共同构成图像匹配的搜索空间。因此,为了缩短匹配时间,应尽量缩小搜索空间。
相似性度量函数和特征空间的选择主要影响匹配精度和算法的抗噪性及抗干扰能力。而搜索策略和搜索空间则将直接影响算法的匹配速度。
3匹配评价
目前,图像匹配算法缺乏通用性,算法的好坏也没有统一的标准。我们一般主要从以下四个方面来评价图像匹配算的性能:
(1)匹配概率。正确匹配的次数与总匹配次数之间的比值就是匹配概率,它基于统计学的概率统计。一般情况下,我们应该把算法的错误匹配率限定在一个比较小的特定精度范围内,也就是说我应该尽量提升算法的正确匹配概率。匹配概率高低的主要影响因素有提取到的图像特征空间、匹配算法和匹配精度。提取的图像特征细而且密集,那么匹配概率则较高,但图像变换这缓慢,匹配较慢。匹配算法也会影响匹配概率,有些极端的匹配算法也会导致匹配概率接近零。
匹配概率=正确匹配次数总匹配次数
(2)匹配精度。匹配的准确性就被称为匹配精度。匹配精度的计算方法有多种,我们一般用匹配误差的均方差来表示:均方差小,则匹配位置误差小,匹配精度高;反之匹配精度低。匹配误差是指匹配算法得到的匹配位置和目标图像在待测图像中的真实位置之间的偏差。匹配精度的影响因素很多,主要有噪声污染、干扰、变形、算法选择、适应度函数构造等。
(3)匹配速度。图像的匹配速度是指匹配的时间。主要由匹配算法的本身计算量和算法的结构两部分决定。算法的本身计算量等于相似性计算量乘以待检测的匹配点。所以相似性计算简单,且待检测点少,那么相应的匹配时间久短。算法的结构主要是指算法是并行还是串行算法,并行能较大程度的提升匹配速度,但是并行算法的实现不但与算法本身设计有关,还需要相应的硬件支持才能运行。虽然如此,现在已经有很多学者已投身于基于并行算法的分布式图像匹配系统研究中了。
(4)鲁棒性及通用性。实际应用中,待测图像一般都是有噪声或是干扰等,这就要求匹配算法具有较强的抗干扰和除噪能力,这就是算法鲁棒性。目前,没有一种图像匹配算法能适用于所有的图像匹配,但是我们都希望匹配算法能尽量适合于更多的匹配需求。所以应尽可能提高算法的通用性。所以鲁棒性和通用性不是匹配算法质量最主要的评价标准。
4结束语
图像匹配虽然起步较晚,发展较快,已经在理论和实践上取得了很大发展,但它依然存在很多问题。比如相似度函数的设计或是选择,图像特征的提取,算法的构造等仍有很大的改进空间。我们仍在为设计出有强通用性、高匹配精度、高匹配概率、匹配速度快、强鲁棒性的匹配算法而努力。
参考文献
[1]戴涛,朱长仁,胡树平.图像匹配技术综述[J].数字技术与应用,2012:174176.
[2]蒋大林,李林.图像匹配技术研究[C].计算机技术与应用进展,2008.
[3]卜凡艳.数字图像匹配技术研究[D].合肥:合肥工业大学,2010.
[4]王宏力.贾万波.图像匹配算法研究综述[J].计算机技术与应用进展,2008:418422.
[5]刘锦峰.图像模板匹配快速算法研究[D].广州:中山大学,2007,(5).
[6]Wu Gang, Wu Chun-feng.Target Location Method Based on Invariable Moment Feature Matching[J].Optics Precision Engineering, 2009,17(2):460468.
关键词:沥青混合料,细观力学,数值模拟,损伤力学
中图分类号:TV431文献标识码: A 文章编号:
0引言
复合材料力学研究具有宏细观两个层次。传统的宏观力学方法从唯象学的观点出发,将复合材料当作宏观均匀介质,视增强相和基体为一体,不考虑组分相的相互影响,仅考虑复合材料的平均表现性能。宏观力学分析方法忽略了复合材料的细观结构特点,没有考虑复合材料的细观破坏形态,因此,难以反映深层次的物理机制。而细观力学的核心任务是建立复合材料宏观性能与其组分性能及其细观结构之间的定量关系,揭示材料及结构在一定工况下的响应规律及其本质。细观力学在复合材料宏观弹性性能预测、弹塑性变形、损伤破坏分析等方面具有宏观力学无可比拟的优势。因此,越来越多的研究者投身于复合材料细观力学的研究。沥青混合料作为道路工程界的一种重要复合材料,其细观力学的研究自然广受业内研究工作者的重视。
1沥青混合料的细观力学研究
沥青混合料是具有复杂结构的非均质、多相(气相、液相、固相)和多层次(微观、细观、宏观)的复合材料体系,其宏观行为所表现出的不规则性、不确定性、模糊性、非线性等特征,正是其细观结构复杂性的反映。
细观力学认为,通过电镜观察到一个画面或用其它方法确定一个典型的细观单元,比如通过力学模型对所有组成整体的各单元的性质作统计分析后得到,或通过力学试验直接测量得到。如果一个细观单元总的几何特性,如增强体的体分比、增强体分布的概率统计值(一次矩阵、二次矩阵)都为常数,且与细观单元的位置无关,则称为一个代表体元。通过代表体元的均匀边界条件所形成的统计均匀场的分析,得到代表体元的平均应力和应变特性。由于代表体元的普遍性,故可推求得沥青混合料的宏观应变和应力,从而推求出沥青混合料的宏观性能。
1.1沥青混合料细观力学研究的主要内容
目前,沥青混合料细观力学研究的主要内容包括:
1)沥青混合料体积特征的研究
沥青混合料体积特征的研究首先是对粗集料的形态特征分析,比如粗集料的周长、直径、针状质量分数和长轴取向等;然后是沥青混合料的组成特性研究,如沥青混合料的空隙率、级配组成状况和离析状况等。对沥青混合料组成特性的研究,可以更为方便、直观地了解沥青混合料内部结构的空间分布、初始损伤,同时也使原先的定性观察研究转为定量计算研究,其研究成果能更好的指导工程实践。但是,沥青混合料体积特征的研究亦存在以下局限性:
目前的混合料内部细观研究多是二维识别与分析。因为不能完全考虑集料、胶浆及空隙的三维体积特征,所以在考虑某个单元体时,具有一定的随机性与变异性;由于检测设备、数据处理系统的软硬件的限制,沥青混合料细观结构研究仍处于理论研究阶段;研究沥青混合料的级配特征时,集料的二维面积级配与三维体积级配间存在差异。
2)沥青混合料试件动态加载时的内部结构研究
在静态研究沥青混合料内部结构形态、尺寸和分布等体积特征的基础上,对沥青混合料试件在动态加载时内部结构的变化做定量研究。台湾国立成功大学黄隆升[1]运用数字图像技术对不同类型沥青混合料的粗集料在高温碾压状态下的行为轨迹进行了定量分析,分析不同级配类型对高温抗车辙能力的影响效应。华南理工大学李晓军[2]利用CT技术对SGC成型的沥青混合料试件在动态加载状态下的内部损伤行为进行了实时测量,结果令人满意。 Hartman A M[3]等运用数字图像技术,分析沥青混合料小梁四分点试验的疲劳性能,通过图像采集系统,研究实时加载过程中小梁的变形及破坏特征,并采用了数字图像与内置位移传感器相结合的对比分析方法,二者结果吻合度较高。
1.2沥青混合料细观力学研究的实现手段
目前,研究人员主要采用以下两种方法来获取沥青混合料的细观结构信息[4].
1)X-ray CT无损伤扫描
利用CT技术对沥青混合料试件内部细观结构进行扫描研究的特点主要是:成像精度较高,在研究沥青混合料时间内部细观结构时,宜采用工业CT。比如俄罗斯生产的BT500型工业CT机,其最大工作电压为450kV,检测的几何灵敏度可达到0.05mm,成像的图片为100×像素;在检测中,不会破坏样品的整体性,同时可多次对试件的不同层面(包括横向与纵向)重复扫描。
2)CCD数码相机拍照
采用数码相机拍照技术对沥青混合料结构进行识别与分析时,主要是利用各种材料具有不同的色彩来区分。从沥青混合料色彩来看,集料呈现为灰色或者白色,沥青胶浆接近黑色,而空隙通常为深黑色。
在数码拍照前,需要将沥青混合料时间按指定位置切开,获取其内部细观结构信息。通常情况下,集料颗粒的边缘在切割时容易发生松散破碎,出现许多松散连接的颗粒群,边缘模糊。宜将沥青混合料试件在零下五摄氏度冷液中冷冻约两小时,然后再进行切割,集料边缘松散状况可得到显著改善。
沥青混合料细观结构的重构是进行细观力学分析的基础。随着数字化技术的发展,又出现了一系列新的细观结构信息收集方式,比如X断层扫描、数字扫描、磁共振(或核磁共振)、视频图像以及数字图像处理技术[5]等。
2沥青混合料细观力学的数值模拟方法
随着检测技术的不断发展,越来越多的学者致力于研究沥青混合料内部细观结构与外部宏观力学性能之间的关系。目前,道路沥青混合料内部结构细观力学模拟[6]的主要方法包括以下三种:
1)离散元法
离散元法是近30多年来发展起来的用于解决非连续介质力学的数值方法,其基本特征在于允许单元体发生有限的位移和旋转,在计算过程中能够自动识别各个离散块体的平动、转动,甚至分离和接触的重新生成,弥补了有限元法或边界元法的介质连续和小变形的限制,而且离散元法无须满足位移连续和变形协调的条件,认为大变形行为是各单元作为独立个体运动和变形的宏观显现,因此离散单元法尤其适用于大变形和旋转等非连续介质模型的宏观和细观力学问题的分析,已经较为成功地运用于解决岩石解理、边坡滑落和采矿等方面的研究。离散元法在沥青混合料内部结构性能的模拟中也得到了应用。
2)有限元法
有限元法是应用最早也是应用最广泛的数值计算方法,在沥青混合料细观结构的分析中,Sepehr较早的采用有限元法模拟沥青混合料的微观结构;Sadi Kose 结合数字图像技术和有限元法计算了混合料中沥青胶质应变的分布:Papagiannakis利用相应的图形软件分析沥青混合料的数码图像特征后,采用有限元法对混合料直剪试验的应变特性进行数值模拟;Masad E等也均采用有限元法对沥青混合料内部结构与外部宏观力学性能间的关系进行了数值模拟。目前应用有限元建模方法对沥青混合料的微细观结构进行力学分析,可以精确地建立集料与沥青胶浆的几何微细观结构模型。
3)边界元法
边界元法是近50年来发展起来的一种数值方法。Soranakom C [7]等采用边界元法对沥青混合料细观结构强度及其变形特征进行二维数值模拟,结果表明:边界元法能够较好的描述沥青混合料内部裂纹的产生、发展及其在混合料内部的分布情况。
3沥青混合料的细观损伤
沥青混合料材料的细观损伤是指在外荷载或环境变化的条件下,由于体内细观尺度的微缺陷如微裂纹、微孔洞等在荷载、温度或环境效应等因素持续作用下,产生弥散裂缝并进一步增长、扩展、汇合,形成一定尺度的宏观裂纹,导致结构的强度、刚度下降,以致最终发生破坏。由试验分析得知,细观上沥青混合料的本构关系表现为弹脆性,微裂缝起裂和扩展表现为张拉形,宏观上的剪切带是已经扩展的细观微裂缝网络变形、错动的结果。因此,可以采用弹性损伤本构关系来表达细观单元的力学性质。基于细观损伤的本构模型常用的有:美国西北大学Bazant教授于1985年提出的微平面模型(micro plane model)、二维格构模型、随机粒子模型和基于弹性损伤本构关系的细观结构模型等。
4结语
沥青混合料是具有复杂结构的非均质的多层次(微观、细观、宏观)复合材料体系,其宏观行为在很大程度上受其复杂的内部细观结构影响。因此,为了真正、全面地分析研究沥青混合料的力学性能,应该从细观角度入手,进行基于细观的沥青混合料力学性能的研究,并且将细观和宏观的方法结合起来。
参考文献:
[1]黄隆升.沥青混凝土巨观车辙及微观轨迹之行为机制分析[D].台南:成功大学,2003.
[2]李晓军,张肖宁.CT技术在沥青胶结颗粒材料内部结构分析中的应用[J].公路交通科技,2005,22(2):14-16.
[3]Hartman A M, Gilehrist M D. Evaluating four-point bend fatigue of asphalt mix using image analysis[J]. Journal of Materials in Civil Engineering, 2004, 16(1): 60-68.
[4]汪海年,郝培文.沥青混合料微细观结构的研究进展[J].长安大学学报(自然科学版),2008,28(3):11-15.
[5]张蕾,王哲人.应用数字图像处理技术研究沥青混合料微细观结构方法综述究进展[J].中外公路,2008,28(3):168-171.
关键词:遥感图像;纹理特征;灰度共生矩阵法
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)09-2216-03
1 图像特征分析
图像最基本属性称为图像特征,它是图像内部最反映图像本质的信息,图像特征可以根据图像所具有的色度、亮度、边缘值、纹理或结构等划分为多种类别,整个图像在各个方面的属性都得到了反映。这几种特征主要分为统计特征(比如图像的均值、方差、直方图等)、幅值特征(比如图像像素的灰度值、频谱值等表示的幅值特征)、变换系数特征、边界特征、拓扑特征以及纹理特征。
下面对其中几种重要的特征做出详细的描述:
1)变换系数特征:亮度图像决定于变换域系数,它和原空间域图像是相同的,都同时具有唯一性的变化,所以其变换系数可以称为一种图像特征。
2)边界特征:包括了亮度边界点和噪声点。图像中的亮度边界点是指利用灰度及三色值来表示的在一幅没有噪声的图像中亮度突变或断续的点。噪声点和周围的像素比较起来也是具有灰度突变的性质,不过它是单独的随机点。
3)纹理特征:纹理特征在所有图像特征的种类中是一种相当重要的特征,它反映了图像或物体本身的属性。例如对遥感图像的分析和解译,最根本的依据就是波谱信息和空间信息两个方面的数据,即灰度和纹理信息。以前对图像的波谱信息的使用是最频繁的,随着卫星遥感图像信息处理的技术不断的提高和发展,单利用波谱信息早已适应不了遥感应用技术的发展需要。譬如,在地质学的角度来看,岩石受含水性或其他因素的影响,它的波谱信息显示的非常杂乱而且没有可循的规律性,但是纹理反映的信息是与岩石的类型有紧密的关系,它详细地描述了岩石表面的粗糙度和岩石的影文结构,所以纹理信息有助于我们将两种不同的物体区别开来,对岩石识别有必要的辅助作用。
2 纹理特征分析
目前对纹理准确的概念在业界还没有统一的标准性定义。我们把图像的像素灰度级或颜色相关的变化指定为图像纹理的一般描述。序列是按照某种特定的规律排列的基本部分所构成的;在某种序列范围之外,其局部的序列信息是不断的重复出现的;各基本部分在纹理范围内的所有地方都是具有几乎相同的结构大小,并且基本都是均匀的统一体。我们将这个系列的基本部分一般命名为纹理基元,纹理基元是一种或多种有特定形状大小的图像基元的组合,所以纹理也可以认为是由纹理基元按照一种特定的统计规律排列,或是按照某种确定的规律组合而成的,我们把前者称为随机性纹理,将后者称为确定性纹理。
纹理在图像中有很多特性,通常表现为疏密性、均一性、周期性、平滑性、粗糙性和复杂程度,特别的还有纹理基元或灰度空间组合的某些特征,如频率、强弱的程度以及方向性会在一个区域内重复地出现,这些特性的改变能深刻的影响图像的质量,使图像的外观产生非常大的改变。粗糙程度和局部的灰度变化与空间中的重复周期是相关的,长周期和低频率的是粗纹理,短周期的是细纹理。对纹理进行描述的参量有很多方面,包括纹理的密度、强度、方向和纹理的粗糙程度等。此外,纹理是二维的,只有一个点是无法描述纹理特征的,所以对纹理进行计算需要选择窗口。
分析纹理的方法一般概括为两类:一种是统计纹理分析法;另一种是结构纹理分析法。基于事物的构成不同,并且空间分布也具有很强的多样性和复杂性等原因,遥感图像的纹理并不拥有规则不变的局部模式和简单的周期重复,它的纹理信息和周期重复只是建立在统计学理论基础之上的,这样遥感图像纹理分析主要采用的是统计纹理分析方法,而结构分析方法在遥感图像中的应用所得到的结果没有用统计纹理分析方法的效果好。
3 空间灰度共生矩阵法
对于纹理图像的特征分析和提取方法是多种多样的,其中一种常用而且非常有效的统计特征提取方法就是空间灰度共生矩阵法。空间灰度共生矩阵主要表示的是在图像中某两个像素在相同方向且不同位置上出现的概率的大小,这种方法的使用是在图像灰度的二阶统计特性的基础之上的。
1)灰度共生矩阵的定义
在图像中任取两个像素点[x1,y1]和[x2,y2],设他们之间的距离为[d],并分别设[i]和[j]为两点对应的灰度值。由下图可知,根据给定的距离[d],与像素点[x1,y1]对应的有不在图像边界上的8个相邻的点[x2,y2],于是我们若对图像进行统计就可以选择[θ=0?]、[θ=45?]、[θ=90?]和[θ=135?]这四个不同方向的角度,如图1所示。
在这四个角度上我们可以得到四个灰度共生矩阵:[P0?]、[P45?]、[P90?]和[P135?],它们的含义可理解为与灰度是[i]的点[x1,y1]相距达到[d]的长度且灰度达到[j]的点[x2,y2]能够出现的概率,即:
由此我们可知灰度共生矩阵法实际上就是关于对称矩阵中相邻基元之间的距离和角度的函数,即[Pi,j=Pj,i]。我们通过一个简单的例子来体会下灰度共生矩阵的作用:有一幅数字图像是[4×4]个四灰度级的,假设当[d=1]时通过计算得到的空间灰度共生矩阵,其中公式(1)表示的是灰度级为[0-3]的[4×4]图像,公式(2)-(5)分别表示的是当[d=1]时四个角度的共生矩阵。
我们在分析图像时,灰度共生矩阵只要确定下来,图像的方向模式就可以通过分析提取的图像特征[P0?]、[P45?]、[P90?]和[P135?]的大小来得到,特别强调的是[d]和[θ]是决定这些特征的关键。比如说,若使空间灰度共生矩阵趋于均匀分布,纹理要细并且是不规则的,[d]的取值要比纹理基元大,此时像素对的灰度值通常才会有大的差别;如果空间灰度共生矩阵趋于对角分布,纹理需要是粗糙且规则的,当[d]的取值比较小时,像素对灰度值才会相似。我们可以得出,分析纹理的粗糙度需要通过计算矩阵中根据不同的[d]值决定的元素,并且要计算元素关于主对角线的离散程度才能达到分析纹理的目的。
4 结束语
在纹理有方向的情况下,通过比较矩阵值随[θ]变化的分散程度就能够分析纹理的方向性,这样也可以达到纹理分析的目的,因为空间灰度共生矩阵对角线上的值是随[θ]变化而变化的。由此可得,直观地反映纹理图像的某些特性是灰度共生矩阵的一大特色,而且它拥有恰好满足人类视觉特性需求的统计方法,所以提取特征分析纹理的方法中比较简单实用的就是空间灰度共生矩阵法。
参考文献:
[1] 何东健,耿楠,张义宽.数字图像处理[M].西安:西安电子科技大学出版社,2003(7):213-218.
[2] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图像图形学报,2009(4).
[3] 阮秋琦.数字图像处理学[M].北京:电子工业出版社,2010.
关键词:压缩感知;低速采样;图像压缩
中图分类号:TN919 文献标识码:A 文章编号:1009-3044(2010)04-0958-02
A Primary Research on Compressed Sensing Based Image Compression
ZHANG Rui
(Southwest Jiaotong University, Chengdu 610031, China)
Abstract: The Nyquist law is applied to all the conventional compression coding algorithms, which prescribes that the sampling rate must be at least as twice as the signal frequency. As this algorithm leads to enormous calculation and resource waste, compressed sensing could be applied to image compression to reduce the account the sampling rate, several experiments are presented.
Key words: compressed sensing; low-speed sampling; image compression
如今,人们对信息的需求与日俱增。在人从外界获得的信息中,大部分是视觉信息。而图像以其生动直观的特点以及包含的丰富信息,成为人们获得信息的主要工具。然而巨大的数据量给图像的传输和存储带来了极大的不便,图像压缩技术显得尤为重要[1-3]。然而,在传统的压缩技术中采样遵循奈奎斯特定律,依据该定律,为了不破坏或丢失信号信息,采样速率要高于原信号频率的两倍。传统的压缩模式是,先对信号进行高速采样,得到大量采样值,进行变换得到大量的系数,在编码时又删减了大部分的系数只提取少量的包含重要信息的作为有效值,对有效值及其定位信息进行编码,这个过程浪费了大量的采样资源,加大了计算复杂度,也造成了不必要的内存浪费。近年来,Donoho等人提出了一种新颖的理论――压缩感知理论[4-8],在该理论中,采样速率不再决定于信号的带宽,而决定于信息在信号中的结构和内容。基于压缩感知理论,信号可进行低速采样,然后进行编码,这大大降低了计算复杂度。本文着重对基于压缩感知理论的图像压缩编码进行探讨,并进行了实验仿真。
1 压缩感知理论介绍
假定长度为n的信号X,在空间基Ψ上的具有表达式X=Ψ,其中系数向量中只有K个非零值,则称X为K-稀疏信号。压缩感知理论指出,将稀疏信号投影到一个随机矩阵上得到少量的投影值,该投影矩阵与稀疏基Ψ不相关,根据这些投影值即可高概率恢复信号,以此实现了对信号的低速采样。即若存在一个与Ψ不相关的M*N的变换基Φ,M
理论证明,基于压缩感知重建信号时,要提高重建图像的质量,包括两方面的主要工作:1)构造测量矩阵Φ,保证图像投影时能尽可能多地把结构信息等投影在测量矩阵上,信息越完整重建图像的质量越好;2)选定图像具有稀疏表达的稀疏基Ψ[4-8],Φ与Ψ越不相关,图像重建质量越好。
图1为仿真实验结果,实验中采用256*256的Lena图像,采用CS理论进行抽样后重建的图像,选取了25000个测量值。
2 压缩感知理论应用于图像压缩
2.1 图像压缩概况
1948年电视信号数字化的概念提出以后,对图像压缩编码技术的研究工作就开始了,至今已经有60多年的历史。图像压缩编码技术经历了两代,第一代如基于DCT变换的技术,在压缩比较大时会出现方块效应,第二代以基于小波变换的压缩算法最具代表性,小波变换本身并不具备压缩性能,小波变换后获得的数据量与原图的数据量是相等的,经过适当的量化和编码后才能实现压缩。但是这些方法都是先对图像进行高速采样,在压缩编码时再去除冗余的方法,计算量巨大。
2.2 基于压缩感知理论的图像压缩
压缩感知理论一经提出,就受到了广泛的关注,该理论不断被应用到数字图像处理中。
如前所述,在传统的图像压缩算法中,都是先对图像进行高速采样,即进行变换后得到大量变换系数,但是为了实现图像压缩又选取其中一小部分系数,称作有效值,扔掉大部分的系数,对有效值及其位置信息等进行压缩编码后再进行传输或存储。而采用压缩感知理论进行抽样时,可以直接对图像进行随机抽样,只得到少量的抽样值,对抽样值进行量化编码即可进行传输或存储,不必记录每个有效值的位置信息并对其进行编码,这大大降低了计算复杂度,也避免了不必要的空间浪费,最重要的是实现了低速采样。流程图如图2。仿真实验中采用了Huffman编码算法,分别选取了10K、25K、20K、25K个测量值,实验结果如表1,解码重建图像如图3。由实验数据可知将压缩感知理论应用于图像压缩是一项可行的技术,通过改进算法即可获得优良的压缩性能。
3 结束语
由初步的仿真实验结果可知,如果能构造适合的投影矩阵,在少量投影值中包含足够的原信号信息,即可高概率重建信号。构造更适合的投影矩阵,将是接下来的主要研究内容。
参考文献:
[1] 覃凤清.数字图像压缩综述[J].宜宾学院学报,2006(6).
[2] 喻玲春,谢小春.压缩感知理论简介[J].数字视频,2008,32(12).
[3] 石光明,刘丹华,高大化,等.压缩感知理论及其研究进展[J].电子学报,2009(5).
[4] David pressed sensing[J].IEEE Trans on Information Theory.2006,52(4):1289-1306.
[5] Emmanuel Candèpressive sampling[A].International Congress of Mathematics[C].Madrid,Spain,2006(3):1433-1452.
[6] Emmanuel Candès,Justin Romberg,Terence Tao.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J]. IEEE Trans on Information Theory,2006,52(2):489-509.
[7] Emmanuel Candès,Justin Romberg.Quantitative robust uncertainty principles and optimally sparse decompositions[J].Foundations of Comput.Math..2006,6(2):227-254.
[8] Emmanuel Candès,Justin Romberg.Practical signal recovery from random projection[EB/OL].acm.caltech.edu/emmanuel/papers/PracticalRecovery.pdf.
[9] Justin Romberg.Imaging via compressive sampling[J].IEEE SIGNAL PROCESSING MAGZINE,2008(3).