前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的模式识别技术主题范文,仅供参考,欢迎阅读并收藏。
关键词:模式识别;语音识别;交互式语音应答;司法社区矫正
中图分类号:TP391.41 文献标识码:A
Abstract:Systematic research was done on the specific algorithm for speech recognition in using genetic algorithm to train continuous hidden Markov mode. Then the detailed design of Voiceprint Recognition System of Community Correction Objects in the Shenzhen City Bureau of Justice has been done based on the speech recognition technology. The system running results show that the recognition rate of recognition algorithm using genetic algorithm to train continuous hidden Markov model is faster and has a higher rate of recognition. Construction of voiceprint recognition system of judicial community correction objects based on pattern recognition is still in the junior stage in our judicial system, and promotion and the construction of voiceprint recognition system of judicial community correction objects have the important practical significance.
Key words:pattern recognition;speech recognition;interactive voice response;judicial community correction
1 利用基因算法训练连续隐马尔柯夫模型的语音识别以及具体算法
作为模式识别重要应用之一的语音识别技术所涉及的领域包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。
隐马尔柯夫模型(Hidden Markov Model,HMM)方法是二十世纪70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破,现已成为语音识别的主流技术[1-4] ,该方法在语音识别时识别速度较快,也有较高的识别率。目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。可见HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型。
在HMM(隐马尔柯夫模型)中,分为离散HMM(DHMM)和连续HMM(CHMM)。由于CHMM直接以帧语音特征向量本身为观测序列,而不是像DHMM那样先将语音特征向量经矢量量化为观测符号,因此CHMM有优于DHMM的识别精度。然而,由于CHMM参数多,传统的训练方法采用迭代法,先假设初始值,用语音信号的观测序列对该初始值进行训练,也即按照一定的方法对这些估值进行提纯,对提纯了的估值要接着进一步的提纯,直到再没有改进的余地,达到某个局部最佳值为止。传统的训练方法不保证训练得到全域最优解,而且训练所需要的时间非常巨大。
本文侧重地研究了基因算法[5],并按照CHMM的特点构造染色体,用基因算法对CHMM进行训练。基因算法自身的特点使得训练结果趋向于全域最优解。同时,由于只需要用Viterbi算法计算语音的观测序列对某一CHMM模型的相关概率,用作基因算法的适应函数,故该算法可以提高CHMM的训练速度。
基因是生物学概念,之所以将基因算法引入HMM的训练中,是因为HMM的训练过程实际上是一个在特定范围内将HMM模型进行一次次的迭代提纯,选择最优模型的过程。将基因算法引入CHMM的训练,就是基于将CHMM看作在特定域的有约束的寻找最佳匹配点的问题。CHMM的状态转移矩阵A和输出概率密度函数中的混合系数c矩阵的每一行向量之和为1.0,可看作是优化问题的约束条件。如果在选取CHMM的初始值时,不是选取一个初始值,而是选取一组分布于不同区域的初始值,以某一种特定的训练方法,使其趋向于全域最优解,那么最终也同样可以完成对CHMM的训练。
根据待优化问题的数学模型,定义适合函数F(ai)。其中ai是某一条染色体,则适合函数F(ai)就是该染色体与目标函数的距离,或是判断该染色体优劣的依据。对每一代基因,计算所有染色体的适合函数,进行排序选择一定数目较优秀的染色体,作为生成下一代基因的父代样本。自然界中染色体成对出现,时一对染色体分离、重组。多点交叉在实现时,可以设定交叉概率门限为ρc。染色体的长度为L,对于随机数0≤rj≤1 (j=1,2,…,L),如果rj≥ρc,那么下一个变量属于另一条基因,否则下一个变量与前一个变量属于同一条基因。
最佳基因是在一代一代的基因重组和基因突变中形成的,是在选择的作用下最适应的个体。基因突变有利于从局部最佳处跳出,防止算法的过早收敛。设定突变概率门限为ρm,对于随机数0≤rj≤1 (j=1,2,…,L),如果rj≤ρm,那么染色体中第j个变量有突变现象发生;否则,复制原染色体的第j个变量。
基因算法的具体实现步骤参考文献[5]。
HMM是用一个有限状态系统作为语音特征参数的生成模型,每个状态能产生连续的输出特征。HMM实际上是一个特征参数发生器,依据其产生的参数与观察到的语音参数的比较,从而识别语音。在识别时的判决依据是HMM模型的生成概率。
在将基因算法引入CHMM训练的过程中,首先要解决的是染色体的构造问题。将CHMM模型的所有关键特征参数排列成一串,构成染色体。对于语音识别,采用自左向右的HMM模型,本文中为5状态自左向右只含一阶跳转的CHMM模型。CHMM模型中参数由初始状态向量π,状态转移矩阵A和每个状态的输出概率密度函数组成。
在CHMM模型中,染色体前一部分的行向量之和均为1。也就要求在产生染色体时,需对其进行一定的控制。在生成每一代染色体时,对这一部分行向量所对应的每一段染色体进行归一化,则可以满足CHMM的约束条件。
Viterbi算法在通常的CHMM语音识别中是作为识别算法的,换句话说,使观测序列与CHMM模型经Viterbi算法的运算结果最大即为优化目标。基于这样的思想,基因算法的适合函数为:所有该CHMM对应的观测序列用Viterbi算法求其观测概率之和,运算结果越大,则该染色体越优秀。
在实验中染色体的前一部分依概率进行二点或多点交叉,而后一部分染色体只进行多点交叉,多点交叉概率ρc=0.8。染色体前一段的基因突变概率ρm=0.1;而对于染色体的后一部分,取ρm1=0.01,对应于以一个参数为单位发生基因突变;ρm2=0.08,以行向量为单位发生基因突变。经基因交叉或基因突变后,对染色体的前一部分需要进行各行向量的归一化处理。每一代基因的数目为300,从中选出60条优秀的染色体作为新的父代基因,经基因重组和基因突变生成240条染色体,共同组成新一代染色体。CHMM模型的训练问题现已转化为求其对观测序列适应概率最大值的问题,用基因算法求解。
训练数据取自博域通讯一体化呼叫中心平台产品BYICC2.0的IVR服务器在实际商业运行中产生的WAV录音文件2000个。
2 利用基因算法训练连续隐马尔柯夫模型的语音识别技术在深圳市司法局社区矫正声纹识别系统中的应用介绍
2.1 司法社区矫正的需求背景以及存在问题
司法社区矫正,是指将社区矫正对象置于社区内,由专门的国家机关负责并组织社会力量对其采取监督管理、教育、帮助措施,矫正其犯罪心理和行为恶习,促进其顺利回归社会的非监禁刑罚执行活动。尽管目前我国社区矫正工作中较普遍地应用了信息化管理手段,根据社区矫正的刑罚执行性质和非监禁特征,各地积极探索运用手机定位等现代科技手段加强对社区矫正人员的实时监管,具体的监管手段包含:手机实时定位监控、电子地图越界告警、人机分离抽查等。现阶段,很多司法社区矫正工作中应用到了诸如手机实时定位监控等高科技手段来实现对社区矫正人员的监控,但在具体操作中仍然存在一些问题和障碍,主要在现有手机定位监控的技术下,难以有效控制人为出现的“人机分离”现象。现有“人机分离”抽查手段主要有:电话抽查、短信抽查、拍照抽查等。虽然一定程度上降低了矫正对象“人机分离”的风险,但这些抽查手段皆无法确保是否为矫正对象本人,有脱管、漏管的可能性。
正是基于以上原因,博域通讯推出的社区矫正声纹识别系统的主要功能是通过远程电话录音来对社区矫正人员进行身份认证,结合手机定位监控系统,促进社区矫正工作向合理化、人性化、智能化、效率化方向发展,推动社区矫正信息化建设,并有效破解移动定位监管“人机分离”的难题。
2.2 深圳市司法局社区矫正声纹识别系统设计
2.2.1 系统应用体系架构
社区矫正声纹识别方案中,包括声纹识别系统、IVR自动语音服务系统并结合现有的手机定位系统以及后台管理系统,同时,声纹识别服务也涉及到了数据库服务器之间的数据通信。
2.2.2 系统网络架构
被矫正人员通过拨打固定电话号码接入社区矫正声纹识别系统,由内置电话语音板卡的IVR服务器将采集到的客户语音,并通过调用声纹服务器提供的接口函数与声纹识别服务器进行交互。声纹服务器将识别的结果反馈给IVR服务器以便进行相应的IVR语音流程控制,同时,社区矫正声纹识别系统将被矫正人员的声纹身份识别结果反馈给手机定位系统。其网络拓扑结构图如图3所示。
2.2.3 系统业务流程
深圳市司法局社区矫正声纹识别系统与现有手机定位系统结合后的主要业务流程如下图:
2.2.4 系统运行结果主要指标
利用基因算法训练连续隐马尔柯夫模型的语音识别的司法社区矫正声纹识别系统已于2014年1月在深圳市司法局上线投入运行。
声纹识别技术在实际应用中,会根据说话人识别内容的不同分为文本相关验证和文本无关验证。深圳市司法局社区矫正声纹识别系统,支持这两种方式的验证,根据实际工作和业务的需要,用户可以选择适合自己的声纹验证方式。
同时,与手机实时定位监控、电子地图越界告警、电话抽查、短信抽查等传统监管手段相比较,语音识别技术有效地控制了司法社区矫正中人为出现的“人机分离”现象。
3 结束语
模式识别从20世纪20年展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。基于模式识别技术的司法社区矫正声纹识别系统能够有效地破解移动定位监管“人机分离”的难题,其建设工作在我国司法系统目前尚处于起步阶段,推广和建设司法社区矫正声纹识别系统具有重要的现实意义。
参考文献
[1] 刘伯高.化工过程推断估计的若干问题研究[D].华东理工大学博士论文.华东理工大学图书馆,2000.
[2] 王岚,陈晶,王睿,等.几种模式识别方法在生物信息中的应用[J]. 计算机与应用化学,2007,(1):8-12.
[3] 杨海峰,张德祥.模式识别理论和技术在语音识别研究中的应用[J].合肥学院学报:自然科学版, 2009,(1):40-46.
船舶运动模式的提取是轨迹数据分析的重要任务,它可以为船舶异常行为的检测提供参考依据,同时也可以作为航路规划和定线制设计的技术指标.针对现存的聚类算法大多为了追求效率而忽略了运动轨迹特征的问题,对聚类算法中的轨迹结构距离进行改进,将其作为轨迹相似度的评价标准.采用无监督DBSCAN聚类算法实现船舶运动模式的提取.利用琼州海峡船舶自动识别系统(AutomaticIdentificationSystem,AIS)数据,对该水域的船舶运动模式进行提取,获得行驶于该水域的船舶运动轨迹分布以及各类轨迹中转向区域的分布,其中船舶运动轨迹包括从琼州海峡东峡口向西航行的船舶轨迹,从琼州海峡西峡口向东航行的船舶轨迹,从秀英港前往海安港的船舶轨迹,从海安港前往秀英港的船舶轨迹和从琼州海峡东峡口前往海口港的船舶轨迹.将最终的聚类结果应用于电子海图显示与信息系统(ElectronicChartDisplayandInformationSystem,ECDIS)上,实现了对船舶的动态监控仿真.
关键词:
船舶自动识别系统(AIS);模式识别;聚类分析;电子海图显示与信息系统(ECDIS);琼州海峡
中图分类号:U697.33
文献标志码:A 收稿日期:20150907 修回日期:20151102
0引言
随着全球船舶自动识别系统(AutomaticIdentificationSystem,AIS)岸站的建立和不断完善,各地海事主管机关时刻都能接收到大量有关船舶信息的数据.对这些数据的研究可以帮助我们提取船舶运动模式,分析船舶行为,从而进一步挖掘不同航线船舶、不同类型船舶的运动特点.例如:在一些运量较大的港口附近,对船舶运动轨迹进行分类能够帮助监控人员识别异常行为;根据渔船运动的无规律性和货船运动的周期性,利用聚类结果区分船舶种类,判断运动特征是否与船舶类型相符,是否需要进一步的监控和调查.此外,船舶运动轨迹的聚类分析能够为航路规划和定线制的设计提供理论依据,有利于加强船舶动态监控,提高海事监管的效率.
目前国内外学者提出了诸多从目标对象的轨迹中获取运动模式的方法.SHU等[1]利用自组织映射网络作为预处理技术标记行人的运动特征,然后采用后向算法建立马尔科夫模型,实现了对人行为模式的提取;胡宏宇等[2]以改进的Hausdorff距离作为相似度标准,采用谱聚类算法实现了对车辆轨迹空间分布的提取;闻佳等[3]利用加权的Hausdorff距离和周分割算法实现了车辆轨迹的聚类;RISTIC等[4]基于港口信息,采用核密度估计的方法对船舶轨迹进行分类;ETIENNE等[5]提出了一种基于统计学和图论的轨迹聚类分析方法,该方法将船舶的起讫港作为节点,将相似轨迹归一化为特定的有向路径;AARSETHER等[6]采用图像匹配的方法对船舶轨迹进行聚类;GERBEN等[7]对提取船舶运动模式的两种主要的相似度对比的方法进行了分析,总结出二者中更适合于船舶轨迹聚类的方法;ANDERS等[8]将轨迹聚类应用于近海监控系统来识别船舶的异常行为;LAXHAMMAR等[9]通过高斯混合模型和核密度估计的方法对船舶运动进行统计分析,获得有异常行为的船舶数据.此外,神经网络和以K均值为代表的无监督聚类方法也被广泛应用于轨迹聚类,如JONHSON等[10]建立自组织特征映射网络学习轨迹分布模式,ATEV等[11]则利用K均值算法完成对轨迹的聚类.
海上交通与陆路交通有一定的相似性.道路被划分为单行道、双行道等,而航路也被划分为单向航路和双向航路.虽然海上交通的航行范围广阔,但在某些特定水域(港口、通航分道、狭水道)船舶密度较大,轨迹分布较密集.鉴于此特点,应用在陆路交通上的一些方法也可以应用到海上交通,以提高海上交通的监管力度和效率.
1AIS数据的预处理
由船舶交通管理中心(VesselTrafficServicecenter,VTS)提供的AIS数据通常具有较高的可信度,但是AIS数据中的船舶位置、船舶速度等信息会由于设备以及信号漂移等原因发生较大的改变,如AIS数据显示船舶位于陆地上,显示航速为35kn甚至更高[12].
为保证数据的可用,需要对数据做预处理,具体方法如下.
2轨迹聚类
移动目标轨迹的聚类能否取得良好的效果,在于轨迹间的相似性度量是否合理.当前主要的相似性度量的方法有基于欧氏距离的算法、基于公共子序列的算法、基于动态时间弯曲距离的方法和基于Hausdorff距离的方法,其中基于欧氏距离的算法通常用于计算等长的船舶轨迹相似性,其他的几种方法可以用于不同长度的船舶轨迹相似性计算.以上方法都仅从距离方面反映相似度,而基于轨迹结构距离的相似性度量方法的优点在于能够刻画每条子轨迹变化的趋势.因此,为便于度量船舶轨迹的变化,需要将整条轨迹划分成若干条子轨迹.
2.1轨迹分割
船舶轨迹的划分是通过设置船舶转向角的阈值实现的.船舶轨迹转向角是指相邻两个子轨迹段的航迹向之差,见图1.
图1中,a,b为轨迹中的两条子轨迹段,其航迹向的夹角为θ1,即为这两条子轨迹的转向角.鉴于AIS数据的位置坐标采用的是WGS84坐标系,利用恒向线直接反解算法[13]求得两条子轨迹段的航迹向,根据其航迹向的差值可以获得船舶子轨迹间的转向角.
恒向线直接反解算法的步骤如下.
2.2轨迹结构相似性度量
船舶子轨迹段相似性计算从子轨迹段的航迹向和两条子轨迹段间的距离两个方面进行.对两方面的度量结果赋以一定的权重求和,形成轨迹的结构距离.
(1)船舶航迹向的比较.
如图2所示,Li,Lj表示两条航迹线,θ表示航迹段的方向夹角,J表示Lj相对于Li的偏转程度.
航迹向对比方法为
通过上式不难发现:当夹角为0°时为最佳状态,即两条子轨迹方向完全一致;当夹角大于90°时可以认为两条轨迹基本反向,将两条轨迹的距离设置为无穷大,这样有利于区分航向相反船舶的轨迹.
(2)位置的比较.
本文在两条子轨迹段间距离的度量方面所采用的相似性度量方法为基于Hausdorff距离的方法:
式中:P(Li,Lj)为两轨迹间的位置距离;h(Li,Lj)为两轨迹间的直接Hausdorff距离;d(a,b)为a与b之间的欧氏距离.
船舶轨迹结构是指船舶轨迹所具有的属性的集合,这些属性刻画了船舶轨迹的特性和状态.船舶轨迹结构通常包含船舶运动信息,如:船舶的航迹向、船舶的位置.同时,在实际应用中还可以加入速度以及波动性的度量.进行轨迹相似性的比较时,充分考虑这些因素可以提高聚类的精度[14].依照式(8)和(9)可以求得子轨迹航迹向以及子轨迹间距离相似度.为计算轨迹结构的相似性,还需设定他们在轨迹结构中所占的权重W=(WT,WP),其中WT表示角度距离权重,WP表示位置距离权重.各权重值设定应满足:权重值之和应为1;各权重值应为非负,同时不能大于1.通常情况下采用的是将结构距离中的权重平均分配.式(11)和(12)分别为结构距离和相似度计算方法.
2.3聚类算法
基于轨迹结构距离的聚类算法是以DBSCAN算法为框架的,即从子轨迹集合中任取一条轨迹并判断在其邻域半径内是否包含满足要求的最小实体数.如果满足以上述条件,则认为是核实体,并搜索该实体的密度可达对象,标记为一类,直至子轨迹集合全部扫描完毕,未被标记的子轨迹则是孤立轨迹.具体的实现方法如下.
步骤1设定权重W,转向角阈值ω,近邻阈值η,近邻的数目ε.
步骤2根据ω将轨迹T分割成若干个子轨迹Ti.
步骤3对子轨迹段Ti,计算其与未标记的子轨迹段的D和N,若满足D和N条件的轨迹数目大于ε则将该子轨迹段标记为核心子轨迹段.
步骤4将Ti子轨迹段距离范围D内满足N条件的子轨迹段Tj与Ti聚为一类.
步骤5对Tj重复步骤3和4,将满足条件的子轨迹段继续归为一类,如果Tj不再满足上述条件,则重新从子轨迹集合中选取未被聚类的子轨迹段重复步骤3和4.直至轨迹集合全部扫描完毕.
3琼州海峡应用实例与应用
琼州海峡位于雷州半岛与海南岛之间,宽10~20nmile,长50~60nmile,是广州港、湛江港等港口与北部湾各港口海上交通的捷径.琼州海峡主要可分为3部分,分别为:琼州海峡东口,包括外罗水道、北水道、中水道和南水道;琼州海峡西口,包括灯楼角与临高角联线以西、兵马角所在经度线以东水域,该水域是来往于琼州海峡驶往八所港、三亚港等地的转向点,也是往北部湾各港口的转向点;琼州海峡中部,包括山狗吼灯塔经度线以西、灯楼角与临高角联线以东水域,该水域的水较深(20~118m),碍航物较少.
算例采用32位WIN7系统、2GRAM,在VS2010编译条件下提取750条船舶运动轨迹进行聚类,获得了5类结果,见图3.A类结果为从琼州海峡东峡口向西行驶于通航分道内的船舶的航行轨迹分布、B类结果为从琼州海峡西峡口向东行驶于反向航道的船舶的航行轨迹分布、C类结果为从海安港到秀英港的船舶的航行轨迹分布、D类结果为从秀英港到海安港的船舶的航行轨迹分布、E类结果为琼州海峡东峡口向西行驶进入海口港的船舶的航行轨迹分布.
3.1算法分析
为比较算法的优劣,将基于轨迹结构距离的DBSCAN算法与传统的DBSCAN算法进行对比,结果见表2.
表2算法对比结果
从表2中可以看出,基于轨迹结构距离的DBSCAN算法在运行时间方面劣于传统的DBSCAN算法,但是在分类结果和准确度方面皆优于传统的DBSCAN算法.这是因为:基于轨迹结构距离的DBSCAN算法需要进行轨迹的分割、角度的度量、归一化等操作,增加了计算复杂度;该算法以轨迹特征为参考,从多方面计算轨迹相似度,易发现比较隐蔽的轨迹群,使其聚类效果优于传统的DBSCAN算法的聚类效果.
3.2聚类应用
将上述所获得的船舶轨迹聚类的结果应用到船舶监控、异常检测上,能够大幅度提高海上安全保障能力,防止海上交通事故的发生[15].
3.2.1速度监控
速度监控是利用监控水域的AIS信息,对聚类结果中的船舶速度进行统计,获得船速分布图.根据实际工作中的经验和需要,确定行驶于该监控水域的船舶速度监控范围.图4是对从琼州海峡东峡口航行至海口港的船舶速度统计.对于该监控水域,本文以80%船舶运营速度(9~14kn)为标准.
图5为监控系统的速度报警,可以看出编号为A的船超速,说明该船航速不在监控航速范围内,予以报警.
3.2.2位置监控
位置监控主要是对航行于聚类结果区域的船舶进行船位的实时监控,如果船舶偏离监控水域,本船和监控系统应给予报警和提示,提醒监控人员和船舶驾驶员关注船舶动向.图6a为本船的位置报警示意图,图6b为监控系统的位置报警示意图.
3.2.3航向监控
航向监控主要利用AIS数据对聚类结果中船舶航向进行统计,获得船舶的航向分布,以此作为监控依据.图7a是对从琼州海峡东峡口到海口港的聚类结果中船舶转向后的航向统计结果.图7b和7c为本船和监控系统的航向报警示意图.
综上所述,可以得到船舶监控的实现流程图(图8),首先对进入监控水域的船舶进行位置监控(若偏离监控水域则报警),然后进行速度监控(判断速度是否超出规定范围,如果超出则进行速度报警),接着进行航向的监控直至船舶驶离监控水域.
4结论
本文利用轨迹结构距离作为相似性的度量标准,对轨迹段间的相似性进行评价,采用无监督的DBSCAN算法将相似性接近的船舶轨迹归为一类,实现了对船舶运动模式的提取.以琼州海峡为例,利用预处理过的部分琼州海峡AIS数据,将航行于该水域的船舶轨迹分为5类,分别为从琼州海峡东峡口向西航行的船舶轨迹、从琼州海峡西峡口向东航行的船舶轨迹、从海安港到秀英港的船舶轨迹、从秀英港到海安港的船舶轨迹以及从琼州海峡东峡口向西航行进入海口港的船舶轨迹.从琼州海峡东峡口向西航行的船舶轨迹位于(20°14′25″N,110°26′20″E)与(20°09′05″N,110°01′24″E)之间的通航分道内;从琼州海峡西峡口向东航行的船舶轨迹分布于(20°13′N,110°26′20″E)与(20°06′45″N,110°01′24″E)之间的通航分道内;从琼州海峡东峡口向西航行进入海口港的船舶轨迹,其转向位置大约发生在以(20°10′16″N,110°14′08″E)为圆心,半径为0.5nmile的水域范围内.将聚类的结果与ECDIS模拟器相结合,从船舶位置、速度、航向等3个方面实现了船舶动态监控的仿真.实验证明船舶运动模式识别能够有效地应用于船舶动态监控,进而保障航行安全,增强海上安全保障能力.
参考文献:
[1]SHUHM,KATSU.TraininghiddenMarkovmodelstructurewithgeneticalgorithmforhumanmotionpatternclassification[C]//SCIICASEInternationalJointConference.Busan:IEEEPress,2006:618622.
[2]胡宏宇,王庆年,曲昭伟,等.运动目标空间模式识别与异常行为检测[J].吉林大学学报,2011,41(6):15981602.
[3]闻佳,崔维.实时视频中的车辆运动轨迹的提取和聚类[J].计算机工程与应用,2010,46(11):155157.
[4]RISTICB,SCALARL.StatisticalanalysisofmotionpatterninAISdata:anomalydetectionandmotionprediciton[C]//11thInternationalConferenceonInformaiton.Fusion,Cologne:IEEEPress,2008:17.
[5]ETIENNEL,DEVOGELET.Similarityanalysisofmobileobjectstrajectoriesfollowingthesameitinerary[J].IngenierieDesSystemesD’information,2009,14(5):85106.
[6]AARSETHERKG,TORGEIRM.EstimatingnavigationpatternsfromAIS[J].JournalofNavigaiton,2009,65(4):587607.
[7]GERBENKDV,MAARTENVS.Ananalysisofalignmentandintegralbasedkernelsformachinelearningfromvesseltrajectoris[J].ExpertSystemswithApplications,2014,41(2):75967607.
[8]ANDERSD,LARSN.Trajectoryclusteringforcoastalsurveillance[C]//10thInternationalConferenceonInformationFusion.Quebec:IEEEPress,2007:18.
[9]LAXHAMMARR,FALKMANG,SVIESTINSE.AnomalydetectioninseatrafficacomparisionoftheGaussianmixturemodelandthekerneldensityesimator[C]//12thInternationalConferenceonInformaitonFusion.Seattle:IEEEPress,2009:756763.
[10]JOHNSONN,HOGGD.Learningthedistributionofobjecttrajectoriesforeventrecognition[J].ImageandVisionComputing,1996,14(8):609615.
[11]ATEVS,MASOUDO,PAPANIKOLOPOULOSN.Learningtrafficpatternsatintersectionsbyspectralclusteringofmotiontrajectories[C]//IEEEInternationalConferenceonIntelligentRobotsandSystems.Beijing:IEEEPress,2006:48514856.
[12]QUXB,MENGQ,LISY.ShipcollisionriskassessmentfortheSingaporestrait[J].AccidentAnalysisPrevention,2011,43(3):20302036.
[13]史国友,朱公志,贾传荧,等.恒向线主题直接正反解的高精度算法[J].大连海事大学学报,2009,35(2):59.
一、3G用户细分体系架构
用户细分是3G业务开发及市场营销的基础,用户细分能够使差异化成为可能,使运营商提供的3G产品和服务能够更有针对性。3G用户细分方法的选择直接决定了相关用户细分结果的准确性及实用性。对于3G用户细分的体系搭建的思路是: 采用3 个纬度进行用户的细分,首先按照用户价值纬度进行用户细分,然后再结合消费行为纬度和消费心理纬度细分用户群。在3G用户细分的体系架构中,3个纬度的用户细分依据、方法及应用价值如表1 所示。
二、客户识别分类模型
(一)数据抽取
本案例数据来源于某电信运营公司,该数据总量为26000条。每一条对应一个客户近六个月的统计信息。其中已知分类(2G、3G)的为18000条,未知分类8000 条。其中包括客户年龄,月平均消费额,月平均通话时长等属性250 个(包括客户类型)。本例利用26000条已知分类的数据进行分类模型的建立,随机抽取训练数据10000条,测试数据8000条。
(二)数据预处理
上述采集的数据有数据多、数据取值范围广和数据取值类型多样的特点,因此必须在建模前对数据进行预处理,如采集的样本数据存在一些属性值缺省或空值,如果不做处理,将直接影响后续算法的挖掘效果,严重时甚至得到错误的结果。数据预处理包含数据清洗、属性筛选、数据平衡、数据归一化和离散化五个步骤。数据清洗分为类型转换和缺失数据填补两部分;属性筛选分为人工筛选和通过相关系数分析实现属性选择两部分;由于作为训练的18000条数据只有少数是3G用户,这样会导致模型输出结果偏向判别为2G 客户,因此必须通过数据平衡实现2、3G用户数量达到1:1;为了提高BP 神经网络的性能,需要对数据进行归一化;对于决策树算法,需要对数据进行离散化,否则生产的决策树将会过于茂盛,以至于无法分析。
三、客户数据分类识别过程
本文分别采用BP 神经网络和决策树进行建模,实现对3G 客户的分类识别。本案例运用TipDM 数据挖掘在线建模平台中的性分析进行数据探索,再运用BP 神经网络和C4.5 决策树进行客户识别。(一)模型输入。本案例中,模型数据涉及客户年龄、月平均通话时长和月平均消费额等240多个属性(包含客户类型),模型输入需将客户识别样本属性表导入建模平台中即可。(二)仿真识别过程。建模仿真过程说明如下:1.登录TipDM 平台,在方案管理页面中,新建方案或者打开一个已建方案;2.切换到数据管理页面,上传经预处理后的专家样本数据文件;3.选择相关性分析功能,导入样本数据进行相关性分析;4.分别选择BP 神经网络算法和C4.5 决策树算法,进行模型构建;5.对比BP 神经网络和C4.5 决策树的建模结果,并选择最优算法;6.用最优法对测试样本进行3G 客户识别。(三)仿真结果分析。1.基于BP 神经网络的模型构建。由于神经网络算法输出结果受到训练次数影响,并伴随一定的随机性,多次实验得到的分类正确率如下表所示。
四、总结与建议
决策树与BP神经网络对于3G客户的识别正确率都接近80%,说明本用例建立的分类模型对3G客户的敏感度比较高,基本能识别出3G用户,能达到预期目标。但是只看3G客户的识别正确率是不科学的,还要看2G 客户的识别正确率和总体识别正确率。从总体正确率看,BP 神经网络的正确率仍然比决策树高近10%,BP神经网络无论是总体性能还是对局部分类的敏感度都表现不错,而决策树分类模型性能还有待提高。
虽然本例的客户识别未能达到百分百地准确,但从另外一个角度看,一味追求正确率并没有太多意义。因为本来运营商对各个用户的类别就已经作了登记,反而,我们或许能从客户的误识别中获得更多信息。
关键词:环境激励 模态参数识别
中图分类号:N945.14
随着我国大型土木工程结构的大量建设,结构的监测评估越来越受到重视,但由于其结构的复杂性,传统的模态测试方法实施难度大、成本高,已不能满足工程需要。基于环境激励的模态参数识别方法具有不影响结构正常使用、仅需结构的输出响应便可识别结构的模态参数等优点越来越受到国内外的关注。近年来
基于环境激励的态参数识别方法又有了新的发展,本文参考国内外最新研究成果对其进行了详细的综述,并在此基础上指出其存在的关键问题和研究发展方向。
1. 模态参数识别方法:
1.1 峰值法
峰值法是一种最简单的模态参数识别方法。最初是基于结构自振频率响应函数上会出现峰值,成为特征频率的良好估计[2]。Bao和Ko[3], Lin和 Nikaeen[4],Luz[5]等率先利用功率谱峰值法提取模态参数,用这种方法得到自振频率并用半功率带宽法计算阻尼,最后用各响应点和参考点的互谱密度函数值和自谱密度函数值确定振型方向和振型分量比值得出振型。在此基础上,进而产生了频域分解法、联合时域分析法[6].近来应用实践中,王睿等[7]提出了一种基于峰值法及稳定图原理的钢结构塔模态参数识别方法,利用稳定图原理处理的一阶段处理图在三维坐标中进行呈现,并进行二次处理,得到了良好的效果。
1.2 自然激励技术(NExT)
由美国SADIA国家实验室的James和Carne提出,用来获取模态识别所需的自由响应数据[8-9]韩建平等[10]基于Hilbert-Huang 变换和自然激励技术,提出了一种新的模态参数识别方法,首先通过经验模态分解和Hilbert 变换提取信号的瞬时特性,进而利用自然激励技术和模态分析的基本理论识别结构的模态频率和模态阻尼比。李万润[11]基于传递函数提出了一种基于ARX(Auto Regressive model with exogenous input)模型建立伪传递函数(Pseudo-Transfer Function)的损伤定位方法,并结合自然激励技术对其进行了改进,可将该方法应用于环境激励下结构的损伤识别。
1.3 时间序列法
时间序列法是一种利用参数模型对有序的随机采样数据进行处理,从而进行模态参数识别的方法。用到得参数模型有:AR模型、MA模型、ARMA模型和ARMAX模型 [12-15].各种模型参数估计的算法有最小二乘法、Levinson法、Burg法、先后估计法和长自回归白噪法。1969年,Akaile[16]首次利用自回归滑动均值模型进行白噪声激励下的模态参数识别。
1.4 随机减量法
随机减量法[17-19]的步骤为:
(1)将响应信号分成若干相等长度的段,并对其进行叠加,得到自由衰减的振动信号。
(2)结合其他模态识别方法识别模态数据。Y.Jann N[20]等人阐述了随机减量法的数学基础;Ibrahim把随机减量法运用到了多通道信号领域。此方法仅适用于白噪声激励的情况。
1.5 随机子空间法
随机子空间法是目前比较先进的识别方法,但是处理数据时间长。近年来,同济大学的常军、张启伟、孙利民[21,22,23]等人对其计算效率进行了改进。这种方法的步骤为:
(1)采集环境激励下结构的动力响应数据。
(2)对动力响应数据进行预处理,并求得结构的系统矩阵。
(3)根据根据结构的系统矩阵提取结构的模态参数(固有频率、阻尼比、振型等)。
(4)对模态参数的识别结构进行分析,作出稳定图[24]。根据加权方法的不同有三种算法:UPC算法、CVA算法、PC算法,从计算结果看,PC算法的精度较高[25].
1.6 特征系统实现算法(ERA)
特征值实现算法通过构建hankel矩阵求得系统的特征值和特征向量,从而得到模态参数,且其主要难点在于准确确定hankel矩阵。Pappa[26]等对其进行了持续的研究。祁泉泉等[27]在此算法基础上引入观测马科夫(Observer Markov)参数,推导并提出了扩展特征系统实现算法(EERA)。
1.7 时频分析方法
时频分析方法分为线性时频分析方法和双线性时频分析方法。作为一种新的参数识别方法,越来越受到人们的关注。近年来其热点主要包括:魏格纳分布( WVD)、短时傅里叶变换(STFT)、时变ARMA参数化模型[28-31]、小波变换(WT)、Hiber-黄变换(HHT)。
2 存在的关键问题及研究发展方向
现有的基于环境激励模态参数的识别方法虽然有了很大的发展,但是由于噪声的干扰、非稳态激励的存在、结构外部环境的变化,使其在实际工程中遇到了许多问题。其研究发展趋势主要有:
(1)信号降噪处理目前仍为研究的热点。
(2)研究具有自主产权的实验模态分析系统。
(3)对非稳态环境激励下的模态参数识别问题研究。
(4)温度、风力等环境因素影响是模态参数识别的一个重要问题。
(5)真实模态与虚假模态参数识别具有远大的发展前景。
参考文献:
[1] 任伟新. 环境振动系统识别方法的比较分析. 福州大学学报(自然科学版),2001,29(6):80-86.
[2] 王睿,刘晓平,张鹏. 一种基于峰值法及稳定图原理的钢结构塔模态参数识别方法[J].信息通信,2012,121(5):77-78.
[3] 韩建平,李达文. 基于 HILBERT-Huang 变换和自然激励技术的模态参数识别[J]. 工程力学,2010,27(8):54-59.
[4] 李万润. 基于模型修正与时序分析的结构损伤识别方法研究[D].兰州理工大学 2013.
[5] 赵永辉,邹经湘.利用ARMAX模型识别结构模态参数[J].振动与冲击.2000,19(1):34-36.
[6] 刘齐茂.用随机减量技术及ITD法识别工作模态参数[J].广西工学院学报.2002,13(04):23-26.
[7] 黄方林,何旭辉,陈政清等.随机减量法在斜拉桥索模态参数识别中的应用[J].机械强度.2002,24(03):331-334.
[8] 常军,孙利民,张启伟.基于两阶段稳定图的随机子空间识别结构模态参数[J].地震工程与工程振动,2008,28(3):47-51.
[9] 常军.随机子空间方法在桥梁模态参数识别中的应用研究[D].博士学位论文.上海:同济大学,2006.
关键词 可变样本 BP网络 模式识别
Abstract Mean shifts in production process could be detected quicker by the application of variable sampling rate (VSP)control charts。In this paper, a framework which using the integration of Variable sample sizes and sampling intervals(VSSI) and back-propagation(BP) networks for process controlling and non-normal patterns recognition was proposed, and the sampling rate groups and BP networks group model were designed.
Keywords: Variable sampling BP Networks patterns recognition
引言
统计过程控制(SPC)在生产过程中的应用主要是为了维持特定质量特性的稳定性和可接受性,其中,休哈特控制图作为SPC的重要工具之一,也是最常采用的手段。控制图呈现的状态可以反映生产过程是否受控,当出现非受控情形,需要对其异常模式进行识别并进行相应的调整。在控制图异常模式识别的研究中主要集中于人工神经网络(ANNs)D T Pham和E Oztemel[1]采用学习矢量量化(LVQ)网络组建立了一个控制图异常模式识别系统,并讨论了提高识别器精度方法;S K Gauri和S Chakraborty[2]采用经由反向传播算法训练的多层感知神经网络构建了异常模式识别器,并对其进行了评估。C S Cheng和C A Tzeng使用反向传播网络进行了控制图异常模式识别的研究[3]。本文中采用BP神经网络来进行控制图异常模式识别。
另一方面,传统的休哈特控制图采用固定样本容量和抽样区间的方式进行样本组的抽取。近些年来对可变样本参数控制图的研究表明可变样本容量(VSS)与可变抽样区间(VSI)的控制图能够更快地发现生产过程中存在的微小变化。A F B Costa[4]对可变样本参数的控制图进行了深入研究,提出了可变警告限的方法并通过与CUSUM和EWMA的对比,证明了该方法可以获得更高的灵敏度;Y C Lin与C Y Chou[5]采用Burr分布,针对非正态分布的情况下设计了可变样本容量与区间(VSSI)的均值图,并通过对比验证其具有更高的精确性和鲁棒性。
本文结合VSSI的均值-极差控制图,提出一种采用BP网络进行过程控制,以及控制图异常模式识别的系统框架。
1 系统实现框架
系统的主要功能包括模式识别与样本参数组控制两大方面,在系统的应用过程中,需要综合考虑异常模式识别与样本参数选择和控制图数据之间的相互关系。经过对系统的分析,确定系统包括三个模块,分别是:传递模块、异常模式识别模块、样本参数反馈模块。系统的总体框架如图1所示:
图1 系统总体框架图
(1)传递模块 该模块的主要作用是接收生产过程中采集的质量数据,并初步判断是否超出控制限,若超出控制限则将数据只传递至异常模式识别模块,同时自行生成样本参数调整信号,反之传递至异常模式识别模块与样本参数反馈模块;此外,该模块接受异常模式识别模块反馈的模式识别结果,并反馈至生产过程决策端以供误差识别与调整使用,同时接受样本参数模块的反馈结果,并传递是否调整样本参数的信号至生产过程的信号采集端。该模块即为系统的中转站。
(2)异常模式识别模块 该模块的主要作用是根据传递模块所传送的生产过程数据,通过内置神经网络,对其进行模式识别,并将模式识别的结果反馈至传递模块。
(3)样本参数反馈模块 该模块的主要作用是根据经由传递模块转达的过程数据,通过当前内置控制图参数进行判断是否需要更改控制图参数,将判断结果以选择信号的形式反馈至传递模块。
系统工作的流程图如图2所示:
图2 系统流程图
为了实现基于可变样本参数与神经网络的控制图异常模式识别系统,使其能够满足控制图异常模式识别和控制图参数可变的需求,系统需要解决两个方面的问题, 分别为可变参数控制图样本参数的选取和异常模式识别模块的设计,本文其后将详细探讨这两个方面。
2 可变样本参数控制图的主要原理
可变样本容量与抽样区间控制图是近些年来兴起的应用方向,与传统的休哈特控制图不 同的是,可变样本容量与抽样区间控制图一般设计为具有两组或以上取样参数的模式,从而能根据当前系统的过程数据,灵活确定样本参数,从而提高效率。考虑到对于一般的过程控制,当取样模式大于两种时,在取样行为更改与实施过程中所耗费的时间可能会大于所节省的时间,因此,本文采用两组取样参数s1(n1,h1)和s2(n2,h2),其中n和h分别代表样本容量与抽样区间。其中,s1为较小样本容量和较大取样区间,对应于良好的过程情况,反之,s2为较大样本容量和较小取样区间,对应于需要密切监控的过程情况。假设过程均值为 ,标准差为 ,两组模式的上下控制限分别表示为UCL1、LCL1和UCL2、LCL2,上下警告限分别表示为UWL1、LWL1和UWL2、LWL2。其计算公式如式(1)和式(2),其中k为控制限系数,w为警告限系数。
(1)
(2)
通过定义样本点可控概率p0,平均样本容量n0,以及固定取样区间h0,样本容量n1和n2之间必须满足方程(3),取样区间h1和h2之间必须满足方程(4):
(3)
(4)
通过采用控制限与警告限,VSSI控制图分为三部分:中间区域、警告区域和活动区域。在其应用于控制的过程中,当样本点位于中间区域时,则认为过程受控,采用模式s1进行下一组取样;反之,当样本点位于警告区域时,认为过程具有不受控的风险,采用模式s2进行下一组的取样;当样本点超过控制限,即处于活动区域,则发出信号。
此外,本文结合系统特点,对样本参数的选择作出了更改:当异常模式识别模块发现异常模式时,同时将异常信号经由传递模块传送至样本参数选择模块,在接下来的过程中,采用样本参数组s2进行取样,即视作具有不受控风险的情况对待。
3 异常模式识别模块
BP神经网络是一种典型的指导学习型网络,经常用于识别、预测和分类,其结构包括输入层、输出层及中间的隐藏层,如图1所示。BP网络每层神经元的数目通常根据问题复杂程度确定,同时过多的神经元数目会导致训练时间过长,本文采用56-35-1和56-35-4结构的三层结构BP网络。
图3 BP网络结构图
根据经验总结,控制图中常见的异常模式包括:①一个点远离中心线超过3个标准差;②连续7点位于中心线一侧,即偏移模式;③连续6点上升或下降,即趋势模式;④连续14点交替上下变化,即周期模式。这些异常模式反映在控制图上,可以通过图3[6]中6种波动模式进行表达。
图4 控制图异常模式
识别器模块由两个子模块组成,如图2所示,其中子模块1为一个56-35-4结构的BP网络,其作用为接受控制图数据输入,将其分类为相应的异常模式,随后将其相应的参数传送至下一子模块中相应的BP网络模块。子模块2中为四个56-35-1结构的BP网络B、C、D,其工作模式为接受网络A发送的参数并进行识别,以得出是否属于异常的结论,B、C、D对应的模式参数均为0或1,网络A的输出值对应模式识别结构如表1所示。
表1 BPN A输出值与模式对应表
模式 输出
1 2 3 4
正常 1 0 0 0
偏移 0 1 0 0
趋势 0 0 1 0
循环 0 0 0 1
图5 异常模式识别器结构图
结语
本文研究了将可变样本容量参数控制图与BP神经网络异常模式识别器集成于一体的系统框架,该系统的主要思想是采用可变样本参数的方式提高过程效率,同时结合由BP神经网络构建的异常模式识别器对生产过程进行误差实时识别和诊断,并提高抽样效率。该方法将可变样本参数控制图的优点与神经网络模式识别的功能相结合,相对于单一的模式识别网络具有功能优势。由于时间关系,未能开发原形系统来进行实例验证。同时,希望在以后的工作中,可以继续完善,使其能够实现包括误差源等更多层次的功能,从而更大地提高工作效率。
参考文献
[1] D T Pham, E Oztemel. Control chart pattern recognition using learning vector quantization networks [J]. International Journal of Production Research, Vol 32, Issue 3, 1994 , p 721 C 729.
[2] S K Gauri, S Chakraborty. Improved Recognition of Control Charts Patterns Using Artificial Neural Networks [J]. The International Journal of Advanced Manufacturing Technology, Vol 36, p11-12, 2008.
[3] C S Cheng, C A Tzeng. A Neural Network Approach for Detecting Shifts in the Process Mean and Variability [J]. Computer Industrial Engineering, Vol28, p51-61,1995.
[4] A F B Costa. Xbar Charts with Variable Sample Sizes and Sampling Intervals [J]. Report Series in Quality and Productivity, No 133, 1995.
【关键词】近视眼 屈光,眼 角膜
中图分类号:R779.63 文献标识码:B 文章编号:1005-0515(2011)6-071-02
近年来,随着现代眼科屈光手术的不断发展,使越来越多的近视患者获得了良好的视力。而透镜焦度、角膜中央厚度、角膜曲率对合理选择手术及设计手术方案非常重要,并在很大程度上直接关系到屈光手术的安全性和矫正的可预测性。因此,我们对840例准分子激光手术患者的术前检查结果进行了回顾性分析,探讨透镜焦度、性别与角膜厚度、角膜曲率的关系。
1 资料与方法
1.1 对象选择 本组840例(1670只眼)均为2007年9月~2009年4月来我院眼科接受准分子激光屈光手术的近视患者。所有病例无眼部不适症状,眼科常规检查无异常,排除散光≥2.00 D。年龄18~45岁,平均(23.35±4.56)岁。其中男性480例(954只眼),平均(22.4±4.26)岁,女性360例(716只眼),平均(26.15±5.89)岁。所有病例均遵从等效球镜原则(等值球镜=球镜度数+1/2散光度数),根据透镜焦度将1670只眼分为3组,低度近视组(-6.00D),680只眼。根据性别分为2组,男性组480例(954只眼),女性组360例 (716只眼)。
1.2 检查方法
1.2.1 验光 对所有病例进行复方托品酰胺充分散瞳使睫状肌麻痹后用TOPCON RM-8000电脑验光,然后用枪影镜检影验光,结合瞳孔恢复后主觉验光,确定近视透镜焦度,透镜焦度以最佳视力最低度数为准,排除散光≥2.00 D,并计算等值球镜度数。
1.2.2角膜地形图检查 采用ORBSCANⅡ型角膜地形图仪进行检查,分别记录角膜水平曲率K1值和垂直曲率K2值。
1.2.3 角膜中央厚度测量 用超声角膜测厚仪(DGH-500)测量角膜中央厚度每眼3次,取最小值。
1.3 统计学处理 运用SAS 8.1统计软件分别对测量数据进行方差分析,P
2 结果
2.1 透镜焦度 轻、中、高度近视的角膜厚度分别为(541.33±36.23)、(536.34±33.36)、(535.80±34.13)μm,统计学处理有显著性差异,中、高度之间无显著性差异。轻度近视的角膜比中、高度角膜厚。三组角膜水平曲率比较无显著性差别,三组的垂直曲率分别为(43.71±1.46)、(43.95±1.60)、(44.39±1.63)D,三组比较有显著性差别(P=0.000 1),说明随着近视度数的增高,角膜垂直方向有变陡的趋势。见表1。
表1 轻、中、高度近视各组间角膜中央厚度、角膜曲率比较
2.2 性别 男性角膜厚度、角膜水平曲率、垂直曲率954只眼分别为(537.86±38.23) μm、(42.71±1.51)、(43.83±1.69)D,女性为(533.07±38.67) μm、(43.91±14.20)、(44.51±1.50)D,三者比较有显著性差异(P
3 讨论
透镜焦度与角膜中央厚度的关系存在一定的争议。有学者认为角膜厚度与近视透镜焦度之间无明显相关性[1~3]。范艳华等[4]认为角膜中央厚度与透镜焦度间呈正相关,角膜厚度每增加95μm透镜焦度上升1D。倪焰等[5]认为低度近视的角膜厚度最高,与其他2组间均有统计学差异,而中、高度之间的角膜厚度无统计学差异,与本研究相似。本研究中低度近视与中、高度近视的角膜厚度有显著性差异(P
角膜曲率对近视透镜焦度的影响,国内进行了许多研究,结论尚有争议[6~8],本组显示3组间角膜水平曲率无统计学差异,但垂直曲率有显著性差异(P=0.0001),说明随近视度数的增高角膜垂直方向变陡。提示近视除眼轴增长外同时也受角膜曲率改变的影响。
性别与角膜曲率、角膜厚度的关系,本研究中男性角膜厚度为(537.86±38.23) μm,女性角膜厚度为(533.07士38.67) μm,统计学分析显示性别之间的角膜厚度差别有明显的统计学意义,男性角膜厚度大于女性。也有学者认为角膜厚度与性别无关系[9]。本研究还显示,男性角膜曲率和女性角膜曲率比较,有明显的统计学意义(P
以上问题之所以存在争议,可能与所研究的病例构成样本大小及使用的测量仪器不同有关,这些问题还需要进一步研究。而透镜焦度、角膜厚度及角膜曲率是准分子激光屈光手术前必不可少的检查,在眼的屈光系统中,角膜曲率对眼球屈光状态影响很大,它的整体屈光力大约为+43.00D,占眼球屈光系统的3/4,角膜曲率的轻微改变都会对屈光状态产生影响,角膜厚度个体差异较大,对手术方式的选择有重要的指导意义。因此,在角膜屈光手术前,精确地分析透镜焦度、角膜厚度及角膜曲率能使我们在不同性别、不同透镜焦度的手术方式的选择、手术计划的设计上更趋安全。
参考文献
[1] 熊洁,邓应平.影响近视眼患者近视屈光度的相关因素分析 [J].眼科,2006.15(5):321―323.
[2] 倪海龙,王勤美,许琛琛.等.Orbscan测量近视眼角膜厚度 [J].眼视光学杂志,2001.3(3):137―139.
[3] 吴苗琴,徐志能.洪朝阳.等.LASIK术眼角膜厚度与眼压及屈光度相关性研究[J].眼外伤职业眼病杂志,2005,27(10):744 746.
[4] 范艳华,彭清华,曾自明.等.近视跟角膜中央厚度相关因素分析[J].中国中医眼科杂志.2006,16(2):81―83.
[5] 倪焰.孙建宁,魏春惠,等.近视眼屈光、角膜厚度与眼压三者间的相关分析[J].眼科新进展.2004,24(4):289―290.
[6] 杜连娟,孟样毓.陈明,等.近视眼的眼轴与角膜屈光力相关研究[J].实用眼科杂志,1998,16(6):361―362.
[7] 张悦,张国辉。廖世煌.等.近视相关的多因素分析[J].眼科研究.1997,15(1):54―56.
[8] 高昌卫,贺景波,孙红玲,等.4227只近视眼的角膜厚度测量及分析[J].临床眼科杂志,2003,1l(4):353―354.
[9] 韦斌,具尔提,付玲玲,等.影响近视跟角膜中央厚度的多因素分析[J].国际眼科杂志,2006.6(4):818-820.
关键词:模式识别;本科教学;教学实践;教学改革
随着电子信息技术的迅速发展和信息处理自动化需求的不断扩大,模式识别方法和技术在信息处理领域中的重要性越来越受到重视。在吸引了众多研究者投身到模式识别研究领域的同时,模式识别的教学也从研究生教学逐渐延伸到了本科教学。模式识别作为计算机、电子信息技术等专业的专业基础课程,已经在越来越多的高等院校开设。本科模式识别课程主要讨论以统计学为基础的模式识别理论和方法,内容包括:贝叶斯决策理论以及参数估计方法、以误差函数最小化为原则的线性和非线性判别、近邻规则、特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法、非度量方法、独立于算法的机器学习等内容[1]。由于模式识别研究领域的广泛性,模式识别本科教学的内容和侧重点的安排目前尚处于探索阶段。模式识别领域的发展日新月异,这就要求教师在授业解惑的同时能够与时俱进地介绍该领域的发展前沿,从而培养学生主动探索知识的兴趣。
本文将结合本科模式识别教学的实践,分析该课程在内容设置方面面临的问题并给出相应的解决问题的建议;结合模式识别课程的特点,提出了以应用实例为先导的教学方法,以提高学生的学习兴趣;针对不同类型的学生,提出了如何培养学生实践能力和科研兴趣的方法。
1模式识别教学内容的层次划分和讲授方法
模式识别是一门理论与实践紧密结合的学科,其理论基础涉及高等数学、线性代数、数理统计、矩阵论、随机过程、工程优化方法、小样本统计学习理论、模糊数学等学科[2]。然而除了高等数学、线性代数和数理统计,其他课程都是研究生阶段才会开设的数学基础课。这就使得本科的模式识别教学面临着尴尬的局面:既不能花过多的时间讲数学基础知识,又要把以这些数学知识为基础的内容讲清楚。面对这一难题,我们在教学实践中总结出了一套办法,具体做法是将教学内容划分为基础型、前沿型两类;并采用弱化公式推导,强调数学表达式物理含义的方法进行讲授。
基础型教学指的是已经发展完善的模式识别原理和方法。基础型内容包括:贝叶斯决策理论、概率密度函数估计、线性判别、近邻规则、独立于算法的机器学习等内容。贝叶斯决策理论和概率密度函数估计是以数理统计为基础的[3],这一部分也是模式识别的重点内容。线性判别是以高等数学和线性代数为基础,同时涉及工程优化方法课程的部分内容。在这部分内容中,公式推导占据了相当大的篇幅,而且推导过程是学生可以理解和掌握的。对于基础型的内容,可以采取理论推导和实际例子相结合的讲授方式。在公式推导的过程中,尤其要强调公式的物理含义,同时给出几个有趣的例子,在增强记忆加深理解的同时提高学生的学习兴趣。
前沿型教学指的是正在发展中的模式识别原理和方法。前沿型内容包括:特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法等内容。这部分内容或者是数学基础超出了本科生的能力范围,或者处于发展前沿,很多内容正处于探讨阶段。对于前沿型的内容,可以忽略公式推导过程,直接讲授推导的结论以及结论的物理含义,同样结合实际例子加深学生的理解。对于发展中的模式识别方法可以适当介绍该领域的发展前沿,在开拓视野的同时激发学生的科研兴趣,引导部分学生从事感兴趣的科学领域的研究。
2实例先导的教学方法
模式识别方法是为了解决信息处理中面临的识别问题而提出的。在讲授方法之前,首先要明确将要介绍的模式识别方法的应用背景和使用范围,而不是像我们通常做的那样,先介绍方法的理论基础和流程,最后再给出一个例子,或者通过课后练习和作业的形式让学生掌握课程介绍的理论和方法的应用。针对本科模式识别课程的特点,我们在教学实践中摸索出了一套以实例为先导的教学方法,并与上机实验和课程设计相结合,大大提高了学生的学习兴趣和动手能力,取得了良好的教学效果。
实例先导的教学方法是在介绍每一章或者相关的几章内容之前首先用一个实际的例子引出要学习的内容,在相关内容的学习结束之后给出解决实例问题的模式识别方法。例如:在讲授贝叶斯决策理论之前,给出根据长度和光泽度等数值特征识别鲑鱼和鲈鱼的例子[4];在讲授决策树之前,给出根据颜色,形状、尺寸等非度量特征识别水果的例子等等。通过学习,找到了解决这类问题的一般方法,同时学生也通过实例记住并理解了该方法的适用范围。又例如在讲授特征的选择与提取这一章时,先不讲特征空间的映射和变换,而是从几个实例出发,说明并不是特征越多越好,而是要选择合适的特征向量;特征的组合变换可以使复杂的分类问题转化为简单的问题等。从而让学生更好地理解特征选择和提取的目的和重要性。
在接触到实际的模式识别问题时,会引发学生的思考。在授课过程中,教师可以针对具体问题组织学生进行讨论,看是否能够利用已学过的模式识别方法解决该问题。若可以解决,则引导学生分析用已学方法解决该问题时存在的不足,从而引出下面将要介绍的新方法。这样,在介绍新方法的同时,学生会很自然地将新方法与旧的方法进行比较,分析各种方法的优劣,有利于学生对教学内容的深入理解和掌握。这种方法在讲授解决同一类模式识别问题的不同方法时是适用的。如在讲授贝叶斯决策时,可以通过对比的方式介绍几种决策规则的特点,又如在讲授线性判别方法中各种形式的感知器算法时,也可以对比学习各种算法的优劣。若该模式识别问题不能用已学的方法解决,则引导学生分析该模式识别问题的特点,思考为何必须引入新的模式识别方法来解决该问题,学生是否能够提出自己的解决方案。在分析和思考之后,教师再将解决该问题的思路引入到下面将要介绍的新方法上。这种方法在讲授解决不同类型的模式识别问题时是适用的。如在讲授非度量模式识别方法时,面对非度量语义属性的模式识别问题是前面介绍的方法无法解决的,要引入非度量模式识别方法加以解决。
因此我们建议在教材的编写上可以尝试采用实例先导的方法。首先在引言部分给出一个实际例子,然后在介绍方法的部分结合理论分析给出解决实例问题的方法。这种方法有利于提高学生的学习兴趣,增强记忆,加深理解。
3实践能力和科研兴趣的培养
模式识别是一门理论和实践紧密结合的科学,该学科的发展日新月异,在计算机和信息处理领域的地位越来越重要。因此,在模式识别课程的教学过程中要注重学生实践能力和科研兴趣的培养。在教学实践中,我们采用了上机实验和科学报告相结合的教学方式。
掌握各种模式识别方法的原理和流程是本科模式识别教学的第一个阶段。在此基础上,我们要求学生在计算机上实现模式识别方法并用于解决实际的模式识别问题。在上机实现的过程中,学生不仅需要掌握模式识别问题在计算机中的表示方法和识别结果的展示形式,尤其重要的是学生需要对模式识别方法的每一个细节都要深入理解和掌握才能将算法实现。在上机教学中,我们采用了Matlab编程环境实现课程中介绍的模式识别方法。Matlab的编程语言简单高效,而且提供了功能强大的图形展示功能[5]。例如在贝叶斯决策和线性分类器的上机实验中,学生可以利用画图函数用不同的颜色和符合标记不同类别的样本,可以轻松地画出决策面,这种可视化的分类结果展示形式不仅提高了学生的学习兴趣,而且加深了学生对模式识别方法及其特点的理解。
在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇具独到的见解。
在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇独到的见解。
4结语
本科模式识别教学由于学生的数学基础有限而面临着两难的境地。既要把原理和方法讲清楚,又不能过多的涉及复杂的数学推导,这给教学带来很大困难。在教学实践中,我们把教学内容划分为基础型、前沿型两类,并提出了弱化公式推导,强调公式的物理含义,以及结合实例增强记忆的教学方法。为了提高学生的学习兴趣,加深理解,我们提出了实例先导的教学方法。用实际例子引导学生思考,加深学生对模式识别方法应用背景和适用范围的理解。模式识别是实践性很强的科学,并且该学科的发展十分迅速。在教学实践中,我们十分重视学生动手能力和科研兴趣的培养。通过上机作业和科学报告的形式引导学生积极动手,积极思考。
参考文献:
[1] 边肇祺,张学工. 模式识别[M]. 2版. 北京:清华大学出版社. ,2002:9-303.
[2] 顾波. 模式识别本科教学方法浅谈[J]. 中国科教创新导刊.,2010(4):68.
[3] Andrew R. Webb. 统计模式识别[M]. 2版. 王萍,等,译. 北京:电子工业出版社,2004:1-10.
[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分类[M]. 2版. 李宏东,姚天翔,等,译. 北京:机械工业出版社. ,2003.
[5] 杨淑莹. 模式识别与智能计算:Matlab技术实现[M]. 北京:电子工业出版社,2008:1-300.
Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming
QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2
(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)
摘 要:为实现对巴布剂涂布过程中均匀度的检测,提出一种基于模糊模式识别的检测方法。根据采集图像像素点之间的空间和时间相关性及其特征界限的模糊性,引入模糊集理论,运用模糊算法对像素点的灰度值进行识别分类。检测系统采用基于CycloneⅡ系列的FPGA技术,运用Verilog HDL硬件语言对系统完成建模与实现,并且通过了仿真和验证。通过在线测试,对视频数据流进行分析、处理和识别,实现对涂布过程中巴布剂均匀度的检测,根据统计结果,正确率达到95%。检测结果证明了模糊模式识别算法的可行性和检测系统的可靠性。
关键词:模糊集理论;模式识别;巴布剂;均匀度检测;FPGA技术
中图分类号: TP274.3; TP391.4 文献标志码:A
Abstract: To detect cataplasms uniformity, a method based on fuzzy pattern recognition was proposed. According to the spatial and temporal correlation of pixels and the fuzziness of character boundary, the fuzzy theory was introduced and the fuzzy algorithm was used to recognize and classify the pixels value. The CycloneⅡ Field-Programmable Gate Array (FPGA) of Altera was chosen, and the modeling and realization were performed by making use of Verilog HDL. The detection system passed the simulation and verification. In the on-line detection system, after analyzing, processing and recognizing the data of digital video, cataplasms uniformity detection was completed. According to the statistic results, the accuracy of fuzzy pattern recognition in digital image signals is up to 95%. After experiments and online detection, the feasibility of fuzzy pattern recognition and the reliability of this quality detection system are verified.
Key words: fuzzy set theory; pattern recognition; cataplasm巴布剂的英文是这个吗?我在网上查的是别的词,请您明确,并按照规范的词来表示。; uniformity detection; technology of Field-Programmable Gate Array (FPGA)
0 引言
近年来,经皮给药系统(Transdermal Drug Delivery System, TDDS)以其独特而有效的疾病治疗方式,深受国内外医药学研究机构和制药企业的重视,鉴于其在国内外的广阔市场需求和应用前景,将巴布剂的制药成型工序推向自动化、形成产业智能化的趋势已势不可挡[1]。
目前,巴布剂成品质量检测大多采用人工鉴定的方法,鉴定成品是否合格是从视觉上来看是否有气泡,亮度、颜色是否均匀,这种对均匀度评估分析带有一定的主观性,难以形成规格化标准,而且不能实时地监视涂布过程中均匀度的变化。本文设计采用数字图像处理的方法将目标问题转化为信号处理问题,根据图像像素点之间的空间和时间相关性及其特征界限的模糊性,引入模糊集理论,提出一种基于模糊模式识别的巴布剂均匀度检测方法,实现对巴布剂均匀度的实时检测,该方法还可用于对本系统其他指标的检测,有利于实现巴布剂成型工序的自动化。
1 模糊模式识别原理
模糊集理论是研究和处理现实世界中客观存在的模糊现象的有效工具之一。在模式识别中引入模糊集理论[2],用模糊技术来设计识别控制系统,可以更广泛、更深入地模拟人的思维过程,提高系统的实用性和可靠性。
模糊模式识别问题可分为两大类型:1)待识别的对象是明确的元素,而模式库(所有已知标准模式的全体)是模糊的,可采用隶属原则进行分类,称为直接法;2)待识别的对象是模糊的,模式库也是模糊的,可使用择近原则进行分类,称为间接法[3-4]。
本检测系统通过采集巴布剂图像进行分析、处理和识别判断,实现对巴布剂均匀度的检测,所以输入待识别对象(数字图像的640×480个像素点)是特定具体的,而识别库(符合标准,几乎符合标准和不符合标准三个模式)是模糊的,所以采用模糊模式识别的直接方法。
模糊模式识别直接方法的基本原理是:设U为待识别对象所构成的集合,U中每一个待识别对象u有m个特性指标u1,u2,…,um,构成特征向量u=(u1,u2,…,um),设待识别对象集合U可分成P个类别,且每一类别均为U上的一个模糊集,记为A1,A2,…,Ap,则称它们为模糊模式。给定一个对象ui∈U,求出ui对P个模式的相应的隶属度A1(ui),A2(ui),…,Ap(up),然后按照某种隶属原则(最大隶属度原则、最大隶属原则、阈值原则)对识别对象ui进行判断,指出它应归属哪一类别。
2 模糊模式识别模块设计
系统采用直接方法对每一个像素点进行模式识别,隶属原则选择了最大隶属原则,具体的步骤如下。
2.1 抽取特性指标
巴布剂成品均匀和不均匀的图像及其灰度直方图如图1所示。
灰度直方图是灰度值的函数,它描述了图像中具有该灰度值的像素的个数,其横坐标表示像素的灰度级别,纵坐标表示的是该灰度出现的像素的个数[5]。根据图1分析可知,合格图像的灰度值比较集中,灰度值在130~170,而不合格的图像,由于存在气泡或者药剂喷涂不均匀带来的颜色深浅不同,灰度值比较分散,灰度值在50~200。
该系统选取亮度信号Y作为识别对象的特性指标。由于经解码后的数字视频数据符合ITU-R BT.601标准[6],其无量纲和数量级的差别无需再进行规格化处理。
2.2 设定模糊模式类别并构造隶属函数
隶属函数是刻画模糊集合最基本的概念,模糊集合是人脑对客观事物的主观反映,而人的心理进程是隶属度形成的基本过程,故模糊集合的隶属度函数表达形式不是唯一的,因此很难用统一的方法来构造隶属函数,只能针对具体问题及其特点,采用与之相应的方法来构造隶属函数。
本文的设计在构造模式识别的隶属函数时,采用样板法。首先依据标准均匀度的特性指标值将识别模式分为三大类,即符合标准(模式A1)、几乎符合标准(模式A2)和不符合标准(模式A3),然后从模糊模式Ai中选出Ki个样板,并对每个样板的特性指标向量采集实测值,然后计算这Ki个特性指标向量的平均值,即样板均值,为构造隶属函数时计算距离作准备,最后将输入数字图像样点值相对三个模式做隶属归类识别。对应三个模式特性指标Y及两个色度信号Cr和Cb(色度信号Cb、Cr可以用在方案扩展中)的样板均值如表1所示。
接下来计算图像视频数据与各模式均值样板之间的距离,本系统设计选择模糊Lambert距离函数,即:
(A,B)=1n∑ni=1A(ui)-B(ui)A(ui)+B(ui)(1)
令
D=max{d1(U,a1),d2(U,a2),d3(U,a3)},则模糊模式Ai的隶属函数为:
Ai(u)=1-di(U,ai)/D; i=1,2,3,…(2)
2.3 利用最大隶属原则进行识别判断
在Ai(u)的计算结果中,若A1(u)最大,模式识别判断属于模式A1;若A2(u)最大,模式识别判断属于模式A2;若A3(u)最大,模式识别判断属于模式A3。对于每个像素点的模糊模式识别过程完成。
一帧图像由640×480个像素点组成,模式识别是针对每一个有效像素点进行识别,若判断巴布剂是否均匀,需要完成对一帧图像的所有像素点的识别,通过记录一帧图像中不合格点个数,然后结合实际要求给出判断信号。
3 基于模糊模式识别的检测系统实现
本设计采用基于CycloneⅡ系列的FPGA(Field-Programmable Gate Array)技术[7],运用Verilog HDL(Hardware Description Language)对系统完成建模与实现。
3.1 图像采集、处理、识别系统的硬件平台
在图像信息处理过程中为保证实时性,首先要求图像处理系统具有处理大量数据的能力;其次对系统体积的大小、功能、稳定性等也有严格要求。本系统的框图如图2所示。
系统各模块功能简要描述如下:
1)视频解码器ADV7181B配置模块是基于I2C总线原理,上电后首先要对ADV7181B进行初始化配置,完成对其性能、端口、数据格式、工作模式等必须通过配置选择;
2)数据传输模块识别出行、场同步信号,根据需要选择采集图像的大小,并将符合ITU-R BT.656标准数据转换为符合ITU-R BT.601标准数据[8];
3)SDRAM控制器模块产生控制SDRAM读写时序信号,实现大容量数字图像视频数据的控制与缓存[9-10];
4)模糊模式识别模块用模糊模式识别理论对系统采集的数字图像进行处理、分析和判别,实现对巴布剂成型过程中均匀度的检测。
3.2 模糊模式识别模块的实现
该均匀度检测系统的核心部分是模糊模式识别模块的实现。该模块的实现步骤如下:
1)提取特征因素(亮度信号Y);
2)提取水平、垂直同步信号HS(Horizontal Sync)和VS(Vertical Sync)[11];
3)提取有效像素点(640×480);
4)用模糊算法对每个像素点进行识别;
5)完成一帧图像所有像素点识别,记录不合格点数,输出判断信号(control)。
视频数据的水平和垂直时序如图3所示。以水平时序为例,HS为负时标志着一行的开始和结束,有效的像素在A这段时间传输,HS在一行的最后一个像素传送后,间隔至少B-A时间后拉低,然后保持时长C-这个是减号,还是连接符?请回复。回复:减号B为低电平,HS的负脉冲结束后,至少保持D-C的时间后开始新的一行。一行的总持续时间为D,像素有效时间为A,D-A为水平消隐时间[12]。垂直时序与水平时序类似,各对应时间段分别用E、F、G、H表示。
视频数据的水平和垂直时序具体参数为: A=25.4μs,B=26μs,C=29.8μs,D=32.8μs,E=15.3ms,F=15.6ms,G=15.65ms,H=16.7ms。在FPGA中,用Verilog HDL合成满足上述时序关系的水平、垂直同步信号,同时还要加一个复位信号,使模式识别从第一行第一个像素开始,完成对每帧图像的均匀度的检测。
在对每个像素点进行模糊模式识别的程序设计中,主要通过有限状态机实现的[13],如图4所示。状态State0时,分离视频图像信号的三个特征指标Y、Cr和Cb;转入State1时,将亮度信号Y与模式标值对应代入式(1)中的分子,求差并取绝对值;转入State2时,将Y与模式标值对应代入式(1)中的分母,求和;转入State3时,将State1中的差值与State2中的和值作商;转入State4时,求模糊Lambert距离;转入State5和State6时,利用隶属函数求值,根据最大隶属原则做模式识别,并给出判断信号。另外,在该模块的设计中嵌入了除法器模块,通过task任务调用实现。
图5中,data_cr、data_cb、data_y分别为输入的数字视频信号的三个特性指标,cmd2是读操作命令,data1和data2是数据缓存单元,control为对各像素点进行判别后所归属的模式类别,以十进制标识,4是符合厚度标准“100”,2是几乎符合厚度标准“010”,1是不符合厚度标准“001”;另外,当没有视频数据输入到模式识别模块时,control输出为“0”值。
本系统设计将巴布剂均匀度检测结果的判断信号输出给两个LED灯:A(均匀)、B(不均)。实验检测结果表现为:当摄像头摄取均匀的巴布剂成品时A灯间歇性亮灭;当摄取不均匀的巴布剂成品时B等间歇性亮灭。灭的时间表示正在对一帧图像进行基于模式识别的均匀度检测;亮的时间表示输出判断信号的延时。
4 结语
本文提出一种基于模糊模式识别的巴布剂均匀度检测系统,从实验和在线检测结果看,模糊模式识别的算法比较理想,可以实现对巴布剂均匀度的实时检测。本系统设计不仅为实现TDDS制剂成型生产的自动化作了有益的探索性尝试,而且该系统还可以对其他的指标进行检测,对今后TDDS成型生产设备走向工业化有着积极的借鉴意义。
参考文献:
[1]
谢光杰,邓启华.经皮给药制剂概述及研究现状[J].内江科技,2009,30(9):31-32.
[2]
陈水利,李敬功,王向公.模糊集理论及其应用[M].北京:科学出版社,2005:156-178.
[3]
刘素华,侯惠芳,刘东.模糊模式识别在大气评定中的作用[J].计算机工程,2005,31(2):7-10.
[4]
王艳玲,张,罗诗途.基于模糊模式识别的场景图像分类方法[J].微计算机信息,2007,23(34):220-221.
[5]
尹建新,楼雄伟,黄美丽.灰度直方图在木材表面缺陷检测中的应用[J].浙江林学院学报,2008,25(3):272-276.
[6]
柯.数字视频文件转换算法的设计与实现[J].企业技术开发,2011,30(9):21-22.
[7]
黄智伟,王彦.FPGA系统设计与实践[M].北京:电子工业出版社,2005:130-132.
[8]
蔡军辉.基于FPGA的视频信号数字化采集与显示系统[D].南京:南京航空航天大学,2009.
[9]
何云斌,张玉芬.多端口SDRAM控制器的设计与实现[J].微计算机信息,2009,25(14):49-50,73.
[10]
向兴富,袁玉群,谭亚军.基于FPGA的DDR2 SDRAM数据存储研究[J].贵州大学学报:自然科学版,2010,27(2):70-73.
[11]
陈彬,伍乾永,刘永春.基于FPGA的VGA控制模块设计[J].微电子学,2008,38(2):306-308.
[12]
朱奕丹,方怡冰.基于FPGA的图像采集与VGA显示系统[J].计算机应用,2011,31(5):1258-1264.
[13]
刘小平,何云斌,董怀国.基于Verilog HDL的有限状态机设计与描述[J].计算机工程与设计,2008,29(4):958-960.
收稿日期:2011-07-25;修回日期:2011-09-21。
基金项目:
国家自然科学基金资助项目(2009ZX09502)。
关键词:脱机手写藏文识别;GABP神经网络;特征提取
中图分类号:TP317.2 文献标识码:A 文章编号:16727800(2013)009007902
基金项目:青海省普通高等学校研究生创新项目
作者简介:梁会方(1987-),女,青海师范大学计算机学院硕士研究生,研究方向为藏文信息处理。
0引言
模式识别在各个领域中的应用非常多,从这些应用中可以看到它们的共性,即一个模式识别系统通常包括原始数据的获取和预处理、特征提取与选择、分类或聚类、后处理4个主要部分。其中藏文识别需要解决的关键问题是模式分类,其理论基础是模式识别技术,其中最常用的方法是统计模式识别方法和结构模式识别方法。近年来也有很多人将隐马尔科夫模型用于手写识别领域,取得了良好的效果。本文主要介绍统计模式识别、结构模式识别以及使用较多的隐马尔科夫模型和人工神经网络模型。
1模式识别
1.1统计模式识别
统计模式识别是依据统计的原理来建立分类器,其分类器设计方法主要有贝叶斯决策理论和判别函数。贝叶斯决策理论基本思想为:在类条件概率密度和先验概率已知或者可以估计的条件下,利用贝叶斯公式比较样本属于两类的后验概率,然后将类别决策为后验概率大的一类,从而使总体错误率最小。常见的一种贝叶斯决策为最小错误率贝叶斯决策[1],其决策规律如下:
如果P(w\-1|x)>P(w\-2|x),则x∈w\-1;反之,则x∈w\-2。
通过贝叶斯公式 ,后验概率的比较可以转化为类条件概率密度的比较,离散情况下也是类条件概率的比较,而这种条件概率或条件密度则反映了在各类模型下观察到当前样本的可能性或似然度,因此可以定义两类之间的似然比或对数似然比进行决策。
该方法的主要优点是抗干扰能力强,且易于实现,但是应用中的主要缺点是细分能力较弱,区分相似字的能力较差。
1.2结构模式识别
藏文文字结构复杂,但同时具有相当的规律性,这种文字都含有丰富的结构信息,因此可以获取这些组字的规律以及藏文字符信息的结构特征作为识别的依据。结构模式识别[2]的主要思想就是文字图像划分为很多基本组合,然后利用一些相似性度量准则确定出这些组合之间的关系,以及这些字符图像模式和一些典型模式之间利用一些相似性度量准则确定的相似程度。
1.3隐马尔科夫模型
HMM模型[3]是将特征值和一个状态转移模型联系起来,它是一个双重随机过程,其中状态转移过程是不可观察即隐藏的马尔科夫模型,而可观察事件的随机过程是隐藏状态转换过程的随机函数。HMM有3个基本问题及常用算法:①评估问题:前后向递推算法;②解码问题:Viterbi算法;③学习问题:BaumWelch算法。
HMM模型可以用一种特定的神经网络模型来模拟[4],该模型收敛性较差,易陷入局部极值。
1.4人工神经网络模型
神经系统是由大量神经细胞构成的复杂网络,是一个由大量简单的处理单元组成的高度复杂的大规模非线性自适应系统。神经网络是一个高度并行的分布处理结构,它是非线性的,具有自组织和自学习的能力。神经网络与传统的模式识别不同,能够直接输入数据并进行学习,用样本训练网络并实现识别。它是非参数的识别方法,不需要传统方法中的建模、参数估计以及参数校验、重新建模等复杂过程。
在字符识别领域常用的网络模型有:BP网络、RBF网络、自组织网络、Hopfield网络、SVM网络等。
BP网络是一种多层前馈网络[5],是一种依靠反馈值来不断调整节点之间的连接权值而构建的一种网络模型。它由输入层、隐藏层、输出层相互连接构成,其结构如图1所示。
网络的学习训练过程由信号的正向传播与误差的反向传播组成,其中正向传播是把输入样本从输入层输入,经各隐层处理后传向输出层,若输出层的实际输出和期望输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。各层权值调整过程是周而复始地进行,直到网络输出的误差减少到可以接受的程度。
2遗传算法改进的BP网络
藏文字符识别是中国多文种信息处理系统的重要组成部分,脱机手写藏文识别在很多领域有广阔的使用前景。在现有汉字以及数字识别方法的基础上,提出了很多预处理和模式识别的方法,大大提高了手写藏文的识别精度。为了提高脱机手写藏文识别精度,本文将GABP神经网络应用于脱机手写藏文识别分析中,识别过程分为两步:训练阶段、识别阶段。在训练阶段,提取训练样本集的特征,建立网络模型,以输入为目标,保存网络的连接权值和阈值以及字符特征;在识别阶段,将待识别的藏文特征送入网络运行,待网络运行到平衡状态,将输出结果与数字特征库的值进行比较,识别出藏文字符。
BP网络是目前应用最多的神经网络,这主要是因为BP算法[6]有较强的非线性映射能力、泛化能力以及容错能力。但是它本身存在大量的问题,突出表现在:BP算法的学习速度很慢,需要较长的训练时间;网络训练失败的可能性较大,易陷入局部极小点,逼近局部极小值[5]。为了改善这些缺点,通常会改变隐层数量,隐藏层一般根据具体情况制定,但是增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能力。而遗传算法的基本作用对象是多个可行解的集合,而非单个可行解。它同时处理多个个体,同时对搜索空间中的多个解进行评估,使得遗传算法具有较好的全局搜索性能,减少了陷于局部最优解的可能性,同时,它本身具有良好的并行性。所以用遗传算法学习神经网络的权重及拓扑结构[6],对神经网络进行改进,提高了神经网络的精度,同时也提高了遗传算法的局部搜索能力。在模式分类应用中进行数据预处理,利用遗传算法进行特征提取,其后用神经网络进行分类。GABP混合学习算法结构如图2所示,采用GA优化BP网络权值。
①BP网络参数初始化;
②按BP网络的权值和阈值连接随机产生染色体;
③计算染色体的适应值以及迭代次数,如果达到要求,则结束GA算法,产生最佳个体,如果没有达到,进行下一步;
④按适应度进行选择、交叉和变异操作,产生新的染色体,重复上一步;
⑤将产生的最好个体依次映射到BP网络中对应的权值和阈值,并将此作为BP网络的初始值;
⑥利用BP网络,判断误差是否达到预定要求,达到就结束,如果没有,则BP网络反向传播,返回上一步。
3结语
本文分析了文字识别的常用方法及其优缺点,着重分析了手写藏文识别征提取和分类器设计两个关键技术,并对藏文识别研究领域今后的研究方向和发展前景提出了一些看法。在原BP网络的基础上改进GABP神经网络,可以提高其学习速度,加快收敛速度,相比而言识别精度较高、训练时间较短,且具有较强的鲁棒性。由于神经网络和遗传算法已经发展得比较成熟,将两者结合的方法用于藏文识别,具有很大的实用价值,同时将GABP神经网络用于藏文识别,有助于神经网络用于藏文识别的可能性和有效性。
参考文献:
[1]张学工.模式识别[M].北京:清华大学出版社,2010.
[2]吴刚,德熙嘉措,黄鹤鸣.印刷体藏文识别技术[C].第十届全国少数民族语言文字信息处理学术研讨会论文集,2005.
[3]刘卫,李和成.基于局部保持投影与隐马尔可夫模型的维文字符识别[J].计算机应用,2012,32(8).
[4]梁弼,王维兰,钱建军.基于HMM的分类器在联机手写藏文识别中的应用[J].微电子学与计算机,2009,26(4).