公务员期刊网 精选范文 识别技术论文范文

识别技术论文精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的识别技术论文主题范文,仅供参考,欢迎阅读并收藏。

识别技术论文

第1篇:识别技术论文范文

1、概述生物识别技术,又称为生物特征识别技术,是通过计算机与生物传感器、生物统计学等高科技手段紧密结合,利用人体固有的生理特征和行为特征识别身份的技术。该技术被称为数字时代的安全卫士。在实际应用中,生物特征识别通过特定的设备进行特征取样测量,转化成数字代码;对代码取样后形成特征模板;用特征模板与实际个体取样进行比对;根据比对结果是否匹配来决定接受或拒绝该用户。常用于识别的生物特征有指纹、人脸、掌纹、血管纹路、DNA等;行为特征有签名、语音、步态等。

2、生物识别技术的特点与应用优势生物特征是与生俱来的,与传统身份识别方式相比,生物识别技术具有以下优势[4]:(1)能够进行身份识别。传统身份认证识别采用用户名+口令验证的方式来验证用户身份。生物特征同样可以完成身份识别的功能。(2)生物特征具有唯一性,防伪性好,难以被伪造或盗用。传统身份识别技术中的用户名和密码会因为信息泄露而带来身份认证漏洞。生物特征则是个人特有的,极难被仿造或盗用。(3)携带方便,不会遗忘或丢失。传统身份识别技术采用口令验证或实物验证,两者都有遗忘和丢失的风险。而生物特征是人类的体貌和行为特征,携带方便,也不存在丢失和遗忘的风险。(4)用户使用体验好,不容易被损坏。传统身份识别技术依赖数据库记录用户名和密码,常因为字符输入错误而被拒识;IC卡一类的实物验证技术则有因损坏而被拒识的风险。生物特征大大降低了此类风险。即使是容易受到手指表层皮肤破损而影响验证的指纹识别也可以通过存储多个手指的指纹来达到顺利验证身份的目的。此外因为生物识别技术使用友好度高,用户体验好。

3、常用生物识别技术的特性分析在众多的生物特征中,最常使用的用户接受度较高的是指纹识别、人脸识别和签名识别。指纹识别是应用最早、应用面最广的生物特征识别技术。早在几千年前人们就已经发现了指纹的特点,开始使用指纹进行身份的识别。指纹识别主要是利用指纹记录仪和计算机等电子设备,通过人类手指表层皮肤上交替出现的脊和谷进行指纹图像的读取、提取指纹特征、制成特征模板,再通过模式匹配,最终实现身份的自动识别。每一个人都有自己独特的而且终身不会变化的指纹。指纹识别技术可靠性高,识别简便,是一项成熟的生物特征识别技术。在应用面上也体现出无与伦比的优势,目前国内外指纹识别应用已经覆盖了公安刑侦领域、公共安全领域等。由于指纹识别技术是将输入的指纹和数据库中预存的指纹模板进行比对从而验证身份,因此要求指纹信息数据库的容量足够大,并且要不断更新。人脸识别技术是近年来迅速发展的一种生物识别技术。人脸识别技术涉及了计算机视觉、人工智能、感知学习和模式识别技术等科学领域。人脸识别是通过摄像机读取人类脸部特征信息,分析现实人脸的空间图像映射到机器空间的过程,分析人类脸部共有特征和个体人脸特征之间的关系,形成人脸图像模板,最终实现人脸自动识别。人脸识别技术具有方便、直接、友好等特点,在使用者接受度方面表现极好。但是人脸图像信息的数据量巨大,为了提高人脸识别的运算速度,必须对原始图像数据进行压缩,这就有可能降低识别率,造成一定的误识率和拒识率。签名识别是通过分析使用者签署自己名字的方式来进行身份鉴别。签名识别与指纹识别、人脸识别不同,它属于人类行为识别技术。签名识别分成在线验证和离线验证两种形式。离线验证是使用纸张上的字迹通过扫描仪等电子设备转化成数字图像再与数据库中模板信息比对;在线验证则通过手写板或压敏笔等传感器设备记录签名过程中的各项动态特征数值(写字速度、力度、角度、加速度等)。签名的动态特征是难以模仿的,因此签名的在线验证方式比离线验证方式要更加可靠。此外签名识别与人们平时的签字行为极为相似,因此具有很高的用户接受度。

二、生物识别技术在电子商务中的应用

伴随电子商务的发展,解决电子商务中的安全问题和寻找更加可靠方便的身份认证方式成为进一步发展电子商务的新需求。另一方面,随着全球信息化的发展,生物识别技术在技术发展和市场培育上都日趋完善,人们对生物识别技术的认知度和认可度也不断提高。全球生物识别技术产业化发展程度在不断扩大。2002年11月,中国科学院计算机技术研究所承担的“面像检测与识别核心技术”项目获得突破性成果,该系统能够在1/10~1/20秒之内自动检测到人脸,并且在1秒内完成身份识别。2003年阿拉伯联合酋长国宣布启用基于虹膜认证技术的针对被驱逐外国人的国界控制系统。2006年北京农村商业银行在国内试点使用指纹识别认证,用户可以通过指纹识别认证进入银行系统,自助完成各项操作。2007年中国建设银行和中国邮政储蓄银行分别在全国营业网点内推广应用柜员指纹身份认证系统。2008年北京奥运会,奥运村使用了基于人脸识别的酒店门禁管理系统。2010年波兰BPSSA银行宣布引入采用生物识别技术的自动取款机。国际民航组织确定从2010年起,其所有的成员国和地区必须使用基于人脸识别的机读护照,此项规定已经成为国际标准。此外日本三菱银行开发了基于手指静脉的认证系统用于金库管理。欧美国家将生物认证技术广泛用于医院病人资料库管理、政府信息中心出入境管理、小学生信息管理等多个领域。由此可以期待,在不远的将来,基于生物特征识别技术的更加平民化的电子商务应用走入我们的生活,带来更加安全更加便利的使用体验。

三、生物识别技术对电子商务的影响趋势

现代社会生活各方面都需要可靠方便的身份认证识别技术,尤其是在电子商务领域内,目前电子商务的运营过程中不乏因为过程监控不够周密而出现的货物丢失、冒领,并由此引发纠纷事件。未来,基于生物识别技术的身份认证识别能够覆盖电子商务的全领域,彻底解决电子商务运营过程中的身份认证问题。

1、在电子商务领域内的全领域覆盖电子商务在运行过程中涉及了买卖双方的身份认证、订单信息认证、支付安全认证、物流运输安全认证等多项认证。其流程之繁琐,认证技术运用频率之高是其他行业所无法比拟的。可靠便利的生物特征识别认证技术能够确保电子商务系统的正常运转。未来,电子商务的买卖双方可以通过生物特征认证技术证明自己的身份;通过生物特征认证和数字签名的双因子认证确定订单的真实有效,并完成相应的支付;物流公司的物流派送人员通过指纹验证确认接收到需要派发的货物;最终收货人通过提供带有生物特征信息的签收信息表明身份,确保货物安全送达。由此,生物特征技术确保了电子商务安全领域内的安全性、可用性、可控性、保密性和不可否认性,保障电子商务系统正常有序运行。

2、多项生物特征融合应用从目前的应用看来生物识别技术虽然前景良好,但仍存在有漏洞。例如,利用塑胶可塑性的特点采集指纹应对指纹验证系统;利用3D打印技术欺骗静态人脸识别验证系统。多项生物特征的融合使用就是生物特征识别技术的多因子验证。这种对多项生物特征的采集、融合、联合验证的新型理论和技术就是生物特征识别的未来发展趋势。该项技术能够对所采集的生物特征信息进行多方面、多级别的处理,得到更加完备的数据特征信息,从而完成精准度更高的身份认证,为安全可靠的身份认证技术的实施奠定了基础。

四、结论

第2篇:识别技术论文范文

无线射频识别技术[1](radio frequency identification,RFID)是一种非接触的自动识别技术, 它通过射频信号自动识别目标对象并获取相关数据。在RFID系统工作时,数据碰撞将导致读写器的接收机不能正确而及时地读出数据,从而降低RFID系统的工作性能及其效率。标签防碰撞算法可以实现多个标签与读写器之间的正确通信,其性能决定了标签的识别速度和效率。因此, 标签防碰撞算法是RFID系统中的关键技术之一,其优劣性在很大程度上决定了射频识别过程的时间性能以及识别成功率。

传统的标签防碰撞算法可分为ALOHA算法[2-3]和树形算法[4-5]2类。ALOHA算法是1种完全随机接入的多址接入协议算法,比如:PALOHA算法(随机推迟算法)、时隙ALOHA算法(SA算法)、帧时隙ALOHA算法(FSA算法)、动态帧时隙ALOHA算法(DFSA算法)和分组ALOHA算法等。该类算法在标签试图发送数据时,并不考虑信道当前的忙闲状态,一旦产生数据,就立刻决定将其发送至信道,这种发送控制策略有严重的盲目性。随着用户数量或发送信息量的增加,这种完全随机接入的算法将使信道重叠现象加剧,碰撞概率增大,传输性能下降。

近几年,有学者提出了采用CDMA技术进行防碰撞的方法,其性能有明显改善。文献[6]提出在标签识别过程中,使用码分多址技术,实现一个时隙可以同时传输多个标签。文献[7]提出了一种基于码分多址思想的时隙ALOHA算法,来解决射频识别中的防碰撞问题,此算法的系统稳定范围要大于时隙ALOHA系统,并且当选用的扩频码组阶数为N时,此算法的最大吞吐量可达原时隙ALOHA的N倍。上述2个文献所提到的算法,当标签数量很多时,数据碰撞的概率明显增加,使系统的吞吐量急剧下降,影响了系统的整体性能。基于以上原因,本论文提出了1种改进的基于CDMA技术的防碰撞算法,能够适应大量标签的识别应用,减少了识别碰撞的发生,使系统吞吐量得到明显改善。

1基于CDMA技术的新型防碰撞算法

n×1-1Nn-1(2)由于传统的基于ALOHA的防碰撞算法中一个时隙最多只能正确识别一个标签的信息,所以当标签数目过大时,系统的吞吐率,即正确识别标签数目所占的百分比将会大幅度的降低,所以对于过量的标签,本算法将会采取对所有标签进行分组识别,当标签需要分成2组时(系统识别帧最大时隙数N为256):nN×1-1Nn-1=n2N×1-1Nn2-1 (3)用上述公式可知n=354,所以当标签数量大于354时,系统将会对标签分组识别。

本文提出的新型算法如下:依据分组帧时隙ALOHA算法,通过此算法的分组规则,完成识别的所有标签的分组。分组帧时隙ALOHA算法的分组规则如下:当标签数量≤354时,无论帧长选择8个时隙还是256个时隙,标签都不分组,按照一个大组来进行识别;当标签数量>354时,帧长选择256个时隙比较适合读写器的识别;当标签数量在355707时,标签分为2组;当标签数量在708~1 416时,标签分成4组更适合信息的传输识别。当标签数量更多时,按照这个规律分成合适的组数再进行识别,详细过程如图1所示。标签分组工作完成后,在每个分组中分别采用码分多址技术,利用其技术的保密性、抗干扰性和多址通信能力,对标签中的数据进行扩频处理并传输。然后读写器端利用码组的自相关特性对不同标签所发的数据进行解调,从而达到防碰撞的目的,进而完成对全部标签的识别,也实现了同一时隙可以传输多个信息的情况。本论文中提到的新型防碰撞算法需要预先在待识别的标签中植入扩频性良好的正交码组,以防止接收端没有办法正确解扩接收,本文选用Walsh序列。该算法可以有效减少图1算法执行过程示意图标签识别过程中的碰撞次数,从而减少了识别时间并且降低了功耗。本论文将分组帧时隙ALOHA算法和码分多址技术相结合,实现在每个分组内可以有多个标签同时进行扩频传输,并且在接收端采用并行接收技术进行多个标签的同时接收。本发明在识别标签过程中,每个组内均为一个独立的识别过程,在分组帧长不改变的前提下,提高了标签数量庞大时的系统性能。有效地减小标签之间的碰撞概率,缩短读写器操作时间,提高吞吐率, 很适合应用于具有较大数量标签的RFID系统中。

2仿真结果

本论文提出了采用码分多址技术的新型防碰撞算法,并仿真了固定时隙数下ALOHA算法的系统吞吐率和本文所提出的算法改进后的系统吞吐量。

RFID系统中时隙ALOHA算法的帧长取值从16个时隙到256个时隙变化,根据公式2,系统吞吐率如图2所示。其中,系统仿真设定的信息帧长F即时隙数设定按2的幂次方递增,即F取值从16个时隙变化到256个时隙,横坐标为标签数N从1变化到500,纵坐标为吞吐率。当帧长设定为256个时隙,标签数量少于256个时,系统吞吐量随着标签数量的增加而增加,直到标签数量达到256时系统的吞吐量达到最大值。随着标签数量的逐渐增多,系统的吞吐量又呈现下降趋势。从图2可以得出2点结论:一、当标签个数接近信息帧长时,系统的吞吐率比较高;二、随着帧长取值的增加,系统对标签的识别性能有明显改善。

本论文提出的基于码分多址技术的新型防碰撞算法选用Walsh序列码,其在对标签的ID号进行扩频处理后,即可实现在同一时刻有2个以上的标签同时进入读写器的识别区域,它们同时发送各自的ID号后,读写器在接收到这些在空间叠加后的信号时也能完整地分离出不同标签的ID号,突破了时隙ALOHA算法在同一时刻不能有2个以上标签到达的限制。此时,系统的吞吐量为(Walsh序列的阶数为r)esucc=∑t=2rt=1N×P(N,n,t)(4)固定时隙数的ALOHA算法的系统吞吐量仿真图和其与基于码分多址技术的新型防碰撞算法的比较仿真结果如图3所示。仿真条件为标签的到达情况符合泊松过程。仿真图3给出了RFID系统的读写器阅读100个标签的识别结果,其中新型算法选用的是Walsh序列,其阶数r取值从2变化到3,固定时隙数的ALOHA算法的信息帧长F取值从32变化到64,横坐标为标签数N从1变化到100,纵坐标为吞吐量。从仿真结果看,在同样的到达率的条件下,阶数越大,算法的吞吐量越高,系统的识别性能有明显改善。并且随着到达率的增加,新型算法的吞吐量也随着增加,当标签到达量与阶数相等时,系统吞吐量达到最大,但到达量大于阶数时,吞吐量随着到达率的增加而呈下降趋势。这是由于当在同一时隙内到达的标签数量增加到一定程度后,基于Walsh序列阶数r的有限性,选用相同的Walsh序列作为扩频码的标签数量将会增加,此时必然导致碰撞的增加。当选用的Walsh序列阶数为3时,基于码分多址技术的新型防碰撞算法的系统吞吐量可高达3.2,远高于时隙ALOHA的0.368。而且随着Walsh序列阶数的提高,吞吐量的最大值还可以提高,但这会以增加读写器和标签的硬件复杂度为代价,在实际使用中必须根据需求在吞吐量和Walsh序列阶数中作出折中选择。

第3篇:识别技术论文范文

1 文献统计分析

1.1 文献数量统计 笔者通过中国知网的“中国学术文献网络出版总库”,分别以“图书馆*RFID”、“RFID*图书馆”两组关键词为检索路径,采用高级检索的方式,以2004~2013年为检索年限,检索时间截至2013年12月31日,检索结果如表1所示。

1.2 文献学科类别 以“图书馆?RFID”为关键词检索到的332篇文献作为统计基础,根据文献研究内容主题进行统计,共涉及9个学科类别,其中199篇为图书情报专业学科,占发表文献总量的59.9%(见表2)。

1.3 发文年代分布

2 从文献量化分析看研究进程

2.1 图书馆RFID研究文献的起步 关于我国“图书馆RFID”的文献研究起步于2004年。2004年西华大学图书馆李欣荣发表了《RFID在现代图书馆管理系统中的应用》,文章探讨了RFID的定义、RFID系统的组成、RFID的优点,指出RFID及时是一种市场前景和应用规模巨大的高新技术,这种技术的应用将给现代图书馆管理系统带来革命性变化。2004年杭州师范学院图书馆沈嵘发表了《无线射频识别技术(RFID)及其在图书馆的应用》,指出射频识别技术RFlD与条形码识别技术相比的优越性,在图书馆应用方面,射频识别技术弥补了条形码识别技术的不足。

2.2 图书馆RFID研究文献的发展 2004~2013年间,共发表有关“图书馆RFID”的文章332篇,这些论文分别来自54种国内公开出版的学术期刊,其中包括图书馆学专业及人文社会科学其他专业。

从论文年代分布对其发展进程进行分析,10年的研究大体上分为2个阶段:第一阶段:起步阶段,2004~2006年,这一阶段涉及到的论文有17篇。第二阶段:高峰阶段,2007~2013年,研究的论文数量逐渐增多,7年共发表324篇论文,占文献总量的97.6%,并逐渐形成研究热点。这一阶段可以看作是图书馆RFID研究的高峰平台期,且还没结束。

3 文献研究的内容

3.1 RFID的理论以及应用模式研究 通过对10年发表的332篇论文主题的归纳分析,发现关于图书馆RFID的理论以及应用研究占大多数,都从RFID的介绍、特点、优越性在图书馆中应用的可行性以及应用效果等方面对图书馆应用RFID进行了充分的论述。

河北师范大学图书馆刘绍荣、杜也丽、张丽娟在《RFID在图书馆使用现状分析》一文中通过对国内外图书馆实施RFID技术情况的调研,就其在国内的总体发展情况、使用情况以及使用效果进行了分析,并指出使用中存在的问题,提出解决问题的建议,为关注者和准备实施RFID的图书馆提供参考。

在《RFID在图书馆应用的可行性研究》一文中,中山大学资讯管理系蔡孟欣从图书馆的战略规划、经济、技术、安全、人文等方面,对RFID在图书馆应用的可行性进行了分析,同时指出图书馆应根据自身及社会的实际情况进行综合考虑,进而确定是否采用RFID系统。

深圳图书馆甘琳在《RFID技术在图书馆的应用创新》一文中从深圳图书馆应用RFID的经验、体会出发进行阐述,同时在服务、业务及管理等方面,论证了这种新技术给图书馆行业带来的机遇与挑战。

3.2 图书馆应用RFID的优缺点研究 从目前发表的文章来看,有关RFID技术在图书馆应用的优势,不足及改进办法的论述已经比较全面。其优势主要包括:①实现自助借还,优化图书借阅服务;②便于书库管理,提高馆藏清点速度;③提高工作效率,节约人力成本等。不足主要包括:①成本较高;②标准不统一;③安全问题;④侵犯隐私权;⑤识别精度;⑥与现有系统的整合等。

西南政法大学图书馆杨雪在《RFID技术在图书馆应用中的思考》一文中指出,在图书馆应用方面,RFID技术具有非常大的优势,可以提高图书馆的管理和服务水平,但在实际应用中仍然遇到一些问题。除上文提出的一些普遍存在不足之外,还提出图书馆在应用RFID技术中管理观念滞后、系统集成方案不成熟等问题,需要图书馆、RFID厂商及管理系统开发商协调工作,共同解决。

天津农学院图书馆王颖在《对RFID在图书馆应用的思考》一文中重点讨论了图书馆人在RFID应用中需要关注和思考的问题,包括RFID标准、人力资源合理安置、读者调查以及图书馆应用RFID系统的示范项目等方面。

4 总结与分析

自从2006年厦门集美大学诚毅学院和深圳图书馆应用RFID系统以来,国内许多学者即从RFID的概述、作用、运行模式等方面进行探讨,取得有意义的理论和实践成果。

4.1 RFID研究文献增长迅速 笔者利用“中国学术文献网络出版总库”,以“图书馆*RFID”为检索策略,检索出2004年至2013年文献332篇,从“文献发表年代分布统计”一表中可以看出,国内对RFID的研究成直线上升状态。

4.2 RFID理论研究热点 ①RFID概述及其特点。在图书馆领域,随着现代化技术的广泛使用,使用多年的条形码识别技术逐渐被新型的射频识别技术RFID所取代。对于RFID技术来说,其优势主要表现为:使用寿命长、读取距离大、标签上数据可以加密、存储数据容量更大等,该技术可以替代条形码和磁条技术。②RFID在图书馆中的应用研究。自从RFID技术在集美大学诚毅学院和深圳图书馆的应用,RFID技术已经受到图书馆越来越多的关注。RFID技术在图书馆的应用,使图书馆的管理更趋于科学化,将给现代图书馆管理系统带来革命性的变化,将图书馆从数字化图书馆推向了智能化图书馆。③RFID优缺点的研究。RFID技术在图书馆应用面具有非常大的优势,可以提高图书馆的管理和服务水平、提高图书馆的服务效率,但在使用过程中仍然遇到一些问题,也存在不成熟或不完善的地方。近些年许多学者通过对RFID技术在图书馆应用中存在的优势及问题进行分析,提出解决方法及对策。

第4篇:识别技术论文范文

关键词:星敏感器;星图识别算法;导航星数据库;奇异值分解

中图分类号:TP391.4 文献标识号:A 文章编号:2095-2163(2014)02-

An Improved Star Recognition Algorithms based on Singular Value Method

XING Yifan, WANG Jianhua

(Institute of Computer Science and Information Engineering, Harbin Normal University, Harbin 150025, China)

Abstract: Star tracker is most precise instrument of attitude measurement, playing a vital role in attitude measurement and control system of all kinds of Aerospace Flight Vehicles. Star pattern recognition algorithm as one of core technology of star tracker is so important that the reliable, fast and accurate star pattern recognition is widely investigated. The star pattern recognition algorithms are investigated. For the problem of low coverage throughout the sky caused by lack of bore sight direction, an improved singular value method for recognition algorithm is proposed respectively. The design thoughts of programs are elaborated clearly. Finally, this thesis develops JAVA language code of the improved algorithm in the JDK 5.0 Builder environment and makes an comparison with performance of the traditional Triangle algorithm in detail.

Keywords: Star Tracker; Star Recognition Algorithms; Database of Guide Star Pattern; Singular Value Decomposition

0 引言

天文导航是通过对已知自然天体的坐标位置和运动规律开展研究,应用观测天体的天文坐标值来确定导航体在地球上的地理位置等导航参数[ ]。与其他导航技术相比,天文导航系统由于不需要其他地面设备的支持,可以实现自主式导航,同时还具有指向精度高、体积小、自主性强、无姿态累积误差等优点,星敏感器的这些性能使其成为一种优良的空间姿态敏感器技术而在空间飞行器中得到越来越广泛的应用。

星敏感器技术的出现为空间飞行器的姿态测量探明了一个新的途径。星敏感器利用恒星坐标系作为参考坐标系,以若干个恒星矢量进行航天器在轨飞行阶段的高精度姿态测量。对于星敏感器而言,星图识别的实质就是寻找观测星图中观测星在星表(天球坐标系)中对应的导航星[ ],这是星图导航中极为关键的一个步骤。该步骤指出了星敏感器拍摄到的实时星图的空间位置信息,可为导航中的姿态和位置解算提供了基础,其效率和准确度对整个星图导航系统有着极为重要的意义[ ]。

1 基于奇异值分解的星图识别算法

基于奇异值分解的星图识别算法是一种非直观的星模式识别方法,是利用观测坐标系下的观测单位列矢量矩阵的奇异值和参考坐标系下相应的参考单位列矢量矩阵的奇异值来进行星模式识别。由数学原理解析可得,该算法进行模式识别所用的奇异值相对于坐标变换是不变的[ ]。对于一帧观测星图,无论有多少个向量,最后提取的特征只有3个奇异值。

第5篇:识别技术论文范文

首先通过对基于区域分析的指尖检测算法的介绍和研究,并验证了该算法的有效性。然后介绍了增强现实技术以及增强现实中的人机交互,并把指尖检测算法应用到增强现实系统中,通过实验能够很好的识别指尖与虚拟对象的交互区域并实时反馈交互结果,证实了该算法在增强现实系统中的可行性。

【关键词】区域分析 指尖检测 增强现实 交互应用

1 基于区域分析的指尖检测算法

1.1 改进的图像差分算法

在传统的邻帧差法主要是通过前后两帧的灰度值来检测图像中变化的区域,这种算法在目标运动并且背景静止的情况下是很有效果的,但是当目标停止运动时邻帧差法就会失效。而背景消减法主要是通过把当前帧和参考图像相消减来获取静止的目标物体。所以能否准确分割的关键取决于如何选择与更新参考图像。

1.2 指尖的检测识别

1.2.1 指尖模型

指尖模型包括二维模型和空间三维模型。空间三维手指模型可以通过提供详尽的建模使得后面的手势识别有很高的精确度。但是手指动作随时都在变化,手指的空间三维模型还是很复杂而且实时计算代价很高,所以我们通过利用指尖二维平面位置检测法来解决以上问题。

通过对手指在二维平面上各种动作的观察,我们发现在手指运动并且变换各种动作时其指尖形变部位相对较小,所以我们可以把指尖的状态看做是一个圆和一组平行线的组合。基于这种情况,我们设计一个模型作为指尖模板,如图1所示。在图中,d表示的时手指的宽度,这个宽度由摄像头和手指之间的距离来确定。

如果在二值化后,前景图像中的目标是1,背景是0的话,我们可以看到在指尖区域有两个特点:

(1)在指尖的中心被一个圆包围,这个圆是由一圈圈像素填充所绕成的,其半径可以定义成手指的宽度;

(2)如图1所示,在圆外的特定搜索区域内,指尖部分是被0像素和连续的1像素所包围。

根据形状匹配思想,主要是通过按一个度量标准来对比匹配的物体间的相似程度来进行形状匹配。根据这个思想,如果要想对某一模式进行识别,那么就要先准备好与之相对应的模板。因为考虑到要识别的模式其大小、方向等外部特征会发生改变的可能,所以需要对于每一种变化后的模式都要有对应的模板,这样才能保证真确识别。因为指尖会有各自动作变化或者会有部分被遮挡,而且不同人的手指也存在大大小小的不同,所以我们采用的指尖模板要能够伸缩、平移以及保证旋转时不变。

1.2.2 指尖检测

因为摄像头和人手之间的距离一般都是相对固定了,所以我们将手指宽度设定为5和15之间,通过一些实验,结果表明这个值的设定对于大多手指都是适用的。在搜索区域中,其边长相比于手指直径,一般都要大两到三个像素。如果这个边长的值设置的比较大,那么计算代价就会比较大,这样就会导致检测的精度不够高。公式1.4中的Max和Min是对前景像素在搜索区域方向上个数的限制,一般来说Min的值等同于手指宽度d,Max为Min的两倍。

结合上述内容,一个像素点只有同时满足三个条件,才可以被判断为指尖。这三个条件如下:

(1)在这个像素点得周围区域里的前景像素一定要达到一定数量。

(2)在以这个像素点为中心的搜索区域边界上的前景像素和背景像素各自的比例一定要合适。

(3)在搜索区域边界上的前景像素一定要能够直接连通。

1.2.3 指尖检测实验结果与分析

在实验中,我们通过手指在投影墙壁上移动来测试以上算法能否准备检测出指尖位置。在开始的时候,我们将背景设置为蓝色,手指进入背景后缓缓移动,我们可以检测到指尖位置,用黑色的十字叉将其表示出来。

当我们将背景从蓝色变换成白色时,这时因为起始设置的蓝色背景图没有来得及迅速更新,这时就会导致前景分割出现错误,当白色的背景稳定后,设置的背景图片进行更换后,就可以检测出之间的位置,如图3所示。

2 增强现实中的人机交互判定与反馈

与虚拟对象交互的判定以及虚拟对象对用户的反馈是交互模块中主要实现的功能,也是系统中手指虚实交互的最后一个环节。

当过以上指尖定位算法,我们能够比较精确地检测出指尖的位置,可以得到指尖与虚拟对象交互的有效区域,这个交互区域也就是指尖和虚拟对象相交的区域。再通过坐标转换,将交互区域的二维坐标转换为空间三维坐标。我们通过设定一个处理动作触发的时间来对指尖动作进行判定,一般这个触发时间是在0.5秒到一秒之间。当指尖的触发时间在设定的时间之内并且指尖位置没有很大变化的时候,就判定指尖对虚拟对象进行了触发动作,通过程序处理,虚拟对象会根据指尖的动作做出相应地反馈。

3 基于区域分析的指尖检测算法在AR系统中的应用

通过实验验证,利用基于区域分析的指尖检测算法在大多情况下能够准确地检测出指尖的位置,从而有效的判断了手指与虚拟对象的交互区域。实验运行结果如下:图4所示为系统识别标识物呈现出来的虚拟对象,人手指点击虚拟对象的边角并且拖动后,图5为手指点击并拖动后的交互效果。

4 结束语

手势作为一种直观的动作表示,在人机交互中有着无可比拟的优势,目前也是模式识别、计算机视觉等组多领域的研究热点。但是目前的算法还是有诸多不足,包括本文介绍的基于区域分析的指尖检测算法,也会出现一些误检情况。随着人们研究的深入,一定会有更加高效的算法。通过高效的指尖检测算法,未来的AR系统的交互将更加的实时、准确,也会促进AR技术的高速发展。

参考文献

[1]周国众.移动增强现实关键技术及应用[J].测绘与空间地理信息,2012,35(9):140-144.

[2]唐笑.增强现实技术在移动互联网中的应用[J].华章,2013(2):330-331.

[3]罗颖.基于增强现实的交互界面设计研究[D].华中科技大学硕士学位论文,2012(5).

[4]周俊威.手机增强现实虚实注册关键技术研究[D].华中科技大学硕士学位论文,2011.3.

[5]程志,金义富.智能手机增强现实系统的架构及教育应用研究[J].技术与运用,2012.8:134-138.

[6]李可歆.手持设备上基于增强现实的虚实交互技术的研究与应用,青岛大学硕士学位论文[D],2010(6).

[7]梅萍华.基于手势的人机交互和指尖检测算法的研究[D].中国科技大学硕士学位论文,2010.

[8]颜浩.增强现实系统的人机交互技术研究与应用[D].青岛大学硕士学位论文,2011.

作者简介

周锋(1987-),男,江苏省泗洪人。硕士研究生学历。主要研究方向为计算机监控,模式识别。

第6篇:识别技术论文范文

关键词 轮胎缺陷;计算机视觉识别;轮胎X射线检测;算法

中图分类号TN29 文献标识码A 文章编号 1674-6708(2013)95-0073-03

0 引言

目前对轮胎X射线检测系统的图像识别都是由人来主观判断的。X光机对轮胎进行扫描成像,将图像传输到计算机中在显示屏上显示,工作人员通过对轮胎X射线图像的识别来判断轮胎是否有缺陷并对其缺陷进行分类,由人工来进行轮胎缺陷图像识别受到外界的干扰较大,并且具有工作量和工作强度大的特点,这些都容易给轮胎缺陷图像的识别带来较大不利影响。采用计算机图形识别技术对轮胎X射线图像进行识别,不仅能提高工作效率,有效解决人工识别过程中带来的问题,使识别的过程客观化,更加科学和规范。轮胎X射线缺陷检测系统能对其图像进行自动处理和归类,通过对轮胎缺陷图像的统计,还可以建立轮胎缺陷图像的数据库,提高企业在轮胎生产过程中的经济效益[1]。

国内厂商大都是用国外生产的X射线检测产品,比较常见的品牌有德国的Collmann和YXLON等[2]。YXLON是国际上轮胎内部缺陷检测设备的最大生产厂家,其产品具有可靠的检测结果、快速的检测时间、维护简单、结构紧凑、操作简单直观等特点[3]。相比较国外,国内对轮胎用X光机图像处理技术的研究不多,对于国内的轮胎制造厂商,如果想要运用轮胎缺陷图像自动识别技术,只能向国外购买,但是价格昂贵。因此,现在国内的大部分厂商还是采用人工肉眼对轮胎X射线图像检测的方法进行质量判断[4]。

1 轮胎X射线检测装置和结构分析

我们采用的轮胎X射线检测图像采集装置为YXLON公司生产的LX-1500型轮胎X射线检测系统,YXLON的轮胎X射线检测系统由X射线管、U型传感器、数字图像转换器、图像处理工作站和显示器等部分组成,该系统具有机械结构设计良好和图像识别系统分辨率高的特点。采用该系统对轮胎进行X射线检测时,轮胎首先通过起重机被装载到检测的支架上,系统操作工使用控制面板输入合适的参数,按照设定好的参数,径向X射线管伸进到轮胎的中部,马鞍型的轮胎线阵列检测器也移动相应的位置,轮胎在支架上保持匀速的转动,从而确保了轮胎X射线检测过程的连续性。

2轮胎X射线检测图像分析

由于轮胎的规格型号极其繁杂,轮胎的内部结构也是千差万别,导致表述轮胎缺陷时没有统一的标准,这里依据对轮胎生产质量的控制要求,结合轮胎缺陷数据分析和文献资料参考的基础上,将轮胎内部钢丝帘线的缺陷特征概括为以下四类:

2.1 帘线的形状

对于质量正常的轮胎而言,其内部的胎体钢丝帘线分布应该是与图像横向平行排列的直线序列,如图1(a)所示。当帘线弯曲时,其检测图像如图1(b)所示。

2.3帘线的细节

轮胎内部钢丝帘线的细节主要表现为钢丝帘线上的不连续点、交叉点或者断点。图3(a)是帘线交叉的X射线检测图像,图3(b)是帘线断开的X射线检测图像。对于胎体异物而言,由于X射线投影成像的关系,异物的影像会与钢丝帘线的影像发生重叠,如图3(c)所示,所以胎体异物也可以归纳为帘线上的细节问题。

4 结论

本文首先介绍了轮胎X射线检测装置,然后对轮胎X射线检测的图像进行了详细分析,并对图像中轮胎的缺陷种类进行了分类,最后介绍了自己设计的轮胎X射线检测缺陷识别算法,针对形状、尺度、细节、排列四种轮胎缺陷,分别设计了相应的轮胎缺陷识别算法。

参考文献

[1]冯霞,郝振平.X射线在轮胎边缘检测中的应用[J].CT理论与应用研究,2010,19(3):61-66.

[2]徐啟蕾.轮胎X光图像自动识别系统算法研究[D].青岛:青岛科技大学硕士学位论文,2006.

[3]张小丽.轮胎缺陷X光检测图像的处理与识别研究[D].天津:天津大学硕士学位论文,2007.

第7篇:识别技术论文范文

关键词: 藏文联机手写识别; 笔画识别; 方向码; 笔画合并

中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2017)07-10-03

Research and implementation of Tibetan online handwritten recognition

Suonan Jiancuo, Guan Bai, Li Lei, Shan Fafu

(Tibetan information technology engineering research center, Tibet, Lhasa 850000, China)

Abstract: This paper presents a method of Tibetan online handwriting recognition based on stroke and its corresponding rules, and implements it. First, each Tibetan text is decomposed into various sub patterns, and then the sub pattern is further divided into strokes. Through the identification of strokes and the corresponding rules of each Tibetan character, the user's handwriting character is recognized. In the identification of a stroke, its trajectory is taken as a set of points, and eight directional codes are used to mark it, and then the stroke is determined. Before the identification, the similar strokes are classified and merged to solve the problem of nonstandard user writing. Without considering the joined-up writing, tested on more than 600 Tibetan words commonly used, the accuracy rate can reach 92%.

Key words: Tibetan online handwriting recognition; stroke recognition; directional code; stroke merge

0 引言

S着如平板电脑、智能手机和数码笔等基于笔和触摸输入设备的发展,联机手写字符识别再次引起了人们的兴趣。近年来,研究人员开发出多种方法,来识别不同类别的字符并提高识别性能。这些方法力求在实际应用中以较低的复杂度来实现高性能的识别来满足用户的需求。

在中国,藏文作为少数民族文字,大约被600万人使用,尤其是在自治区,云南和青海等省。联机手写藏文字符识别也被广泛应用到便携设备以及桌面的应用程序[1]。然而,相较于中文、英文和日文等语言,藏文要达到高识别率仍然具有挑战性。

1 藏文联机手写识别

1.1 研究方法

手写识别方面主要有基于统计决策模式的识别方法和基于文字结构模式的识别方法两大类别[2-5],基于统计决策模式的识别方法是首先将待识别的文字提取出一组统计特征,然后根据此组特征形成该文字的多维特征向量,最后再将该多维特征向量与语料库中每个字的训练的多维特征向量进行比较,得出相似度最高的那个多维特征向量,此多维特征向量对应的文字就是所识别出的文字,如图1所示。

[待识别文字][多维特征向量][语料库][识别结果][特征提取][判别函数][相似度]

基于文字结构模式的识别方法就是将被识别的文字(本文中指单个藏文字)看成由多个子模式(本文中指藏文字母)按照一定的规则组成,而子模式又由基元(本文中指笔画)组成,如图2所示。基元是构成该模式的最小单元。通过识别基元,进而识别出子模式,最终识别出该模式,即识别出要识别的藏文字,如图3所示。识别藏文字时,可以把藏文字当作一种特殊的二维文字,其基本组成单元为:基字、前加字、上加字、下加字、后加字、再后加字、元音[6]。

基于文字结构模式的识别方法相比于基于统计决策模式的识别方法,充分利用了藏文字的构字规律,因此本文采用基于文字结构模式的识别方法。

1.2 笔画的归纳及合并

藏文的输入及编码已经有了统一的标准,但是在手写识别研究方面的成果还不多,前人多是基于构件进行识别。本文采用一种基于笔画的和规则的方法进行识别[7],首先对藏文笔画进行归类,然后建立每个藏文字与笔画之间对应的规则,根据规则查找到对应的藏文字。

一个藏文字由若干个部件构成,一个部件又由若干个笔画组成,笔画是组成藏文字的最小单位。要想识别藏文字,首先就要识别出笔画。但是藏文字笔画比较复杂和繁多,为了方便识别,我们首先对藏文字笔画根据其特征进行分类,最终确定了20个笔画,并用a―t对其分别命名,如图4所示。然后确定了30个辅音字母的构成规则,如

1.3 笔画的识别问题

我们采用了笔画识别的方法进行藏文字识别,即先识别用户输入的笔画,再根据笔画的集合查找对应的藏文字所对应的笔画序列,最终确定所写藏文字。这种基于笔画的藏文字识别方法,特点是写一笔,识别一笔,即联机识别。笔画识别是藏文字识别的前提和关键。然而笔画识别还存在诸多问题,例如笔画的获取算法对识别的影响、书写速度的快慢对识别的影响、连笔情况下的识别等。

1.3.1 书写快慢影响的解决

通过对训练的笔画的数据进行预处理,用以解决使用者在书写快慢对识别率的影响。在笔画识别的程序设计时,笔者把用户输入的笔画轨迹看成点的集合,使用者在进行训练或者书写的时候,不同的书写速度会对笔画轨迹信息造成影响。例如写“横”的时候,虽然二者的方向数据都是“3”,但是在数据长度方面却有很大差别,缓慢书写要比快速书写的长度要长许多,所以书写的快慢也会影响识别率。

对于此问题,本文提供两种解决办法。第一种是在数据训练时,就故意快速写和缓慢写,此方法可以解决这种问题,但这对于训练人员的要求较高,并且此种方法会产生大量的数据,会降低识别速度。第二种方法是将数据进行归一化处理,连续相同的方向以一个数字代替,不计算其长度,只关注其方向,再拐点处再标记下一个方向。本文采用第一种方法,用数据的训练来弥补技术的不足。

1.3.2 连笔问题的解决

人们书写藏文经常会两笔或多笔连写,所以连笔是个需要解决的问题,不过已经有了解决思路。首先统计经常会连笔的笔画,例如藏文字“”的最后两笔,正常书写应该像图5的左边是由两笔完成,但是人们经常会按照图5右边那样一笔写完,所以我们采用一个藏文字对应两个笔画序列规则或者一个藏文字对应多个笔画序列规则进行连笔识别,即“”对应的规则有正常书写的“accm”和连笔书写的“acd”两个。

1.3.3 训练程序及识别程序的实现

基于笔画识别的藏文字识别方法还需考虑用户在输入的时候,难免会有一些抖动或者其他干扰因素导致和标准的藏文字体差别的情况,为此,本文提出了一N具有容错机制的训练方法,以达到能够具有容错的性能。

具体的优化方法为:

第一步,将用户输入的点看作原点,以正上方为Y轴的正半轴,正右方为X轴的正半轴,建立一个平面直角坐标系,如图6所示。原来采用正向上为方向码“1”,现在采取两边各5度的容错范围,即在正上方(即Y轴的正半轴)向左偏离5度的范围内或者向右偏离5度的范围内都认为用户输入的是方向码“1”,同理,方向码“2”到方向码“8”如图6所示。

第二步,开始对笔画进行训练,笔画训练起初是采用直接在电脑上进行训练,用鼠标代替手写输入,给出所要训练的笔画,照着所给笔画进行描写,点击保存则会保存当前笔画轨迹信息,获得该笔画的训练数据。后来,为了更加准确的获得训练数据,我们设计了安卓版的训练软件,使用户可以在屏幕上用手直接进行训练。

在基于安卓手机的训练程序完成后,我们找了20个藏族学生,每人训练一小时,对笔画进行了训练。训练完成后,开始对笔画的识别,笔画识别方面,我们采用的是基于余弦定理的文本相似判别方法,将所写笔画的轨迹信息与训练的语料库中所有笔画训练的信息进行对比,计算出当前所写笔画的轨迹信息知识经过多少步可以变成与当前比较的语料库中的轨迹信息,最后得出差异化步骤最小的就是相似度最高的那个笔画轨迹,进而判断出所写笔画。

1.4 联机手写识别

藏文联机手写识别则是在用户进行手写的同时进行处理和识别,因而可以非常方便的获得藏文手写笔画。由此,藏文联机手写识别流程可以简化为图7,即先获取用户所写的当前笔画,根据语料库对当前笔画进行识别,获得当前书写的笔画。然后再计算当前所获得的笔画序列和语料库中藏文字所对应的笔画序列相似度,计算此相似度的时候,方法为:当前笔画序列数与藏文字对应序列中有x个笔画对应相同,该字共有y个笔画,相似度则为x/y,若x大于y,则相似度为y/x。然后得出相似度最高的藏文字。

[获取当前笔画][识别出当前笔画][识别出藏文字][语料库] [规则]

2 结论及展望

最终,我们采用常用的600多个常用藏文字对其进行测试,在不考虑连笔书写的情况下,识别的准确率可以达到92%以上,证明基于笔画的藏文字识别是可行的,可以继续研究和探讨。

此方法还有一些需要改进的地方。第一,在笔画归类的时候,可以先进行训练,然后根据训练的数据进行分析和聚类,控制一个阈值,使相似度达到这个阈值的笔画聚为一类,然后将其作为语料库,这种办法可以有效解决笔画聚类方面由于开发者主观因素的影响。第二,记录笔画轨迹信息的时候,可以通过只录拐点处的方向码,以此减少数据量,进而提高识别速度。

参考文献(References):

[1] 杨峰.联机手写藏文字样本符采集及分析处理[D].青海师范

大学硕士学位论文,2014.

[2] 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.深度学习在手写

汉字识别中的应用综述[J].自动化学报,2016.8:1125-1141

[3] 吕新桥.联机手写汉字识别技术研究[D].华中科技大学硕士

学位论文,2009.

[4] 柳洪轶,王晓东,王维兰.藏文联机手写识别的难点及其解决

方法[J].西北民族大学学报(自然科学版),2005.1:77-80

[5] 唐松,郭椿标,郑南宁.基于文字结构特征的快速平滑细化方

法[J].中文信息学报,1990.2:49-54

[6] 关白.信息处理用藏文分词单位研究[J].中文信息学报,

2010.3:124-128

第8篇:识别技术论文范文

一是假冒国内正规期刊的刊名、刊号和出版单位名称,尤其是名社、名刊;有部分假冒期刊是以“增刊”、“合订本”的名义出现的。

二是国内某些正规期刊社未经批准擅自编印所谓“论文集”,以“宣传推广本刊为名”,故意将本刊社名和刊号混排其中,给读者造成错觉。

三是署名香港“某某出版公司”出版,或与某单位联合主办,编造所谓的“国内统一刊号”如“CNxx-yyyy(HK)或“CN(HK)xx-yyyy”等扩大“知名度”(香港根本没有新闻出版署,只有一个康乐处书刊注册组,从来没有资格颁发国内统一CN刊号,香港本身具有新闻出版自由),这些非法期刊常常虚张声势,在刊名上冠以“中华”"中国"字样用来欺骗国内急于想发论文评职称的人。

四是署名“某某学会”、“某某研究会”主办,无刊号或杜撰刊号,未署出版单位名称或杜撰某某编辑部等。

五是仅有国际标准刊号,而无国内任何部门批准发行的书刊编号或没有国内统一刊号。

六是偷梁换柱,将正规期刊的某些内容替换成自己撰写或收集的文章,仍以原刊的刊名、期号、装帧重新制版印刷。

第9篇:识别技术论文范文

关键词:驾驶辅助;立体视觉识别

中国分类号:TP391.41

1 驾驶辅助与立体视觉识别的背景与意义

交通部针对未来交通运输发展提出明确的政策目标,包含“提供公众优质的出行环境、提业健全的物流环境、提供社会良好的运输环境”三大目标,再拟定后续的运输政策发展主轴。为提升整体运输系统效率与服务质量,以解决日益严重的交通运输问题,期望减少交通事故并改善运输环境,世界各大先进国家在近年来,也纷纷投入更多资源促使运输系统的改善,积极研究将通讯、信息、电子、控制、感测、机械等相关技术与产品,整合并应用于现有或规划中的运输系统。并从中创造新的营运、管理模式,开创新的运输系统概念,此类结合新的科技或现有技术应用于交通运输,即称为智能交通系统。目标明确提出引进运输科技的重要性,显示公路运输系统智能化的课题日趋重要,未来要能改善国内交通系统的运输环境与效率,智能交通系统正好扮演了重要角色。

随着公路智慧化运输的时代来临,智能车辆的概念日益普及,驾驶人针对车辆主动安全的功能诉求日益重要。然而目前行驶于公路的车辆,仍须仰赖驾驶人全程操作行进。尽管交通部不断倡导公路交通安全的观念,道路交通事故的肇事率仍然居高不下,显示道路交通安全的改善成效已达到瓶颈。

根据交通部的统计信息指出,道路交通事故的肇事主因,以疲劳驾驶、酒醉驾驶、驾驶人分心、未注意四周路况等案例为大宗。此外,发现驾驶人随时受内在情绪与外在环境影响路况识别能力,难以每一分一秒都专注于留意四周路况,致使每一位驾驶人所留意的先后顺序不一,容易遗漏关键路况信息,充分显示道路交通安全仍有显著的改善空间。

智能交通系统,简称ITS(Intelligent Transportation System)是目前世界交通领域研究之前沿课题。它是在当代科学技术充分发展和进步的背景下产生的,旨在将先进的信息技术、数据通信技术、电子控制技术及计算机处理技术等综合运用于地面交通管理体系,建立起一种大范围、全方位发挥作用的,实时、准确、高效的交通管理系统。

将计算机视觉应用于智能交通系统是近几年来的热点之一。计算机视觉技术在ITS中的应用大致可分为两类,即车载自动驾驶系统和路边视频监视系统。在车载处理系统中,摄像机跟随自主车辆运动,系统追踪的目标为车道、前方车辆及障碍物、道路旁设立的各种交通标志或交通信号、司机的疲劳状态等;在视频监视系统中,摄像机被安放在道边或道路上方,为智能交通系统提供车辆位置、速度、类型等数据信息。

2 驾驶辅助与立体视觉识别的国内外研究趋势

视觉服务控制应用于辅助车辆驾驶的概念,近年首先起于美国,美国国防部(Defense Advanced Research Projects Agency,DARPA)先后在2004年、2005年与2007年举办无人驾驶竞赛,报名参赛的团队,分别由各大院校的硕博士研究生与指导教授所共同组成。参赛团队接受的挑战,必须建立一套能在真实环境中,自动驾驶车辆的系统。且依照主办者提供的路线行驶,使车辆能自主性地抵达指定目的地。美国DARPA国防部以寻求各大院校师生共同参与挑战的方式,促使国防部在研发与科技领域能快速进展,可谓国防部寻求千里马而展开的计划。

根据完成全程行驶的各参赛车队,所提供的系统研发报告中指出,车辆除了能自主性地朝向规划路径行驶,也能识别障碍、标线,在直线路段变换车道,并能在路口选定轨迹转弯,以及后退停车等行为。历经三届的无人驾驶竞赛,由第三届竞赛中,前三名参赛车队所显示的研发成果可以发现,除了对于美国DARPA国防部有卓越的贡献,更成为未来实现无人化自动驾驶技术的标竿,亦促使车辆产业更进一步将旗舰车款的研发迈向视觉辅助车辆驾驶领域。

解析全球汽车产业的发展现况,发现国际各大主流汽车制造商,纷纷将研发焦点着眼于安全驾驶辅助系统的领域。显示行车智能化控制系统与安全驾驶辅助系统,已逐步成为汽车制造商开发未来车款并开创企业蓝海市场而锁定的目标。智能化车辆的安全驾驶辅助系统,欲根据感测信号自行识别四周路况,根据目前发展现况,需要将声纳、雷达、雷射、卫星定位与地图、图像处理等系统相互组合,以利于辅助识别路况。而本论文根据锁定图像处理,利用行车前方采集的图像识别路面与车道标线,重现驾驶人识别行车前方路况的过程与视觉信息读取行为,期望能节省其它类型系统采集路况信息的需求。

Gold System(Generic Obstacleand Lane Detection System)所采用的视觉识别方法,首先将行车前方路面视为完全平坦,并直接利用矩阵算法将图像转为上视图。再凭借上视图识别车道标线的几何分布。此算法的基础需建构在路面完全平坦的道路场景,一旦路面有垂直分量的微幅起伏变化,或动静态障碍出现于道路场景中,将导致路面区域与车道标线的识别成效失真,并不适用于辅助立体视觉识别。

针对立体视觉识别的问题与研究现况深入探讨,如何通过双镜头图像识别共同像素特征并获得特征景深信息,将是立体视觉识别算法过程的主要瓶颈。探索当前的发展现况,立体视觉可应用的范围已广泛延伸至生活周遭各领域,但若要将图像内所有的特征进行立体视觉识别,一来将带来繁杂却不必要的额外算法数据,二来过长的算法时间将难以达到实时化视觉识别与服务控制的系统要求。

清华大学顾瑜研究团队已成功研究前方车道线与前车信息等侦测,并进一步将侧边盲点视野纳入侦测范围。此文献针对行车前方的道路识别,锁定车道标线的边缘检测,并以线性化的向量归类其标线特征;本研究则在白天道路场景采用HSV色系识别车道标线的色泽,亦或在夜间道路场景以Sobel Filter的矩阵Sx识别车道标线边缘特征。另外,此文献所介绍的道路场景模式,将列为道路识别图像处理应考虑的重要变因。

本论文识别路面与车道标线所选定的道路场景分配,根据交通部出版的《公路景观设计规范》中,以常态的道路场景作为主要的图像取景目标,并尽可能避免图像取景范围内出现动态行人或车辆,以防止干扰图像处理的成效。

3 就驾驶辅助与立体视觉识别的研究内容

如果重现驾驶人识别行车前方路况的过程与视觉信息读取行为,采取立体视觉图像应用于识别行车前方道路场景的算法处理方法,模拟并重现驾驶人的视觉识别处理模式。因此,可以利用平行双镜头采集行车前方的路况场景图像,两侧图像同步采集路面与车道标线等有效特征信息。并将采集后的有效特征进一步转换为空间坐标信息,并分别在不同的气候环境下,识别路面上的标记标线和前方的各类指示牌,辅助驾驶人强化前方路况的视觉识别。

所以从三个方面入手,首先介绍了系统的理论基础,主要是特征识别和成像理论;其次通过对不同气候场景模式的识别处理,分析和设计了行车途中对车辆前面的平行双镜头对路面标线和指示牌的图像识别;最后在实地行车途中采集图像数据进行测试比较,并得出结果。通过本论文所提供的立体视觉图像处理技术和算法推导流程,除了将提供辅助识别行车前方路况信息外,也将融入无人化自动驾驶系统的视觉服务控制中,不可或缺的探讨领域,期望未来能进一步实现无人化自动驾驶的愿景。

参考文献:

[1]吴莉婷,张宇,杨一平.深度图像中基于轮廓曲线和局部区域特征的3维物体识别[J].中国图象图形学报,2012(02):486-489.

[2]张一鸣,秦世引.基于单目视觉的移动机器人测距方法[J].微计算机信息,2008(29):179-185.