公务员期刊网 精选范文 计算机视觉的前景范文

计算机视觉的前景精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的前景主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉的前景

第1篇:计算机视觉的前景范文

关键词 计算机;视觉技术;应用研究

中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2013)16-0114-01

计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。

1 计算机视觉技术

计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。

2 计算机视觉技术在各领域的应用分析

随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。

2.1 在工业领域中的应用

工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。

2.2 在农业生产领域中的应用

该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。

2.3 在林业生产中的应用

该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。

2.4 在农产品检测中的应用

农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。

2.5 在电力系统自动化中的应用

计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。

2.6 在图书馆工作中的应用

随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。

3 结束语

通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。

参考文献

第2篇:计算机视觉的前景范文

关键词:计算机视觉;课堂考勤;深度学习;MCV架构

前言

随着国家标准《智慧校园总体框架》(Smartcampusoverallframework)的,智慧校园的规划与设计成为了校园建设的重点项目[1]。而课堂考勤作为学校教学管理、学生评价的重要组成部分,随着物联网技术、人工智能和移动通信技术的水平的提高与发展,更应该向着智能化、准确化的方向发展[2]。本文研究了的当前应用的课堂考勤方式,并做了进一步的分析,最终根据社会技术的革新与发展[3],提出了一种基于计算机视觉的实时课堂考勤系统的设计。我们的主要工作是搭建了整个系统框架,包括数据库系统、服务器、计算机视觉模型、网络通信、图像采集系统、客户端和网络通信系统。

1课堂考勤方式现状

目前校园中主要的课堂考勤方式存在为两种,分别是传统的考勤方式和生物识别的考勤方式。如图1所示,其中传统的考勤方式包括点名考勤和通过校园卡进行考勤,点名考勤的方式仍然是高校中最常用的考勤手段,因它不受场地的限制,可以根据点名册直接核对现场的学生信息,但这种方式存在的缺点就是花费时间,影响上课效率,为此有些教师不进行点名,因此影响了考勤的效果。校园卡考勤解决了点名占用课堂时间的问题,但这种方式具有学生代考勤的漏洞,因为学生可以拿着别人的校园卡进行考勤。生物识别的考勤方式包括指纹考勤和人脸识别考勤,这些方式有效解决了传统考勤方式代考勤的弊端,但这种方式受设备硬件的影响,识别能力太慢,尤其是在下课后学生较多,考勤签退时容易发生拥挤等现象,具有安全隐患[4]。因此,为解决当前考勤方式存在的一些弊端,本文设计了一种基于计算机视觉的实时课堂考勤系统。

2系统设计基础

2.1系统开发环境

本文设计的实时课堂考勤系统主要是使用Python开发语言,Python是目前最流行开发语言之一,主要应用于Web服务设计、大数据、人工智能等领域,它的主要优点是开发效率高、可扩展性强、跨平台和具有可移植性等,满足了本文系统的设计要求。另外,在开发过程还用到了基于Python的第三方软件开发包,包括Flask用于搭建系统的Web服务器;PyQt5用于搭建系统的客户端;OpenCV用于系统中对图像视频的处理;Tensoflow用于开发计算机视觉模型,搭建深度学习模型,完成人脸检测和识别任务;Mysqlclient用于管理、访问、查询和更新Mysql数据库。

2.2系统开发框架

本文设计的实时课堂考勤系统通信基于Web应用,因此选择一个合适的服务架构有利于提高系统的开发和部署效率。目前较流行的Web应用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)两种架构。本文使用了基于Python和Flask搭建的MVC架构[5],该架构如图2所示,主要包括模型层、视图层和控制器。使用该框架的优点是可将视图层和业务逻辑层进行分离开发,提高开发效率,方便系统的部署、维护和管理。

3系统设计方式

3.1系统总结构设计

本文设计的实时课堂考勤系统的总体结构如图3所示。根据MVC构架的设计,我们将该系统分为了模型层、控制器层和视图层,另外还包括网络通信设备。

3.2模型层设计

模型层主要是关系型数据库模,MySQL是目前使用最多的关系型数据库系统,也是学校管理系统使用最多的数据系统,为了更好地与学校管理系统兼容,我们选择了MySQL数据库,数据表之间的关系如图4所示。

3.3控制器层设计

控制器层主要包括服务器应用软件和计算机视觉模型,服务器应用软件的功能包括系统通信配置、数据业务处理和系统各模块间的调度。计算机视觉模型是实时课堂考勤系统的核心模块,基于深度学习卷积神经网络实现[6],主要作用是进行人脸检测和识别两个部分,计算机视觉模型的工作流程如图5所示。在人脸检测阶段使用VGG16检测器作为主干网络,为提高模型的检测准确率,通过引入注意力模型和多尺度特征融合对网络进行了优化,有效地从输入图片中提取人脸位置信息,得到人脸图像。在人脸识别阶段首先使用FaceNe人脸识别网络提取人脸图像的特征图,然后通过决策树算法与待检测的人脸特征进行匹配,从而识别图片中的学生信息。

3.4视图层设计

本文设计的实时考勤系统的模型层主要包括图像采集系统和客户端。目前各学校教室内都安装有监控设备,因此为节约成本和安装消耗,图像采集系统使用教室内的监控设备作为图像采集系统,负责采集教室现场图片。客户端设计首先在本系统中采用应用程序接口,然后在教学管理系统中设计图形化用户界面,通过应用程序接口调用本系统的功能,从而减少资源浪费,方便维护和管理。

4实时考勤功能的实现

实时考勤功能的实现方式如图6所示,首先系统启动后,用户可以随时更新考勤信息,比如在数据库中创建新的考勤表等。接着系统会自动读取考勤表的信息,比如课程所在教室、上课时间。然后启动考勤程序,进行签到、签退操作,并将考勤数据保存到考勤数据表中。整个系统启动完成后可以自动运行,直到关闭系统,而且可以实时进行课堂考勤。

第3篇:计算机视觉的前景范文

多媒体技术是计算机技术和社会发展进程中人类总需求的结合。计算机技术发展的初期解决的是数值计算问题,诞生的缘由是美国为了研究军事技术,对攻击精度的计算。计算机硬件设备的发展,使计算机处理数据的能力越来越强,逐渐从处理数值发展到对复杂的多种形式媒体的处理。多媒体技术融合了对数据、多种媒体、复杂的智能化处理和交互,并在高速信息网的作用下实现了信息资源的共享。目前,计算机多媒体技术已经改变了人类的生活方式,促进了现代文明的进程,广泛应用于军事、工业、通信、教育、金融、娱乐等诸多领域。

2多媒体技术的特征

从计算机处理多媒体的种类和处理的效果、人类接受的方式来分析,计算机多媒体技术主要具有多样性、集成性、数字化、实时的交互性等特征。

2.1多样性

计算机多媒体技术面向的媒体种类众多(章惠,多媒体技术和教学的有机结合:洛阳大学学报,2003),从最初的数值处理发展到了人类感官能触及到的文字、图像、声音、动画、视频等多种形式媒体的处理。媒体的多样性,使媒体形式变得丰富多样,这必将使表达更为自然生动,表现更为灵活,解决问题更为便捷。

2.2集成性

为了获得更好的展示效果,各种媒体并不是各行其是的。计算机使用不同的媒体,共同展示相同的内容,媒体与媒体之间的融合集成、充分展示,让人们的不同感官得到充分刺激,使人们更易于接受(孙涛,计算机多媒体技术的应用:长春理工大学学报,2011)。为了多媒体后期的运用,各种媒体会被进行数字化处理,然后由多通道统一采集、编辑、存储、检索、显示、传输与合成。计算机领域内最新的硬件和软件技术也将促使多种媒体更好的处理效果和更快的处理速度。

2.3数字化

多媒体中的各种媒体,进入计算机后,已全部转化为了数字,以数字的形式展示和存储。图像经采样量化后,以BMP、RGB、CMYK、黑白灰度图等数字化形式显示、存储;声音是通过一定的采样频率和采样周期,实现模拟到数字的过程;而视频是在每帧图像和声音的采样、数字化基础上,形成的连续信息。

2.4实时的交互性

传统媒体是指报纸、广播、电视、杂志,这些媒体只能单向、被动地传播信息,不能称其为多媒体。多媒体技术与传统媒体最大的区别就是实现了人机交互,使用户能对多媒体信息进行主动选择、操纵和控制,使得获取和使用信息变被动为主动,同时被人的多种感官所感受、体验。不仅如此,因为多媒体的实时性,即是视频、声音等媒体是没有延迟的,随着时间的变化而变化。所以,多媒体的交互在高速网络的帮助下,能做到没有延迟的做出实时反馈。

3计算机创新技术在多媒体技术上的应用

多媒体技术涉及范围非常广泛,包括了计算机软硬件技术、数字信息处理技术、数据压缩、高性能大容量存储、网络通信技术等等。这些日新月异发展的新手段、新技术,推动多媒体系统逐步进入人类社会许多领域。多媒体新的技术不时涌现,带给人们新的惊喜。人工智能是一门新的科学技术,甚至有些大学将人工智能从计算机科学与技术专业剥离出来,独立成一个专业,在学生本科期间就进行相关研究。但事实上,人工智能是建立在数学和计算机科学与技术基础上的高层次学科,是一门近几年出现的最引领人类研究兴趣的技术。人工智能研究的最终结果就是机器人,而事实上,机器人集多种媒体表现于一生,通过机器人的触感模仿人类去理解和辨别外界。人工智能研究的图像识别、自然语言处理、语言识别融合在了机器人身上,与多媒体技术广泛结合,应用于人类生活。我们从机器人身上看到了人工智能对多媒体技术的影响。下面从涉及到的几个方面去分别探讨。

3.1计算机视觉

人们通过感官获取外界信息,仅视觉就能获得外界80%-90%的信息(王守佳,基于图像的人体检测跟踪和人脸识别的研究:吉林大学,2013)。计算机视觉是一门属于计算机智能的学科,采用了动物视觉原理,具有获取图像、分析图像到理解图像的工作过程。计算机视觉通过镜头等图像传感设备代替人类的眼睛来获取周围环境的图像,依靠计算机来代替人类大脑的工作,将采集到的图像进行分析和处理。人类处于一个三维的环境之中,计算机视觉技术可以帮助分析处理。处理的手段可分为三个层次,底层、中间层、高层。底层就是图像处理技术,将二维图像去噪、边缘检测后进行分割、根据图像特征进行提取、图像识别等。中间层是指对图像、视频外在特征的归纳判断,譬如形状、颜色、运动轨迹等。高层,即是对外界事物和环境的观察和理解。由以上三个层次可见,利用计算机视觉技术能对数字化图像改变形态、尺寸、色彩调整、文件格式转换等。目前,计算机视觉技术还能对图像进行高效的检测、高速的识别,对运动轨迹进行精准判断。而这些已被广泛地应用于多媒体产品中。

3.2音频技术

声音是多媒体技术经常采用的一种媒体形式,包括了语音和音乐等。多媒体通常需要通过声音去烘托主题气氛,彰显意境。特别是自学型多媒体系统和多媒体广告,没有人进行现场讲解,那么就需要加入声音进行解说,这样,数字音频信号显得更加重要。音频技术基于电声技术,主要包括:去噪、压缩、调整振幅等的数字化处理,以及语音处理和识别。长久以来,语音识别是人们的梦想,人们一直期盼计算机能够听懂人说话,根据人的语言做出相应动作,这也是设计智能计算机的目的之一。如今,具备多种语言识别功能已成为多媒体设备的标配,识变率也非常高。无论持哪种语言、地方口音的人们,都能通过语音转化为文字,甚至通过语音传送指令,得到回应、达到意图。

3.3虚拟现实技术

虚拟现实技术是利用计算机多媒体技术,运用3D场景、灯光、声音、动感创造模拟出真实氛围,为用户建立出一个虚拟环境。虚拟现实技术与计算机仿真技术相结合,将用户置身其中进行学习、工作与娱乐。这种技术已被广泛应用于教育教学、科普、军事、医疗、娱乐以及大型的网络游戏中。虚拟技术投入成本较高,成熟的设施主要运用于教学,比如多媒体航空飞行教学系统,通过该系统,可按100%比例局部展示表盘、操纵杆、舱外景物,通过配合空中场景、感知各种场景给身体带来的变化。使用这套系统进行模拟训练,可以有效的提高飞行员对飞机的操作水平。随着计算机技术的迅猛发展,虚拟现实技术成为目前的高新技术。在多媒体环境中,多种媒体的相互融合,使媒体的形式更加多样,多媒体技术在模式识别、语音识别和传感技术基础上,提取对象面部特征,模拟触觉、视觉、听觉等感官,使人处于逼真的三维世界,当人有反应或行动时,场景还会适时变化,即是让人如临其境的、自然的与计算机进行交互。虚拟现实技术具有非常广阔的发展前景,为人们的日常生活提供了很多乐趣和便捷。

3.4网络化

多媒体应用的数据通道是通信网络,网络给了多媒体更大的施展空间。多媒体技术的应用要想在网络上有所建树,必要受通信技术的影响。在网络通信技术的进步和整合下,网络带宽影响传输速率、通信协议影响传输可靠性、交换方式影响信道利用率,这些势必会影响多媒体的传输。计算机网络给用户提供了一个难以想象的庞大的信息网络平台,丰富的信息资源随手拈来,方便于人们的学习、工作和生活交流。而无线网络技术的发展,使资源变得随手可取(李晓静,计算机多媒体技术的应用现状与发展前景:科技情报开发与经济,2007),人们可随时随地通过访问全球网络和设备,便捷地实现对多媒体资源的共享,是未来发展的主题。计算机技术的不断创新和发展,促使了巨大的变革。CPU、内存、GPU等在内的计算机终端硬件设备性能越来越先进;而网络设备,例如服务器、路由器、网桥、交换机等也越来越强大。计算机计算的精度、速度、逻辑判断能力和充裕的带宽,让人们更加游刃有余的与网络虚拟世界互动。网络环境的高质、高速,消除了人与人空间和时间上的困扰,能全方位的为人类效劳。动态和交互式多媒体技术还能在网络环境中创建更形象的2D和3D场景。办公、教学和娱乐工具在视频、音频设备的协助下,集成在终端多媒体计算机中,新一代用户界面与人工智能等个性化、网络化的多媒体软件应用,可随时与身处世界任何角落的人们进行交流。

4结论

第4篇:计算机视觉的前景范文

关键词:计算机技术;轮廓提取;视觉测量

计算机视觉测量技术是一种综合技术,融合了光电子技术、计算机技术、图像处理技术等多种技术。在对采集对象进行处理之后,就可以得到目标物体的几何特征参数。想要得到准确的图像,就必须重视目标物体的轮廓提取参数。在计算机视觉测量系统中,为了保障测量的精准度,选取合适的轮廓提取方法也是很重要的。边缘检测法是轮廓提取方法中主要的内容,该方法借助于空域微分算子,使图像和模板完成卷积。边缘检测方法中的局部算子法,具有实现简单、运算速度快等优点。梯度算子、Sobel算子、Roberts算子、canny算子,都是经典局部算子法。本文提出了基于灰度阈值法的原理,根据链码跟踪技术对轮廓信息进行存储,实现图像轮廓的提取。这种方法具有准确度高、稳定性好等优势,在工程上的应用十分广泛。

1 轮廓提取的原理

轮廓提取指的是从物体图像上得到物体外形,它能够有效保障测量的精确度。由于计算机视觉测量图像只含有目标和背景2类区域,应该利用阈值分析法对图像进行分割。为了确保二维图像中没有噪音,可以利用非线性的滤波能力消除噪音。为了实现轮廓提取,将会掏空图像内部的点。通过链码跟踪技术对轮廓的信息进行存储,使图像的轮廓处理工作量得以减轻。轮廓提取的工作流程是:首先对原始图像进行预处理,消除噪音后可以得到平滑的图像。然后,对图像进行阈值分割得到二维图像。对二值图像进行轮廓提取,就可以得到图像的边界点。最后,再根据跟踪算法将轮廓存储为链码序列的形式。

2 图像轮廓提取的关键技术

轮廓提取技术是计算机视觉测量技术中的重要组成部分,轮廓提取技术主要包括图像预处理技术、阈值分割技术、轮廓提取技术和链码跟踪技术等内容。本文将具体介绍几种关键的图像的轮廓提取技术。

2.1 图像预处理技术

通过光学成像系统产生的二维图像经常含有各种噪音。为了提高计算机的视觉能力,增加计算机的分析和识别能力,必须消除掉这些二维图像中的噪音。有目的地显示出有用的信息,消除掉无用的信息,这种方法就是图像预处理技术。图像预处理技术能够有效增加图像的清晰度,是一种关键的计算机视觉测量技术。图像的预处理技术是指在图像输入过程中对图像进行处理,从而得到清晰图像的技术。图像的预处理技术的内容很多,比如图像中如果含有噪音,就需要除掉图像中的杂音,提高图像的语音效果。对于一些比度比较小的图像,就需要对其进行灰度变换。对于已经模糊的图像,应该进行各种复原处理。对于失真的图像,应该采用几何方法来校正。

计算机视觉测量中的图像预处理技术,能够有效地提高图像的画面质量,让图像便于处理,更易于测量。图像预处理的方法有很多,通常情况下,主要采用图像平滑处理、图像锐化处理、图像边缘增强等技术。

2.2 阈值分割技术

由于计算机视觉测量技术中只有目标和背景两类区域,本文将采用单阈值法来分割图像。阈值分割法在实施的过程中,先要确定分割阈值,再将分割阈值与像素的灰度进行比较。

阈值分割法的原理是:首先设定图像的灰度区间在z的最大值和z的最小值之间。在该区间设定一个阈值Z,阈值Z的大小在z最小值与最大值之间,令图像中所有灰度值小于或等于Z的像素,将它们的新灰度值设定为0,大于Z的像素新灰度值设定为1。经过这样的阈值分割,就可以得到输出的二值图像。

阈值分割的工作尽量保留原图像,在此基础上,应该去掉一些冗余信息。但阈值分割法中最为关键的就是阈值z的确定,这是灰度值的突变点。本文将采用迭代法来确定阈值Z,根据灰度直方图来确定初始阈值,将图像分割为目标和背景,计算目标和背景灰度的平均值,可以利用循环迭代的方法求出差值较小的阈值,该阈值就是灰度阈值Z。这种方法求灰度值算法简单,便于实现,其具体的步骤是:首先,求出图像的最大阈值与最小阈值,令初始阈值为最大阈值与最小阈值和的一半。然后,再利用初始阈值将图像分割为目标和背景,分别求出目标和背景的平均灰度值Zo与Zb。Zo与Zb和的一般就是新阈值Z,如果新阈值Z与初始阈值相等,那么新阈值Z即为所求阈值。

2.3 轮廓提取技术

通过对阈值分割后的图像进行缺陷修补,还需要利用轮廓提取技术,最后才能得到图像中目标的二维轮廓。本文将采用掏空内部点的方法对二维图形进行轮廓提取。假定背景颜色为黑色,目标颜色为白色。当目标中有1个点为白色,这个内部点周围的8个点都为白色时,就可以将这个点和它周围8个点都删除,把内部点全部掏空。

在二值图像中,假设背景的灰度为0,目标灰度为l,那么边界轮廓的提取方法如下:如果中心像素值为O,那么其余相连8个像素均规定为1;如果其余相连8个像素为1,那么将把中心像素值改为0;除此之外,中心像素将一律设定为1。根据这样的规则,就可以得到图像的轮廓。

2.4 链码跟踪技术

链码是一种改进的坐标序列存储结构,链码用指向中心像素P的8个方向来表示,每个方向都存在着45度的夹角。对于轮廓图像来说,除了起始像素以外,所有的像素都可以用8个像素方向来确定。轮廓跟踪是以链码的方向来进行的,上一个轮廓点将会影响到下一个跟踪点。这种方法能够加快像素扫描的速度,能够有效地提高跟踪效率。

链码的跟踪过程如下:(1)通过扫描得到初始轮廓点,将该点的坐标定位(x,y),进入步骤(2),如果扫描之后得不到轮廓点,那么进入步骤(4)。(2)按照链码的方向来扫描当前与相邻的8个区域,如果遇到轮廓点,用“-”设置停止扫描跟踪,并记录该店的链码值,转进步骤(3);如果扫描过程中没有遇到轮廓点,则设置结束跟踪标志,将扫描点重新设置到起始点(x,y)坐标上,转退步骤(1)。(3)用底色填充扫描轮廓点,将当前点设置为跟踪到的轮廓处,转退步骤(2)。(4)用“-”设置结束所有轮廓跟踪。

根据上述步骤,不仅可以算出链码序列,还能够求出链码序列中的坐标、方向,甚至能求出链码的具体值。为了区别链码序列中的不同轮廓,要使用特殊标志将它们分开。为了找出封闭轮廓的起始点,应先标出链码方向序列,将轮廓结束标志最后标出。在自闭式轮廓跟踪系统中,序列的记录工作是根据轮廓线条顺序进行的,这将大大方便后续轮廓处理工作。

通过链码的解密工作,可以求出链码表示的轮廓值,解码的过程和编码的过程相同。链码和像素之间存在一一对应关系,可以用数组的方法来解决解码问题。对于X坐标的数组,可以将它们设定为X[8],X[8]={1,1,0,-1,-1,-1,0,1}。对于Y坐标的数组,可以将它们设定为Y[8],Y[8]={0,1,1,1,0,-1,-1,-1)。通过处理这种链码序列,可以求出不同轮廓的坐标值。

3 图像轮廓提取效果分析

如果图像在没有受到干扰的情况下,就能够提取到较为清晰的轮廓。但是如果存在某种敏感性因素时,就会严重影响图像的轮廓提取效果。利用20%的椒盐噪声影响一个花瓶图像,在预处理环节对其滤波之后,会产生出图像5(c)。以这种图像为检验标准,对其进行轮廓提取试验。同时,也可以利用Sobel,Robets,Canny等算子对该图像进行边缘提取试验,将实验得出的结构图像,与轮廓提取试验中得到的图像相比较,可得到图1。

根据图1可以看到,Sobel算子、Robets算子、Canny算子在受到干扰的情况下,对图像轮廓的提取效果不是很好,会出现断线、噪声等问题。而采用本文方法的轮廓则能保持较高的清晰度,这种方法适用性强,无噪音,未来必将会得到广泛应用。

第5篇:计算机视觉的前景范文

(上海大学通信与信息工程学院,上海200072)

摘要:运动目标的检测是数字图像处理和模式识别的基础,也是计算机视觉研究的一个重要领域。以C#为主要研究工具,对基于相邻帧差法及背景差分法的视频目标检测算法进行了研究,主要对其原理和算法进行研究。最后利用以AForge.NET架构类库,利用图像灰度的绝对值是否大于设置的阈值实现了对运动目标进行检测,实验结果表明,采用该算法可以对运动目标进行较为精确的检测。

关键词 :运动检测;AForge.NET;帧差法;背景差分法

中图分类号:TN911.73?34 文献标识码:A 文章编号:1004?373X(2015)17?0058?03

0 引言

由于微电子技术的发展与社会生活水平的提高及各种安防需求的增多,运动目标检测逐步成为当前监控系统研究领域的热点,更是计算机视觉领域中视频跟踪算法和识别技术的基础,该算法的检测精度直接影响了后续的运动目标跟踪及识别效果。目前,运动目标检测领域比较常用的方法有:光流法、帧间差分法和背景差分法。

光流法是相对于观察者的运动目标造成的观测目标、表面或边缘的运动[1]。但是该算法计算量比较大,并且存在抗干扰能力差,所以对于实时性要求较高的场合,该检测算法在视频运动检测应用中并不是特别的适用,目前在运动检测中最常用的方法实际上是背景差分法[2]和帧间差分法[3]。

帧间差分法是一种通过对视频图像序列中相邻两帧作差分运算来获得运动目标轮廓的方法,非常适用于存在多个运动目标和摄像机移动的情况[4]。由于该算法对光线及场景变化具有较强的抗干扰性,且无需获得背景图像,更新速度快,所以非常适用于实时性较强的应用场合。但是该算法存在阈值难以确定的问题,这个现象在低对比度灰度图像序列别明显,导致对目标对象的完整区域提取不完整而产生空洞的现象。

背景差分法是采用图像序列中的当前帧和背景参考模型比较,来检测运动目标的一种方法,其检测性能依赖于所使用的背景建模技术[5]。该算法可以实现缓慢的背景变化过程中对目标进行精确快速的分割,所以具有很强的适用性,然而对于突然的光照变化和背景扰动,对物体带有影子的图像分割出来的前景图像可能带有影子区域[6],为此可以通过建立实时更新的背景模型机制将前景区域分割出来,就可以减少动态场景变化对运动分割的影响[7]。

本文利用AForge.NET[8]架构类库,在Microsoft VisualStudio 2010中分别实验了帧间差分法与背景差分法,并实现运动目标的检测。实验结果表明,利用帧间差分法可以快速实现运动目标的检测,但是对于运动速度较慢的目标检测效果不是特别理想。为此,对于缓慢变化的运动目标引入背景差分法,利用类库中MoveTowards类建立实时有效的背景模型,有效地解决目标低速运动识别率较低的问题,提高了目标检测的准确率。

1 AForge.NET 简介

AForge.NET是一个专门为开发者和研究者设计的基于C#框架,包括计算机视觉与人工智能、图像处理、神经网络、遗传算法、机器学习、模糊系统、机器人控制等领域[9]。AForge.NET 是一个不断完善和发展的计算机视觉和图像处理库,目前的最新版本是2.2.5。

这个框架由一系列的类库组成,主要包括有:

AForge.Imaging:日常的图像处理和过滤器;

AForge.Vision:计算机视觉应用类库;

AForge.Neuro:神经网络计算库AForge.Genetic?进化算法编程库;

AForge.MachineLearning:机器学习类库;

AForge.Robotics:提供一些机器学习的工具类库;

AForge.Video:一系列的视频处理类库;

AForge.Fuzzy:模糊推理系统类库;

AForge.Controls:图像,三维,图表显示控件。

2 检测原理

帧差法及背景差分法主要原理就是图像的差分技术。设在一个时间轴上相邻时刻点ti 采集到的图像帧分别为f (x,y,ti),ti + 1 采集到的帧为f (x,y,ti + 1),则可以得出:

//对两帧数据差值进行数据滤波

Bitmap tmp3 = erosionFilter.Apply(tmp2);

上面几行代码可以计算出当前帧与上一帧这两帧数据相差的像素数据,通过设定特定的阈值,就可以实现对运动目标的报警功能。在本文所做的实验中,为了形象展示当前帧与上一帧数据的差值数据,把连续两帧数据差值用过红色高亮数据进行显示。实验结果表明,通过差帧法可以快速实现运动目标的检测,由于帧差检测法存在阈值难以确定的问题,特别是对于低速运动的运动目标,如果设定较低的阈值则存在误触发虚报的问题,而对于设定的高阈值,因为具有较低的检测灵敏度,则存在漏警的问题,实验结果如图2所示。

为此,本文引入了背景差分法技术,相对帧差检测算法,该算法使用AForge.NET的MoveTowards类实现实时背景的建模,再通过当前图像帧与建模形成的背景帧数据进行差分运算,实现运动目标的检测。该算法可以解决帧差检测法阈值难以确定的问题,可以实现低速运动目标精确的定位与检测。

背景差分法与帧间差分法的区别只是有了一个背景更新的过程,本文新背景的建立是通过AForge.NET视频库中类实现,该类背景提取算法原理是当前帧与前一个背景帧求加权平均得出当前背景帧数据。背景差分法的具体算法流程如图3所示。

背景差分法相关实现代码如下:

// 初始化背景类

MoveTowards moveTowardsFilter = new MoveTowards();

// 把当前帧复制给该类

moveTowardsFilter.OverlayImage = currentFrame;

// 通过前一帧与当前帧建立新的背景

Bitmap tmp = moveTowardsFilter.Apply(backgroundFrame);

// 把原先老的背景去除掉

backgroundFrame.Dispose();

//把当前计算出来的背景帧保存下来,为下一背景帧计算做准备

backgroundFrame = tmp;

背景差分法运动检测算法的相关实验结果如图4所示。

从图4 可以看出,背景差分法具有更好的目标轮廓,通过当前帧与背景帧比较的运动检测算法,可以很好地解决运动目标低速运行的问题,可以较为精确地实现与运动目标的检测。所有背景差分法与帧差法相比,具有更高的检测精度,非常适合工程中的应用。

4 结语

本文利用AForge.NET 类库,分别采用帧差法及背景差分法对运动目标进行实时检测。实验结果证明,利用AForge.NET可以实现运动目标的检测功能,并且具有很强的实时性。帧差法可以快速地检测运动目标,但是由于其特性决定了其对于低速运动目标的检测较背景差分法检测灵敏度要低。本文只针对运动目标进行简单的检测,对于更进一步的问题将在后续工作中继续研究。

参考文献

[1] 陈银,任侃,顾国华,等.基于改进的单高斯背景模型运动目标检测算法[J].中国激光,2014(11):245?253.

[2] 纪青华,禹素萍.基于Surendra背景减除法和四帧差分法的目标检测算法[J].计算机应用与软件,2014(12):242?244.

[3] 邱斌,干红华,张亶.基于时空信息的运动目标分割算法[J].激光杂志,2014(12):40?44.

[4] 柴池.基于背景差分和三帧差分的运动目标检测[J].网络安全技术与应用,2014(11):75?76.

[5] 黄素茵.基于视频监控运动目标检测算法研究[D].广州:华南理工大学,2013.

[6] 余启明.基于背景减法和帧差法的运动目标检测算法研究[D].赣州:江西理工大学,2013.

[7] 严晓明.一种基于改进帧差法的运动目标检测[J].莆田学院学报,2011(5):69?72.

[8] KIRILLOV A. AForge.NET framework [EB/OL].(2010?03?02)[2010?12?20]. http:// aforgenet. com.

第6篇:计算机视觉的前景范文

利用计算机的存储能力完成统计记录功能。变电站自动化系统,是变电站(所)自动化监控管理的重要设备,是集计算机技术、自动控制技术和通讯技术等实现对变电站二次设备(包括继电保护、控制、测量、信号、故障录波、自动装置及远动装置等)的功能进行重新组合、优化设计,对变电站全部设备的运行情况执行监视、测量、控制和协调的一种综合性的自动化系统。通过变电站综合自动化系统内各设备间相互交换信息,数据共享,完成变电站运行监视和控制任务。变电站综合自动化替代了变电站常规二次设备,简化了变电站二次接线。

2电网调度自动化

电网调度自动化主要是通过电子计算机运用自动化技术对电网进行调动,实现对整个电力运行系统的监控。从而确保了能够及时预测和处理电力运输过程中出现的安全隐患以及故障发生,从而达到合理分配电能的目的。电网调度自动化会带来很多有利的功效,首先,通过合理化的调度可以降低电能消耗,从根本上减少了能源浪费;其次,电网调度自动化为电能的安全运行提供了有力的保障。能够及时检测出可能导致电网异常运行的因素,并对之进行有效的处理,避免了因电网故障而发生的系统崩溃等严重情况;最后,电网调度作为电力系重要的组成部分,其自动化发展促进了电网建设进程的加快,有助于电力系统自动化的发展。

3计算机技术推动电力系统自动化技术的发展历程

上世纪八十年代单片机技术的发展,以及国产的工业计算机和PC机技术应用,促进了电力系统自动化设备的发展。自动化装置采用数字电路和模块化软件设计技术,具有了通信功能,数字式故障录波器、微机远动装置及巡回检测设备、微机继电保护装置性等一系列建立在计算机技术基础上的设备开始大量使用。计算机技术为电力系统调度自动化、电厂监控系统、变电站综合自动化奠定了基础。上世纪九十年代高性能工作站、服务器及软件技术、信息处理技术发展迅速,电网调度自动化系统、电厂监控、变电站自动化、配电自动化的技术水平上了一个新台阶。大幅度减少了电力电缆、通信电缆的用量,减少了占地面积从而降低了建设成本。增加了设备配置的灵活性、互换性和可维护性,提高了系统运行的可靠性。

4计算机技术的发展对电力系统自动化的影响

4.1计算机技术与电力设备出现电磁干扰现象随着电子计算机在电力系统中的使用,计算机中的处理器与电力设备之间很容易相互影响,在一定的条件下会对运行的设备和人员造成干扰现象,出现电磁不兼容的问题。电力系统十分复杂和庞大,包含很多不同功能的处理系统,各个系统彼此关联、互相影响,当前的技术对于电能的运行环境还没有达到控制在相对稳定的局面,一旦某一以微处理器为核心的微机型产品受到电磁的干扰,便会出现数据紊乱的状况,很容易导致整个供电系统的瘫痪或者数据丢失等严重故障。所以,如何保证电子计算机与管理系统的和谐融合一直是社会重点关注并有待解决的内容。

4.2计算机视觉技术在电力系统自动化中的应用计算技术觉技术在80年代取得了突破性进展。那么什么是计算机视觉呢?简单点说就是用机器的眼睛“看”世界,对计算机拍摄下来的图像进行多角度的处理,使人们更容易从中分析获取需要的信息。目前此项技术已经发展到各个应用领域,其中也包括了电力系统。因为随着电力系统规模的扩大,对供电要求的不断提高,在处理图像信息的过程中,要求工作人员的分析能力也越来越高,人脑已逐渐无法适应高速的计算能力,所以计算机视觉技术取代人脑来分析处理图像数据就成为了必然趋势。其高效率、高智能的处理器促进了电力系统向自动化的发展。

4.3计算机智能控制技术在电力系统自动化中的发展前景随着电力系统不断向自动化发展,电力调度技术慢慢告别了传统的手段,改为依靠以智能控制为核心的智能控制技术。这种技术使电力系统实现了从量变到质变的本质飞跃。控制技术的智能化强化了电力系统的安全稳定性,对复杂的指令进行有条理的处理,增强了电力系统的实用性和收益性。随着学者们对这种技术的研究,智能控制技术还拥有着十分广阔的发展前景。

5结语

第7篇:计算机视觉的前景范文

【关键词】OpenCV;智能视频监控;目标检测;目标跟踪

1.引言

近年来,随着我国职业院校的不断发展,校园建筑面积和规模逐步扩大,校园的流动人口大量增加,治安形势错综复杂,做好校园的安保工作,仅靠简单的增加人力和物力,采取常规的防范措施已经很难适应新形势的需要。为了加强校园安全防范整体力量,有效保护校园与学生的财产安全,利用先进的科技手段建立一套功能完善、覆盖范围广泛的监控系统是维护学生正常学习、生活,创造平安校园的必要条件。

智能视频监控是综合利用图像处理、机器视觉和计算机视觉知识进行研究的一个新兴的研究方向和备受关注的前沿课题。与传统的模拟监控不同,智能监控系统能实时的对摄像机捕捉到的视频序列进行处理和分析,自动完成动态目标的检测、识别和跟踪,并在此基础上可以进一步对目标的行为进行分析和理解。本文构建的校园智能视频监控系统利用OpenCV实现了对视频图像中动态目标的行为快速有效地进行监控和分析,并实现了对动态目标的精确跟踪。

2.OpenCV视觉库简介

OpenCV是Intel公司开发的用于数字图像处理和计算机视觉的函数库[1]。它由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉方面的很多通用算法。OpenCV其源代码完全开放,运行速度快,由于具有良好的可移植性和统一的结构及其稳定性,因此可以缩短系统设计的开发周期,使系统运行更加稳定。

鉴于OpenCV的特点,它主要用于对视频图像进行一些高级处理,如人脸识别、动态跟踪、图像分割及人机互动等。

3.校园智能视频监控系统的实现

3.1 系统工作流程

当动态目标出现在可视范围内,首先通过背景差分法将前景图像与背景图像分离,再对差值进行二值化判断,利用给定的阈值去除噪声等干扰后,从场景中检测出动态目标。与之前检测出的目标做特征比对,如果是新目标则加入到跟踪序列中,如果是旧目标则舍弃。目标跟踪阶段,对跟踪序列中的目标采用CamShift跟踪算法,提取目标特征信息,并获得其运动轨迹,对目标进行实时跟踪。其关键点在于目标的特征信息提取和匹配,这是决定目标跟踪效果的重大因素。

3.2 动态目标检测

动态目标检测是校园智能视频监控系统的重要组成部分。动态目标检测的主要目的是从视频图像中实时的提取出动态目标并获得动态目标的特征信息,如色彩、形状、轮廓等[2]。动态目标提取的过程就是在连续的视频图像序列中寻找差异,并把由于目标运动和表现出来的差异提取出来。

动态目标检测常用的有四种常用方法:连续帧间差分法、背景差分法、光流法和运动能量法[3]。由于背景差分法具有实现简单,运算速度快,因此最常用。它通过当前帧图像与背景图像相减并提取出感兴趣区域来检测动态目标,固定场景下应用背景差分法进行动态目标检测,关键在于创建和维护一个可靠的背景。针对这种情况,背景模型应运而生。评价一个好的背景模型,应该从两个方面进行考虑:第一,背景模型对背景变化的响应速度要足够快;第二,背景模型对运动目标要有较强的抗干扰能力。

3.2.1 提取前景图像

假设环境温度不变,视频图像的背景也不变,当动态目标出现时.图像相应像素点的灰度值会发生明显的改变,利用图像减法就可以得到差分灰度图像[4]。差分灰度图像包含了动态目标信息,相对于背景图像又称之为前景图像。相减的结果中每一像素的值和一个预先设定的阈值相比较,若这个像素的值大于阈值,则认为这点是前景图像,否则是背景图像。假设利用图像平均法可得到当前背景图像BK(x,y),当前的输入图像为CK(x,y),则前景图像DK(x,y)可以表示为当前图像与背景图像差的绝对值即:DK(x,y)=|CK(x,y)-BK(x,y)|

3.2.2 差分图像二值化

选取T为阈值,对差分图像进行二值化[5]:

1,DK(x,y)≥T

EK=

0,DK(x,y)

其中,EK为进行二值化后的图像,当差分图像中像素值大于某一给定的阈值T时,则认为该像素为前景像素,即认为该像素可能为目标上的一点,反之则认为是背景像素。

在OpenCV中,差分图像的二值化是由函数void cvTheshold实现的。

由于背景差分法受外界光线的变化、背景中含有轻微扰动的对象,如树枝、树叶的摇动等的影响,因此对前景图像还要进行一系列的图像处理。包括:平滑处理,形态学膨胀、腐蚀,二值化操作,轮廓提取等。但是并不是所有的轮廓都是由目标产生的,有些是目标的子轮廓或者是噪声产生的轮廓,因此必须对轮廓进行筛选,淘汰伪目标的轮廓,把目标轮廓筛选出来后加入到跟踪队列。

3.3 动态目标跟踪

在校园智能视频监控系统中,动态目标跟踪起着承上启下的作用,它是利用图像处理和计算机视觉等相关技术对视频图像序列进行处理和分析,在连续的图像序列中找到动态目标的位置和相关信息,比如动态目标的速度、形状等。为了实现该功能,本文采用了OpenCV中的CamShift目标跟踪算法。它主要通过视频图像中动态目标的颜色信息来达到跟踪的目的。

3.3.1 CamShift算法简介

Gary R.Bradski提出的CamShift算法,是以颜色直方图为目标模式的目标跟踪算法,是对MeanShift算法的改良,可以有效地解决目标变形和部分遮挡的问题,而且运算效率很高。它的基本思想是将视频图像的所有帧做MeanShift运算,将上一帧的运算信息作为搜索窗口的初始值,并将初始值作为对下一帧图像运算的输入,进行迭代后实现对动态目标在每一帧图像序列中的连续跟踪。由于RGB颜色空间对光照亮度变化比较敏感,为了减少光照亮度变化对跟踪效果的影响,CamShift算法将图像由RGB颜色空间转化到HSV颜色模型,方便对动态目标特征的提取。

3.3.2 CamShift算法实现

在OpenCV库中,CvCamShiftTracker类就是用来实现CamShift算法的,使得进行二次开发变得很简单[7]。

其中,prob_image为目标直方图的反向投影;Window为初始搜索窗口;criteria为确定窗口搜索停止的准则;comp为生成的结果,包含收敛的搜索窗口坐标(comprect字段)与窗口内部所有像素点的和(comparea字段);box为目标的最小矩形。如果非NULL,则包含目标的尺寸和方向。

利用该函数,在VC++2010开发环境下,就很容易实现CamShift算法跟踪动态目标。

4.结束语

本文设计的基于OpenCV的校园智能视频监控系统,由于其较低的计算复杂度和较高的鲁棒性,具有广阔的应用前景。采用了背景差分法作为动态目标检测的方法。检测是跟踪的前提,检测结果的精确性直接影响跟踪的可靠性。利用CamShift跟踪算法提取每个动态目标的颜色特征信息,实现对多个动态目标的精确跟踪,最后将动态目标的轮廓和运动轨迹描述出来。

该系统平台简单,大大缩短工作人员的开发周期,只需根据不同的需要进行简单的改进,就可以实现多种场合的不同应用。实验证明,系统运行稳定,检测结果真实可靠,具有较高的精确度。

参考文献

[1]Gary Bradski,Adrian Kaehler.学习OpenCV[M].北京:清华大学出版社,2009.

[2]谭歆,武岳.基于OpenCV的运动目标检测方法研究与应用[J].视频应用与工程,2010,34(S1):184-187.

[3]尹俊超,刘直芳.基于OpenCV的运动目标检测与跟踪[J].计算机工程与设计,2011,32(8):2817-2820.

[4]林洪文,姚作,涂丹,李国辉.基于减背景技术的运动目标检测方法研究[J].国防科技大学学报,2003, 25(3):66-69.

[5]侯宏录,李宁乌,刘迪迪,陈杰.智能视频监控中运动目标检测的研究[J].计算机技术与发展,2012,22(2):49-52.

第8篇:计算机视觉的前景范文

关键词:数据融合传感器无损检测精确林业应用

多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。

一、数据融合

1.1概念的提出

1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。

70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。

1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。

Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。

1.2基本内容

信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。

数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:

(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。

(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。

(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。

根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:

(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。

(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。

(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。

1.3处理模型

美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:

数据源。包括传感器及其相关数据(数据库和人的先验知识等)。

源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。

态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。

处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。

二、多传感器在林业中的应用

2.1在森林防火中的应用

在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。

2.2森林蓄积特征的估计

HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。

KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。

2.3用非垂直航空摄像数据融合GIS信息更新调查数据

森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。

TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正。

试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。

三、数据融合在林业中的应用展望

3.1在木材检测中的应用

3.1.1木材缺陷及其影响

木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。

3.1.2单一传感器在木材检测中的应用

对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。

随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。

新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。

美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。

在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。

X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。

3.1.3数据融合在木材检测中的应用展望

单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。

基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。

3.2在精确林业中的应用

美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。

目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。

南京林业大学提出了“精确林业工程系统”。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。

[参考文献]

第9篇:计算机视觉的前景范文

摘要:计算机;DSP;智能视频系统

中图分类号:TP277文献标识码:A文章编号:1007-9599 (2011) 20-0000-01

Intelligent Video Systems Analysis and Research on Computer and DSP

Cheng Zhi

(School of Physics and Engineering,Qufu Normal University,Qufu273165,China)

Abstract:In recent years,as computer performance and DSP chip performance continues to improve,there has been intelligent video of this emerging technology,its applications have greatly expanded control over the people for the site conditions,and to make video surveillance more accurate and timely,has become new direction for the future development of the video.Based on computer vision technology and DSP technology,made two kinds of computer-based intelligent video systems and DSP implementations,while their software has done a more detailed description.In computer-based system due to the use of the OpenCV vision library to make the video more rapid development:DSP is used in TI's recently launched TMS320DM6446,its unique design allows faster image processing,real-time fully meet the needs of the scene.

Abstract:Computer;DSP;Intelligent video systems

智能视频技术主要是指“自动的分析和抽取视频源中的关键信息”。如果把摄像机看作人的眼睛,那智能视频系统或设备就可以看作是人的大脑。借助计算机或是专用的数字处理芯片DSP强大的数据处理功能,能对视频画面中的海量数据进行高速分析,过滤掉用户不关心的信息,只为监控者提供有用的关键信息:。近儿年,随着计算机性能的不断提高及高性能DSP芯片的出现,利用其对视频信息进行分析,从而使视频监控系统在数字化基础上真正实现了智能化。

本文研究了两种不同系统,分别基于计算机和DSP。基于计算机的视频系统借助于计算机的巨大的处理功能,集合各种函数库,特别是OpenCV的应用,能帮助监控者快速准

确地对图像做出相关处理。基于DSP的视频系统,通过对软硬件的开发与设计完成数字化视频处理,与前一系统相比灵活性,实时性增加并且功能能进行更多的扩展,在实际中得到更为广泛的应用。

一、基于计算机视觉技术的视频系统

其基本系统构成是微型计算机和前端图像获取,图像获取包括必要的图像采集单元和图像存储单元。通过图像采集单元采集来的图像被存储在图像存储单元,借助于网络,实现计算机与存储单元的通信,图像从存储单元进入计算机,在计算机中对图像进行相关处理完成日标的检测。系统需根据实际的需要选择好相关的视频采集跟存储单元硬件,如在实验室条件下完成简单的视频开发可以采用普通的摄像头作为图像前端获取,图像存储单元在只对一帧图像做处理时也可省略,这样一个摄像头一台计算机就可以实现最简单的视频系统的搭建。在软件设计方面可以直接利用计算机开源的视觉代码库OpenCV来实现,其在图像处理方面提供了大量的库函数以供选择,与DSP的视频系统相比编程更加简单,功能更易实现,且开发的速度快,价格便宜,非常适合研究初期的应用。但系统有其自身的局限性,由于只能在计算机上实现图像的相关处理,可移植性差,系统的灵活性大大降低,并且处理速度慢,不适合大数据量复杂场景的现场检测。但对于夜间巡检等场合由于背景简单,需要处理的数据量少,采用本系统在降低成本的同时保证了检测的准确性,有一定的可选度,但总体来说应用面比较窄,局限性比较大,前景应用不及基于DSP的视频系统。

二、基于DSP的视频系统

基于DSP的智能视频系统,体积小安装灵活,易形成大批量的独立产品且在上位机利用计算机能为用户提供友好的人机界面,近儿年来得到业界广泛重视。本中介绍的基于DSP的视频系统选用的芯片是达芬奇视频处理芯片TMS320DM6446,与其他6000系列芯片相比由于具有双核处理器,处理速度更快,并且系统的设计充分发挥了达芬奇高集成度硬件、音视频软件算法优势,使视频数字化,监控网络化,系统集成化,管理智能化,具有体积小、布线简单、成本低、不占用主机资源等特点,虽然在协调双核工作时与其他芯片相比存在一定的困难,但是其强大的功能使行业内对其开发逐渐升温。

基于DSP的视频系统主要由上位机人机交互界面,下位机DSP实现两部分组成。

1.上位机的实现。主要是指在计算机中实现可视化的界面,使交互更加便于操作。

2.下位机的实现.下位机使用的主要处理芯片是TMS320DM6446,具体包括视频解码、图像数据存储、图像数据处理等儿个部分组成。视频信息通过摄像头进入到视频系统,在丁VP5I46PFP的作用下有模拟信号变为YCBCr模式的数字信号,进入DSP6446中进行相关算法处理。同时,在片选信号的控制下,把需要进行存储的图像数据通过数据线送入图像存储器DDR2 SDRAM中进行存储。经由DSP6446处理完成的视频数据则通过其视频输出端口输出到视频输出设备。

参考文献:

[1]黎洪松.全子一图像矢量量化频率敏感自组织神经网络算法[J].通信学报,1995,16(3):59-64