公务员期刊网 精选范文 计算机视觉的核心范文

计算机视觉的核心精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的核心主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉的核心

第1篇:计算机视觉的核心范文

以下为报告详细内容:

2017年计算机视觉技术在更多的领域有所落地应用,自动驾驶领域、高考、政务等领域更多的场景开始应用计算机视觉技术。艾媒咨询分析师认为,计算机视觉行业技术是核心基础,随着技术成熟度提高,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多新的应用领域,提高商业落地应用。

2017年人脸识别技术在智能手机终端应用开始普及。9月苹果新品会上,iPhone X宣布引入Face ID高精度人脸识别技术,引来人们高度关注。而除了iPhone X,华为、小米、OPPO、vivo等手机厂商都推出了带人脸识别功能的智能手机。艾媒咨询分析师认为,计算机视觉领域内人脸识别功能可应用场景广泛,商业化落地能力强,除了计算机视觉创业企业,互联网巨头和硬件巨头企业也纷纷关注布局人脸识别领域。但目前人脸识别技术仍然存在一定缺陷,艾媒大数据舆情管控系统数据显示,“手机人脸识别”热词言值数据为48.5,整体舆情偏负向。现阶段人脸识别技术在智能手机终端上的应用仍处于起步发展阶段,技术和安全性仍有待提高,未来随着各计算机视觉企业加强技术研发,人脸识别技术有望进一步改善,成为智能手机标配。

iiMedia Research(艾媒咨询)数据显示,2017年中国计算机视觉市场规模为68亿元,预计2020年市场规模达到780亿元,年均复合增长率达125.5%。艾媒咨询分析师认为,人们安全和效率需求不断提升,计算机视觉技术在各行业应用能有效满足人们需求,市场发展空间巨大。国家政策对人工智能行业的支持也为计算机视觉的发展提供了有利的环境。随着计算机视觉技术日渐成熟,企业商业化落地能力不断提高,未来计算机视觉市场规模将迎来突破性发展。

iiMedia Research(艾媒咨询)数据显示,商汤科技以24.3%的企业知名度排名各计算机视觉企业首位,旷视科技与云从科技则分别以23.1%以及21.7%的知名度分列二三位。艾媒咨询分析师认为,商汤科技计算机视觉技术及算法能力在行业内较为出色,同时在安防、金融、商业、手机端等多个领域均有商业落地应用,在企业认知和品牌推广方面具有优势。

iiMedia Research(艾媒咨询)显示,61.7%的受访网民通过手机APP应用接触计算机视觉应用,另外有50.9%的受访网民接触途径为通过智能手机终端。艾媒咨询分析师认为,计算机视觉企业主要服务B端用户及政府机构,相比于其他途径,移动端更适合应用计算机视觉技术的产品推广。计算机视觉技术日趋成熟,在移动终端和APP上均有落地应用,也进一步为计算机视觉企业在大众中奠定基础。未来企业可通过线上渠道开发挖掘C端用户市场。

iiMedia Research(艾媒咨询)显示,半数受访网民认为智能手机及APP加入人脸识别技术功能方便了二者的使用,另有48.8%的受访网民认为人脸识别技术在手机及APP上的应用是未来技术发展的趋势。艾媒咨询分析师认为,人脸识别技术在手机及APP端的应用满足人们智能化和便捷化的需求,随着越来越多的手机及APP产品加入人脸识别功能,未来其普及和认可程度将得到进一步提高。

iiMedia Research(艾媒咨询)显示,41.8%的受访网民表示未来愿意使用人脸识别技术进行手机及APP解锁,同时有41.4%的受访网民虽持观望态度,但愿意尝试。此外,47.4%的受访网民认为人脸识别将取代其他手机及APP解锁技术成为未来主流。艾媒咨询分析师认为,近期智能手机纷纷应用人脸识别技术解锁推动该功能技术的普及,便捷性的优势使该功能技术前景受看好。但目前人脸识别解锁技术的准确性仍然受到质疑,随着未来技术进一步成熟,该技术有望成为智能手机设备标配。

iiMedia Research(艾媒咨询)显示,33.9%的受访网民曾使用过人证比对功能进行业务办理。在使用过该功能的人群中,54.6%认为其方便了业务办理,提供了效率,且有47.3%该部分人群认为其识别准确程度高。艾媒咨询分析师认为,政府、银行等机构业务办理效率以往常遭诟病,人证识别技术的应用提高了办事效率,在提高人们满意度的同时,加强了计算机视觉技术的认可度。未来计算机视觉技术在政府、银行等机构的落地应用将进一步扩展,但其中涉及到个人信息保护等问题需要企业及相关机构合力解决。

iiMedia Research(艾媒咨询)显示,34.1%的受访网民认为公安办案为最有必要应用人脸识别技术的安防情景。而关于网民对人脸识别技术在安防监控领域应用看法调查中,56.1%的受访网民认为其能有力保护人们人身财产安全。艾媒咨询分析师认为,计算机视觉技术,尤其是人脸识别技术在安防领域应用意义重大,在刑侦破案、身份认证、公共安全保护等情景具有重要应用价值。未来安防领域将成为计算机视觉技术重点应用领域,而安防的重要性也对相关企业技术实力有严格的要求,未来安防领域市场或由少数技术实力较强的企业占据。

商汤科技是专注计算机视觉与深度学习原创技术的人工智能创业企业,拥有强大的技术能力和人才资源储备支撑发展。商汤科技在计算机视觉领域综合实力较强,获资本方青睐,B轮融资4.1亿美元,同时与国内外知名企业展开合作。艾媒咨询分析师认为,商汤科技在商业营收上同样处于行业领先水平,但其本质专注于技术发展,强大的技术基础能较好支撑商汤科技在上层应用场景的扩展。商汤科技在技术驱动商业应用的同时,积累商业应用经验,提高企业知名度,拓展应用至更多领域。

艾媒咨询分析师认为,商业化落地能力欠缺是目前计算机视觉行业大部分企业的痛点,商汤科技在商业落地应用方面处于行业领先位置。这一方面源于商汤科技技术能力往专业化发展,以专业技术和研发基础实现场景差异化应用。另一方面,纯计算机视觉技术或算法由于其专业性,需求方在使用时需要具备专业能力,而商汤科技技术产品往标准化方向打造,打包成行业解决方案,能适应更多企业使用需求,也有利于商汤科技技术进一步落地应用。未来坚持技术为基础,继续提高商业落地能力,商汤科技有望继续保持良好发展态势。

旷视科技成立于2011年,2017年10月完成巨额C轮融资,专注于人脸识别、图像识别和深度学习技术自主研发和商业化落地,深耕于金融安全、城市安防、商业物联、工业机器人等领域,同时打造人工智能开放云平台。艾媒咨询分析师认为,旷视科技利用云平台为开发者提供技术支撑,有利于计算机视觉技术进一步结合产品运营,同时可以收集海量图片数据,通过进行深度学习,旷视科技图像识别技术又能进一步得到提升,有利于其强化自身核心技术能力。

艾媒咨询分析师认为,人脸识别技术对于金融行业业务办理及风控等流程具有重要应用价值,旷视科技在人脸识别技术上的优势也助其有效开展金融领域的服务应用。未来随着旷视科技利用云开放平台相关图片数据进行深度学习强化人脸识别技术,以及在金融领域积累的渠道资源,其有望在金融领域继续强化技术服务,成为该领域市场有力的竞争者。

艾媒咨询分析师认为,自动驾驶为人工智能和汽车行业未来发展方向,计算机视觉技术在自动驾驶汽车实现路况感知、高精度定位等方面发挥重要作用,自动驾驶为计算机视觉技术未来重要应用领域。图森未来的计算机视觉技术和算法在自动驾驶领域实现专业化发展,未来有望在此细分领域成长为领先企业。

2017-2018中国计算机视觉行业发展趋势

需求驱使计算机视觉行业发展潜力巨大应用场景拓展渗透各行业

艾媒咨询分析师认为,人们对生活安全以及生产效率追求两大需求的提升,决定计算机视觉行业具有巨大发展空间。而计算机视觉技术场景应用具有广泛性,有望发展成为下一个智能时代的标配。目前计算机视觉技术主要应用在B端领域,短期内行业发展趋势也是集中于B端领域。未来随着技术成熟,计算机视觉有望拓展更多新的应用场景,实现场景落地,渗透至各行各业,形成AI+,开拓更多C端业务。此外,计算机视觉技术可以跟其他技术,如AR、VR、无人驾驶等结合发展,创造新的应用领域。

技术应用由点及面行业解决方案及软硬件结合成商业产品出路

对于计算机视觉技术使用者来说,由于技术的学习应用需要花费较多时间和精力,硬件产品及行业解决方案往往更受青睐。未来计算机视觉企业需要将软硬件结合,如打造嵌入式芯片等。此外,计算机视觉企业应将技术应用由点及面,将技术应用发展成针对各行业的解决方案。未来市场将出现更多基于计算机视觉技术应用的行业解决方案和软硬一体化产品,只有打造方便用户使用的商业产品,才能有效适应其需求,帮助计算机视觉企业迅速占领行业市场,在市场竞争中取得领先优势。

计算机视觉行业发展对企业综合实力要求高

艾媒咨询分析师认为,计算机视觉行业巨大的发展前景决定其具有高成长性特点,未来将涌现更多人工智能领域优秀企业。但行业发展同时伴随高风险性,行业竞争需要比拼企业技术算法能力、资金能力、以及人才资源,同时考验企业能否实现技术迅速落地,对企业综合实力要求高,综合实力不具备优势的企业在行业内将难以生存。

第2篇:计算机视觉的核心范文

关键词:数字摄影测量 计算机视觉 多目立体视觉 影像匹配

引言

摄影测量学是一门古老的学科,若从1839年摄影术的发明算起,摄影测量学已有170多年的历史,而被普遍认为摄影测量学真正起点的是1851―1859年“交会摄影测量”的提出。在这漫长的发展过程中,摄影测量学经历了模拟法、解析法和数字化三个阶段。模拟摄影测量和解析摄影测量分别是以立体摄影测量的发明和计算机的发明为标志,因此很大程度上,计算机的发展决定了摄影测量学的发展。在解析摄影测量中,计算机用于大规模的空中三角测量、区域网平差、数字测图,还用于计算共线方程,在解析测图仪中起着控制相片盘的实时运动,交会空间点位的作用。而出现在数字摄影测量阶段的数字摄影测量工作站(digital photogrammetry workstation,DPW)就是一台计算机+各种功能的摄影测量软件。如果说从模拟摄影测量到解析摄影测量的发展是一次技术的进步,那么从解析摄影测量到数字摄影测量的发展则是一场技术的革命。数字摄影测量与模拟、解析摄影测量的最大区别在于:它处理的是数字影像而不再是模拟相片,更为重要的是它开始并将不断深入地利用计算机替代作业员的眼睛。[1-2]毫无疑问,摄影测量进入数字摄影测量时代已经与计算机视觉紧密联系在一起了[2]。

计算机视觉是一个相对年轻而又发展迅速的领域。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[3]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看做是计算机视觉的分支。

数字摄影测量的发展已经借鉴了许多计算机视觉的研究成果[4]。数字摄影测量发展导致了实时摄影测量的出现,所谓实时摄影测量是指利用多台CCD数字摄影机对目标进行影像获取,并直接输入计算机系统中,在实时软件的帮助下,立刻获得和提取需要的信息,并用来控制对目标的操作[1]。在立体观测的过程中,其主要利用计算机视觉方法实现计算机代替人眼。随着数码相机技术的发展和应用,数字近景摄影测量已经成为必然趋势。近景摄影测量是利用近距离摄影取得的影像信息,研究物体大小形状和时空位置的一门新技术,它是一种基于数字信息和数字影像技术的数据获取手段。量测型的计算机视觉与数字近景摄影测量的学科交叉将会在计算机视觉中形成一个新的分支――摄影测量的计算机视觉,但是它不应仅仅局限于地学信息[2]。

1. 计算机视觉与数字摄影测量的差异

1.1 目的不同导致二者的坐标系和基本公式不同

摄影测量的基本任务是严格建立相片获取瞬间所存在的像点与对应物点之间的几何关系,最终实现利用摄影片上的影像信息测制各种比例尺地形图,建立地形数据库,为各种地理信息系统建立或更新提供基础数据。因此,它是在测绘领域内发展起来的一门学科。

而计算机视觉领域的突出特点是其多样性与不完善性。计算机视觉的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息,因此直到计算机的性能提高到足以处理大规模数据时它才得到正式的关注和发展,而这些发展往往起源于其他不同领域的需要。比如在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用计算机来替代人工视觉。

由于摄影测量是测绘地形图的重要手段之一,为了测绘某一地区而摄影的所有影像,必须建立统一的坐标系。而计算机视觉是研究怎样用计算机模拟人的眼睛,因此它是以眼睛(摄影机中心)与光轴构成的坐标系为准。因此,摄影测量与计算机视觉目的不同,导致它们对物体与影像之间关系的描述也不同。

1.2 二者处理流程不同

2. 可用于数字摄影测量领域的计算机视觉理论――立体视觉

2.1 立体视觉

立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分[5]。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。

2.2 影像匹配

立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。

在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。

2.3 多目立体视觉

根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性[5]。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度[2]。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。

第3篇:计算机视觉的核心范文

关键词:计算机视觉技术;C# ;;作物无损检测;软件设计

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)15-3640-03

数字农业和农业物联网技术作为现代农业最前沿的发展领域之一,是当今世界发展农业信息化,实现农业可持续发展的关键和核心技术。数字农业要求快速、实时、准确和定位化的获取植物生长信息,而农业物联网技术要求植物信息可实时动态感知,显然,传统的实验室测量分析和信息获取方法已经不能满足数字农业和农业物联网技术的发展要求。因此,研究和开发植物生命信息快速无损检测技术和传感仪器等软硬件平台已经成为现代农业承待解决的关键问题[1]。

目前,国内在作物无损检测方面的研究仪器主要是依赖进口,而相应的软件也是伴随着仪器而购买。此类软件,一般价格昂贵,而且在自主研究平台中,因为无法取得源代码而无法使用或升级,从而出现研究瓶颈。在各类无损化检测技术中,随着计算机视觉技术越来越广泛的应用,对应的软件系统的开发迫在眉睫[2]。

正是基于这样的背景,我们通过对目前应用比较广泛的C#进行研究,利用C#强大的数据处理能力和良好的用户界面开发,并结合强大的图像处理能力,进行作物实时检测软件平台的自主设计与开发。

1 计算机视觉技术简介

计算机视觉也称机器视觉,是采用摄像机或者数码相机将被检测图像转化为数字信号,再采用先进的计算机软件技术对图像信号进行处理,从而得到所需要的各种目标图像特征值。并由此实现模式识别,坐标计算等功能。然后再根据其结果输出数据,发出指令,再配合执行机构完成好坏筛选,位置调整,数据统计等自动化流程。与人工视觉相比较,计算机视觉的最大的优点是快速、精确、可靠,以及数字化。

随着数字农业和农业物联网技术的发展,计算机视觉技术将越来越广泛的应用于农业生产中,而构成计算机视觉系统的软件系统是整个计算机视觉系统的灵魂。随着硬件技术的不断发展完善,计算机视觉系统其功能是否强大,可以说完全取决于软件系统的能力。

2 软件系统设计

2.1 C#与

C#是由微软公司开发的一种面向对象的新型编程语言,它是从C和C++ 中派生出来的,保留了C/C++原有的强大功能,并且继承了C/C++的灵活性。同时由于是MicroSoft公司的产品,它又同Visual Basic一样具有简单的语法结构和高效的开发能力,可以使程序员快速的编写出基于.NET平台的应用程序。

一个基于C#框架,专门为C#开发者和研究者设计和开发的,这个框架提供了丰富的类库资源,包括图像处理,神经网络,模糊系统,遗传算法,人工智能和机器人控制等领域。该框架架构合理,易于扩展,涉及多个较前沿的技术模块,为相关开发人员或科研人员的工作提供了极大的便利。本系统就是采用C#程序设计语言,通过调用该框架来实现作物无损检查系统的开发。

2.2 系统设计与实现

本软件系统是在数码相机拍摄的作物图像的基础上,采用图像处理方法进行特征提取与分析,从而实现作物的无损检测。主要分为图像输入,图像预处理,特征提取,特征分析几个模块。

1) 图像输入

将要分析处理的图像读取到系统中来,为后面图像处理作准备。C#提供了三个最重要的图像处理类,即Bitmap类、BitmapData类和Graphics类。三种图像处理的方法,即提取像素法、内存法和指针法。从执行效率和实现难度综合考虑,本系统的开发采用内存法。

2) 图像预处理

图像预处理主要包括图像的大小调整,形态矫正,平滑和去噪等,以降低环境对拍摄照片造成的不利影响。提供了多个类,可以对图像进行平滑去噪等操作,本系统中采用了中值滤波算方法,对应中的Median类。

3) 特征提取

特征提取分析,是整个系统的核心所在,需要选取合适的图像分割算法,对图像进行处理,提取目标区域,为特征分析作准备。在本系统中采用了阈值分割技术,因为这种算法相对来说比较直接并且易于实现。

采用阈值分割技术,首先,必需确定一个阈值作为图像分割的阈值,在本系统中,采用自适应阈值法,由用户在软件的操作过程中进行设定,并且可以根据需要进行调整。然后,根据这个阈值对图像进行分割,并将其转化为二值图,如图(b)所示。从图中我们可以看到二值图像中存在大量的小孔,这种太小的孔洞对我们进行图像分析没有实际意义,并且会干扰结果的正确性,因此我们需要采用腐蚀和膨胀的形态学方法来进行填充孔洞,结果如图(C)所示。最后,我们需要根据需要提取目标区,涉及到连通区域的提取问题。最后,输出结果。

4) 特征分析

对图像分割结果进行分析,用于指导生产实践。我们可以对通过图像处理得到的目标区域进行分析,比如可以根据叶片颜色的变化判断叶绿素含量,进而推算出作物的营养状况,根据色素区域的大小计算出叶面积,根据不同区域的形状、大小判断病虫害等。

3 实验结果及分析

软件运行后主界面如图3所示。

为验证本系统的有效性,我们通过设定不同的阈值进行图像分割,并跟photoshop cs4软件中魔棒的工具作对比,来提取图片中的目标区域。测试图片大小为800px×610px,取特征点坐标P(310,70),该点的RGB值为(29,92,0),获取目标区域的总像素和绿色分量平均值,数据如表1所示。

从上述表中我们可以看出,本软件在图像处理目标区域的提取方面,提取到的目标区域较photoshop 提取的小,绿色分量平均值较photoshop更接近特征点数值,由此看出用本软件做图像分割准确性更高。

4 结束语与展望

计算机视觉具有非破坏性、快速、高效、信息量大等特点,目前已在主要的农作物和经济作物的养分诊断,植物病虫害的快速检测及预警预报等方面有了广泛应用,取得了较好的效果。随着计算机视觉技术和图像处理技术的发展,计算机视觉技术将更多的应用于植物长势预测、产量估计等方面。

通过本次研究,开发了一个交互界面良好的色素分量检测系统,能对图像在RGB分量上实现阈值分割,并实现目标区域的获取分析。该文主要提倡一种软件开发的理念,所设计开发的软件的针对性较强,还存在着很多的局限和不足,要作为计算机视觉类的通用软件,系统的稳定性和功能都还有待进一步提升。

参考文献:

[1] 刘飞.基于光谱和多光谱成像技术的油菜生命信息快速无损检查机理和方法研究[D].浙江:浙江大学博士学位论文,2011.

[2] 朱哲燕,陈红.基于MATLAB的作物信息光谱分析平台的设计与开发[J].科技资讯,2012(16).

[3] 蒋丽华.基于计算机视觉技术的叶绿素含量检测系统[D].苏州:苏州大学硕士学位论文,2009.

[4] 赵春江.C#数字图像处理算法典型实例[M].北京:人民邮电出版社,2009.

[5] 何勇,刘飞,聂鹏程. 数字农业与农业物联网技术[J].农机论坛,2012(1).

[6] 张起丽.基于数学形态学的彩色图像处理研究[D].西安:西北大学硕士学位论文,2009

[7] 冀高.基于数字图像处理的棉花群体特征提取[D].北京:北京邮电大学硕士学位论文,2007.

第4篇:计算机视觉的核心范文

关键词:计算机;交通监管系统;视觉

中图分类号:TP277

近年来,道路交通安全问题因公路交通事业的快速发展而受到越来多关注。据2002年世界银行统计,全球平均每年死于道路交通事故高达117万人。而在中国,据2008年公安部交通管理局公布的数据显示,全国道路交通事故多达265204起,死亡人数为73484人。

全国道路交通事故防御工作随公路里程、机动车保有量、道路交通流量、驾驶人数的增加成递增趋势。而通过必要的技术手段构建交通安全保障机制,降低交通事故是重中之重。若要好的为基础的交通违规行为检测技术的不断更新,市场上已出现了自动检测与记录的商业化产品,能实时记录出闯红灯、违规超车、违规停车、超速、逆行等违规行为。然而,我国高速交通监控体系仍比较落后,大多在交叉路口设置电子警察系统以此检测车辆闯红灯的违规行为。交通管理部门并不能对出现违规行为的车辆进行及时的交通管制和处理,概括来说管理与检测仍处于管理误区与盲目状态。针对该现象,文本研究了基于计算机的交通监管系统设计与实现。

1 智能交通管理系统简介

ITS系统,该系统综合先进的现代计算机网络技术、信息电子通讯技术、现代信息技术以及自动控制技术等,并将其在整个交通运输管理体系进行有效的运用,为此建立起一种实时、有效、准确、范围广的全方位发挥作用的交通运输控制体系和综合管理系统。近几年人流、车流随着城市发展而猛增,交通职能部门对更加智能的交通管理系统的需求越来越急迫。所以,ITS成为21世纪地面交通管理、运输科技、运营的主要研究方向,带领着交通运输一场伟大的变革。北美、西欧、日本自上世纪80年代末就开始竞相发展智能运输系统,并制定相应的开发计划加以实施,而发展中国家也开始对ITS系统的全面研究与开发。

2 认识基于计算机视觉的智能交通监控系统

2.1 计算机视觉技术

所谓计算机视觉,理解为使用可替代人眼的高清摄影机设备或其他现代高清电子影像摄录装备进行观察,实现对目标的追踪定位、图像识别、模拟数据测量等,并对采集的视觉数据信息送达远端计算机服务器,通过计算机服务器的信号图形图像处理技术对视频数据信息进行进一步加工,实现三维重现现实情景的计算机观察呈现技术。

2.2 智能交通监测系统

通过使用现有的、先进的计算机智能化、视觉化、信息化科技对国内各大路况交通运输实施监测,为工作于交通运输人员呈现数据信息的自动化采集、分析、处理等的智能化服务,且该交通管理系统存在一定自作能力和指挥能力,即为智能交通系统。随着道路、车辆的飞速发展,人民生活水平及国民生产总值的不断提高,智能交通系统,在国内外受到越来越多的青睐。近几年,各道路关键路段、路口随着道路监控机制的普遍建立,也都基本完成了视频监控。

2.3 基于计算机视觉的智能交通监控机制

根据前面2.1对计算机视觉技术和2.2对智能化交通监控系统概念的解析与理解,可总结出以计算机视觉为基础的智能化交通监控机制,其是通过现代高端计算机对视觉信息收集、提取、处理、分析等技术,实现对城市道路交通信息的实时监控、视频数据的收集、信息分析处理,并对城市交通状况使用智能交通机制状况,并通过视频影像引导车辆行驶,以此降低或避免各种各样交通事故发生的智能化交通监控机制。

3 构建以计算机视觉为基础的智能交通监控机制及配套措施

3.1 基于计算机视觉的智能交通监控机制的构建

监控指挥系统、实时交通信息收集系统、高质量信息传输系统是基于计算机视觉的智能交通监控的三大系统。实时交通信息收集系统由多套信息收集装置组成,通过这些信息采集装置实时监控不同位置交通现状。实时交通信息收集系统不仅能进行路段监控与实时交通信息采集的工作,还能将收集数据信息,经由高质量信息传输系统实施输送,或在服务器中存储已处理的信息;一个中央数据库与一个中央服务器是高质量信息存储传输系统核心部分,其中中央数据库对获取到的实时交通路况信息进行存储。而为了便于工作者能通过界面对中央数据库实施提取、查询、查看等操作,因此该界面就由中央服务器来提供,此外该服务器还能将已处理的实时路况数据通过高质量的传输系统输送到监控指挥机制,达到对各路段的交通进行管制、部署及指挥的目的。

3.2 专业技术人员的储备

以计算机视觉技术为基础的智能交通监控机制是一个庞大的系统,具有突出点的优点,该系统集自动化、信息化、智能化为一体,只有专业的技术人才才能使该系统高效工作,因此开展培训储备相关技术人员至关重要。实时交通信息借助于先进的高清装置的正常采集工作,所以储备一批针对高清装置安装、检测、调试及故障修复的技术人员极为重要。现代基于计算机视觉的智能交通监控机制虽然本身具有一定的图形图像分析及处理能力,然而有些工作人是永远被替代的,所以培养储备一批专业的图形图像处理技术人员也是重要的。储备服务器维护技术工,每天以计算机视觉技术为基础的智能交通监控机制都会获取大量的监控信息数据,然而只有大型的服务器才能存储这些数据,可想而知一旦服务器瘫痪就会引发整个机制的崩溃,造成严重的后果,因此专业服务器维护工作者的储备与培养也尤为重要。基于计算机视觉技术的智能交通监控机制并不能取代交通指挥员,其仅是用来采集实时交通信息的系统,仅为了协助交通指挥员监管及疏导城市交通,因此要求储备一批高素质、高质量的交通指挥员也极为必要。

3.3 交通知识的宣传

大城市的交通问题,并不是依靠单纯的开发先进的计算机视觉智能交通监控系统就能处理解决,也不是单单要求市政建设增加公交数量、增铺几条公路或增开通几条地铁就能解决的,以上这些仅是辅助方法。关键在于开展交通知识的宣传与教育工作,强化驾驶员的素质,倡导不酒驾、不逆行、不超速、限号行驶等,自觉遵守道路交通规则,提倡公交地铁出行,减少私家车辆行驶,齐心协力共同打造和谐的交通环境。

3.4 获取政府支持

市政建设的主要问题之一即是交通问题,政府的支持是万万不可缺失的。由于构建以计算机视觉技术为基础的智能交通管制机制,涉及面广,包括道路勘测、先进装置的引进、专业技术人员的储备、装备组织安装与调试、后期维护等等多方面,这些都需要投入大量的人力、财力、物力,而对于任何一个单位、部门或几个市政部门来说都无法独自承担,由此可知政府的大力支持是必不可少的,以政府的力量为媒介,将各部门进行协调、协作,只有这样才能构建成较健全的交通监控体系。

4 结束语

道路交通杂、乱是国内城市交通最突出的特点之一,对于我国的交通事业来说进行行人识别势在必行。而我国对于行人识别的研究仍处于起步阶段,还较落后。且基于计算机的交通监管系统设计较为复杂,涵盖点较多,因此本文仅对设计进行简要介绍,希望达到抛砖引玉的效果。

参考文献:

[1]康晓丽.无线网络技术在交通管理中的应用[J].科技情报开发与经济,2011(21).

[2]钟振,赖顺桥,肖熠琳,张沛强.RFID车辆智能管理系统[J].机电工程技术,2011(02).

[3]文军.视频监控系统软件现状与技术分析[J].金卡工程,2007(08).

[4]张玉风.简述视频监控系统的发展历程[J].铁道通信信号工程技术,2006(06).

[5]马伏花,朱青.基于射频识别技术的车辆自动识别系统的实现[J].中国仪器仪表,2006(11).

第5篇:计算机视觉的核心范文

关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物

中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3

计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。

1 计算机视觉中与摄像机定标解析

计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。

2 传统的摄影机定标方法及应用特点

传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。

2.1 基于3D立体靶标的摄像机定标

这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。

这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。

2.2 基于2D平面靶标的摄像机定标

基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。

这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。

2.3 基于径向约束的摄像机定标

基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。

总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。

3 摄像机自定标方法及其应用特点

摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。

3.1 基于主动视觉的自定标法

目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。

这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。

3.2 基于Kruppa方程的自定标方法

基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。

这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。

3.3 分层逐步定标法

分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。

这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。

3.4 基于二次曲面的自定标方法

基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。

在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。

4 传统摄像机定标方法与自定标方法优缺点分析

从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。

4.1 传统的摄像机定标方法弊端

传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。

总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。

4.2 摄像机自定标方法相关问题

目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。

5 结束语

随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。

参考文献

[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.

[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.

[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.

[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.

[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.

[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.

[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.

[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.

第6篇:计算机视觉的核心范文

多采用是人工测量的方式,在误差的控制上选择的是多次测量,反复操作,再将多次测量的结果进行加权,最终得到相对准确的测量数值。这种方法在一定程度上是操作十分复杂,精度还很难达到设计要求,所以我们在矿区土地信息测量工程中引进了GIS技术这样的一个概念,下面我们就如何通过GIS技术进行有效的观测测量来进行讨论。

[关键词] GIS技术; 精密测量; 构造几何模型; 信号源的接收

地理信息系统(Geographic information system,GIS)是利用计算机及其外部设备采集、存储、分析、描述与空间和地理分布有关的数据的空间信息系统。GIS融合计算机图形和数据库于一体,在一定的地域内,将地理空间信息和一些与该地域地理信息相关的属性信息结合起来,达到对地理和属性信息的综合管理。从外部来看,GSI表现为计算机软硬件系统,而其内涵是由计算机程序和地理数据组织而成的地理空间信息模型,是一个高度信息化的地理系统。

1)等高线生成及等高线分析:等高线图是人们传统上观测地形的主要手段。可以在等高线图上精确地获知地形的起伏程度、区域内各部分的高程等等。等高线图可以从格网数字地形模型中获取相关的资料信息,也可在不规则三角形格网T(NI)中生成。

2)立体透视图分析:当用户需要从直观上观察地形的概貌时,用绘制透视图的方法(还可以用色彩)可以更逼真地显示地形。

3)坡度分析、地表面积计算及挖、填土方体积计算:建立DTM后就可以用之计算坡度、面积和挖、填土方体积,以其作为土地适宜性评价的因子。

一 GIS技术在信息管理模式中的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机GIS技术精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机GIS技术测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供矿区技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

(1)计算出观察控制点到计算机视觉图像测量仪器的有效距离;

(2)得出观察点到目标控制点之间的三维的运动几何参数;

(3)推断出目标控制点在整个平面上的表面特征(大多时候要求形成立体视觉);

(4)还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机GIS技术精密测量的在矿区土地信息管理中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。

所谓的压力感应就是一种新型的传感器,通过电阻的变化作为一种感应值的判断标准进行计算和采集数据。具体的做法是在受力物体上粘贴高灵敏度的感应片,通过力的传递将物体上受到即时的力传递到感应片上,以备技术人员收集。在物体的中心或者是机械的隔断处,使用丙酮溶液进行擦拭,以保证物体的表面洁净和贴合度较高。当液体充分风干的情况下将感应片贴在已涂丙酮的物体上(注意感应片的正反),再使用导线和感应片相互连接,从而形成了一个完整的闭合电路体系,在通电的情况下,在计算机终端上可以显示出来。以便技术人员可以在任何时候掌握每个检测点的施工使用情况,一旦机械设备发生异常现象,就会在计算机图形中显示出来。于此同时,它还可以对施工人员所处的具置做到应力感应,人自身的重量传递到地面上,结构会出现结构上的略微变化,这个仪器就能第一时间以信号的方式传送到计算机终端,让技术人员掌握相关施工的情况,并结合数据报告总结出相关的可行性分析付诸实践。

当无法观察到控制点是,计算机GIS技术测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。同时在信息管理中通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机GIS技术。

二 计算机GIS与CAD技术的结合

在计算机GIS技术测量中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在土地信息的选择中,无法使用高帧数的图片显示,无法将计算机测量的关键技术的优点发挥出来。在煤矿生产过程中,对于生产效率的提高就要对开采环境的要求更高。使用绘图技术与GIS技术相互结合可以将复杂的地理环境的具体形状在电脑当中展现出来,用较为直观的图形准确的反应出来。而且在使用中,可以在计算机中随时将图像进行修改,完全可以适应复杂情况下的设备调试。在以往传统的图像设计中,技术人员在图纸中很难将地理信息进行再次修改,在设计后期在计算机图形绘制处理技术中,对于图像的调试使用的范围很广,通过虚拟的模拟和现实的结合来实现煤矿信息的完整,有效的加强了煤矿的信息化管理。

CAD技术是基于工程图上的三维建模方式。三维模型是从二维信息中提取的三维模型信息,通过再次分类以后,得到的一系列的相关处理信息,之后在三维空间建立相应的二维信息的三维形状模型提,使模型本身恢复点,线,面和拓扑关系,从而实现形状重建工程。计算机图形绘制处理,也可以应用于测绘图纸和关于地形的建模。土地信息中包含的地貌和自然资源图,它是国民经济体系的重要组成部分。我们可以画一个图,三维地形图的存储信息的产生。为预测和决策水平的使用有重大的意义,也为综合治理和煤炭资源的研究开发利用提供科学依据,这些依据,在军事上也起着非常重要的作用。在煤矿机械设备也使用CAD软件绘制零件图,利用绘图软件在操作更简单的菜单式设计,绘制出图形更准确。

三 GIS技术测量的关键技术遇到的困难和使用前景

计算机GIS技术测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了矿区土地信息管理部门的广泛青睐。在测量调控方面的这些可靠性和稳定性也是有目共睹的。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。通过在一些相关的技术之间的相互结合才能使GIS技术发挥的更加完美。

我们都知道,人的眼睛是可以受到自身的控制,想要完成矿区土地观测是十分简单的,但是在计算机GIS技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

四 结束语

在煤矿土地工程发展的今天,很多的测量技术已经离不了计算机GIS技术的辅助,本文中详细的谈到了GIS技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案,对于和CAD绘图技术相互结合的使用方式也做出了详细的介绍。测量工程中使用计算机GIS技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题亟需技术人员不断去解决完善。

将GIS技术在矿区土地管理信息系统中使用,也是加强了矿区建设的信息化水平。可以预见的是,在未来使用计算机GIS技术在矿区土地管理信息系统建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让GIS技术在矿区土地管理信息系统在煤矿的开挖中的作用发挥的更好。

[参考文献]

[1] 汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36

[2] 段发阶等. 拔丝模孔形计算机视觉检测技术[J] . 光电工程时报, 2006, 23( 13):189-190

第7篇:计算机视觉的核心范文

关键词:智能视频监控;物联网;公共安全

中图分类号:TP31 文献标识码:A 文章编号:1006-8937(2016)11-0077-02

1 概 述

近年来,视频监控技术取得飞速的发展,其中视频监控系统设备虽然拥有了较好的性能,但仍存在一些因素限制,使得视频监控出现一些误差缺陷,导致整个系统的安全性和实用性大大降低。此外,社会的不断发展和人口数量的不断增多使得人们对安全性要求越来越高,监控摄像的覆盖面不断扩大,传统的视频监控技术只能实现监控记录实况,无法实现预测和报警,而实现实时监控,就需要人工监看视频,时间过久就会出现疲劳,甚至在面对多路视频监控时容易出现错误,无法及时对异常情况作出反应。这些问题的解决就需要将智能监控技术引入视频监控系统中,辅助视频监控人员做好监察工作。

目前,计算机的视觉进步使得智能监控技术得到广泛的重视和研究,也使得智能视频监控技术成为研究的热点。为从众多数据中高效提取出有用的信息,监控工作就需要充分应用智能视频监控技术。具体来讲,智能视频监控技术就是由计算机储存摄像图像并对图像序列内容进行理解和分析,及时检测出异常情况,进行自动预警和报警。

2 智能视频监控技术的发展史

视频监控技术的研究有助于相关人员做好安全防范工作,尽可能地从被监控的区域用最短时间获取有用的信息。最初我国监控是完全依赖人工获取信息和处理信息的,比如清朝的东厂,以及飞鸽传书、守门之犬。乔家大院的“万人球”是中国历史上最早被采用来进行监控的外部设备,本质上是水银玻璃制作的镜子,主要用它来监视房间内的一举一动。到了19世纪70年代才真正出现了现在的视频监控,人类开始采取摄像来获取信息,这也是智能视频监控技术的最初萌芽时期。鉴于信息科技的不断发展和市场需求得不断提高,现代的视频监控技术发展大体上三个阶段:模拟化、数字化和智能化。本部分将具体对这三个阶段进行阐释。

2.1 模拟化的视频监控技术

在20世纪70年代开始,光学成像技术飞速发展,电子技术也取得了较大的成就。这些成果都使得视频监控设备制作和使用可能性加大。为了实现这样的目标,世界出现了电子监控系统,满足了利用电子设备进行监控的需要。此阶段主要是以CCTV监控为主,这也就是早期的模拟视频监控系统。CCTV的工作原理就是采用同轴电缆进行传输信息,信息由模拟监视器显示、由磁带录像机进行信息储存。模拟视频监控技术的价格较为低,安装简易,主要广泛被采用到规模较小的安全防范系统中。

2.2 数字化的视频监控技术

到了20世纪90年代,数字压缩编码技术和芯片技术取得了较为突出的进步。再者模拟化的视频监控技术出现了一些缺陷,比如磁带录像机的储存量较小,监控范围有限等。初期主要采用NVR,被称为半数字时代,慢慢发展到后期主要采用DVR进行监控,这才真正实现了数字化的视频监控。DVR最显著的特点就是可以使得监控系统储存较多的视频信息,容纳较多的摄像头,从而解决了模拟视频监控系统的储存量问题。数字化的视频监控技术应用广泛,具有良好的扩展性,使用维护较为简单容易。数字化的视频监控技术发展为以后智能化的视频监控发展奠定了基础。

2.3 智能化的视频监控技术

进入21世纪,计算机视觉和模式识别技术获得了飞速的发展,使得第二代的数字化视频监控技术取得较大进步。因此,大规模的布置监控系统的可能性加大。目前全球对视频监控系统需要迫切,各区域的摄像头越来越多,这样方便了大规模的安全防范工作,可以及时获取大量的数据信息进行实时监控,但是也给人类带来较大的挑战。鉴于这些问题,世界上出现了智能化的视频监控系统,主要利用计算机视觉和模式识别技术对视频图像利用各种算法进行分析,依据事先设置好的安全程序及时发出报警信号,做好事中分析和预警工作。

3 智能视频监控技术的核心算法

作为智能化的视频监控系统,最大的特点就是可以自动化运行,全天二十四小时对监控画面进行实时分析和报警。这样既能及时识别异常情况,还能提醒安保人员做好准备工作。智能化应用于视频监控技术得到了各界的认可,本部分主要介绍从底层、中层和高层三个层次智能视频监控技术的核心算法。

3.1 目标检测算法

目标检测算法主要是在底层对视频图像进行采集获取终端上的图像序列,对异常情况目标进行检测,跟踪目标以便及时对目标做好后续的处理分析工作,其中关键就是确定目标的位置和储存量。

目前根据处理对象不同可将目标检测分为两种:基于目标建模的目标检测和基于背景建模的目标检测。前者主要特征就是应用场景较为广泛:既能对固定摄像机记录的视频图像进行分析,还能对静态图像和移动摄像机记录的视频图像进行分析。主要应用于检测速度较慢、扫描视频图像较多的区域,此检测方法实时性较差,且对受遮挡影响较大,容易漏检。后者只能适用于背景不变的运动目标,若背景发生变化时无法检测。此检测方式主要针对视频进行较快的处理,对受遮挡部分的影响较小,一般实时性较强,广泛应用于固定摄像机检测。

3.2 目标跟踪算法

目标跟踪算法主要是针对底层阶段确定好的目标进行跟踪,确定目标的具体轨迹。目标跟踪问题的解决关键点在于处理好计算机视觉的问题,这也是实现智能视频监控技术的关键环节,应用性较为广泛。目前依据应用场景的差别将目标跟踪算法分为两种:单一场景目标跟踪和综合场景目标跟踪,前者具体细分为跟踪单个目标和跟踪多个目标,后者具体细分为重叠场景目标跟踪和非重叠场景目标跟踪。在单个场景中,一个目标可以在连续的空间里非常相似;而在重叠场景中的目标跟踪时较为复杂,目标可以从一个场景进入另一个场景,需要在连续的空间里确定好新进入场景的目标的具体信息;在非重叠场景的目标跟踪算法中,鉴于场景间相互存在盲区,不同场景会影响到同一目标的观测数据信息。

3.3 目标的分类识别算法

目标的分类和识别主要是在中层阶段以底层上获取的信息为基础,对其进行判断识别,具体认知目标,做好定位目标的工作。简单来说,就是判断识别视频图像中的物体类别,以识别目标的具体情况。这也是高层计算机视觉得到广泛应用的前提。近十年来主要有词袋模型和深度学习模型这两种算法得到广泛的应用。前者主要是将大量的工作集中在特征编码和特征汇聚上,主要是由特征提取出来数据信息,接着对其进行特征聚类、编码和汇聚,最后由分类器做好分类工作。而后者主要是模拟人脑的神经元处理结构听过学习层次化的方式将目标由底层到中层再到高层的特征进行记录,最终建立反馈机制并形成认知。

3.4 行为分析算法

行为分析主要是在高层充分应用计算机视觉信息对行为主体即目标的具体运动进行分析的算法。根据信息的复杂度不同可将行为分析分为静态姿态识别、运动行为识别和复杂事件分析方法三种。第一种主要是将静态图像作为研究对象,根据时空特征对其进行识别,分析目标的时空体特征、局部特征和轨迹特征。第二种主要是利用时序推理其行为,并利用统计模型和句法模型对目标的行为进行分析。第三种主要是分析目标的交互行为和群体行为。

4 物联网时代下的智能视频监控的挑战及发展方向

4.1 跨场景挑战

目前全球的摄像头数量越来越多,急需智能视频监控技术可以跨各个场景适用。同时监控使用的摄像机不单单包括固定摄像机,还包括移动摄像机等,这些都是的监控摄像机在全球各场景下广泛分布,而如何将这些设备建立成一个系统的体系是将来智能视频监控技术面临的一大挑战。

4.2 跨空间挑战

从视频监控系统开始发展至今,监控数据种类也由单一变得复杂多样,很多信息都可以作为监控数据的载体,进行数据储存。这使得处理数据工作也变得繁琐复杂,因此如何处理好各个载体中的信息,获取有效的信息,将大数据转变成为小数据是未来智能视频监控技术面临的一大问题。

4.3 发展方向

基于物联网时代的迅速发展,智能视频监控技术将面临巨大的机遇和挑战。物联网时代下,信息的传送和集中可以实现跨空间获取有用的数据,还可以扩展到多样化的智能分析。大体上将来的智能视频监控技术具有三大特性:高效视觉网、主动视觉网和协同视觉网。这也是将来智能视频监控系统发展研究的主要方向。

5 结 语

综上所述,智能视频监控技术的发展时间较长,且具有广阔的发展空间;智能视频监控的核心算法还处于积累阶段,需要不断应用验证技术,做好研究工作。物联网时代下的智能视频监控技术面临着巨大的机遇和挑战。我们坚信在未来智能视频监控技术将为监控系统发挥最大的作用,适应时代的发展。

参考文献:

[1] 韩国强.浅谈智能视频监控技术及其主要应用[J].计算机与网络,2014,(2).

第8篇:计算机视觉的核心范文

以下为报告详细内容:

逾八成人工智能创业公司聚集一线城市

iiMedia Research(艾媒咨询)数据显示,35.7%的人工智能创业公司位于北京,另外在深圳、上海、广州这三个一线城市也聚集了超过四成的人工智能创业公司。艾媒咨询分析师认为,人工智能是高度知识密集型的产业,北京的人才、技术、产业、资本等环境都优于其它地区,是人工智能的创业重镇。共有81.8%的人工智能创业公司分布在有丰富技术、硬件和产业资源的北上广深。人工智能产业将形成以北京为绝对核心,一线城市上海、广州、深圳为重点的地理布局。

手机网民普遍认为无人驾驶只能部分取代人类驾驶

iiMedia Research(艾媒咨询)数据显示,有78.9%的受访手机网民认为无人驾驶将部分取代人类驾驶,10.0%的受访手机网民认为无人驾驶能全部取代人类驾驶,6.9%的受访手机网民认为无人驾驶完全不能取代人类驾驶。艾媒咨询分析师认为,近年国内外企业陆续开发无人驾驶领域引发网民对无人驾驶和人类驾驶之间关系的热烈关注,人们对仍处于起步阶段的无人驾驶接受程度仍有待提高,但随着智能技术进一步发展,未来无人驾驶产品的市场普及程度仍然值得期待。

人们相信无人驾驶更安全

iiMedia Research(艾媒咨询)数据显示, 对于无人驾驶与人类驾驶的安全性比较,32.6%的受访手机网民认为无人驾驶更安全,26.6%的受访手机网民认为人更安全。艾媒咨询分析师认为,无人驾驶与人类驾驶安全性比较问题尚停留在理论阶段,对于无人驾驶算法判断的精准性,用户仍然没有具体的感知。现阶段无人驾驶技术水平处于起步阶段影响人们对未来智能汽车操控方式的期望,未来无人驾驶技术说仍需继续提高以增强人们对汽车智能操控的信心。

人工智能为主的操纵方式受欢迎

iiMedia Research(艾媒咨询)数据显示,人们对未来无人驾驶汽车的操纵方式也有自己不同的看法,62.6%的受访手机网民认为智能汽车操纵方式应以人工智能为主,人工操作为辅,22.0%的受访手机网民认可人工操控为主,智能辅助为辅的方式, 只有10.6% 的受访手机网民选择纯人工智能操控。艾媒咨询分析师认为,随着无人驾驶技术的进一步深入,其在日常驾驶的应用比例将稳步提升,人工判断与智能判断并行的驾驶方式或将成为较长时间内的主流。

无人驾驶安全性最受关注

iiMedia Research(艾媒咨询)数据显示,当前对无人驾驶实际应用主要的担忧因素中,受访手机网民最担心的是安全技术不够成熟,占比61.7%,另外23.4%和12.6%的受访手机网民认为购车成本高和使用不方便。艾媒咨询分析师认为,智能汽车相关厂商需要通过更多的试验参数,不断提高无人驾驶安全技术,以获取用户对智能汽车安全的信任。同时,当前无人驾驶技术在前期投入的研发成本巨大,其实际应用的较高购买门槛,也将是其普及的一大阻碍。

速记、翻译工作者未来最可能被人工智能取代

第9篇:计算机视觉的核心范文

[关键词]数字图像处理 OpenCV 实验教学 项目教学

[中图分类号] G642.423 [文献标识码] A [文章编号] 2095-3437(2013)09-0042-02

一、引言

目前,大多数高校的数字图像处理课程都是在引入Matlab集成的工具箱及其自带函数的基础上进行实验教学[1]。由于Matlab程序的移植性较差,学生学习完成后不能直接面对实际的软件开发和应用,难以真正提高学生的工程实践动手能力。

为了让学生既能掌握基本理论和技术,又能较容易编写算法的程序,我们在数字图像处理的教学中引入了开源的计算机视觉库OpenCV(Open Source Computer Vision Library)。该软件是以C 函数和C++类的形式实现大量图像处理算法,学生可以方便地利用OpenCV 进行图像处理算法的编程和验证,进而在VC中开发功能更强大的应用程序。相对于Matlab而言,学生不仅可以利用OpenCV 开放的源代码,以函数进行图像处理,而且可以查看算法的代码实现,更好地培养学生的编程能力[2]。

二、OpenCV概述

OpenCV是Intel公司资助的面向广大研究人员和学生的开源计算机视觉库,它由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉方面很多通用算法,同时提供了MatLab等语言的接口,因此极大地方便了图像处理和视频技术的二次开发[3]。

OpenCV主要包含六大模块,其具体功能分别是[3]:(1) CV模块:包含基本的图形处理函数和高级的计算机视觉算法;(2) CVAUX模块:包含辅助的OpenCV函数,一般存放一些被淘汰的算法和函数,同时也包含一些新出现的实验性的算法和函数;(3) CXCORE模块:包含OpenCV的基本数据结构和线性代数支持;(4) HIGHGUI模块包含图像和视频的界面函数;(5) ML模块:包含一些基于统计的分类和聚类工具,模式识别算法和回归分析等;(6) CVCAM模块:负责读取摄像头数据的模块。

利用OpenCV进行程序开发具有以下几个特点[4]:(1) 独立性。OpenCV中大量的函数和类库既可以独立运行,也可以在加入其它外部库的情况下运行;(2) 跨平台性。构成OpenCV的API函数具有跨平台性,不仅能很好的支持各种不同的操作系统,也可以很好地在不同公司的C/C++编译器下工作;(3) 功能强大。OpenCV包含了线性表、树、图等基本数据结构,也包含图像滤波、边缘检测和数字形态学等数字图像处理的基本操作以及一些图像高级处理功能;(4) 高效性。OpenCV的算法都是基于动态数据结构,使用Intel处理器指令集开发的优化代码,运行速度快,处理效率高;(5) 开放性。OpenCV的源代码是开放的,程序设计者可以直接修改它的源代码,也可以将新的函数或类集成到它的库中。

三、数字图像处理的实验设置

实验是理论教学的有效辅助,对于数字图像处理这类实践性很强的课程就更加重要。通过阅读和调试算法源代码、体验算法的处理效果,学生可以加深对基础理论的理解。根据理论教学的重点难点内容,我们设计了相应的实验项目,每个项目都要求学生运用OpenCV和Visual C++编程语言框架来编写数字图像处理基本算法。

项目教学法是针对课程体系结构设计出一系列学习单元项目,项目设计围绕着具有典型性、启发性的关键问题,学生通过参与项目完成的全过程实现对课程内容系统而深入的掌握[5]。项目教学法真正实现了以学生为中心、以教学目标为中心,实现理论方法学习与实践动手能力培养的紧密结合。

本文基于项目教学法的研究,针对“数字图像处理”课程教学体系结构,并结合教学大纲与教学目标要求,同时参考国外大学的相关课程,设置了以下实验项目:

(1) 图像变换。

(2) 图像直方图均衡化。

(3) 频域图像增强。

(4) 图像边缘检测。

(5) 图像分割。

(6) 人脸检测。

通常,学生完成一个项目需要4个过程[6]:(1) 项目原理分析;(2) 项目具体流程设计;(3) 基于OpenCV的软件设计;(4) 结果展示与分析。以上每个阶段都要求学生提交阶段报告,根据学生报告反映出的问题,老师有针对性地进行指导,在解决问题中帮助学生真正掌握所学的知识,并提高动手能力。在项目法教学过程中,我们特别要注意克服项目无法完全覆盖全部知识点的局限,因此,要在项目选择与设计中综合考虑,并结合项目原理研究建立对教学体系框架和全部知识点的整体把握。

四、OpenCV处理图像的应用实例

(一)图像变换

OpenCV提供多个图像变换函数。函数cvWarpAffine利用指定的矩阵对输入图像进行仿射变换,这类变换可以用一个3×3的矩阵来表示,其最后一行为(0, 0, 1)。典型的仿射变换包括平移变换、缩放变换、剪切变换、旋转变换等。此外,函数cvWarpPerspective对图像进行透视变换,函数cvLogPolar将图像从直角坐标映射到极坐标,核心代码如下:

IplImage* dst = cvCreateImage( cvSize(256,256), 8, 3 );

cvLogPolar( src, dst, cvPoint2D32f(src->width/2,src->height/2), 40 );

图1给出了图像映射到极坐标的结果实例。

(二)图像边缘检测

图像的边缘是图像最基本的特征,是灰度不连续的结果,因而边缘检测是图像处理中的重要问题。OpenCV提供了cvSobel函数、cvLaplace函数和cvCanny等函数进行边缘检测,下面以cvLaplace函数进行举例,其边缘检测的代码为:

IplImage *result_img = cvCreateImage(cvSize(img->width, img->height), IPL_DEPTH_8U, 1);

cvLaplace (img, result_img);

cvNamedWindow(“Result”, 0);

cvShowImage(“Result”, result_img);

第一句是创建一幅与原始图像img同样大小的通道数为1的图像result_img;第二句是使用Laplace算子对图像进行边缘检测,并将结果存放在result_img中,后面两句是在窗口中显示result_img。程序的处理结果如图2 所示。

五、结束语

OpenCV中的函数几乎能够覆盖到所有的数字图像处理的基本功能,而且其代码又是免费的和开放的。实践证明,通过将OpenCV引入数字图像处理的实验教学中,既能简化图像处理的编程,又能切实地提高学生的实践能力,使学生深入理解图像处理的基础理论和典型算法,获得了良好的实验教学效果。

[ 参 考 文 献 ]

[1] 赵敏.Matlab用于数字图像处理的教学实践研究[J].电脑知识与技术,2012,8(31):75397540.

[2] 李树涛,胡秋伟.OpenCV在“数字图像处理”课程教学中的应用[J].电气电子教学学报,2010,32(6):2628.

[3] 刘瑞祯,于仕琪.OpenCV教程[M].北京:北京航空航天大学出版社,2008.

[4] 方玫.OpenCV技术在数字图像处理中的应用[J].北京教育学院学报(自然科学版),2011,6(1):711.