公务员期刊网 精选范文 计算机视觉技术基础范文

计算机视觉技术基础精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉技术基础主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉技术基础

第1篇:计算机视觉技术基础范文

以下为报告详细内容:

2017年计算机视觉技术在更多的领域有所落地应用,自动驾驶领域、高考、政务等领域更多的场景开始应用计算机视觉技术。艾媒咨询分析师认为,计算机视觉行业技术是核心基础,随着技术成熟度提高,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多新的应用领域,提高商业落地应用。

2017年人脸识别技术在智能手机终端应用开始普及。9月苹果新品会上,iPhone X宣布引入Face ID高精度人脸识别技术,引来人们高度关注。而除了iPhone X,华为、小米、OPPO、vivo等手机厂商都推出了带人脸识别功能的智能手机。艾媒咨询分析师认为,计算机视觉领域内人脸识别功能可应用场景广泛,商业化落地能力强,除了计算机视觉创业企业,互联网巨头和硬件巨头企业也纷纷关注布局人脸识别领域。但目前人脸识别技术仍然存在一定缺陷,艾媒大数据舆情管控系统数据显示,“手机人脸识别”热词言值数据为48.5,整体舆情偏负向。现阶段人脸识别技术在智能手机终端上的应用仍处于起步发展阶段,技术和安全性仍有待提高,未来随着各计算机视觉企业加强技术研发,人脸识别技术有望进一步改善,成为智能手机标配。

iiMedia Research(艾媒咨询)数据显示,2017年中国计算机视觉市场规模为68亿元,预计2020年市场规模达到780亿元,年均复合增长率达125.5%。艾媒咨询分析师认为,人们安全和效率需求不断提升,计算机视觉技术在各行业应用能有效满足人们需求,市场发展空间巨大。国家政策对人工智能行业的支持也为计算机视觉的发展提供了有利的环境。随着计算机视觉技术日渐成熟,企业商业化落地能力不断提高,未来计算机视觉市场规模将迎来突破性发展。

iiMedia Research(艾媒咨询)数据显示,商汤科技以24.3%的企业知名度排名各计算机视觉企业首位,旷视科技与云从科技则分别以23.1%以及21.7%的知名度分列二三位。艾媒咨询分析师认为,商汤科技计算机视觉技术及算法能力在行业内较为出色,同时在安防、金融、商业、手机端等多个领域均有商业落地应用,在企业认知和品牌推广方面具有优势。

iiMedia Research(艾媒咨询)显示,61.7%的受访网民通过手机APP应用接触计算机视觉应用,另外有50.9%的受访网民接触途径为通过智能手机终端。艾媒咨询分析师认为,计算机视觉企业主要服务B端用户及政府机构,相比于其他途径,移动端更适合应用计算机视觉技术的产品推广。计算机视觉技术日趋成熟,在移动终端和APP上均有落地应用,也进一步为计算机视觉企业在大众中奠定基础。未来企业可通过线上渠道开发挖掘C端用户市场。

iiMedia Research(艾媒咨询)显示,半数受访网民认为智能手机及APP加入人脸识别技术功能方便了二者的使用,另有48.8%的受访网民认为人脸识别技术在手机及APP上的应用是未来技术发展的趋势。艾媒咨询分析师认为,人脸识别技术在手机及APP端的应用满足人们智能化和便捷化的需求,随着越来越多的手机及APP产品加入人脸识别功能,未来其普及和认可程度将得到进一步提高。

iiMedia Research(艾媒咨询)显示,41.8%的受访网民表示未来愿意使用人脸识别技术进行手机及APP解锁,同时有41.4%的受访网民虽持观望态度,但愿意尝试。此外,47.4%的受访网民认为人脸识别将取代其他手机及APP解锁技术成为未来主流。艾媒咨询分析师认为,近期智能手机纷纷应用人脸识别技术解锁推动该功能技术的普及,便捷性的优势使该功能技术前景受看好。但目前人脸识别解锁技术的准确性仍然受到质疑,随着未来技术进一步成熟,该技术有望成为智能手机设备标配。

iiMedia Research(艾媒咨询)显示,33.9%的受访网民曾使用过人证比对功能进行业务办理。在使用过该功能的人群中,54.6%认为其方便了业务办理,提供了效率,且有47.3%该部分人群认为其识别准确程度高。艾媒咨询分析师认为,政府、银行等机构业务办理效率以往常遭诟病,人证识别技术的应用提高了办事效率,在提高人们满意度的同时,加强了计算机视觉技术的认可度。未来计算机视觉技术在政府、银行等机构的落地应用将进一步扩展,但其中涉及到个人信息保护等问题需要企业及相关机构合力解决。

iiMedia Research(艾媒咨询)显示,34.1%的受访网民认为公安办案为最有必要应用人脸识别技术的安防情景。而关于网民对人脸识别技术在安防监控领域应用看法调查中,56.1%的受访网民认为其能有力保护人们人身财产安全。艾媒咨询分析师认为,计算机视觉技术,尤其是人脸识别技术在安防领域应用意义重大,在刑侦破案、身份认证、公共安全保护等情景具有重要应用价值。未来安防领域将成为计算机视觉技术重点应用领域,而安防的重要性也对相关企业技术实力有严格的要求,未来安防领域市场或由少数技术实力较强的企业占据。

商汤科技是专注计算机视觉与深度学习原创技术的人工智能创业企业,拥有强大的技术能力和人才资源储备支撑发展。商汤科技在计算机视觉领域综合实力较强,获资本方青睐,B轮融资4.1亿美元,同时与国内外知名企业展开合作。艾媒咨询分析师认为,商汤科技在商业营收上同样处于行业领先水平,但其本质专注于技术发展,强大的技术基础能较好支撑商汤科技在上层应用场景的扩展。商汤科技在技术驱动商业应用的同时,积累商业应用经验,提高企业知名度,拓展应用至更多领域。

艾媒咨询分析师认为,商业化落地能力欠缺是目前计算机视觉行业大部分企业的痛点,商汤科技在商业落地应用方面处于行业领先位置。这一方面源于商汤科技技术能力往专业化发展,以专业技术和研发基础实现场景差异化应用。另一方面,纯计算机视觉技术或算法由于其专业性,需求方在使用时需要具备专业能力,而商汤科技技术产品往标准化方向打造,打包成行业解决方案,能适应更多企业使用需求,也有利于商汤科技技术进一步落地应用。未来坚持技术为基础,继续提高商业落地能力,商汤科技有望继续保持良好发展态势。

旷视科技成立于2011年,2017年10月完成巨额C轮融资,专注于人脸识别、图像识别和深度学习技术自主研发和商业化落地,深耕于金融安全、城市安防、商业物联、工业机器人等领域,同时打造人工智能开放云平台。艾媒咨询分析师认为,旷视科技利用云平台为开发者提供技术支撑,有利于计算机视觉技术进一步结合产品运营,同时可以收集海量图片数据,通过进行深度学习,旷视科技图像识别技术又能进一步得到提升,有利于其强化自身核心技术能力。

艾媒咨询分析师认为,人脸识别技术对于金融行业业务办理及风控等流程具有重要应用价值,旷视科技在人脸识别技术上的优势也助其有效开展金融领域的服务应用。未来随着旷视科技利用云开放平台相关图片数据进行深度学习强化人脸识别技术,以及在金融领域积累的渠道资源,其有望在金融领域继续强化技术服务,成为该领域市场有力的竞争者。

艾媒咨询分析师认为,自动驾驶为人工智能和汽车行业未来发展方向,计算机视觉技术在自动驾驶汽车实现路况感知、高精度定位等方面发挥重要作用,自动驾驶为计算机视觉技术未来重要应用领域。图森未来的计算机视觉技术和算法在自动驾驶领域实现专业化发展,未来有望在此细分领域成长为领先企业。

2017-2018中国计算机视觉行业发展趋势

需求驱使计算机视觉行业发展潜力巨大应用场景拓展渗透各行业

艾媒咨询分析师认为,人们对生活安全以及生产效率追求两大需求的提升,决定计算机视觉行业具有巨大发展空间。而计算机视觉技术场景应用具有广泛性,有望发展成为下一个智能时代的标配。目前计算机视觉技术主要应用在B端领域,短期内行业发展趋势也是集中于B端领域。未来随着技术成熟,计算机视觉有望拓展更多新的应用场景,实现场景落地,渗透至各行各业,形成AI+,开拓更多C端业务。此外,计算机视觉技术可以跟其他技术,如AR、VR、无人驾驶等结合发展,创造新的应用领域。

技术应用由点及面行业解决方案及软硬件结合成商业产品出路

对于计算机视觉技术使用者来说,由于技术的学习应用需要花费较多时间和精力,硬件产品及行业解决方案往往更受青睐。未来计算机视觉企业需要将软硬件结合,如打造嵌入式芯片等。此外,计算机视觉企业应将技术应用由点及面,将技术应用发展成针对各行业的解决方案。未来市场将出现更多基于计算机视觉技术应用的行业解决方案和软硬一体化产品,只有打造方便用户使用的商业产品,才能有效适应其需求,帮助计算机视觉企业迅速占领行业市场,在市场竞争中取得领先优势。

计算机视觉行业发展对企业综合实力要求高

艾媒咨询分析师认为,计算机视觉行业巨大的发展前景决定其具有高成长性特点,未来将涌现更多人工智能领域优秀企业。但行业发展同时伴随高风险性,行业竞争需要比拼企业技术算法能力、资金能力、以及人才资源,同时考验企业能否实现技术迅速落地,对企业综合实力要求高,综合实力不具备优势的企业在行业内将难以生存。

第2篇:计算机视觉技术基础范文

【关键词】精密测量 计算机视觉图像 关键技术

在现代城市的建设中离不开测量的运用,对于测量而言需要精确的数值来表达建筑物、地形地貌等特征及高度。在以往的测量中无法精准的进行计算及在施工中无法精准的达到设计要求。本文就计算机视觉图像精密测量进行分析,并对其关键技术做以简析。

1 概论

1.1 什么是计算机视觉图像精密测量

计算机视觉精密测量从定义上来讲是一种新型的、非接触性测量。它是集计算机视觉技术、图像处理技术及测量技术于一体的高精度测量技术,且将光学测量的技术融入当中。这样让它具备了快速、精准、智能等方面的优势及特性。这种测量方法在现代测量中被广泛使用。

1.2 计算机视觉图像精密测量的工作原理

计算机视觉图像精密测量的工作原理类似于测量仪器中的全站仪。它们具有相同的特点及特性,主要还是通过微电脑进行快速的计算处理得到使用者需要的测量数据。其原理简单分为以下几步:

(1)对被测量物体进行图像扫描,在对图像进行扫描时需注意外借环境及光线因素,特别注意光线对于仪器扫描的影响。

(2)形成比例的原始图,在对于物体进行扫描后得到与现实原状相同的图像,在个步骤与相机的拍照原理几乎相同。

(3)提取特征,通过微电子计算机对扫描形成的原始图进行特征的提取,在设置程序后,仪器会自动进行相应特征部分的关键提取。

(4)分类整理,对图像特征进行有效的分类整理,主要对于操作人员所需求的数据进行整理分类。

(5)形成数据文件,在完成以上四个步骤后微计算机会对于整理分类出的特征进行数据分析存储。对于计算机视觉图像精密测量的工作原理就进行以上分析。

1.3 主要影响

从施工测量及测绘角度分析,对于计算机视觉图像精密测量的影响在于环境的影响。其主要分为地形影响和气候影响。地形影响对于计算机视觉图像精密测量是有限的,基本对于计算机视觉图像精密测量的影响不是很大,但还是存在一定的影响。主要体现在遮挡物对于扫描成像的影响,如果扫描成像质量较差,会直接影响到对于特征物的提取及数据的准确性。还存在气候影响,气候影响的因素主要在于大风及光线影响。大风对于扫描仪器的稳定性具有一定的考验,如有稍微抖动就会出现误差不能准确的进行精密测量。光线的影响在于光照的强度上,主要还是表现在基础的成像,成像结果会直接导致数据结果的准确性。

2 计算机视觉图像精密测量下的关键技术

计算机视觉图像精密测量下的关键技术主要分为以下几种:

2.1 自动进行数据存储

在对计算机视觉图像精密测量的原理分析,参照计算机视觉图像精密测量的工作原理,对设备的质量要求很高,计算机视觉图像精密测量仪器主要还是通过计算机来进行数据的计算处理,如果遇到计算机系统老旧或处理数据量较大,会导致计算机系统崩溃,导致计算结果无法进行正常的存储。为了避免这种情况的发生,需要对于测量成果技术进行有效的存储。将测量数据成果存储在固定、安全的存储媒介中,保证数据的安全性。如果遇到计算机系统崩溃等无法正常运行的情况时,应及时将数据进行备份存储,快速还原数据。在对于前期测量数据再次进行测量或多次测量,系统会对于这些数据进行统一对比,如果出现多次测量结果有所出入,系统会进行提示。这样就可以避免数据存在较大的误差。

2.2 减小误差概率

在进行计算机视觉图像精密测量时往往会出现误差,而导致这些误差的原因主要存在于操作人员与机器系统故障,在进行操作前操作员应对于仪器进行系统性的检查,再次使用仪器中的自检系统,保证仪器的硬件与软件的正常运行,如果硬软件出现问题会导致测量精度的误差,从而影响工作的进度。人员操作也会导致误差,人员操作的误差在某些方面来说是不可避免的。这主要是对操作人员工作的熟练程度的一种考验,主要是对于仪器的架设及观测的方式。减少人员操作中的误差,就要做好人员的技术技能培训工作。让操作人员有过硬过强的操作技术,在这些基础上再建立完善的体制制度。利用多方面进行全面控制误差。

2.3 方便便携

在科学技术发展的今天我们在生活当中运用到东西逐渐在形状、外观上发生巨大的变大。近年来,对于各种仪器设备的便携性提出了很高的要求,在计算机视觉图像精密测量中对设备的外形体积要求、系统要求更为重要,其主要在于人员方便携带可在大范围及野外进行测量,不受环境等特殊情况的限制。

3 计算机视觉图像精密测量发展趋势

目前我国国民经济快速发展,我们对于精密测量的要求越来越来高,特别是近年我国科技技术的快速发展及需要,很多工程及工业方面已经超出我们所能测试的范围。在这样的前景下,我们对于计算机视觉图像精密测量的发展趋势进行一个预估,其主要发展趋势有以下几方面:

3.1 测量精度

在我们日常生活中,我们常用的长度单位基本在毫米级别,但在现在生活中,毫米级别已经不能满足工业方面的要求,如航天航空方面。所以提高测量精度也是计算机视觉图像精密测量发展趋势的重要方向,主要在于提高测量精度,在向微米级及纳米级别发展,同时提高成像图像方面的分辨率,进而达到我们预测的目的。

3.2 图像技术

计算机的普遍对于各行各业的发展都具有时代性的意义,在计算机视觉图像精密测量中运用图像技术也是非常重要的,在提高图像处理技术做以提高。同时工程方面遥感测量的技术也是对于精密测量的一种推广。

4 结束语

在科技发展的现在,测量是生活中不可缺少的一部分,测量同时也影响着我们的衣食住行,在测量技术中加入计算机视觉图像技术是对测量技术的一种革新。在融入这种技术后,我相信在未来的工业及航天事业中计算机视觉图像技g能发挥出最大限度的作用,为改变人们的生活做出杰出的贡献。

参考文献

[1]汤剑.周芳芹.杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2015,14(18):33-36.

[2]马玉真.程殿彬.范文兵,计算机视觉检测技术的发展及应用研究[J].济南大学学报,2014,18(23):222-227.

[3]李华.基于计算机视觉图像精密测量的关键技术分析[J].电脑知识与技术,2013(05):1211-1212.

第3篇:计算机视觉技术基础范文

关键词:计算机视觉技术 铁路检测 应用

中图分类号:TP391 文献标识码:A 文章编号:1007-3973(2012)002-075-03

1 前言

自1825年世界第一条铁路在英国出现以来,铁路已经成为人们不可或缺的交通工具,越来越多的人在使用铁路出行,由于近年来铁路事故频频发生,促使了计算机视觉技术在铁路检测上的广泛使用并大力发展。

传统的铁路检测一直是靠人工和静态检测,这种检测缺乏实时性和准确性,并且效率低下,根本无法满足铁路的发展。这就要求研究一种新的检测方法来适应环境的发展,人们就试图将计算机视觉技术应用于铁路检测上,并取得了很好的效果。将计算机视觉技术应用在铁路检测上显著提高了铁路检测的实时性、准确性,有效的减轻了人工检测中工作条件恶劣,工作量大等缺点。它能在列车行驶的过程中就能对铁路和列车状况进行检测,并及时的做出预警,防止安全事故的发生。目前有关铁路检测主要集中在铁路信号检测、轨道检测、接触网检测、电力机车检测及站台环境监测等五个方面。

2 计算机视觉技术

计算机视觉,也称机器视觉。它是利用一个代替人眼的图像传感器获取物体的图像,将图像转换成数字图像,并利用计算机模拟人的判别准则去理解和识别图像,达到分析图像和作出结论的目的。

计算机视觉是多学科的交叉和结合,涉及到数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域。计算机视觉已有多年的发展历程。随着计算机、控制理论、模式识别、人工智能和生物技术的发展,计算机视觉在机器人、工业检测、物体识别的应用越来越广,研究方向也从二维到三维,从串行到并行,从直接依赖于输入信号的低层处理到依赖于特征、结构、关系和知识的高层处理。

一般的计算机视觉系统是有CCD(电荷耦合器件)摄像机、装备有图像采集板的计算机、光照系统以及专用图像处理软件等组成。CCD摄像机将所要研究的对象和背景以图像的形式记录下来,这其实是一个光电传感器,将光学信号转成电信号,图像采集板把采集的电信号转为数字信号,即数字化,一般情况下在摄取图像时都需要一个照明系统提供光照,然后再用专用的图像处理软件对图像进行处理,输出分析结果。

3 计算机视觉技术在铁路信号中的应用

铁路信号灯和现在的交通公路上的红绿灯是一个功能,但铁路和公路不同,铁路有限定的道路,列车必须在限定的股道上行驶,所以一旦与其他车辆相遇的话根本没有办法避让,如果发生车祸将会对国家和人民的生命和财产造成严重的损失,因此列车必须严格按照信号灯的指示行驶。

铁路信号灯识别主要是利用了信号灯在不同情况下会发出特定色彩光的特点。文献[1]在HSV空间中对S分量图像边缘检测和膨胀等,结合各种信号灯色调H分量的取值范围得到信号灯区域,然后多次腐蚀直到消除孤立点得到信号灯的边缘,最后填充信号灯区域,从而实现了信号灯的识别。在文献[2]也与此类似。文献[3]将彩色图像由RGB模式转化为HSI模式,用彩色特征聚类分析法来对图像进行分割,文中提出了基于颜色和形状相结合的复杂环境中目标检测与识别方法,用Hough变化来提取目标边界,从而提取出特定目标,而后得到指示灯区域所有像素的H,S统计值确定信号灯的颜色。在文献[4]提出一种基于改进的Hough变化的吊车信号灯识别算法。Roberto将摄取的图片转换到HIS颜色空间,用基于形状特征和模板匹配的方法探测到相关的铁路标志而放弃无关的基础设施。

为了部分消除因为光照条件、背景和拍摄角度对目标识别的影响,文献[5]提出使用一种利用sift特征的方法,它首先建立已知样本模型的特征集,然后将视频流每帧灰度图像的sift特征与之比较,从而实现对目标的检测或跟踪。实验表明该方法不仅能避免目标的错误识别,而且也明显优于基于边缘检测的算法,在识别准确率上达到了90%。

4 计算机视觉技术在轨道检测中的应用

随着世界铁路运营速度的不断提高,列车在行驶时对轨道的撞击、摩擦加剧,这就会造成轨道的变形、零件松动、磨损乃至缺失等,这些都会对列车的安全性造成严重影响,极有可能会造成铁路安全事故的发生。因此轨道设备具备良好的状态是铁路运输安全的重要保证。

随着电子技术和检测技术的发展,轨道检测技术也经历了翻天覆地的变化,其中也有不少研究机构将计算机视觉技术应用于轨道检测上,且取得了若干有效的检测方法。

轨道表面缺陷对列车行驶的质量和铁路系统的安全性会造成严重的影响,文献[7]提出了一种轨道表面缺陷检测的实时视觉检测系统。利用跟踪提取算法分割出轨道的灰度图像,然后用局部归一化法增强轨道图像的对比度,最后用基于投影轮廓的缺陷定位法检测缺陷。该算法对噪声有较强的鲁棒性和计算速度快,在一定程度上克服了光照不均和轨道表面反射性质不同对图像的影响,但对局部归一化过程中参数的选择有待进一步研究,以使该系统有更强的鲁棒性。该系统在216km/h速度下能进行实时检测,但随着检测速度的提高检测的准确度会明显下降且缺乏实时性。

文献[8]利用一排结构光视觉传感器,将钢轨轮廓的大圆周和小圆周的中心作为检查点。首先结构光视觉传感器拍摄铁轨侧面并且将其标记 在参考坐标帧中,最后通过比较测量的钢轨轮廓与参考轮廓的比较计算出铁轨磨损程度。该方法简单快速精确且不需要特殊的图像处理设备,在列车较高速度时仍然能达到良好效果。

5 计算机视觉技术在接触网检测中的应用

接触网是沿铁路线上空架设的向电力机车供电的特殊形式的输电线路。其由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。它是轨道交通的主要组成部分,主要为机车提供动力,接触网的连接件由于受外界因素的影响容易产生过热现象,严重时会导致供电中断,引发列车停运事故。

我国的计算机视觉技术的接触网检测系统是基于德国相关技术而建立起来的,目前基于计算机视觉技术的接触网磨耗检测主要有两种方案:(1)基于镜面反射,激光照射接触线,线性CCD照相机捕获反射图像;(2)基于漫反射原理和CMOS(互补金属氧化物半导体)照相机。由于长期的频繁摩擦,接触网与受电弓接触部分很少被空气氧化,所以用光进行照射时该部分光反射率明显高于其他部分,因此这也为计算机视觉技术用于接触网检测提供了可能。

基于机器视觉的接触网检测系统主要是建立在图像识别和图像处理等视觉技术基础之上的,检测的内容涵盖接触网的所有基本几何参数。随着铁路的发展,原有的检测系统已经暴露出了一些问题,已无法满足需求,所以研究人员在系统硬件设备不变的情况下提出了许多改进的算法,如文献[9]针对现行的接触网定位器倾斜度检测方法效率低下、精确度不高的缺点,提出了一种基于计算机视觉的接触网定位器倾斜度自动测量装置,应用图像分割、剔除干扰线、图像细化等算法,对采集的图像进行处理,然后利用改进的霍夫(Hough)变换检测细化后的图像,对相邻的特征像素点进行聚类并感知编组,最后用随机Hough变换使感知编组后的每条线段更接近直线,进而计算装置中定位器的倾斜度,实验证明该算法精度高、速度快。

6 计算机视觉技术在电力机车检测中的应用

在列车的行进过程中,机车车轮与钢轨接触面不断发生摩擦,也就是轮缘与踏面的摩擦。从而会造成踏面的擦伤或剥离,而剥离会严重影响列车运行的安全性和平稳性以及轨道设施的使用寿命,因此需要对轮缘进行定期的检测和维修。

传统的检测方法需要人工逐项检测,存在费时费力、工作量大、工作环境差、效率低等缺点,所以人们就提出了一种基于计算机视觉技术的检测技术,该技术是一种非接触式检测方法,它能检测出所有关于火车轮缘轮廓的几何参数,从而计算出火车轮缘的磨损情况。这种检测方法检测速度快、准确率高且大大减轻了劳动强度,在实验中取得了满意的效果,并且在实际检测中也得到了广泛的应用。

文献[10]中研发设计了一种利用CCD成像测量技术、图像处理理论和计算机控制等相关技术,提出了一种非接触式的在线测量系统。采用二元多项式方法对由于硬件装置引起的误差的图像进行几何校正,用统计均值法对图像进行分割,从而求出车轮踏面的各项参数,通过在实验室对标准物进行测试实验而得到的测量数据结果进行分析而得出。此系统能够完成对火车轮对几何参数的测量,并且可得到相对准确的测量结果。

为了解决检测轮缘高度和宽度存在精度难以保证及稳定性不高的问题,文献[11]提出了一种基于三角法测量的在线监测系统,该系统由CCD高速摄像机和结构光发射器完成数据的采集,然后利用三角测量原理导出测量模型和计算模型,根据轮缘高度和宽度的定义完成对高度和宽度的测量,最终对轮缘磨损程度进行量化,实验表明该算法测量精度高,结果稳定可靠。

7 计算机视觉技术在站台环境监测中的应用

近年来铁路交通事业发展迅速,铁路客流量也不断增大,如中国每年的春运期间都有上亿人次通过火车返乡,各种危害乘客安全的事故也时有发生,因此世界各国特别是中国站台监控就显得越来越重要,目前的站台监控主要是依靠安装在各个角落的闭路电视或专业技术人员,这不仅需要专业技术知识还需要大量的人力物力。随着计算机、图像处理等技术的快速发展,对站台的自动监控也逐渐成为发展趋势。

近年来人们做了许多关于站台人群检测的研究,这些研究大都使用铁路站台中的闭路电视(CCTV)系统,在现代的CCTV系统中基本上使用的是数字化图像,在人群监测过程中大量使用了数字图像处理技术,如边缘检测、细化、像素计算等,通过图像的处理可以轻易的得到想要的结果。

文献[12]仍采用原有的CCTV监控系统拍摄的灰度图像作为处理对象,利用基于视觉的经过最小二乘法和全局搜索的混合算法训练的工业的额神经网络来估算站台的拥挤程度,该系统在实际的运行中获得了较高的精确度,虽然不能计算人数但却能实时的预测人群的密度。

文献[13]所设计的系统就较为复杂,它利用多台摄像头对站台进行检测。首先判断站台上列车的四种状态,如:没有列车、有列车、列车正在出站、列车正在入站等,然后对物体或行人检测及跟踪,最后对所检测的结果综合分析,做出合理的预警或警告。

8 计算机视觉技术在铁路检测上的发展趋势

随着计算机视觉技术的铁路检测中的应用越来越广泛和深入,并且随着计算机视觉技术等关键技术的不断发展,计算机视觉技术在铁路检测上应用发挥更大的作用,它就目前而言在铁路检测的应用上仍然存在技术难题需要研究:

第4篇:计算机视觉技术基础范文

Abstract: This paper puts forward the camera calibration method in computer vision, through analysis of principle of computer vision, and analyzes the application of camera calibration methods in computer vision.

关键词: 计算机;视觉;摄像机;定标

Key words: computer;visual;camera;scaling

中图分类号:TP391.4 文献标识码:A 文章编号:1006-4311(2013)24-0193-02

0 引言

在计算机技术快速发展的今天,人们越来越依赖于计算机,计算机在人们的生活工作中占有重要的地位。计算机中的各种应用层出不穷,广泛应用在各个领域,计算机视觉在摄像中的应用为摄像机定标方法提供了巨大的参考价值。由于人们对摄像机拍摄效果的要求,使得摄像机在不断改革更新,摄像机的定标方法是摄像机研究领域备受关注的话题。计算机视觉中摄像机的定标方法是摄像机研究领域所推崇的,它受到了研究人员的高度重视。计算机视觉中摄像机的定标方法呈现出了高质量的摄像效果,极大地满足了人们对摄像机摄像效果的要求。

1 计算机视觉投影原理

计算机视觉投影原理是利用光的折射现象,把视觉中呈现的影像投射到摄影机的屏幕上,形成了固定的图像。在计算机视觉中摄影机的成像原理就是利用光的感应,通过对摄像机的焦距进行调整,确定拍摄目标在摄像机镜头中的位置,然后利用光的折射形成固定的图像。在进行摄像时调整焦距是非常关键的,焦距就是镜头与目标之间的距离,这两者距离的远近决定了摄像的效果。如果焦距太远的话,目标成像就会非常小甚至是模糊。如果焦距太近的话,目标成像会很大也会导致无法看清图像,所以调整焦距是非常必要的,只有调好了焦距才会形成高质量的图像。

2 计算机视觉中的摄像机定标方法

2.1 三维立体定标法 摄像机的成像往往都是三维立体的,把图形通过每个立体面详细的表现出来,以达到完美的效果。要想达到三维立体的效果在对摄像目标的位置进行确定时,就要找出目标的三维坐标点,以便接下来的摄像工作可以顺利进行。然后在图像投影中找到对应的三维坐标,这一步决定了整个摄像过程的设计方案。最后确定目标在摄影镜头中的实际三维坐标,根据镜头中目标的实际三维坐标形成具体的图像。三维立体定标方法的操作原理就是把目标的三维投影进行分步成像,和实际成像效果相联系,形成镜头中具体的三维图像。在计算机视觉中把三维成像图进行处理,对三维定标的参数进行分析,找出最优的三维成像方法,使摄像机呈现出高质量的摄像效果。

2.2 平面定标法 平面定标法就是利用多个成像平面对目标的位置进行分析,选择合适的成像平面对目标进行位置的确定。每个平面的成像都是不同的,由于每个平面的成像都是在运动的,所以应该在摄像机与目标之间的平面内找到一个点,来分析目标与摄像机之间的成像规律,然后根据这一规律对目标进行定标,使摄像机中运动的目标给人们带来不一样的感受。随着目标的不断运动,摄像机与目标之间平面内的点会越来越多,对物体的定标会受到这些点的影响,物体定标的准确度也越来越高,为摄像机定标提供了可靠的信息支持,会减少摄像机定标的成本,提高了摄像的经济效益。相比三维立体定标法,平面定标的精确度更高,定标所用的时间相对较短,所以平面定标法在摄像研究领域中值得推广。

2.3 双平面定标法 所谓的双平面定标法就是利用镜头与目标之间的两个平面的成像点来进行定标,不需要成像平面上的光线通过平面中心,只要选取两个平面之间任意两点坐标来对定标参数进行计算分析,得出具体的成像图。这种定标方式不受平面中心的影响可以在任意点上成像,减少了定标参数的数量,提高了定标的工作效率。但是由于双平面定标法只是任意选取两平面上的点,对定标的精确度造成了一定的影响,使计算机对参数的运算缺少可靠的数据支持,一定程度上降低了摄像机的成像清晰度,使计算机视觉中摄像机的定标精度存在一定的偏差,呈现出来的具体图像质量相对比较差。

2.4 直线两点定标法 在三维立体和平面定标法的基础上,又进一步研究了直线两点定标法,极大程度上满足了人们对摄像效果的要求。直线两点定标法是利用定标物与摄像机镜头之间的直线上的两点进行定标。然后通过计算机视觉对这两点的坐标参数进行分析,然后摄像机利用这些参数对摄像机的焦距进行调整,确定物体的具置。在三维立体和平面定标的基础上对计算机视觉程序进行改进升级,进一步提高对物体定标的精确度。对原有定标方法进行创新改进得出了直线两点定标法使定标参数的数量大幅度的下降,节省了很多的人工成本,摄像机的清晰度也会大大提高。

2.5 透视变换焦距的定标法 透视变换焦距定标法是通过分析镜头与目标之间的距离,不断调整两者之间的距离使镜头里呈现出来的图形清晰为止,然后就将现在的目标设置为定标物。由于这种定标方法不用去分析具体的定标参数被人们广泛的应用。随着科技的发展现在的摄像机都有自动调整焦距功能,不用人为的去调整焦距,使定标物更快地呈现在镜头中,节省了大量的定标时间,计算机的运算速度也加快了。但是这种定标方法也存在一定的缺陷,在实际操作如果不考虑摄像环境以及摄像镜头的变化,定标的精确度会存在一定的偏差,导致镜头中的定标物成像不清晰。

3 计算机视觉中摄像机定标方法的应用

3.1 在计算机视觉中摄像机的主动定标 计算机视觉中摄像机的定标方法推动了计算机技术在摄像机中的广泛应用。计算机视觉中摄像机的主动定标是计算机技术在摄像机中的显著应用。计算机技术使摄像机在定标过程中主动寻找定标物,使焦距和视角很好地配合,充分发挥计算机视觉在摄像机中的成像原理,把定标方法合理地运用在摄像机主动定标过程中,使摄像机的清晰度得到大幅度地提升。

3.2 分层次进行摄像机的定标 随着计算机技术在摄像机定标中的不断发展更新,摄影者喜欢分层次地进行定标,把自己的观点融入到摄像机定标过程中,用自己的思维对定标参数进行分析,利用计算机视觉成像原理把定标物直观的反映在计算机上,以便更好的对定标物进行分析,以其中一个定标物的成像平面来确定定标物的具体成像图,使摄像机镜头中的定标物图像可以更清晰。这种分层次的定标使计算机技术可以更好的应用在摄像机定标过程中,呈现出高质量的摄像效果。

4 总结

在计算机视觉中摄像机的定标方法都是可行的,但各种方法都存在一定的缺陷,所以在实际应用中还应该根据摄影环境以及摄影机的质量选择最优的定标方法,保证定标参数的准确性,在镜头里呈现出清晰的成像。针对计算机视觉中摄像机定标方法的缺陷,摄像机的研究领域应该要不断更新摄像机定标方法,提高摄像机定标的精确度,不断满足人们对摄像机清晰度的要求,呈现出清晰的摄像效果。

参考文献:

[1]邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报,2000(1).

[2]伍雪冬,蒋新华,李建兴,黄靖.计算机视觉中传统摄像机定标方法综述[J].福建工程学院学报,2007(1).

第5篇:计算机视觉技术基础范文

【关键词】计算机视觉 运动目标 跟踪算法

在计算机等现代科学技术尚未出现以前,人们在获取外界信息时往往主要依赖视觉,而在我国计算机技术水平不断发展提升的背景之下,计算机视觉技术的出现使得人类肉眼视觉得到了进一步的发展延伸,尤其是在各种传感器技术的帮助之下,使得人们能够对保持运动状态的目标进行实时跟踪,从而准确掌握目标的具体形态属性。在此背景之下,本文将运动目标设定为运动的人脸,通过探究基于计算机视觉的运动目标跟踪算法,希望能够为相关研究人员提供相关参考和帮助。

1 Kalman filter目标跟踪算法的简要概述

Kalman filter目标跟踪算法是当前众多跟踪算法当中使用范围较广、使用频率比较集中的一种跟踪算法,这一算法最早可以追溯至上个世纪六十年代,人们通过将滤波理论与状态空间模型相集合,从而得到的一种递推估计的算法也就是卡尔曼滤波理论。其通过利用上一时刻获取的预估值以及当下获取的实际观测值,在信号与噪声状态空间模型当中不断更新状态变量,进而顺利完成估计预测并获得当前时刻估计预测值。经过不断的发展,在计算机图像处理以及其他运动目标跟踪当中经常会使用Kalman filter算法。如果在k时刻系统下的状态向量用xk表示,那么在t0时刻下初始化的状态预测方程为;在tk时刻下更新系统状态的具体方程为

,其中Hk、Zk分别表示测量矩阵m×n维以及转移矩阵n×n维的状态向量。但在跟踪计算机视觉运动目标譬如说视频目标时,由于相邻的两帧视频图像本身时间间隔非常短,因此目标在这一时间内难以发生明显的运动状态变化,此时我们可以通过将此间隔时间设定为单位时间,同时目标在单位时间内一直保持匀速运动状态,这时我们可以得到一个状态转移矩阵且

,定义系统观测矩阵即为

,定义噪声Wk以及Vk协方差矩阵则可以分别用

和表示。

如果在滤波器在经过若干次卡尔曼滤波后仍然能够恢复至原始状态,则其具有较好的稳定性,但如果在进行运动目标跟踪实验的过程当中,对于处于运动状态的被跟踪目标,一旦出现遮挡行为则将在第一时间内暂停估计参数,并将这一参数估计值直接代入到状态方程当中,使得运动目标无论是否被遮挡均可以对其进行精确跟踪。

2 基于计算机视觉的运动目标跟踪算法

2.1 建立颜色概率模型

颜色囊括了诸多的信息量光柱点,尤其是在人类的视觉世界从本质上来说也是一种用过感知自然界色彩以及明暗变化的世界,因此人们可以通过使用三基色原理获得RGB颜色空间。考虑到颜色与计算机视觉场景当中各个场景和目标之间有着紧密的关系,同时不同于目标的大小、形态等其他视觉特征,颜色特征鲜少会受到包括观察视角等在内各因素的干扰影响,从某种角度上来说基于颜色特征的运动目标具有较好的稳定性。为了能够保障目标跟踪既稳定又迅速,需要选择合适的颜色特征,否则将极有可能导致出现跟踪失败。在这一环节当中人们通常使用的是RGB颜色空间以及HSI颜色空间,但由于二者均具有一定的局限性,因此本文在对人脸特征尤其是颜色特征进行选取时,选择了rgI颜色直方图的方法,在解决两N颜色空间自身缺陷的同时,尽量避免目标人脸运动位置以及尺寸等变化因素对目标追踪造成的干扰影响。在rgI颜色直方图当中

,,,L=r+g+I其中R、G、B就是RGB颜色空间当中的三原色,r、g、I有着相同的取值范围即在0到1之间。保持间隔相等的情况下划分L值即可得到rgI颜色直方图。虽然rgI颜色直方图与物体相对应,但如果目标只是位置以及尺寸等出现变化,rgI颜色直方图并不会受到任何实质性影响,因此在理想情况下,利用rgI颜色直方图能够对视频图像中不同运动位置以及不同尺寸的人脸进行目标追踪。

2.2 跟踪算法

运动目标的不断变化将会使得模板图像随之发生相应变化,因此需要不断更新模板图像才能够有效完成对运动目标的连续跟踪,本文在对运动目标的实际运动范围进行预测过程中选择使用卡尔曼滤波,之后利用rgI颜色直方图在预测运动范围之内搜索和匹配相应目标,从而通过此举获得与目标模板有着最小欧式距离的区域,在此过程当中存在一个特定阈值T,如果两者的欧氏距离在进行相减时差值没有超过这个特定阈值,那么此时该区域就是运动目标所在的实际位置,利用在这一区域当中的rgI颜色直方图并将其充当下一帧运动目标的匹配模板,在不断重复的过程中模板能够实现不间断地更新。由于相邻的两帧视频图像之间,时间间隔并不长,因此目标人脸在极短的时间间隔当中基本上不会出现突然变化,此时我们可以认为运动目标人脸的运动连续性比较强,此时利用公式

可以进行欧式距离的计算并用以衡量匹配的模板。其中匹配区域和模板的rgI颜色直方图分别用l和l'表示,而rgI颜色直方图中的维数则用n进行表示。根据相关视频图像显示,通过不断更新模板确实可以对目标运动人脸进行实时跟踪显示。

3 结束语

总而言之,本文通过选择当前比较常见的目标跟踪算法即Kalman filter算法,利用卡尔曼滤波以及rgI颜色直方图完成对运动人脸的跟踪。事实证明,Kalman filter算法确实能够在对各目标之间的干扰进行明确区分的基础之上,准确描述运动人脸目标,从而较好地跟踪运动目标,但由于人脸之间本身存在一定的相似性,因此本文只是对理想状态下的运动人脸进行跟踪实验,日后还需要对计算机视觉技术和Kalman filter算法进行进一步优化以妥善解决多人脸目标以及相似性问题。

参考文献

[1]郑薇.基于双目视觉的运动目标跟踪算法研究及应用[D].哈尔滨:哈尔滨工程大学,2014.

[2]李慧霞,李临生,闫庆森,周景文.基于Mean Shift算法的目标跟踪综述[J].计算机与现代化,2017(01):65-70.

[3]李寰宇,毕笃彦,杨源,查宇飞,覃兵,张立朝.基于计算机视觉的运动目标跟踪算法研究[J].电子与信息学报,2015(09):2033-2039.

[4]陈曦,殷华博.基于计算机视觉运动目标跟踪技术分析[J].无线电工程,2014(06):22-24+39.

第6篇:计算机视觉技术基础范文

分布式计算是一种计算方法,和集中式计算是相对的。随着计算技术的发展,有些计算应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长的时间来完成。简单来说,分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。本书使用开源工具及相应技术的开发并实现了大规模分布式处理系统,提出了构建高性能分布式计算系统的先进材料,提供实际的指导、相关练习以及软件框架的理论描述。

全书分为2部分,共8章。第1部分 高性能分布式计算的编程基础,包括1-4章:1.引言:包括分布式系统的介绍、分类,分布式计算体系结构与分布式文件系统,最后指出分布式系统面对的挑战与发展趋势;2.开始使用Hadoop:包括Hadoop的发展历史、生态系统、HDFS的特性、单个节点的集群安装与多个节点的集群安装,最后介绍Hadoop编程与流;3.从Spark开始:包括Spark装置、应用实例、Python编程及应用等内容;4.Spark和Scalding的内部编程:包括其安装步骤与编程指南。第2部分 使用Hadoop、Scalding和Spark的实例,包括5-8章:5. 案例研究1:使用Scalding和Spark进行数据聚类:包括聚类技术、聚类过程、K均值算法和相应的例子,最后进行实现;6.案例研究2:使用Scalding和Spark进行数据分类:包括分类及概率论的相关概念,朴素贝叶斯及其分类器的实现,最后对Scalding的实现进行实验并说明结果;7.案例研究3:使用Scalding和Spark进行回归分析:包括线性回归的代数方法和梯度下降法,并分别使用Scalding和Spark进行了实现;8.案例研究4:使用Scalding和Spark的推荐系统:包括推荐系统的介绍、技术应用、实现规则并使用Scalding和Spark进行了实现。

作者K.G. Srinivasa是卡内基梅隆大学计算机科学学院机器人研究所的副教授;是电脑专业资格认定协会(ICCP,International Conformity Certification Programm)、国际计算机视觉期刊(IJCV,International Journal Computer Vision)、国际计算机视觉与模式识别会议(CVPR,Computer Vision and Pattern Recognition)等多个国际会议的委员会委员,发表超过20篇期刊及会议论文。他的研究领域包括计算机视觉、图像处理、动态场景的计算机视觉监控、基于人的行为和生物特征的人物识别与身份鉴定以及数字多媒体数据的水印处理等。

本书描述了构建高性能分布式计算大规模数据处理的软件系统新模式的基本原理;介绍了Hadoop生态系统并一步步地指导安装、编程和执行;对Spark的基础知识,包括弹性分布式数据集进行了介绍,并对使用Spark和Scalding进行数据聚类、分类和回归进行了分析,提供了详细的案例研究方法;最后使用Scalding和Spark实现了一个实用推荐系统。本书适合计算机体系结构、计算智能、数据挖掘等专业的科研人员及研究生阅读参考。

第7篇:计算机视觉技术基础范文

【关键词】视频;图像处理;智能交通系统

交通视频监控系统是一个国家交通正常运行的有力保障。随着我国城镇化进程的不断推进和汽车的普及,交通问题日益严峻,道路拥挤、事故频发,加上不遵守交通规则的人比比皆是,使交通问题成为一直困扰我国的难题。而由于交通系统是一个相当复杂的庞大系统,所以监控起来十分困难。

随着计算机技术的发展,计算机视觉处理技术兴盛起来。计算机视觉处理技术是模拟人类视觉系统的一种技术,人类可以通过对视觉中感知到的信息进行适当的组合和联想以达到对外界信息进行判断的能力,计算机视觉处理技术就是要用计算机代替人类的大脑实现对采集到的信息进行处理,从而使计算机具有外部感知的能力,这对于交通视频监控系统具有非常重要的意义。

在智能交通系统中,基于计算机视觉的图像处理技术扮演着重要的角色,它以视频图像为分析对象,利用先进的算法去除干扰,具有直观、高效、精度高等特点。

1 交通视频中进行图像处理的重要性

交通视频检测系统的摄像机在工作时面临的是自然气象条件,这就意味着它要受到各种自然条件的干扰,比如强光、雾霾、粉尘、街灯等,由于光照条件不同所引起的图像差异远远大于由于人的不同所引起的图像差异,即使是在相同光照条件下,由于镜面反射的存在,同一物体的不同表面对光的反射不同,再加上粉尘、雾霾等的影响,从不同视角反映出来的图像有很大差异。外界光照的方向和强度还会随着时间不断发生变化,这些因素会导致采集的图像不清晰、重影、有阴影等,给基于视频的检测带来很大的难度。而视觉检测必须借助外界光线才能够获取图像信息,所以要把图像中的车辆信息完整清晰的反应出来,就要对静止的视频图像序列(即每帧图像)进行预处理。这些处理会涵盖图像色彩模式转换、格式转换、算法处理等。

2 交通视频监控系统的组成

交通视频监控系统一般由采集、传输、控制、显示四部分组成。

2.1 图像采集

图像采集工作由前端的摄像机完成,采集质量的好坏将直接影响视频图像处理的效果。如果视频图像中的车辆信息清楚,对比度好,无干扰信息或干扰信息少,将有利于车辆的检测和跟踪,反之,将不利于车辆的检测和跟踪。

2.2 传输

根据摄像机和控制中心之间距离的长短,会采用不同的传输设备,一般的传输方式包括视频基带传输、射频有线传输、光纤传输、电话线传输等。

2.3 控制

控制部分是整个交通视频监控系统的中心,由总控制台组成。总控制台可以进行信号的缩放、矫正、补偿、切换、遥控、记录存储图像等。

2.4 显示

显示部分的功能就是把传送过来的图像显示出来,由若干台监视器组成。

3 交通视频监控系统中视频图像处理技术的应用

3.1 车辆检测

对运动车辆的检测是交通视频监控系统的核心功能,通过对视频图像中的连续画面的变化分析能抽出运动车辆的特征,从而实现检测。但是由于运动的车辆受光线、灰尘、雾霾、阴影等因素的影响,给图像分割带来很大的困难。所以在进行车辆检测时,要对获得的视频图像进行处理,来提取目标车辆信息,常用的方法有帧间差分法、背景差分法、边缘检测法等。

3.2 车辆跟踪

对车辆进行检测的目的是辨别运动车辆,然而要想了解目标的运动参数,还要对车辆进行跟踪。车辆跟踪的核心内容是根据目标运动车辆的某些特征在不同的图像帧中进行目标匹配,用于匹配的特征包括位置、大小、形状,以及局部的点、线特征和整体轮廓特征等[1]。常用的车辆跟踪方法有基于区域的方法、基于特征的方法、基于运动估计的方法、基于模型的方法、基于轮廓的方法等。

3.3 阴影检测

阴影检测是交通视频监控系统的一项重要且具有挑战性的工作。运动目标车辆由于受各种光源的影响会产生阴影,而阴影与运动目标车辆具有相似的视觉特征和运动特征,所以前面介绍的车辆检测方法都不能有效地将阴影检测出来。阴影的存在会使车辆检测和跟踪产生误差,给交通参数的提取带来很大误差,因而阴影的检测与去除是视频检测的重点和难点。根据阴影形成的不同原理可以把阴影分成不同的类型,而不同类型的阴影又有不同的特点,这给阴影的检测和提取提供了可能。目前,阴影检测方法通常包括两大类:一类是基于阴影属性如颜色不变性、纹理不变性、低频性质等属性的检测技术,另一类是基于应用场景先验知识的模型的阴影检测[2]。

3.4 交通参数的检测

交通参数可以分为两类,一类是针对某一具体车辆的,如该车辆的车型、颜色、车牌、速度、重量等;另一类是针对某一具体路段的,如该这段的固定时间内的车流量、平均速度、车辆密度、车辆数目、路面占有率等。基于图像处理的交通参数检测需要实时处理大量的图像数据,这些参数的获得可以为交通执法提供依据,增加交通道路的容量。目前应用较为广泛的交通参数获取方法为虚拟线圈检测方法,很多学者都在此基础之上设计算法更加精密的检测系统。

3.5 车牌识别

车牌识别技术(Vehicle License Plate Recognition,VLPR) 是计算机视频图像识别技术在车辆牌照识别中的一种应用。车牌识别是现代智能交通系统中的重要组成部分之一,应用十分广泛。它以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者视频序列进行分析,得到每一辆汽车唯一的车牌号码,从而完成识别过程。通过车牌识别可以实现对停车场的收费管理、车辆定位、交通违法行为监控等功能,对于维护交通安全、实现交通自动化管理有很重要的意义。

视频图像处理技术在交通视频监控系统中应用的已经十分广泛,随着计算机视觉、人工智能理论的发展,对包含运动目标的图像序列进行分析和处理,能够实现交通管理的高效智能化。随着视频图像处理技术硬件的不断发展,我们所面临的挑战是如何找出与硬件相匹配的高效的软件技术(即先进的算法),使智能交通系统的功能更加强大和完善。

【参考文献】

[1]梁晓爱.基于视频的车辆检测与跟踪技术研究[D].山东师范大学,2010.

[2]许洁琼.基于视频图像处理的车辆检测与跟踪方法研究[D].中国海洋大学,2012.

[3]卫小伟.视频图像处理技术在智能交通系统中的运用[J].电子测试,2015(6).

[4]姜旭.视频图像处理技术在智能交通系统中的应用[D].苏州大学,2009.

第8篇:计算机视觉技术基础范文

关键词关键词:OpenCV;人脸检测;微笑检测;JNI

DOIDOI:10.11907/rjdk.162330

中图分类号:TP319文献标识码:A文章编号文章编号:16727800(2017)001011502

随着人工智能技术的发展,机器学习、计算机视觉等领域也逐渐成为计算机科学中的热点问题,人脸检测便是计算机视觉中的一个分支。OpenCV作为一个开源的视觉库,提供了不少关于人脸检测的模型与处理接口,而大部分接口与算法均采用C/C++语言编写。Java虽有其跨平台的巨大优势,但是这种特性也给Java带来了局限性,在调用动态数据库文件时存在不便。因此,通过JNI工具,可以利用C/C++语言的特性弥补Java的不足[13]。

1相关技术原理

1.1JNI技术分析

JNI(Java Native Interface)提供了若干API 实现Java与其它语言的通信(主要是C/C++)。从Java 1.1开始,JNI标准成为Java平台的一部分,它允许Java和其它语言编写的代码进行交互。然而使用Java与本地已编译的代码交互,通常会丧失平台可移植性[45]。

通常遇到以下几种情况需要使用JNI:①所开发的程序需要用到其它平台属性,但在Java的标准库中不支持此属性;②程序对于运行效率要求较高,因此希望能用较低级的语言(如C/C++)来实现;③Java已经拥有实现需要的程序和库,希望C/C++对其直接进行调用[67]。

1.2JNI技术架构

JNI允许运行在Java虚拟机上的应用程序调用其它语言(如C/C++语言)来编写需要的方法或类库,也能将Java虚拟机嵌入到本地应用程序中。

图1是JNI在本地应用程序与Java应用之间各自扮演的角色图。从图中可以看出,JNI作为Java与C/C++函悼庵间的桥梁,可以实现Java代码与C/C++库函数当中本地代码之间的交互。然而JNI没有改变Java语言的属性,只是让Java语言拥有一种能够对外调用的形式[89]。

1.3OpenCV介绍

OpenCV(Open Source Computer Vision Library)是一个基于BSD许可发行的跨平台计算机视觉库。它轻量而且高效,由C函数与C++类构成,同时提供了Python、Java等语言的接口,可实现图像处理和计算机视觉方面的很多通用算法。OpenCV中对于人脸的检测方法是基于处理成的灰度图像的弱特征检测方法。该方法建立在Haar特征[10]检测方法基础上,可以获得检测人脸的实时处理速度。

OpenCV中也提供了训练分类器[1112]的程序及方法来检测特征。使用者可以将此方法应用于一些项目中的二次开发,比如双目视觉的三维重构、物体识别,协助机器人完成复杂任务,以及在智能监控中的人脸检测、智能交通中的行人检测等。

2开发工具选择

选用的工具是eclipse,Java版本为JDK1.7,C++使用的是VS2010。另外PC端需要具备内置或外置摄像头,PC机配置为Inter Core i5-3230M CPU 2.6GHz。

3实现过程

从图2中编写JNI代码的大致步骤可以看出Java需要将字节码文件通过javah生成头文件,再与C代码共同生成动态链接库,进而与Java中的代码进行交互。

3.4人脸检测实验结果

第9篇:计算机视觉技术基础范文

【关键词】 运动目标检测 视频图像 OpenCV

一、绪论

随着计算机技术日新月异的发展,计算机视觉,模式识别,人工智能,多媒体技术,越来越受到人们的重视的快速发展。广泛地被定位对象使用运动跟踪和检测,监测和智能人机交互和分析他们的行为,一旦发现有异常行为的对象,监控系统发出警报,提醒人们注意和及时的治疗,改善人类的人工监督注意力浪费资源等问题。计算机视觉是通过计算机代替人的眼睛和大脑感知外部环境,分析和理解。

1.1 OpenCV技术介绍

视觉处理算法的OpenCV提供了非常丰富的,它部分是用C写的,有它的开源特性,妥善处理,无需添加新的外部支持进行编译和链接,生成程序的完整实现,所以很多人们用它做算术移植,OpenCV的可正常运行的系统DSP和MCU系统正常重写代码。

二、运动目标检测

运动目标的检测在整个视频监控系统的底层,各种高级应用,如目标跟踪,目标分类,目标行为的随访,了解互惠的基础。运动对象检测装置,从在实时目标视频流中提取,目标通常设置面积和颜色特性。结果运动目标检测是描述一些静态功能的“静态”的目标前景。根据上下文,其中环境可分为两大类静态背景下运动目标检测和动态背景运动目标检测,本章与实际纸工作主摄像机静态背景运动目标运动结合,不会发生前景对象的运动目标检测检测算法。

2.1运动目标检测的基本方法

目标检测和提取已在目标跟踪应用程序中的重要地位。目标检测和提取的精度直接影响结果和准确性的跟踪。一个良好的各种环境动目标检测算法的应能适用于监测,在正常情况下,移动体检测算法可以根据场景被监视在室内或室外监测算法被分成室内和室外监视算法,则可以按照使用特定算法的方法分为连续帧差分方法,背景减除法和光流法。

2.1.1帧间差分法

对于许多应用,图像的连续帧之间的差检测出图像的顺序是非常重要的一步。场景中的任何可观察到的运动将反映在场景图像序列的变化,如果能检测到这种变化,我们可以分析的运动特性。

2.1.2背景差法

基于该原理的背景差分方法非常简单,基本操作过程示于(4.2)如下:首先使用式(4.3)来计算背景图像之间的差fbk当前帧fk,然后根据下式(4.4)是差分图像的Dk值化和形态学滤波处理,并获得当该区域的通信区域比给定的阈值RK进行连通区域分析的结果,它成为检测对象,并且该区域是区域目标在区间的,你能确定的最小边界矩形的目标。

其中T 是二值化设定阀值。

2.1.3光流法

光流是指在图像模式(或表观的)运动的表观亮度。用“表观运动”,主要是由于光流的运动图像不能有部分信息只以确定,例如,区域性或亮度轮廓点更均匀的亮度不能唯一确定的运动对应的点,但观察到的运动。这解释了光流和该流不一定是由物体的运动所产生的光,而运动的主体不一定会产生光流体育场不一定是唯一的。

三、目标跟踪算法的研究

目标对象的运动信息的条件的先验知识下跟踪,通过从信息源的实时数据来估计所述目标状态,以实现所述目标位置和运动趋势判定。运动目标跟踪问题是一个复杂的估计。研究精度高,性能稳定,目标跟踪方法的适用性仍面临巨大挑战,具有重要的理论意义和实用价值。

3.1图像匹配法

通过图像匹配方法可以识别要跟踪的运动对象,并确定它们的相对位置。早期跟踪涉及的目标位置的变化的两个图像之间的测量计算出的相关函数,跟踪点是,这两个图象相匹配的最佳位置,这是相关函数的峰值。

3.2基于团块的目标跟踪

基于团块(BLOB)的基本原理是用于图像分割候选像素跟踪算法,它决定像素是否属于背景或属于定位或属于其他区域。基于跟踪算法的质量也可称为基于图像分割的跟踪,分割结果刚够目标和背景之间的区分,而传统的图像分割算法需要目标轮廓的精确显示。分裂台球在目标,纹理特征和图像的深度信息的一般特性。

四、结语

随着在军事领域的计算机视觉,智能交通监控,视频运动目标检测与跟踪的发展必将得到更广泛的应用和发展。在本文中,历时四个月中,主要研究的OpenCV实现运动目标检测与跟踪的应用,实验结果表明,该系统具有良好的鲁棒性和准确性,实现毕业设计的预期目标,在工作和问题结合起来实际应用中。

参 考 文 献

[1]刘瑞祯, 于仕琪. OpenCV教程基础篇[M]. 北京: 北京航空航天大学出版社,2007.

[2]彭达. Visual C++多媒体编程技术[M]. 北京: 人民邮电出版社, 1999.

[3]丁金铸. 基于图像处理的运动目标检测跟踪系统的设计与实现[D]. 华中师范大学, 2007.

[4]王建中, 姜昱明. 基于块匹配的运动对象检测算法[J]. 微电子与计算机, 2005, 22(1): 10-12.

[5]林少丹. VC++程序设计基础[M]. 北京: 人民交通出版社, 2009.

[6]唐双发. 基于OpenCV的车辆视频检测技术研究[D]. 华中科技大学, 2009.

[7]李庆忠,陈显华,王立红. 视频监视中运动目标检测与识别方法[J]. 计算机工程, 2004, 30(16):30-33.

[8]胡晓峰, 吴玲达, 老松杨, 司光亚. 多媒体技术教程[M]. 北京: 人民邮电出版社, 2002.

[9]韩鸿哲, 王志良, 刘冀伟, 李郴, 韩忠涛. 阴影消除的自适应背景建模[C]. 第二届全国智能视觉监控学术会议论文集, 2003, 35-39.[10]张玲, 叶海炳, 何伟. 一种基于边缘信息的改进车辆检测方法[J]. 重庆大学学报(自然科学版), 2004, 27(11): 56-58.

[11] J.B.Kim, H.J.Kim. Efficient Region―based Motion Segmentation for Video Monitoring System [J]. Pattern Recognition Letters, 2003, 3(24):113-128.

[12]王春平, 朱元昌,黄允华. 基于图像信息的跟踪算法分析[J]. 火力与指挥控制, 2000, 25(1): 64-67.

[13]杨枝灵, 王开. Visual C++数字图像获取处理及实践应用[M].北京: 人民邮电出版社, 2003.