公务员期刊网 精选范文 计算机视觉的优点范文

计算机视觉的优点精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的优点主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉的优点

第1篇:计算机视觉的优点范文

关键词:计算机视觉技术;食品工业;分级;图像处理

中图分类号: TS207 文献标识码:A

随着微型个人计算机应用的越来越广泛,以及计算机在综合学科中应用的深入研究,现如今在工农业、军事国防、医学卫生等众多领域的使用和研究方面计算机视觉技术都起到了至关重要的作用,为了节省人力、降低成本、减少误差,该项技术在食品企业、科研院所、检测机构中的应用更加普遍。如今,在农产品药物残留检测、水果重量分级、等级筛选、质量监管等方面计算机视觉技术有众多应用。

1 计算机视觉技术概述

计算机视觉技术是利用计算机、摄像机、图像卡以及相关处理技术来模拟人的视觉,用以识别、感知和认识我们生活的世界[1]。该技术是模拟识别人工智能、心理物理学、图像处理、计算机科学及神经生物学等多领域的综合学科。计算机视觉技术用摄像机模拟人眼,用计算机模拟大脑,用计算机程序和算法来模拟人对事物的认识和思考,替代人类完成程序为其设定的工作。该技术由多个相关的图像处理系统组成,主要包括光源提供系统、图像提取系统、计算机数据运算系统等。原理是:首先通过摄像机获得所需要的图像信息,然后利用信号转换将获得的图像信息转变为数字图像以便计算机正确识别[2]。随着科学技术的发展,计算机技术在各个领域得到广泛应用,计算机视觉技术不仅在代替人类视觉上取得了重大成就,而且在很多具体工作方便超越了人的视觉功能。计算机视觉计算有如此快速的发展,是因为与人类的视觉相比该技术具有以下显著优势[3]。

1.1 自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2 实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3 稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2 计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚多达20a,但是发展很快。

2.1 计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图像处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco. J [15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2 计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。Mertens K等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3 计算机视觉技术在检测食品中微生物含量中的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar. B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征,识别出微生物数量,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。Gokmen,V等通用对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率也关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3 展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1 检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大。例如,Davenel等通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花粤和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2 兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是同一套系统和设备很难用于其他种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3 检测性能受环境制约

现阶段的计算机视觉技术和配套的数学模型适用于简单的环境,在复杂环境下工作时会产生较大的误差。Plebe等利用计算机视觉技术对果树上的水果进行识别定位,但研究发现由于光照条件以及周边环境的影响,水果的识别和定位精度不高,不能满足实际生产的需要。

综上所述,可看出国内外学者对计算机视觉技术在食品工业中的应用进行了大量的研究,有些研究从单一方面入手,有些研究综合了多个学科,在研究和应用的过程中,取得了较大的经济效益,也遇到了很多问题,在新的形势下,计算机视觉技术和数码拍摄、图像处理、人工神经网络,数学模型建设、微生物快速计量等高新技术相融合的综合技术逐渐成为了各个领域学者的研究热点,以计算机视觉为基础的综合技术也将在食品工业中发挥更加重要的作用。

参考文献

[1] 宁纪锋,龙满生,何东健.农业领域中的计算机视觉研究[J].计算机与农业,2001(01):1-3.

[2] 李峥.基于计算机视觉的蔬菜颜色检测系统研究[D].吉林:吉林大学,2004.

[3] 曾爱群.基于计算机视觉与神经网络的芒果等级分类研究[D].桂林:桂林工学院,2008.

[4] 韩伟,曾庆山.基于计算机视觉的水果直径检测方法的研究[J].中国农机化,2011(05):25-29.

[5] 李庆中.苹果自动分级中计算机视觉信息快速获取与处理技术的研究[D].北京:中国农业大学,2000.

[6] 孙洪胜,李宇鹏,王成,等.基于计算机视觉的苹果在线高效检测与分级系统[J].仪表技术与传感器,2011(06):62-65.

[7] 刘禾,汀慰华.水果果形判别人工神经网络专家系统的研究[J].农业工程学报,1996,12(0l):171-176.

[8] 应义斌,景寒松,马俊福.用计算机视觉进行黄花梨果梗识别的新方法[J].农业工程学报,1998,14(02):221-225.

[9] 杨秀坤,陈晓光,马成林,等.用遗传神经网络方法进行苹果颜色白动检测的研究[J].农业工程学报,1997,13(02):193-176.

[10] 陈育彦,屠康,柴丽月,等.基于激光图像分析的苹果表面损伤和内部腐烂检测[J].农业机械学报,2009,40(07):133-137.

[11] 冯斌,汪憋华.基于计算机视觉的水果大小检测方法[J].农业机械学报,2003,34(01):73-75.

[12] 朱伟,曹其新.基于模糊彩色聚类方法的西红柿缺陷分割[J].农业工程学报,2003,19(03):133-136.

[13] 曹乐平,温芝元,沈陆明.基于色调分形维数的柑橘糖度和有效酸度检测[J].农业机械学报,2009,41(03):143-148.

[14] 刘刚,王立香,柳兆君.基于计算机视觉的苹果质量检测[J].安徽农业科学,2012,40(08):5014-5016.

[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.

[16] 赵广华,飞,陆奎荣,等.智能化苹果品质实时分选系统[J].中国科技信息.

[17] 王江枫,罗锡文,洪添胜,等.计算机视觉技术在芒果重量及果面坏损检测中的应用[J].农业工程学报,1998(12):186-189.

[18] 欧阳静怡,刘木华.基于计算机视觉的鸡蛋裂纹检测方法研究[J].农机化研究,2012(03):91-93.

[19] 汪俊德,郑丽敏,徐桂云,等.基于计算机视觉技术的双黄鸡蛋检测系统研究[J].农机化研究,2012(09):195-199.

[20] 郑丽敏,杨旭,徐桂云,等.基于计算机视觉的鸡蛋新鲜度无损检测[J].农业工程学报,2009,25(03):335-339.

[21] 潘磊庆,屠康,詹歌,等.基于计算机视觉和声学响应信息融合的鸡蛋裂纹检测[J].农业工程学报,2010,26(11):332-337.

[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.

[23] 殷涌光,丁筠.基于计算机视觉的食品中大肠杆菌快速定量检测[J].吉林大学学报(工学版),2009,39(02):344-348.

[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.

[25] 郭培源,毕松,袁芳.猪肉新鲜度智能检测分级系统研究[J].食品科学,2010,31(15):68-72.

[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.

[27] 殷涌光,丁筠.基于计算机视觉的蔬菜中活菌总数的快速检测[J].农业工程学报,2009,25(07):249-254.

[28] 鲁静.乳品微生物自动检测系统的设计[J].湖北第二师范学院学报,2010,27(08):115-117.

[29] 刘侃.鲜奶含菌量快速检测系统[D].华中科技大学,2008.

[30] 里红杰,陶学恒,于晓强.计算机视觉技术在海产品质量评估中的应用[J].食品与机械,2012,28(04):154-156.

第2篇:计算机视觉的优点范文

关键词 智能交通系统;计算机视觉;汽车流量

中图分类号:TN948 文献标识码:A 文章编号:1671-7597(2014)14-0048-01

基于视觉的图像处理器测量精度高,抗干扰能力强,许多自然及人为的干扰都可以被消除,运用预测技术可以再捕获瞬间丢失的目标,并且能实现对记忆的跟踪。它通常安装在路边或架空安装,不会重新铺设路面,也不会影响埋在地下的水和天然气管道,更不会干扰交通。 基于视觉的图像处理有其突出的优点,表现在:可以获得的目标信息非常巨大,获取信息的方法也非常方便。

1 研究的实用意义

车辆检测系统在智能交通系统中具有很重要的地位。机动车辆流量计数与监控为智能控制提供了相当重要的数据来源,通过计算机视觉的机动车流量统计系统可以检测很多交通参数,便于我们检测和监控,这些参数中的一个重要参数就是汽车

流量。

基于视频的检测法作为最有前途的方法之一,有以下优点。

1)能高效、准确、安全可靠地的监视和控制道路交通,能够提供高质量高分辨率的图像信息。

2)用于交通监视和控制的主要设备就是安装视频摄像机,现在我国所有城市基本都已经安装了视频摄像机,甚至高清视频摄像机。因为安装视频摄像机破坏性非常低、很方便、也很经济。

3)由计算机视觉得到的交通信息可以通过联网工作,非常有利于对道路交通网的监视以及控制。

4)由于目前对智能交通系统的安全性、实时性和可靠性的要求都非常高,计算机技术和图像处理技术的发展显得极其

重要。

2 研究内容

本研究主要包含两大部份:一部分就是采用分类和分割方法把采集到的视频图像的目标进行识别;另一部分就是通过定位方法来实现目标的跟踪。这两部份是缺一不可,紧密联系在一起的。

首先先介绍视频图像的目标识别,视频图像目标的识别方法有很多,但总体上主要有两种方法:一是大家熟悉的相关匹配法,二是特征匹配法。相关匹配法是通过找到最大相关值(最大相关值指的就是当前图像与参考图像间的相关系数的大小)所在的位置来确定当前输入图像中的目标位置。相关匹配法优点是可以在信噪比很小的条件下工作,对噪声抑制能力非常强,在计算形式上比较简单,很容易实现。但它的缺点也很明显,由于相关匹配法对几何和灰度畸变十分敏感,反而计算量偏大,造成的直接后果就是非常容易产生累积误差,而且最关键的就是不能充分利用视频图像目标的几何特性,就不能保证对识别目标的跟踪精度。相关匹配法比较适合于对目标的尺寸变化不大并且场景各部分的相关性不强,当前输入图像和参考图像的产生条件较为一致的场合。特征匹配方法是目前研究较多的一类图像匹配方法,它是通过目标的特征与输入图像中目标的特征来比较辨识目标。它首先提取输入图像和参考图像的相关特征信息,比如边缘、角点等。然后通过测量距离来比较输入图像与参考图像的特征集合,如果输入图像的特征集与参考图像的特征集距离是最小的(在满足给定约束条件下),则判定该目标被识别。它对目标的几何特征、灰度畸变一点都不敏感,但它充分利用了目标图像的特征信息,因而可以保证较高的跟踪精度。

上面介绍了视频图像目标的识别,现在介绍本研究第二部分:通过定位方法来实现目标的跟踪。对于图像目标的跟踪方法通常有下面几个方法。

亮度中心法,其实这种方法计算很简单,只要确定了一个点,就能完成定位。这个点就是一个跟踪点,它就是具有最高灰度的像素点(来自获得的视频目标图像)或这个点上的一个邻域。这种方法、性能很稳定、容易实现,工程上运用的很多。但这种跟踪非常容易受干扰,因为它主要适用于红外和其他放射性目标的跟踪。

最佳空间滤波法是常用跟踪方法之一,它完全是在亮度中心法的基础上建立起来的,为了提高跟踪性能,就要把目标的大小、形状、运动特性等特征都完全利用起来。但目前这类方法也有明显缺点,在实用性、定位精度上和计算量方面都有较大的限制。

投影、形心法是通过目标的投影或形心来确定目标的实际位置和运动姿态。对比前面两种跟踪方法,投影、形心法的优点是计算量非常小,容易通过硬件方式来实现。缺点是它的抗干扰性能力比较差,主要用于均匀背景下跟踪孤立目标。

从以上对研究内容的介绍,现有的各类识别和定位方法都各有优缺点,要想找到一个合适的方法,都达不到满意的效果。要想取得较好的性能,都只能在目标尺寸相对对比度变化都不大、对噪声的干扰又比较小、图像灰度的空间变化并不明显的理论环境中。然而实际的环境通常是变化无常的,通过一种方法来实现目标的识别与跟踪很难有合适的效果。最近几年,结合这些方法的优点和缺点,混合定位识别的方法确能将上述各类基本的识别方法进行混合定位,使它们能够合二为一,相互补充。这代表着目标识别方法非常具有理论研究和应用价值,是一个重要发展方向。

3 技术路线

研究的技术路线(如图1):首先提取出摄像机采集到的视频,该视频是以帧为单位的图片文件形式。然后对图像数据进行数学上的处理,比如二值化、提取边缘等。这样就可以识别汽车的位置进行定位,最后对识别出来的汽车数量通过计数器计数。

4 研究实现

通过基于计算机视觉的研究,我们设计出了能够实现机动车流量的检测和计数的系统。并且该系统能够对运动目标进行识别与跟踪定位,对出现多目标遮挡和丢失目标,还可以重新匹配。

5 结束语

本文创新之处就是将上述各类基本的识别方法进行混合定位,使它们能够相互补充。这代表着目标识别方法非常具有理论研究和应用价值,是一个重要发展方向。

参考文献

[1]章毓晋.图像工程(第2版)[M].清华大学出版社,2007.

[2]夏文龙.基于计算机视觉的汽车流量检测研究[D].四川大学,2003.

[3]葛群辉,浅谈基于视觉的高速公路车流检测技术[J].科技资讯,2010(2).

[4]刘萌萌,基于无标度摄像机的车流跟踪与速度估计算法研究[D].西南交通大学,2005.

第3篇:计算机视觉的优点范文

计算机视觉的第一步是特征提取,即检测图像中的关键点并获取有关这些关键点的有意义信息。特征提取过程本身包含4个基本阶段:图像准备、关键点检测、描述符生成和分类。实际上,这个过程会检查每个像素,以查看是否有特征存在干该像素中。

特征提取算法将图像描述为指向图像中的关键元素的一组特征向量。本文将回顾一系列的特征检测算法,在这个过程中,看看一般目标识别和具体特征识别在这些年经历了怎样的发展。

早期特征检测器

Scale Invariant Feature Transform(SIFT)及Good Features To Track(GFTT)是特征提取技术的早期实现。但这些属于计算密集型算法,涉及到大量的浮点运算,所以它们不适合实时嵌入式平台。

以SIFT为例,这种高精度的算法,在许多情况下都能产生不错的结果。它会查找具有子像素精度的特征,但只保留类似于角落的特征。而且,尽管SIFT非常准确,但要实时实现也很复杂,并且通常使用较低的输入图像分辨率。

因此,SIFT在目前并不常用,它主要是用作一个参考基准来衡量新算法的质量。因为需要降低计算复杂度,所以最终导致要开发一套更容易实现的新型特征提取算法。

二代算法

Speeded Up Robust Features(SURF)是最早考虑实现效率的特征检测器之一。它使用不同矩形尺寸中的一系列加法和减法取代了SIFT中浩繁的运算。而且,这些运算容易矢量化,需要的内存较少。

接下来,HOG(Histograms ofOriented Gradients)这种在汽车行业中常用的热门行人检测算法可以变动,采用不同的尺度来检测不同大小的对象,并使用块之间的重叠量来提高检测质量,而不增加计算量。它可以利用并行存储器访问,而不像传统存储系统那样每次只处理一个查找表,因此根据内存的并行程度加快了查找速度。

然后,ORB(Oriented FASTand Rotated BRIEF)这种用来替代SIFT的高效算法将使用二进制描述符来提取特征。ORB将方向的增加与FAST角点检测器相结合,并旋转BRIEF描述符,使其与角方向对齐。二进制描述符与FAST和HarrisCorner等轻量级函数相结合产生了一个计算效率非常高而且相当准确的描述图。

CNN:嵌入式平台目标识别的下一个前沿领域

配有摄像头的智能手机、平板电脑、可穿戴设备、监控系统和汽车系统采用智能视觉功能将这个行业带到了一个十字路口,需要更先进的算法来实现计算密集型应用,从而提供更能根据周边环境智能调整的用户体验。因此,需要再一次降低计算复杂度来适应这些移动和嵌入式设备中使用的强大算法的严苛要求。

不可避免地,对更高精度和更灵活算法的需求会催生出矢量加速深度学习算法,如卷积神经网络(CNN),用于分类、定位和检测图像中的目标。例如,在使用交通标志识别的情况下,基于CNN的算法在识别准确度上胜过目前所有的目标检测算法。除了质量高之外,CNN与传统目标检测算法相比的主要优点是,CNN的自适应能力非常强。它可以在不改变算法代码的情况下快速地被重新“训练(tuning)”以适应新的目标。因此,CNN和其他深度学习算法在不久的将来就会成为主流目标检测方法。

CNN对移动和嵌入式设备有非常苛刻的计算要求。卷积是CNN计算的主要部分。CNN的二维卷积层允许用户利用重叠卷积,通过对同一输入同时执行一个或多个过滤器来提高处理效率。所以,对于嵌入式平台,设计师应该能够非常高效地执行卷积,以充分利用CNN流。

事实上,CNN严格来说并不是一种算法,而是一种实现框架。它允许用户优化基本构件块,并建立一个高效的神经网络检测应用,因为CNN框架是对每个像素逐一计算,而且逐像素计算是一种要求非常苛刻的运算,所以它需要更多的计算量。

不懈改进视觉处理器

第4篇:计算机视觉的优点范文

关键词:ARM OPENCV AdaBoost

近年来,功能各异的视频监控设备越来越多,但是,大多只能简单记录视频画面,将监控到的视频信息存储起来,而不能对所监控到的视频做一定的处理分析和预测。基于ARM的人脸检测系统,为我们的视频监控设备提供了一个视频处理的参考解决方案,在一定基础上加以扩充,可以完成人物识别,危险行为检测与报警等,使视频监控设备更加智能化。

1、视频监控的几项关键技术及发展方向

视频监控的关键技术主要有视频采集压缩算法、视频信号可靠地传输、信息存储调用的智能化与系统的集中管理等。视频监控技术发展方向为分布采集集中管理、高品质图象压缩处理、开放标准统一接口、统一认证以确保安全、操作人性化以及功能集成化、结构模块化和传输多样化。随着不断发展的网络技术,基于嵌入式技术的网络数字监控系统不再是处理模拟视频信号,而是把摄像机输出的模拟视频信号通过视频编码器直接转换为IP数字信号。

2、平台的搭建

ARM之所以应用广泛,是因为有较快得运算速度,较低的价格,开发人员也比较容易接触,程序较易移植过来等特点。EmbeddedLinux也是Linux家族的成员,支持广泛的硬件平台,如PPC、ARM、MIPS等,也继承了Linux的优点——开源、免费,同时也有广泛的应用软件支持,能够比较方便的移植操作系统与应用软件。

3、OPENCV简介

OpenCV是一个开源的计算机视觉库,采用C/C++语言进行编写,可以运行在Linux/Windows/Mac等操作系统上,同时还提供了Python、Ruby以及其他语言的接口。其设计目标就是执行速度尽量快,它采用优化的C语言编写,能够充分利用多核处理器的优势。除此之外,另外一个目标就是构建一个简单易用的计算机视觉框架,开发人员可以利用它更便捷地设计复杂的计算机视觉相关应用程序。其中包含的函数有500多个,覆盖了计算机视觉的许多应用领域,如工厂产品检测、医学成像、信息安全、摄像机标定、立体视觉和机器人等。

4、人脸检测的原理

人脸检测技术的研究要追溯到20世纪70年代,早期的研究主要致力于模板匹配、子空间方法、变形模板匹配等,近几年,集中研究基于数据驱动的学习方法,如统计模型方法,神经网络学习方法,统计知识理论和支持向量计算方法,基于马尔可夫[1]随机域的方法,以及基于肤色的人脸检测等。目前在实际中应用的人脸检测方法多为基于Adaboost[2]学习算法的方法。

Viola是AdaBoost算法的一种,主要基于积分图和级联检测器,其方法框架可大至分为以下三大部分:第一部分,使用Harr-like特征来表示人脸,并且使用“积分图”实现特征数值的快速计算;第二部分,使用Adaboost算法挑选出一些最能代表人脸的矩形特征,用弱分类器按照加权投票的方式,构造为一个强分类器;第三部分,为有效的提高检测速度,将训练得到的若干强分类器串联组成一个级联结构的层叠分类器。

人脸检测的目的就是从图片之中找出所有包含人脸的子窗口,对人脸的子窗口与非人脸的子窗口进行区分。第一步,在一个20*20的图片中提取出一些简单的特征(Harr特征),将白色区域内的像素减去黑色区域,因此在人脸与非人脸图片的相同位置上,有着大小不一样的数值,这些特征就是区分人脸和非人脸的依据。第二步,使用上万张切割好的人脸图片和上万张背景图片作为训练样本。训练图片一般都调到到20*20的大小。在这样大小的图片中,可供haar使用的特征数大概有1万个左右,然后通过机器学习算法也就是Adaboost算法挑选数千个有效的haar特征,用来组成人脸检测器。第三步,学习算法训练出一个人脸检测器后,便可以在各种各样的场合使用了。使用时,依次缩放图像比例,最后在缩放后的图片20*20的子窗口中依次判别是否是人脸。

人脸检测技术在门禁系统、智能监控系统中已经得到了很好的应用。另外,目前的笔记本电脑登录时,也陆续使用人脸识别技术作为凭证。同时,人脸检测算法也在数码相机和手机中起作用,作为一个新新的功能提供用户使用。

5、结语

ARM上进行图像处理以及人脸检测与识别等是可行的方案,可以减少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一个方案合理、技术成熟、成本低廉、应用广泛的人脸检测与图像处理的解决方案。

参考文献

第5篇:计算机视觉的优点范文

关键词:数字图像技术;应用;发展趋势

中图分类号:TP391.41

计算机的特点在于能够处理各种数据,数字图像能够经过增强、复原、分割等处理,随着计算机技术的不断发展和进步,现在的数字图像技术具有图像处理多样性、精度高、图像的再现性好、处理量大的优点,本文主要研究数字图像处理技术的发展现状和发展趋势。

1 数字图像处理技术研究现状

所谓图像处理是指利用计算机来处理图像的过程,主要是实现改善图像的视觉效果,研究的内容主要包括图像数字化、图像增强、图像还原以及图像分割等。数字图像处理最早来源于20世纪20年代的报纸业,到20世纪50年代,随着计算机的发展,数字图像处理技术得到人们的普遍关注,数字图像处理技术随着太空计划得到很大的发展,最具有典型的例子,是对月球照片的处理。

进入到20世纪70年代后,数字图像处理技术随着计算机断层扫面(CT)的出现得到发展,在以后的时间里,数字图像处理技术不断有新的研究成果,1975年EWI公司研究的CT装置获得诺贝尔奖,目前数字图像技术已广泛应用在各行各业中。

2 数字图像处理技术的应用

数字图像处理技术目前在各行各业中都得到了很大的进展。在遥感航空航天方面,不少国家都派出了侦查飞机对目标地区进行空中摄影,进而通过图像处理技术来分析照片,节省了人力、物理,也能够从图片中得到其他的有用信息。在20世纪60年代以来,美国以及其他的一些国家发射了资源遥感卫星,由于成像条件非常差,因此图像本身的质量也不高,需要采取数字图像处理技术处理,如采用多波段扫描器进行扫描成像,图像分辨率为30m,这些图像转变为数字信号传送下来,再经过处理。数字图像处理技术在各国的应用中已非常广泛,如用在森林调查、灾害监测、资源勘查以及城市规划中。

数字图像处理技术最早来源于医药方面,因此在生物医学工程方面,数字图像处理技术也发挥出了巨大作用,除了上文所讲述的CT之外,还有一些显微图像处理技术,主要是识别红细胞、白细胞以及染色体分析等,在医学诊治方面X光肺图像增强、心电图分析以及超声波图像处理技术等发挥出了重要作用。

在通信工程方面,目前通信主要的发展趋势为综合性的多媒体通信,也就是将电视、计算机以及电话联合在一起在数字通信网上传输,在传输的过程中最为复杂和困难的地方集中在图像的处理中,比如说,彩色电视信号速率为100Mbit/s以上,想要传输出去就需要压缩信息的比特量,因此技术成败的关键就在于编码压缩。目前国家正在大力研发的新的编码方法,如小波变换图像压缩编码以及自适应图像网络编码等。

在工业和工程方面,主要的应用集中在自动装置配线中检测零件的质量、弹性力学照片的应力分析以及邮政信件的自动分检等,另外在智能机器人中也有应用。在军事、公安方面,数字图像处理技术的应用主要集中在导弹的精确制导、侦查照片以及图像的传输和显示方面,在公安方面,主要应用在鉴别人脸、识别指纹以及图片复原方面。数字图像处理技术除了以上所讲述的应用领域之外,在电视图像的编辑、服装设计、发型设计以及文物资料复原等方面也有广泛的使用。

3 数字图像处理技术的发展趋势

目前数字图像技术随着科技的进步得到了很大的发展,随着低成本硬件相关技术的发展可以想象数字图像技术将会得到更加广泛的应用,目前国内的研究成果主要集中在一些诊断、图像压缩编码以及目标识别等方面,但是还没有广泛应用在实际生活中。数字图像处理技术将会向着高分辨率、立体化、超高速以及智能化等方面发展,下面具体讲述数字图像处理技术的发展趋势。

随着计算机、人工智能以及思维科学研究的不断发展,数字图像处理技术在计算机视觉方面将会进一步的发展,智能机器人的重要感觉器官是视觉,目前研究的开放话题集中在理解和识别三维应力,将会应用在军事勘察、危险环境作业以及家庭服务等方面,目前人们对于自身的视觉了解的还非常少,因此在计算机视觉方面还需要进一步的探索。

数字图像处理技术还会向着虚拟现实发展,所谓虚拟现实就是使用计算机构成一个虚拟的三维空间,这项技术的发展是在计算机硬件技术的提高方面提出的,人们应用机器人身上的摄像机能够真实的感受到所在的环境,进而操纵机器人的行为,另外网上虚拟现实也是未来的一个发展方向。人们在完成社会生产中往往习惯使用自身的认识和工具,将这些掌握在自身手中,因此目前时代的发展趋势就是将原来二维的东西向着三维发展,如三维重建技术在地图方面的使用,在军事方面能够使用电子沙盘实现任意角度的转化和计算,也能够真实的直观的反应两点之间的障碍物等,还能够实现模拟飞行路线,为作战指挥带来极大的便利。在计算机中进行三维重建目前的热点和难点问题主要是计算机视觉研究领域。在图像压缩、识别以及分割方面,目前已取得很大的研究进展,目前图像处理面临的新的问题主要是图像专业压缩算法、图像识别算法等。

4 结束语

综上所述,本文先分析了数字图像处理技术研究现状和主要的应用领域,进而研究数字图像技术的发展趋势。目前数字图像处理技术已广泛的应用在生活中,如在网络、手机等中的应用,数字图像处理技术的发展与人们的生活息息相关,随着技术的不断发展,数字图像处理技术还会不断得到进步,这些还需要更多的人努力去研究。

参考文献:

[1]孔大力,崔洋.数字图像处理技术的研究现状与发展方向[J].山东水利职业学院院刊,2012(04):11-14.

[2]陈炳权,刘宏立,孟凡斌.数字图像处理技术的现状及其发展方向[J].吉首大学学报(自然科学版),2009(01):63-70.

[3]吕戈静.浅谈数字图像处理技术的现状及发展[J].电脑知识与技术,2012(33):8035-8036.

[4]丁可.数字图像处理技术研究与发展方向[J].经济研究导刊,2013(18):246+270.

第6篇:计算机视觉的优点范文

关键词:图像识别;SURF算法;特征点;鲁棒性

中图分类号:TP391 文献标志码:A

图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像的局部不变特征有着在多种图像变换(如光照变换,几何变换等)下的不变性、独特性、低冗余性以及无需预先对图像分割等特点,已经被广泛应用于图像匹配领域。基于特征不变的方法具有精度高、执行速度快、压缩信息量和鲁棒性好等优点。尺度不变特征转换(Scale-invariant feature transform,SIFT)算法便是其中的代表,该算法由David Lowe于1999年在ICCV上提出,并于2004年完善总结。SIFT算法匹配能力较强,能提取稳定的特征,可以处理两幅图像之间发生平移、旋转、仿射变换、视角变换和光照变换等情况下的匹配问题,但该算法数据量大,复杂度高,耗时长,同时也存在着特征提取及匹配速度慢,在灰度变化相似的区域容易产生误匹配的缺陷,限制了该算法的应用。SURF算法是针对SIFT算法的不足而改进的一种有效算法。

1SURF算法描述

快速鲁棒特征[1](Speeded-up Robust Features,SURF)是一种高鲁棒性的局部特征点检测器,由Herbert Bay等人于2006年在ECCV上提出的。该算法比SIFT更快更加具有鲁棒性,对图像分辨率、旋转、尺度缩放、平移和亮度变化等保持不变,而且对仿射变换、噪声以及视角变化等也能保持一定程度的稳定性。

SURF算法的基本流程主要包括:特征点检测、特征点描述和特征点匹配三部分。该算法中有三个关键技术,分别为:使用积分图像完成图像卷积操作,减少了时间计算的复杂度,提高计算速度;采用基于Hessian矩阵的检测器检测特征值,其在可重复性和稳定性方面都优于基于HarTis的检测器;采用Haar小波作为特征描述子,Harr特征速度快,能够减少计算时间并增加鲁棒性。

1.1积分图像

积分图像是一种对原始图像的特征表示方法。对于一幅灰度的图像,积分图像中的任意一点(x,y)的值是指从图像的左上角到这个点所构成的矩形区域内所有的点的灰度值之和[2]。图1所示填充区域即为点(x,y)的积分值。

1.2尺度空间的建立

图像的尺度空间是在视觉信息(图像信息)处理模型中引入一个被视为尺度的参数,通过连续变化尺度参数获得不同尺度下的视觉处理信息,然后综合这些信息以深入地挖掘图像的本质特征。一幅图像的尺度空间可定义为原始图像与高斯核的卷积运算,图像的尺度大小可以用高斯标准差来表示[3]。在计算机视觉领域, 尺度空间被表示为一个图像金字塔。在SIFT算法中,输入图像函数反复与高斯函数的核卷积并反复对其进行二次抽样,但因为每层图像依赖于前一层图像, 并且需要重设图像尺寸,所以使得运算量较大。SURF算法与SIFT算法在使用金字塔原理上的不同之处在于SURF算法申请增加图像核的尺寸,允许尺度空间的多层同时被处理,并且不需要对图像进行二次抽样, 从而提高了算法性能。同时SURF算法采用了尺度插值和3*3*3的非极值抑制方法以提取尺度不变的特征点。图2中A图是运用传统方式建立的一个图像金字塔结构,运算会反复使用高斯函数对子层进行平滑处理, 且图像的尺寸是变化的。B图的SURF算法保持原始图像不变而只是改变滤波器的大小。

1.3Hessian特征检测

2算法实现

根据SURF算法的基本原理,设计算法的实现过程。首先通过视频采集设备获取模板图像,并对其建立积分图像和构建尺度空间结构,再通过视频采集设备捕捉当前视频帧,然后检测出模板图像及当前视频帧的特征点, 并保存每个特征点各项特性的描述信息,最后比较模板图像与当前帧图像特征点的描述子信息进行图像匹配。

3OpenCV技术

OpenCV(Open Source Computer Vision Library)[5]于1999年由Intel建立,是一个基于(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。OpenCV轻量级而且高效,由一系列C函数和少量C++类构成, 实现了计算机视觉,图像处理和模式识别等方面的很多通用算法。

OpenCV为Intel公司的Integrated Performance Primitives(IPP)提供了透明接口,这意味着如果有为Intel处理器优化的IPP库,OpenCV将在运行时自动加载这些库。OpenCV致力于真实世界的实时应用,通过优化的C代码的编写对其执行速度带来了可观的提升,编写程序过程中调用OpenCV的基础函数库, 即可完成十分复杂的开发任务, 极大的提高开发效率。

3.1OpenCV的特点

1) 跨平台,Windows,Linux,Mac OS;

2) 免费,开源;

3) 代码经过优化,可用于实时处理图像;

4) 统一的结构和功能定义;

5) 强大的矩阵运算和图像处理能力;

6) 具有底层和高层的应用开发包;

7) 用户接口方便灵活。

3.2OpenCV的功能

1) 对图像数据的操作,包括分配、释放、复制和转换数据。

2) 具有对矩阵和向量的操作以及线性代数的算法程序,包括矩阵、解方程,特征值以及奇异值。

3) 具有基本的数字图像处理能力,如可进行滤波、边缘检测、角点检测、采样与差值、色彩转换、形态操作、直方图和图像金字塔等操作。

4) 对运动的分析,如对光流、运动分割和跟踪的分析。

5) 对目标的识别,可采用特征法和隐马尔科夫模型(HMM)法。

6) 具有基本的GUI功能,包括图像与视频显示、键盘和鼠标事件处理及滚动条等。

3.3OpenCV模块

1) CV核心函数库,实现图像处理,结构分析,运动分析,对象识别,摄像机标定和3D重构等功能。

2) CVAUX辅助函数库,实现通过立体视觉来实现的动作识别,基于轮廓线的形状匹配,模式识别,纹理描述等功能。

3) CXCORE数据结构与线性代数库,实现数据变换,矩阵运算等功能。

4) HIGHGUI图像界面函数库,实现图像获取,用户界面设计等功能。

5) ML机器学习函数库,包括模式分类和回归分析等。

4Android上的系统实现

Android是基于Linux开放性内核的操作系统,是Google公司在2007年l1月5日公布的手机操作系统。Android采用软件堆层的架构,主要分三部分:底层以Linux核心为基础,提供基本功能;中间层包括函数库和虚拟机;最上层是各种应用软件。Android应用程序用Java语言编写。每个应用程序都拥有一个独立的Dalvik虚拟机实例,这个实例驻留在一个由Linux内核管理的进程中[6]。

在Android系统上使用OpenCV来实现该系统,需利用JNI编写相应的本地代码组件并通过Android NDK工具集将其嵌入到Android应用程序中。首先,利用Android应用程序框架编写相应的Java代码;然后通过JNI与OpenCV提供的函数编写本地C/C++代码,并使用Android NDK将本地代码文件编译生成可由Java代码调用的共享库(动态链接库),最后通过SDK生成完整的Android应用程序[7]。

4.1JNI

JNI(Java Native Interface),即JAVA本地调用。它允许Java代码和其他语言编写的代码进行交互。

5结论

本文提出了一种基于SURF算法的图像识别方法,并运用此方法实现了一套基于Android平台的图像识别系统。由于系统需要进行大量的图像处理运算, 因此通过使用Android NDK调用OpenCV图像处理函数库以提高编程效率,。系统通过手机摄像头提取视频帧, 并使用SURF算法对其进行快速鲁棒特征检测。实验结果表明, 该方法复杂度低、实时性好并且具有良好的鲁棒性,将系统用于移动设备图像识别加密,以及视频监控等方面,会使其拥有更好的识别效率和可靠性。

参考文献:

[1]彭欣,刘富强,宋华军.基于SURF目标跟踪算法研究[J].长春理工大学学报, 2011,34(2):138-141.

[2]徐秀云.基于特征点的景象匹配技术研究[D].南京:南京理工大学,2009:1-68.

[3]高健, 黄心汉, 彭刚,等. 一种简化的SIFT图像特征点提取算法[J].计算机应用研究,2008,25(7):2 213-2 215.

[4]VASILEIOS K,CHRISTOPHOROS NIKOU,ARISTIDIS LIKAS.Visual Tracking by Adaptive Kalman Filtering and Mean Shift[J].Springer-Verlag Berlin Heidelberg,2010,6040:153-162.

[5]黎松,平西定,丁益洪.开放源代码的计算机视觉类库OpenCV的应用[J].计算机应用与技术,2005,22(8):134-136.

[6]韩超,梁泉.Android系统原理及开发要点详解[M]北京:电子工业出版社,2010:70-93.

[7]韩露.一种Java与OpenCV结合实现的目标检测模块[J].计算机应用,2008(3):773-775.

[8]HUIYU ZHOU,YUAN YUAN,CHUNMEI SHI.Object tracking using SIFT features and mean shift[J]. Computer Vision and Image Understanding,2009,113:345-352.

[9]HERBERT BAY, ANDREAS ESS, TINNE TUYTELAARS,et al.Speeded-Up Robust Features(SURF)[J].Preprint submitted to Elsevier,2008:233-245.

[10]TA D N CHEN,W C GELFAND,N PULLI K.SURFTrac:Efficient Tracking and Continuous Object Recognition using Local Feature Descriptors[C]//Coumputer Vision and Pattern Recognition(CVPR'09),2009:2 937-2 943.

[11]纪华,吴元昊,孙宏海,等.结合全局信息的SIFT特征匹配算法[J].光学精密工程,2009,17(2):439-444.

[12]CHAVES A,GUSTAFUSON D.Vision——Based Obstacle Avoidance Using SIFT Features[C]//Proceedings of the 5th International Symposium on Advances in Visual Computing.2009:550-557.

[13]公磊,周聪.基于Android的移动终端应用程序开发与研究[J].计算机与现代化,2008(8):85-89.

第7篇:计算机视觉的优点范文

本文深入地分析了当前实施人脸检测技术的可行性,并对本方案实施的优势进行了概括。

【关键词】人脸检测技术 计算机技术 识别技术

1 人脸检测的前景

人脸检测作为近年来生物识别领域的一个热门研究方向,具有操作方便,用户易于接受,事后追踪能力强等优点。但是因为人脸检测与识别运行的过程往往需要大量的运算,并且其算法并不简单,因此目前大部分人脸检测与识别系统的设计与开发都需要立足于计算机技术。下面笔者将会对以计算机平台为基础的人脸检测的实现过程展开详细的论述与分析。

2 相关技术研究现状

2.1 人脸图像的获取与预处理

一般情况下,摄像头负责对人脸图像的摄取,除此之外,专门的图像库也是人脸图像的来源之一。前者多应用于系统的应用阶段,一般来说,它不仅仅可以作为应用系统存在,也可以作为研究系统存在;而后者多应用于研究阶段,并且它只能作为研究系统存在,是基于标准人脸图像库而存在的。

获得需要的图像之后,接下来就要对图像进行预处理,这一环节对于人脸检测与识别系统的应用来说,是非常关键的。在获取图像的过程中,会受到外部复杂环境的影响,例如灯光亮度、配套设施好坏、噪声干扰、对比不明显等等。并且,由于距离与焦距存在的差异,导致无法确定人脸所处的具置。因此,图像预处理这一环节是必不可少的,有了这一环节才能确保图像上人脸所处位置与大小比较恰当。人脸扶正、人脸图像增强及其几何归一化和灰度归一化等都是图像预处理环节主要的工作内容。而图像变换增强、直方图均衡法、非线性平滑滤波、图像的归一化等则是图像预处理过程之中所运用的主要方法。

2.2 人脸检测技术

人脸识别是否能够具有较好的识别性能,取决于人脸检测的性能水平的高低,因此可以说,人脸检测是人脸识别得以实现的前提条件。借助人脸检测算法技术,检查并测验静态图像(动态视频帧),从而准确的对此图像(视频)进行判断,从而知道此图像是否具有人脸图像,假若判断此图像具有人脸图像,则需要明确其所处区域及图像数值大小,这就是人脸检测。高效率与检测精准是用户对人脸检测的一个普遍性评价,现如今这项技术已经获得了用户的认可,专家学者也对其展开了更深入的分析研究。

人脸图像所囊概的特征是非常丰富的,例如肤色、人的轮廓、结构等特征都是极具代表性的,此外其系列图像往往还会涉及到一些其他信息,例如运动状态等。基于这些特征信息,研究者设计了许多人脸识别的检测算法,按照这些方法的思想策略大致可将人脸检测方法分为4类:基于知识的方法、基于模块匹配的方法、基于外观形状的方法和基于特征的方法。

2.3 人脸识别技术

借助对相应的人脸识别算法的运用,辨别出图像上的人脸的身份信息,第一步是对图像进行搜索,从而找出图像上的人脸目标,然后识别人脸目标体的身份信息,这就是人脸识别。

以人脸识别技术的发展状况作为划分的依据,研究工作往往将人脸识别技术划分为四种类别,分别为:其一是几何特征为基础的;其二是以统计特征为基础的;其三是以机器靴子为基础的;其四是以局部模式为基础的;

3 选择的硬件平台

3.1 图像输入

人脸图像的输入部分可以是普通的USB摄像机、网络摄像机等,也可以将已经拍摄好的图像存储在硬盘等存储设备。因此其应用往往不会受限于特定的场所。

如果摄像机选择的性能比较差一些,会增加后面算法的复杂度;此外还会对人脸检测与识别的最终效果造成一定的影响;为了提高系统的性能,所以应该选择性能比较好,产生的相片噪声比较小的相机。

3.2 中央处理

本方案中的中央处理部分选取的是计算机的CPU;因为现在CPU的功能强大,再加上良好的微软系统,使得系统的性能大大的提升。

作为系统的中心处理部分,应该选择一台专门的服务器来处理图像的检测和识别。这是由于图像往往需要占据大量的内存,在实施算法的过程之中会耗用较多的资源。

4 检测系统的组成

4.1 计算机视觉库OpenCV的介绍

Open CV是计算机视觉库,它是跨平台的,并且以(开源)发行为基础,能够在很多操作系统上运用,例如Linux、Windows、Mac OS,其具有的C函数跨平台的中、高层API高达五百个。由于其有着丰富的视觉处理算法,因此在数字图像处理领域之中的运用非常普遍,例如物体、人体、人脸等的识别。本文后面分析工作的开展都是以Open CV计算机视觉库为基础的。

4.2 人脸图像采集模块

原始的人脸图像一般是在用户注册时采集的,一般会在几副到十几幅之间, 且采集到的这些人脸图像需包含该人脸的不同的表情和多种姿态。人脸采集是人脸检测的第一个步骤,笔者在前文现状分析的基础上,为使人脸检测更加精确,结合了人眼与人脸检测两种技术。成功获取人脸图像后将会步入图像预处理这一步骤,相应的工作内容不再赘述。

当然进行人脸识别时的图像采集工作也是由此模块来完成,采集完需要进行归一化、图像均衡、灰度化、直方图增强等预处理,之后根据当前处于训练阶段还是识别阶段将其送入人脸特征提取模块。

4.3 人脸特征提取模块

这一模块的主要工作是提取人脸图片的特征,随后开展降维处理,最终在数据库之中录入该特征,方便人脸图像识别模块对图像的识别。在前文人脸识别技术研究现状分析的基础上,笔者认为此模块工作的开展,首先可以采取人脸区域先分块再提取特征的方法。

4.4 人脸图像识别模块

人脸识别系统的好坏很大程度上取决于人脸识别的设计水平与其所挑选的计算方法,因此可以说,人脸识别系统的关键在于人脸识别。现如今,以小波分析为基础、以视觉联想为基础、以人脸表情为基础的人脸识别技术是运用最普遍的。因此,本文的关键点就在于此,要查阅相关资料,从而挑选出最恰当的算法。

5 结论

我们以OpenCV和计算机为平台,对人脸图像的预处理、人脸图像的特征提取和人脸图像的识别算法进行仿真分析和优化。这样,我们就可以充分利用人脸识别现有的算法,并进行优化,来实现快速高效的检测和识别系统。

参考文献

[1]朱文佳,戚飞虎.快速人脸检测与特征定位 [J].中国图像图形学报,2005,10(11):1455-1458.

[2]王志良,孟秀艳.人脸工程学[M].北京:机械工业出版社,2008.

作者简介

宋家慧(1978-),女,山东省苍山县人。大学本科学历。现为广西机电职业技术学院讲师。研究方向为计算机应用、数据库应用和数据挖掘。

第8篇:计算机视觉的优点范文

关键词:运动目标跟踪;生成方法;图像感知哈希;OPENCV

中图分类号:TP392 文献标识码:A 文章编号:1009-3044(2016)14-0179-03

随着计算机信息技术的发展,计算机视觉已经成为研究热点之一,运动目标跟踪更是计算机视觉领域的热门课题。如今运动目标跟踪技术已经广泛用于监控、交通、军事、医疗的等领域。视频是一帧一帧连续播放的图像序列,目标跟踪是指从视频的某一帧开始,通过目标检测方法找到到运动目标或者人工指定跟踪目标,在之后的连续图像序列中持续对目标进行识别和跟踪。

目标跟踪方法通常分为判别方法和生成方法两种。判别方法把跟踪看成一个二分类的问题:以目标物体作为正样本,背景作为负样本,通过训练分类器可以把目标从背景中分离出来,从而实现对目标的跟踪。目前很多判别方法提出,其中STRUCK是判别方法中最杰出的[2],但是此方法需要大量的计算,速度较慢,并不能满足实时跟踪的需求。生成方法首先学习外观模型来表示目标,然后在搜索区域的候选模型中选择出与目标模型误差最小的一个作为跟踪结果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始图像的整体模板法,即LK方法。仅仅使用原始图像作为模板,不能很好地提取目标外观特征,适应目标外观变化,且需要的计算量较大。Hager和Belhumeur 等人改进了LK方法,对原始图像进行降维,使用对光照不敏感的低维特征作为目标外观的表示。在此基础上,Black和Jepson又提出了使用一定的学习策略进行模型更新,从而更好的处理目标外观的变化。此时生成跟踪方法的框架已经形成。随后很多模型的不同特征被用于跟踪。如Comaniciu人等结合颜色直方图和数学上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自适应尺度变换的改进方法camshift。为了更好的处理遮挡和提升实时性能,局部稀疏表示(PCA、稀疏编码等)和多种特征的联合表示也被用于目标跟踪。[1][2]

跟踪的过程中会出现众多的干扰因素影响跟踪的性能,如尺度变换,光照变化,偏移,遮挡等问题。处理这些因素的关键在于构造有效且鲁棒的外观表示模型。文献[1]证明了模型表示的选择对于跟踪性能的影响最大。于是近些年来,跟踪问题更多的焦点集中在寻找有效的表示模型上。本文提出了一个有效的生成方法,使用图像感知哈希作为模型表示进行跟踪,

具有尺度不变性和运算速度快的优点,并且引入了模型更新策略,从而解决了目标跟踪中出现的偏移、遮挡问题。

1图像感知哈希

感知哈希是指将具有相同感知内容的多媒体信息映射为一段数字摘要,用来对媒体信息进行比对。图像感知哈希则是对数字图像的感知信息进行摘要。传统的哈希技术仅仅简单地把图片看作一个二进制文件进行处理,而没有考虑到图像上的感知信息。随着网络上有损压缩格式的使用,传统的哈希算法如MD5、SHA1等方式不再适用于图片的匹配,于是提出了图像感知哈希技术,利用的图片的感知特征作为摘要信息来进行图像的识别和认证[4]。

在MD5、SHA1这样的加密哈希方法中,得到的哈希值仅仅是一段固定长度的二进制数字,和其本身的内容没有关系。单向性和抗碰撞性要求它对输入的二进制数据的比特变化敏感,也就是说,即使输入数据一位的比特变化,也会导致输出哈希值的明显的随机变化。

对于数字图像而言,图像数据格式的变化,普通的图像润饰或者加工操作,图像通信的信道噪声等在剧烈改变图像二进制数据的同时,一般都只会影响图像呈现信息的质量,而不会改变其内容。因此大部分感知哈希算法都具有共同的基本特性:图像可以放大缩小,可以有不同的方向、角度,甚至可以有细微的颜色差别,其哈希值都应该保持不变或者在一个指定的阈值内变化。而以上的特性也正好适用于目标跟踪中用来匹配目标。

2提出的算法

近些年来,已经有很多不同的图像感知哈希算法提出[5]。其中包含很多复杂的甚至可以加密的方法,但是经测试,即使将很简单的感知哈希算法作为特征使用到跟踪中,也能起到很好的效果。

2.1模型表示

本文中采取的感知哈希作为跟踪目标的模型表示,计算方法如下:

1)将原图像转化为灰度图,灰度图就可以很好的保存图像轮廓和细节,减少计算量,提高速度。

2)缩小图像尺寸,把原大小转化为8*8的方形图像。缩小尺寸可以大幅度减少图像的高频信息,保留低频信息。低频信息反映了图像的整体框架,具有对放大、缩小、平移、模糊的不变性,这也是图像哈希可以作为目标跟踪匹配特征的关键原因。

3)计算所有像素灰度的平均值,用于和每个像素比较。

4)将所有的像素值与平均值进行对比,大于等于平均值记为1,小于平均值记为0。

5)把这64个2进制位由在原图像从左到右从上到下的顺序排列,形成哈希值。

以Lena图为例,计算图像感知哈希的步骤如图1所示:

2.2 运动模型和观察模型

跟踪算法使用图像感知哈希作为模型特征,以两个哈希值之间的汉明距离作为评判相似度的标准(观察模型)。汉明距离表示哈希值中对应位置二进制位不同的个数,汉明距离越大,说明图像越不相似,反之则越相似。

汉明距离的计算:d(x,y)=∑x[i]y[i],如下所示。

由[1]我们得知,在选取合适特征情况下,即便是用很简单的跟踪框架也能够实现很好的跟踪效果。本系统在第一帧使用人工标注的方法圈定要跟踪的目标,之后的每一帧使用滑动窗口作为运动模型搜寻目标:在当前目标2*2的范围内寻找目标,使用汉明距离作为观察模型来从候选的模型中选取最接近目标的一个。如图2。

2.3偏移问题

在模型更新的过程中,由于误差积累,会导致跟踪结果偏移。对于此问题,本算法采取使用第一帧和上一帧的权重共同跟踪的方法,第t帧的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一帧中目标模型所占的权重。随着时间变化,第一帧的权重应逐渐减小。本方法中取α=1/(1+t)。

2.4 遮挡问题

当模型被遮挡时,如果继续更新,会导致更新到覆盖物更新到了错误的模型。所以本方法中的模型更新针对遮挡也提出了解决方法。d(h)表示汉明距离,当0

2.5算法流程

1)在视频的某一帧使用鼠标拖拽圈定要跟踪的目标,作为模型T,大小为p*q,左上角像素的位置为(m,n)。

2)计算选中窗口区域的感知哈希值H(T)。

3)下一帧F中使用在当前位置的2*2大小的窗口中滑动,计算每个大小为p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j为子窗口Fi,j 左上角的像素在F图中的坐标,称为参考点。i,j的取值范围:m-p/2

4)比较搜索窗口和模型窗口的哈希值的汉明距离D(H(T),H(Fi,j)),选取所有子窗口中汉明距离最小的子窗口作为跟踪结果。

5)根据提出的模型更新机制决定是否将跟踪结果Fi,j作为下一帧的跟踪模型T,重复步骤2到步骤5。

3 基于Opencv的系统实现及仿真实验

Opencv是一个开源的数字图像处理和计算机视觉的函数库,实现了图形图像处理和计算机视觉方面的很多通用算法,方便开发人员将注意力集中于算法的实现而不需要自己写一些底层操作代码,避免造成时间和精力上的浪费。

Opencv提供了数组、序列、矩阵、树等基本结构,也包含了差分方程求解、傅里叶分析、积分运算、特殊函数等众多高级数学计算函数,以及各种图像处理操作和目标跟踪、摄像机校准、三维重建等高级视觉函数。本设计中的基本功能如读取视频,鼠标选取操作,缩放图像,彩色图像转化为灰度图像等基本功能都由opencv提供的函数实现。

本设计基于windows10+visual studio 2013+opencv2.4.11环境,实现了在固定的背景的情况下进行稳健的目标跟踪,具有尺度不变性和光照不变性,达到不需要预先训练的每秒30帧以上的实时跟踪效果。图3为程序在第82、269、550、736帧跟踪到的结果。

4 结论

实验结果表明,在目标跟踪中引入图像匹配中的感知哈希方法作为跟踪特征,有较快的运行速度、准确度和鲁棒性,可以作为一种良好的特征用于目标跟踪。虽然与Object Tracking Benchmark[2]中排名靠前的算法相比,本设计仍然有差距,但是提出了一种将图像感知哈希引入跟踪的概念。近些年来还不断有新的感知哈希算法提出,不乏兼具尺度不变性,旋转不变性等良好特性的感知哈希算法,试想将这些方法用于运动目标跟踪,会具有更好的跟踪效果,可作为目标跟踪发展的下一步研究方向。

参考文献:

[1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015.

[2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015.

[3] 徐光柱,雷帮军.实用性目标检测与跟踪算法原理及应用[M].北京,国防工业出版社, 2015.

[4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996.

第9篇:计算机视觉的优点范文

【关键词】计算机技术 残障人士 影响 发展

一 计算机技术带给残障人士生活上的影响

(1)对残障人士基本生活保障

随着计算机技术的不断发展,计算机已经进入社会生活的各个领域,它已经和人们的生活息息相关。它不仅能通过计算机技术来提高工作效率、获取需要的知识以及进行娱乐。与此同时,处于弱势的残疾人群体,也可以通过计算机与外界沟通、交流并获取自己所需知识。一般情况下,残疾人因为行动不便,或者由于语言上的障碍不能正常的外界交流,常失去和其他人公平竞争的机会,这致使很多残疾人的生活得不到保障。但是,计算机技术的发展则使他们得到了学习知识的机会,通过计算机获取相应的知识,以此来提升自身的能力,使自己的基本生活得到保障。

(2)对残障人士学习的保障

通过计算机,残疾人可以不用行动或通过交谈就可以完成工作,他们也可以通过计算机来获取知识从而增加自身的知识储备量。残疾人在“听”、“说”、“看”、“做”等方面有着不同的缺陷,但利用计算机技术可以弥补他们的缺陷方面。如人机交互技术:随着语音识别和计算机视觉技术的发展,人机交互技术成为残障人士克服各种障碍的重要工具。在一些残疾人联合会,负责人通过组织肢体残疾者学习电脑操作技术,使他们可以借助高科技手段,真正的融入社会中去。残疾人借助计算机的帮助可以使自己更加灵活的进行工作。

(3)对残障人士疾病辅助的保障

计算机具有速度快、精度高、可靠性高的优点, 通过计算机技术我们可以设计出有利于残疾人生活的工具。在以前,轮椅要通过手来摇动或者人推动才能移动,而现在通过在轮椅上安装微型的计算机,就可以通过语音或者预设来实现移动。在这方面大大提高了残疾人出行不便的问题。社会上的一些患有先天性聋哑的儿童,通过对他们进行康复训练,纠正他们的发音,每天记录他们的学习情况,把记录录入到计算机中,然后通过一些分析软件来进行分析,分析出他们每天的进步情况,以便为他们制定出更好的康复计划。计算机给残疾人的生活带来各种便利,提高了他们各方面的效率,通过计算机网络的链接,使残疾人与社会更加的贴近,在一定的程度上扩大了他们的生存空间。

二 计算机技术在残障设施上的发展

(1)计算机技术在“听、看”方面的发展

随着计算机技术的发展,让盲人阅读汉字已经成为可能。通过扫描把文字用声音的方式输出,盲人最终也可以通过计算机技术来阅读文字。如今有听力障碍的残疾人有的会佩戴上人工耳蜗,人工耳蜗它是一种电子装置,能够帮助耳聋患者重新恢复听力。它的原理就是代替了已经病变受损的听觉器官,把声音通过电信号传递给内耳耳蜗,刺激分布在那里的听觉神经,然后大脑就形成了听觉。而人工眼是使盲人能够看得见的一个现代化的科技产品,他通过电子设备把景物拍摄下来,然后传送给人的相关神经。这些技术的出现使得残障人士的生活方式、交往方式以及思维方式都发生了很大的改变,可见,计算机技术的发展对辅助残障人士设施的发展产生了深远的影响。

(2)自然人机交互技术领域的发展

伴随着计算机技术的发展,人机交互技术也取得了部分的成就,目前,自然人机交互技术的飞速发展给残疾人带来了很大的方便。近期自然人机交互主要研究及进展有笔式交互、语音交互、基于计算机视觉技术的人机交互、基于传感器的交互。脑电波交互、手臂机交互等比较前沿的人机交互研究也正在开展。像肌电、脑电技术的开展将让肢体有障碍的人士行动自如。20世纪70年代我国的肌电假肢得到了很好的发展,现在此技术已经得到广泛的应用。高位截肢患者的肌肉虽然已经被截去,但其控制运动的神经系统还依然存在。但神经移植术[2]为解决这一问题开辟了途径,这种技术就是利用肌的信号控制多自由度假肢。还有手语识别和合成将会使有听觉障碍的患者“说话”。手语识别即是指通过计算机采集设备获得聋哑人手语数据,采用模式识别算法,结合上下文知识,获知手语含义,进而翻译成语音,传达给不懂手语的正常人。而手语合成则是一个和上述过程相反的过程,即是正常人通过语音表达,然后计算机将语音翻译成手语并表现出来,向有听觉障碍的患者传递信息。这样,有听觉障碍的人就可以“听见”声音了。自然语言理解始终是人机交互的最重要目标,虽然目前在语言模型、语料库、受限领域应用等方面均有进展,但由于它的难度,自然语言理解仍是科学家和语言学家的一个长期研究目标。

三、结论

综上所述,计算机技术是一个融汇技术,经济,法律和社会工作的一门学科,从它身上不仅仅能看出对社会有巨大的价值,还能看到对残疾人的巨大帮助。然而我国在计算机辅助残疾人技术的开发设计与利用服务方面还十分的落后,需要培养大量的的辅助技术领域的引领者,策划者与服务者,以推动各种高品质的辅助技术产品的开发和辅助技术服务的发展;需要通过发展高等辅助技术教育培养高层次研究人员,以总结,完善和发展该学科的理论与技术,发展辅助技术高等教育对支持残疾人独立生活,促使他们向生产性社会成员方面发展,开发新的潜在市场,有重大意义。我们要通过实验来培养实际的工作能力、合作精神以及严谨的工作态度,这样我们才会使我国的计算机技术继续进步,那样才会更大幅度的改善残疾人的生活水平,残疾人才会拥有更加美好的未来。计算机技术的发展,给残疾人带来了本质的改变,让他们能够更有效的使用计算机,改善了他们的生活状况。我们相信,随着计算机技术的不断发展与完善,它将能为残疾人带来更多的便利与帮助。

参考文献: