前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉技术的基础主题范文,仅供参考,欢迎阅读并收藏。
关键词:计算机视觉;课程创新;教学改革
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02
计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。
一、计算机视觉课程的特点
近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。
二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别
1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。
2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。
三、高校计算机视觉课程教学的创新策略
1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。
2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。
3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。
四、结语
在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。
参考文献:
[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).
[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).
[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).
[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).
[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).
[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).
【关键词】精密测量 计算机视觉图像 关键技术
在现代城市的建设中离不开测量的运用,对于测量而言需要精确的数值来表达建筑物、地形地貌等特征及高度。在以往的测量中无法精准的进行计算及在施工中无法精准的达到设计要求。本文就计算机视觉图像精密测量进行分析,并对其关键技术做以简析。
1 概论
1.1 什么是计算机视觉图像精密测量
计算机视觉精密测量从定义上来讲是一种新型的、非接触性测量。它是集计算机视觉技术、图像处理技术及测量技术于一体的高精度测量技术,且将光学测量的技术融入当中。这样让它具备了快速、精准、智能等方面的优势及特性。这种测量方法在现代测量中被广泛使用。
1.2 计算机视觉图像精密测量的工作原理
计算机视觉图像精密测量的工作原理类似于测量仪器中的全站仪。它们具有相同的特点及特性,主要还是通过微电脑进行快速的计算处理得到使用者需要的测量数据。其原理简单分为以下几步:
(1)对被测量物体进行图像扫描,在对图像进行扫描时需注意外借环境及光线因素,特别注意光线对于仪器扫描的影响。
(2)形成比例的原始图,在对于物体进行扫描后得到与现实原状相同的图像,在个步骤与相机的拍照原理几乎相同。
(3)提取特征,通过微电子计算机对扫描形成的原始图进行特征的提取,在设置程序后,仪器会自动进行相应特征部分的关键提取。
(4)分类整理,对图像特征进行有效的分类整理,主要对于操作人员所需求的数据进行整理分类。
(5)形成数据文件,在完成以上四个步骤后微计算机会对于整理分类出的特征进行数据分析存储。对于计算机视觉图像精密测量的工作原理就进行以上分析。
1.3 主要影响
从施工测量及测绘角度分析,对于计算机视觉图像精密测量的影响在于环境的影响。其主要分为地形影响和气候影响。地形影响对于计算机视觉图像精密测量是有限的,基本对于计算机视觉图像精密测量的影响不是很大,但还是存在一定的影响。主要体现在遮挡物对于扫描成像的影响,如果扫描成像质量较差,会直接影响到对于特征物的提取及数据的准确性。还存在气候影响,气候影响的因素主要在于大风及光线影响。大风对于扫描仪器的稳定性具有一定的考验,如有稍微抖动就会出现误差不能准确的进行精密测量。光线的影响在于光照的强度上,主要还是表现在基础的成像,成像结果会直接导致数据结果的准确性。
2 计算机视觉图像精密测量下的关键技术
计算机视觉图像精密测量下的关键技术主要分为以下几种:
2.1 自动进行数据存储
在对计算机视觉图像精密测量的原理分析,参照计算机视觉图像精密测量的工作原理,对设备的质量要求很高,计算机视觉图像精密测量仪器主要还是通过计算机来进行数据的计算处理,如果遇到计算机系统老旧或处理数据量较大,会导致计算机系统崩溃,导致计算结果无法进行正常的存储。为了避免这种情况的发生,需要对于测量成果技术进行有效的存储。将测量数据成果存储在固定、安全的存储媒介中,保证数据的安全性。如果遇到计算机系统崩溃等无法正常运行的情况时,应及时将数据进行备份存储,快速还原数据。在对于前期测量数据再次进行测量或多次测量,系统会对于这些数据进行统一对比,如果出现多次测量结果有所出入,系统会进行提示。这样就可以避免数据存在较大的误差。
2.2 减小误差概率
在进行计算机视觉图像精密测量时往往会出现误差,而导致这些误差的原因主要存在于操作人员与机器系统故障,在进行操作前操作员应对于仪器进行系统性的检查,再次使用仪器中的自检系统,保证仪器的硬件与软件的正常运行,如果硬软件出现问题会导致测量精度的误差,从而影响工作的进度。人员操作也会导致误差,人员操作的误差在某些方面来说是不可避免的。这主要是对操作人员工作的熟练程度的一种考验,主要是对于仪器的架设及观测的方式。减少人员操作中的误差,就要做好人员的技术技能培训工作。让操作人员有过硬过强的操作技术,在这些基础上再建立完善的体制制度。利用多方面进行全面控制误差。
2.3 方便便携
在科学技术发展的今天我们在生活当中运用到东西逐渐在形状、外观上发生巨大的变大。近年来,对于各种仪器设备的便携性提出了很高的要求,在计算机视觉图像精密测量中对设备的外形体积要求、系统要求更为重要,其主要在于人员方便携带可在大范围及野外进行测量,不受环境等特殊情况的限制。
3 计算机视觉图像精密测量发展趋势
目前我国国民经济快速发展,我们对于精密测量的要求越来越来高,特别是近年我国科技技术的快速发展及需要,很多工程及工业方面已经超出我们所能测试的范围。在这样的前景下,我们对于计算机视觉图像精密测量的发展趋势进行一个预估,其主要发展趋势有以下几方面:
3.1 测量精度
在我们日常生活中,我们常用的长度单位基本在毫米级别,但在现在生活中,毫米级别已经不能满足工业方面的要求,如航天航空方面。所以提高测量精度也是计算机视觉图像精密测量发展趋势的重要方向,主要在于提高测量精度,在向微米级及纳米级别发展,同时提高成像图像方面的分辨率,进而达到我们预测的目的。
3.2 图像技术
计算机的普遍对于各行各业的发展都具有时代性的意义,在计算机视觉图像精密测量中运用图像技术也是非常重要的,在提高图像处理技术做以提高。同时工程方面遥感测量的技术也是对于精密测量的一种推广。
4 结束语
在科技发展的现在,测量是生活中不可缺少的一部分,测量同时也影响着我们的衣食住行,在测量技术中加入计算机视觉图像技术是对测量技术的一种革新。在融入这种技术后,我相信在未来的工业及航天事业中计算机视觉图像技g能发挥出最大限度的作用,为改变人们的生活做出杰出的贡献。
参考文献
[1]汤剑.周芳芹.杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2015,14(18):33-36.
[2]马玉真.程殿彬.范文兵,计算机视觉检测技术的发展及应用研究[J].济南大学学报,2014,18(23):222-227.
[3]李华.基于计算机视觉图像精密测量的关键技术分析[J].电脑知识与技术,2013(05):1211-1212.
[关键词] 物流企业; 自动化; 算法
[中图分类号] F252; TP39 [文献标识码] A [文章编号] 1673 - 0194(2013)06- 0058- 03
0 引 言
随着物流业被列入我国十大行业振兴计划,物流业已经成为我国经济发展的不可缺少的重要组成部分。物流业是我国经济运行的基础,是推动国民经济发展的重要支柱性产业之一。随着国家持续加强和改善宏观调控政策,物流业发展环境和条件不断改善,物流业保持了较快的增长速度。但由于中国物流业起步较晚,存在物流成本较高、管理落后等问题,离一体化、信息化的物流业还有一定差距。中国物流业只有应用现代物流的理念,采用先进的信息技术与运作方式,才能应对拥有技术、资金和管理优势的外国企业的竞争。实现传统物流业向现代物流业的转变,也是物流业自身结构调整和产业升级的需要,是整个国民经济发展的必然要求。我国经济要集约式发展,必然需要推进现代物流。现代物流的根本宗旨是降低物流成本、提高物流效率、满足客户需求,其中信息化是现代物流的核心。随着信息技术的不断更新和物流企业自身的发展,使得新兴的信息业务与传统物流业务之间相互介入,模糊了新兴信息技术及业务与传统物流业务的界限,从而模糊了物流业的产业属性和产业界限, 即发生了产业融合现象。产业融合是由于技术进步和放松管制的原因,发生在产业边界和交叉处的技术融合,在经过不同产业或行业之间的业务、组织、管理和市场的资源整合后,改变了原有产业产品和市场需求的特征,导致产业的企业之间竞争合作关系发生改变,从而最终造成产业界限的模糊化甚至重划产业界限。
产业融合促进了传统产业创新, 进而推进产业结构优化与产业发展,即产生创新性优化效应。物流信息化的重要性已经引起国内很多学者的重视,并纷纷提出相应的观点和建议。马健(2005)认为物流企业将在建立呼叫中心、应用系统领域和网络计算机领域出现信息化融合的趋势,并提出物流企业应采取的战略。邓小瑜(2011)等从技术融合、产品融合、业务融合、产业衍生4个层面阐述了物流业如何进行信息化建设。物流业与信息业的融合包含通过融合信息技术提高来增强企业竞争力和将信息业务增加到物流服务中形成新的业务2个方面。
视频摄像头在日常生活中非常普遍,但是利用率较低,大部分监控系统都是提供视频数据的线性存储,成为事后证据查找的有效手段。近年来,随着计算机视觉的发展,很多学者开始研究视频理解,尤其是针对视频信息检测与识别技术,建立有效的算法,实现底层图像处理技术与高层视频内容分析之间的关联,从而推动了计算机视觉在物流领域的应用,提高物流企业的竞争力。
1 计算机视觉的相关知识
1.1 计算机视觉的概念
20世纪80年代初,Marr从信息处理的角度,提出了第一个比较完善的计算机系统视觉框架。计算机视觉是指利用计算机模拟人眼的视觉功能,对图片或视频进行采集、加工、处理和识别,从中提取三维景物的形态和运动信息,解决物流、工业、商业等领域产品图像自动检测识别问题,提高检测识别效率和自动化程度。计算机视觉自动识别技术作为一门交叉学科,近年来受到各相关行业的高度重视。计算机视觉的处理流程为:摄像机图像采集图像处理计算机帧存储、图像识别控制逻辑显示器显示。
1.2 亮度要求
基于计算机视觉的硬件环境中,亮度是非常重要的因素。在计算机视觉中亮度的作用是突出物体的重要特征或使物体本身可见,而弱化物体其他不需要的特征或物体所处的背景。如果物体太亮或太暗,都会影响对物体的处理。
彩色物体反射光谱的某些部分,吸收其他部分。因此开发人员可以利用这个特点来提高某些物体的可视度。开发人员可以利用颜色之间的对比增强某种颜色或抑制其相反的颜色。例如,如果一个红色的物体在一个绿色背景中则应该加强红色,这时可使用红色照明。这样红色的物体会显得明亮,同时会变暗绿色的对象。
LED是目前用于计算机视觉的主要照明技术,相比白炽灯、日光灯等使用时间短、亮度逐渐减弱的特点,LED灯的寿命超过100万小时,而且耗电小,产生热量少。
1.3 计算机和摄像机的接口
常用的计算机和摄像机接口包括IEEE 1394、Ethernet、USB2.0 and Gigabit Ethernet等。
1.4 RGB介绍
RGB 颜色空间是实际应用最多的一个颜色空间,在使用计算机进行图像处理时,数字图像一般用RGB 空间存储和表示,分3个通道:红(Red)、绿(Green)和蓝(Blue),分别反映了颜色在某个通道的亮度值。3种原色光不同比例混合即使得人得到不同颜色的感知,这就是RGB颜色空间的由来。RGB 空间中每种颜色都能用三维空间中的一个点来表示。
2 计算机视觉在物流领域的优势
随着物流业的迅速发展,计算机视觉在条形码识别、运动物流跟踪方面逐渐得到应用。与传统方法相比,计算机视觉应用在物流领域的优势为以下方面。
2.1 灵活、低成本
物流系统中一般采用传感器来收集相关信息,但是传感器的位置是固定的,如果需要多方位的信息,必须同时需要多个传感器才能完成。利用计算机视觉摄像机和计算机来完成,只需要通过程序的设置和一台摄像机就可实现多方位信息的收集。
2.2 高效、准确
在一些人眼难以满足要求的场合,或不适于人工工作的环境下,用计算机视觉来代替人工视觉可以提高生产效率、信息的准确率。
3 计算机视觉在流水线中多方位跟踪计数的算法
物流企业在流水线产品的计数方法目前主要采用传感器,而利用摄像机所提供的视频信息可以实现多方位的跟踪。计算机视觉是一个集成系统,图像分析的时间有限,算法必须简单有效。本文采用的物流流水线视频图像如图1所示。图中红色矩形表示流水线中传输的物品,绿色区域为流水线中的物品处理区域。
系统会在视频图像中设计①、②、③、④四个计数区域,在物品进行相关处理前进行计数。计数方法为将每帧图像变为黑白图,图像中的红色变为白色,其余都变为黑色。当每幅图像中的红线部分中的白色像素超过一定阈值时,认为物体撞线,如图2所示,这时确定有需要计数的物品通过,可以开始计数。
3.1 主要算法
3.2 算法的运行结果
OpenCV是Intel公司开发的开源计算机视觉库。它提供了几百个C/C++函数,实现了计算机视觉领域中大部分最常用的算法。利用Intel开发的开源视觉库Intel OpenCV和VC6.0将上述算法转换为对应的源代码,可实现4个区域的物品计数。
3.3 算法的评价
该算法利用计算机视觉技术实现了物流流水线上的多方位计数,提高物流企业的信息化水平,节约了资金。算法简单,运行速度快,完全可以满足物流企业的实际需求。
4 结论与建议
本文所提出的算法实现了计算机视觉技术在物流企业的应用,为信息产业和物流业的融合提供了新的思路。但信息产业与物流产业的融合并不意味着引入信息技术后物流业的竞争力一定能提高。Berry(1995)指出了企业可以从6个方面来利用技术手段来提高竞争力,根据Berry的建议和我国物流业的实际情况,本文认为从以下几个方面来考虑如何通过与信息技术的融合提高物流企业的竞争力。
4.1 要有一个战略性的全局行动纲领
技术只是一种手段,使用技术的目的是为了企业发展服务,应符合全局发展的需要。因此物流企业高层管理者应该参与技术战略的制定,保证技术战略与全局战略一致,并有CIO(首席信息官)监控具体执行情况。而不应该盲目使用一些新技术或进行信息改革,造成企业不必要的损失。
4.2 解决主要问题
物流业作为服务行业其最终目的是为客户服务,使用信息技术的有效性应建立在为客户解决实际问题的基础上。因此信息产业与物流业的融合应体现在为客户提供更多的便利,或提供增值服务的基础上。
4.3 使用物流公共信息平台和建立物流信息系统,保证系统有效运转
通过现代物流公共信息平台的建设,企业可以及时获得需求信息,政府可获得物流业相关的调控和管理的宏观信息,实现互联互通。通过企业流程再造,利用含有CRM(客户关系管理)等模块的ERP系统,采用EDI(电子数据交换系统)、GPS、条形码、无线射频技术等先进技术,建立真正适应企业发展的符合现有服务模式的管理信息系统。
4.4 创新型物流人才的引进和培养
物流企业在自身提高业务流程和信息化水平的同时,还应注重创新型人才的引进和培养,特别是有国际大型物流企业管理和技术经验的复合型人才。
主要参考文献
[1] L Leonard,Berry. On Great Service:A Framework for Action[M]. New York NY:The Free Press,1995.
关键词:计算机工程;视觉领域;深度学习技术
引言
计算机视觉简言之即是依靠电子设备成像来代替生物视觉系统,随后依靠提前写好的程序对获取的图像信息实施处理。该技术的短期应用目的在于完成相对简单的智能视觉工作,而深度学习技术在计算机视觉领域的应用,在很大程度上丰富了其功能,提高了识别效率,让其能够在更多行业发挥出自身价值。
1计算机视觉领域的深度学习技术
1.1图像分类中的深度学习技术
基于深度学习技术,卷积神经网络得到了进一步的发展,其应用范围也更为宽泛,例如说在图像分类中的运用。图像分析需要对图像实施扫描分析,随后对其具体类别予以划分,更加注重其整体语义。目前相对普遍进行图像分类的数据集为ImageNet,其中囊括了非常丰富的内容,存储了近1500万个图像的URL并将图像划分为数万余个类型。ImageNet每年组织开展的大规模视觉识别挑战赛(ILSVRC)中,图像分类算法与技术也不断创新,图像分类的准确性也持续提升。ImageNet数据集表现出规模大、类型多的突出特点,所以更加适用于迁移学习,即是把部分核心技术或结构拓展应用到各个领域,对于视觉领域的深度模型来说,能够把模型内的网络结构和参数直接共享到其他数据集,从而对数据实施微调。图像分类属于计算机视觉领域最为基础的环节,对于图像分类模型创建和数据分析处理经验也能够迁移应用到其他领域中。
1.2目标检测中的深度学习技术
目标检测相对于图像分类而言表现出更多的复杂性,主要任务是在囊括多种不同类型物体的图像内精确定位和识别某一物体,恰恰是出于这一目的,深度学习技术在目标检测中的应用更为复杂,要实现更加精准的效果也相对更难。近年来针对目标检测的算法日益更新,如优化后的R-CNN算法,是借助于卷积神经网络思想,对物体进行分类,提取物体特征。而SelectiveSearch算法的出现有了进一步的创新和突破,有效促进了检测准确性的提高,这也给通过卷积神经网络进行目标检测带来了更多可能性,随后的FastR-CNN算法极大地促进了目标检测效率的提升,该算法对提取候选区的问题予以优化,大大减少了候选区提取和目标检测过程的时间。目标检测网络以FastR-CNN算法作为支撑,于输出位置设置滑动窗同时和候选区域网络实施连接,目标检测的关键在于卷积神经网络,依靠它把各个点的特征进行提取,再借助回归算法获得对应范围出现目标的概率[1]。
1.3人脸识别中的深度学习技术
人脸识别主要是借助相应算法对人脸特征实施提取,因为其建立的人脸模型表现出一定的不稳定性,因此模型建立往往也表现出一定的难度,相对于建立刚体模型而言更为困难。人脸识别通常来说涉及人脸检测定位以及特征提取两个方面,人脸检测定位是基于背景图像中将人脸目标分割出来,实施归一化处理,而人脸特征提取算法不变。前者存在的技术难点是人脸目标具有多样性以及背景图像具有复杂性,所以对背景情境实施合理假设并予以简化是十分关键的。与此同时,高维空间人脸模型的建立较为复杂,精确度估算难度较大,人脸特征提取的技术难度是因为人脸属于弹性模型,其难度超过刚体模型。一般来说,较为常见对人脸特征实施提取与识别的方法有几何特征法、特征脸算法以及弹性模型法,CNN算法和过去的特征提取算法比起来表现出更高的稳定性和适用性,同时能够有效抵抗外部干扰,促进人脸识别技术的推广应用。
2应用实例
2.1安防领域的应用
深度学习技术在计算机视觉领域中的应用可以为安防行业提供更佳的解决方案,比如说人脸识别技术的应用,很多大型企业如Facebook、腾讯、阿里巴巴等都将非常关注和重视。作为深度学习技术在计算机视觉领域应用的重要内容,人脸识别在安检以及反恐等领域中也能够发挥出很好的效果。与此同时,对行人角度的REID技术实施研究,依托于深度学习强化目标检测,对目标特征实施提取和刻画,能够为异常行为监控和跟踪带来支持[2]。
2.2无人驾驶领域的应用
对于无人驾驶领域来说,选择激光或雷达这类传感器的成本更高,基于深度学习的计算机视觉技术也能够提供新的解决方案。依靠摄像机对视频画面进行采集,对获取到的图像实施分析,提供类似于前车碰撞预警等功能。在这一过程中,计算机视觉技术可以实现对目标的检测识别、对目标车辆的跟踪分析、对车道线是否偏离进行检测等。基于深度学习技术的检测识别表现出更加强大的优势,现阶段深度学习芯片日益增多,对于无人驾驶技术的发展也带来了更加有力的支持。
2.3智能家居领域的应用
过去的很多智能家居产品一般都是依靠智能手机蓝牙或者WiFi等途径来实现对家居产品的控制,这一方案即便能够做到家居智能化,但其水平依旧有待提高。基于深度学习技术,能够有效促进智能家居行业的更新发展,除开语言、语音识别之外,还能够利用计算机视觉技术实现人际交流与互动,比如说手势识别控制。2.4教育领域和图片搜索领域的应用基于深度学习的计算机视觉技术也能够在智慧教育中得以普及应用,如近年来很多新的拍照解题App,使用者只需要利用手机相机拍照上传即可获得相关题目的分析解答,促进学习者学习效率的提升。此时视觉技术包括了对文字的检测与识别,另外针对个人简历识别、文档识别等方面也能够进行拓展应用。同时计算机视觉技术还可以在图片搜索领域中得以应用,使用者通过拍摄上传相应的图片,即可从数据库中找出与原图相似的图片,深度学习属于一种非常高效的技术手段,能够提供更加快速高效的图像检测功能,结合图像搜索引擎,为用户带来更加便捷的服务[3-5]。
2.5医疗影像数据中的应用
医学影像直接关系到对患者疾病诊断的准确性,对于放射科的医务人员来说,依靠医学影像能够促进诊断效率的提升。现阶段国内外诸多医学专家队伍,在心血管、肿瘤、神经内科以及五官科等都建立了精准深度学习模型,极大地推动医疗水平的提升,为广大患者带来了更加便捷和高效的医疗服务。基于深度学习技术的计算机视觉在医疗影像数据中的应用主要集中在如下几个方面:(1)能够提供临床诊断辅助等医疗服务;(2)依靠数据分析技术,能够在很大程度上促进医疗机构经营管理水平的提升;(3)在医学影像中的应用,能够让医务工作者更加直观便捷地获取患者影像;(4)深度学习技术能够为医疗大数据的可视化带来便利;(5)在药企研发工作中的应用,可以处理好过去一直以来药物研发周期长和成本居高不下的问题;(6)在健康管理领域中的应用,借助于可穿戴设备来对个人健康数据实施监测,进而对疾病风险予以提前预测。
关键词:计算机视觉;课堂考勤;深度学习;MCV架构
前言
随着国家标准《智慧校园总体框架》(Smartcampusoverallframework)的,智慧校园的规划与设计成为了校园建设的重点项目[1]。而课堂考勤作为学校教学管理、学生评价的重要组成部分,随着物联网技术、人工智能和移动通信技术的水平的提高与发展,更应该向着智能化、准确化的方向发展[2]。本文研究了的当前应用的课堂考勤方式,并做了进一步的分析,最终根据社会技术的革新与发展[3],提出了一种基于计算机视觉的实时课堂考勤系统的设计。我们的主要工作是搭建了整个系统框架,包括数据库系统、服务器、计算机视觉模型、网络通信、图像采集系统、客户端和网络通信系统。
1课堂考勤方式现状
目前校园中主要的课堂考勤方式存在为两种,分别是传统的考勤方式和生物识别的考勤方式。如图1所示,其中传统的考勤方式包括点名考勤和通过校园卡进行考勤,点名考勤的方式仍然是高校中最常用的考勤手段,因它不受场地的限制,可以根据点名册直接核对现场的学生信息,但这种方式存在的缺点就是花费时间,影响上课效率,为此有些教师不进行点名,因此影响了考勤的效果。校园卡考勤解决了点名占用课堂时间的问题,但这种方式具有学生代考勤的漏洞,因为学生可以拿着别人的校园卡进行考勤。生物识别的考勤方式包括指纹考勤和人脸识别考勤,这些方式有效解决了传统考勤方式代考勤的弊端,但这种方式受设备硬件的影响,识别能力太慢,尤其是在下课后学生较多,考勤签退时容易发生拥挤等现象,具有安全隐患[4]。因此,为解决当前考勤方式存在的一些弊端,本文设计了一种基于计算机视觉的实时课堂考勤系统。
2系统设计基础
2.1系统开发环境
本文设计的实时课堂考勤系统主要是使用Python开发语言,Python是目前最流行开发语言之一,主要应用于Web服务设计、大数据、人工智能等领域,它的主要优点是开发效率高、可扩展性强、跨平台和具有可移植性等,满足了本文系统的设计要求。另外,在开发过程还用到了基于Python的第三方软件开发包,包括Flask用于搭建系统的Web服务器;PyQt5用于搭建系统的客户端;OpenCV用于系统中对图像视频的处理;Tensoflow用于开发计算机视觉模型,搭建深度学习模型,完成人脸检测和识别任务;Mysqlclient用于管理、访问、查询和更新Mysql数据库。
2.2系统开发框架
本文设计的实时课堂考勤系统通信基于Web应用,因此选择一个合适的服务架构有利于提高系统的开发和部署效率。目前较流行的Web应用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)两种架构。本文使用了基于Python和Flask搭建的MVC架构[5],该架构如图2所示,主要包括模型层、视图层和控制器。使用该框架的优点是可将视图层和业务逻辑层进行分离开发,提高开发效率,方便系统的部署、维护和管理。
3系统设计方式
3.1系统总结构设计
本文设计的实时课堂考勤系统的总体结构如图3所示。根据MVC构架的设计,我们将该系统分为了模型层、控制器层和视图层,另外还包括网络通信设备。
3.2模型层设计
模型层主要是关系型数据库模,MySQL是目前使用最多的关系型数据库系统,也是学校管理系统使用最多的数据系统,为了更好地与学校管理系统兼容,我们选择了MySQL数据库,数据表之间的关系如图4所示。
3.3控制器层设计
控制器层主要包括服务器应用软件和计算机视觉模型,服务器应用软件的功能包括系统通信配置、数据业务处理和系统各模块间的调度。计算机视觉模型是实时课堂考勤系统的核心模块,基于深度学习卷积神经网络实现[6],主要作用是进行人脸检测和识别两个部分,计算机视觉模型的工作流程如图5所示。在人脸检测阶段使用VGG16检测器作为主干网络,为提高模型的检测准确率,通过引入注意力模型和多尺度特征融合对网络进行了优化,有效地从输入图片中提取人脸位置信息,得到人脸图像。在人脸识别阶段首先使用FaceNe人脸识别网络提取人脸图像的特征图,然后通过决策树算法与待检测的人脸特征进行匹配,从而识别图片中的学生信息。
3.4视图层设计
本文设计的实时考勤系统的模型层主要包括图像采集系统和客户端。目前各学校教室内都安装有监控设备,因此为节约成本和安装消耗,图像采集系统使用教室内的监控设备作为图像采集系统,负责采集教室现场图片。客户端设计首先在本系统中采用应用程序接口,然后在教学管理系统中设计图形化用户界面,通过应用程序接口调用本系统的功能,从而减少资源浪费,方便维护和管理。
4实时考勤功能的实现
实时考勤功能的实现方式如图6所示,首先系统启动后,用户可以随时更新考勤信息,比如在数据库中创建新的考勤表等。接着系统会自动读取考勤表的信息,比如课程所在教室、上课时间。然后启动考勤程序,进行签到、签退操作,并将考勤数据保存到考勤数据表中。整个系统启动完成后可以自动运行,直到关闭系统,而且可以实时进行课堂考勤。
关键词:农业机械;技术手段;应用;发展前景
我国在国际上的地位正在逐渐提高,这与我国的经济发展是分不开的,经济的发展需要基础的支持,农业就是我国的基础,我国是农业大国,农村人口基数大。随着近几年我国农业的发展,很多高新技术也被运用到农业的机械设备中,使农机设备向着智能化的方向发展,有效地提升了农业生产的整体效率。在农业的生产中使用高新技术还能够提高农业的生产效率,保证农机相关机械的正常运作。
1农业机械技术的应用分析
1.1计算机技术
这里所说的计算机技术主要指的是计算机视觉技术,这一技术最早被运用在农业机械上是在20世纪70年代中期,当时主要运用的是计算机技术中的视觉技术,利用这一技术的主要目的是可以对农产品的品质质量进行分级别检查。计算机视觉技术是以图像处理为基准,随着图像处理以及视觉模拟技术的发展,计算机视觉技术不仅可以用来检查农产品的品质,而且还可以用来对农产品进行播种、收割。虽然计算机视觉技术在我国农业技术领域的应用时间还不是很长,在实际的使用中还有很多的问题出现,但是相信随着科学技术的不断发展,计算机视觉技术必将会改变传统的农业作业模式,为现代化农业发展提供技术上的支持。
1.2网络信息技术
网络信息技术在我国农业机械上的应用是非常成功的,信息技术与地理信息系统的有机结合不仅可以为农业的生产提供高精度的监控,而且还能够对农业生产中出现病虫害的情况进行及时的检测,然后根据定位系统来进行田间作业。
1.3液压技术
液压技术主要依靠的是微电子技术和工业传感技术,在数据的采集上,运用液压技术主要完成的是能量的转换和匹配,其目的是为了让农业机械的效率能够得到进一步的提高,让机械设备的相关系统特征可以得到完善,让机械设备的可靠性能够得到提升,这也很好地符合了环境保护的相关标准要求。而大部分的农业机械都是采用内燃机作为原动力,所以很多时候都会出现工作负荷,一般情况下,我们都是通过电液控制手段来完成负载与原动力之间的匹配情况,尽可能地减少功率传输过程中出现的损失,从而提高农业机械系统的工作效率。
1.4人工智能技术
随着信息全球化的不断深入,高端技术不仅在大型的企事业单位中被运用,在农业中也得到了广泛的应用,比较有成果的就是美国利用人工智能技术研发出激光拖拉机、机械的内部导航装置,等等,这些装置可以对拖拉机的运行方向及所处位置进行实时的测定,在了解地区土地信息之后,再制定合理的土地种植方案、农药及种子的数量,等等。
2农业机械技术的发展趋势
2.1推广农业机械产品的技术发展
目前在我国的农业机械发展上,已经开始运用机电智能化技术和计算机技术,这使得农业机械化设备的科技含量有了极大的提高,不仅有效地提高了农业机械的作业效率,而且也提升了农业的生产效率。
2.2农业资源的利用率得到了提升
只有提高了农业资源的开发利用率,才能够确保农业实现可持续发展,同时也为保护生态环境奠定基础,如回收农业生产的废弃物,普及无害化的处理设备,运用无害化技术来处理废水可以有效地达到保护环境的作用。而在农业种植的过程中,使用有机肥料还可以进一步提高农业资源的利用效率。除此之外,大力发展节能型动力机械设备可以有效地避免出现资源浪费,从而提高农业资源的整体利用效率。
2.3提高农业机械产品的质量监督水平
要想提升农业的机械化水平,还要从规范设计的基本要求出发,全面提高农业产品的质量。在质量提升的过程中,还要注重农业产品的整体造型和外观,农机设备的耐久性也要经得起考验。选用与农机设备相配套的发电机及元件,能够最大程度上提高农业机械产品的质量。在农业机械设备完成安装之后,还要对其进行试运行,只有保证了设备各项指标都正常的基础上,才能够真正的投入使用,这也是提高农业机械产品可靠性的前提。
2.4加大政府的补贴力度
各级地方政府要加大农业机械的技术推广,做好农业机械的培训工作。国家还要将拖拉机、插秧机等农机具作为农具购置补贴的关键,普及农业机械知识。这样也能够更好地提高农业机械化的发展进程。
2.5确保农业机械技术的安全生产
关注安全监督管理及装备的创建工作,加大农业机械的安全投入,以便更好地满足农业机械工作安全监督管理的需求。除此之外,最重要的是,要将农业机械的安全检验工作纳入到各级县市政府的财政预算当中。
3结语
随着科学技术的飞速发展,一些高新技术正在逐渐地被运用到农业的机械设备中,这些机械设备的出现不仅提高了农业的整体生产水平,而且还进一步提升了农业的生产效率,很好地实现了农业的可持续发展。在今后的农业发展过程中,农业机械也必定是智能化的,所以要求操作人员要不断地提高自己的专业素养,全面推广农业机械新技术,只有这样才能够真正意义上实现我国农业机械的智能化。
作者:徐家亮 刘晓鹏 单位:黑龙江省克东县农机安全监理站
参考文献:
[1]陶乐然.长春星宇小区新技术应用[C]//增强自主创新能力促进吉林经济发展———启明杯•吉林省第四届科学技术学术年会论文集(下册).2006.
[2]刘蒙之.传播新技术与国家发展———一种政治经济学的观察[C]//中国传播学会成立大会暨第九次全国传播学研讨会论文集.2006.
[3]张仁江,田莉.制造业企业新技术采纳:动因、路径及障碍分析———基于T公司的纵向案例研究[C]//第六届(2011)中国管理学年会———技术与创新管理分会场论文集.2011.
[4]胡札进,姚尚斌,徐七三“.双低”储藏与四项储粮新技术的综合应用[C]//全面建设小康社会:中国科技工作者的历史责任———中国科协2003年学术年会论文集(上).2003.
[5]柳旭.浅析电视空间新技术对审美体验的影响[C]//2009中国电影电视技术学会影视技术文集.2010.
为了加快我国城乡一体化进程建设,农业机械自动化的地位变得越来越重要。但是由于我国农业人口多,以及长期以来经济技术落后的现状,使得我国农业机械自动化在发展的过程中依旧面临着较大的难题。就目前的情况来看,我国农业机械自动化技术的水平,与西方国家相比还有很大的差距。所以,如何促进农业机械自动化技术的发展,以及对农业机械自动化技术进行优化,已经成为解决三农问题的关键。本文从农业机械自动化对农村建设的意义出发,对农业机械的分类做了相关的介绍,并指出了农业机械化技术发展中存在的问题,最后对农业机械自动化技术要点及优化应用措施提供了建议。
关键词:
农业机械自动化;技术要点;优化措施
0引言
所谓农业机械自动化技术,指的是将控制论、计算机技术、液气压技术等应用到农业机械的设计当中,使农业机械可以独立完成田间耕作。随着科学技术的不断发展以及为了响应政府高效农业的号召,我国农业正逐步朝着机械自动化的方向发展。农业机械的自动化,不仅能够使劳动的生产效率得到提高,还能减轻农民的劳动强度,并且提高劳动舒适度,在一定程度上缓解农村劳动力短缺的问题。在科技高速发展的今天,世界各国都加大了对农业机械自动化技术的研究。很多科研成果已经从实验室走向了实用阶段。
1农业机械自动化对农村建设的意义
对社会主义新农村进行建设,是我国构建社会主义和谐社会的基本要求。社会主义的和谐与广大农村地区的和谐是不可分割的。虽然从整体上看,社会主义新农村处于较为稳定和谐的状态,但不可否认的是,社会主义新农村的建设也存在着一定的问题。其中,最主要的问题是农民收入过低。因此,我国要大力推行农业机械自动化建设,为减轻农民的劳动强度、提高农民的经济收入提供保障。
2农业机械的分类
通常来说,农业机械是由动力设备和与之配套的农机器具组成的。这两者之间主要是以牵引悬挂或者是半悬挂的方式进行连接。也有的农业机械将这两者制造成一个统一的整体。动力设备和与之配套的农机器具这两者在耕作的过程中,互相配合,缺一不可。
3农业机械自动化发展中存在的问题
我国农业机械技术在发展的过程中,并不是一帆风顺的,而是遇到了很多问题。首先,我国大型农业自动化机械在推广的过程中难度较大。很多农民没有意识到机械化生产的重要性,导致了他们不愿意在农业生产的机械方面进行投入,最终造成了我国大型农业自动化机械供大于求的尴尬。第二,我国的农业机械制造水平较低。与西方国家相比,我国农业机械制造的起步较晚,在很多方面,科技水平还不够成熟。第三,我国对农业机械自动化技术的研究缺乏足够的动力。我国大型农业机械的制造企业,以及科院院所存在着资金不足、科研环境较差的问题。对农业机械进行设计,不仅需要耗费大量的时间和精力,还需要一定的技术条件作为依托。我国大部分科研院所和农业机械制造企业,由于资金不足,并没有完成对实验室的配套建设,使得科研人员在进行工作时困难重重,这一现状也严重影响了科研人员的工作积极性。第四,自动化技术在农业机械的应用中还处于起步阶段。对自动化技术的应用,需要很高的科技水平作为依托,但是我国科技基础薄弱的现实,使自动化技术的应用变得困难。
4农业机械自动化技术要点及优化应用措施
4.1实现计算机技术应用于农业生产
计算机视觉技术,作为新时期重点研究和应用性广泛的新科技,很多西方国家先后展开了对计算机视觉技术的研究。计算机视觉技术在农产品质量的鉴定方面,以及在记录农产品生长的信息等方面有着十分重要的作用。英国对计算机视觉技术的应用进行了首次尝试,利用该技术研制了专业性的采蘑菇机器人。采蘑菇机器人在采蘑菇的过程中,不仅能够对蘑菇的位置进行精准的定位,而且能够对所采的蘑菇进行合理化的分类。受到英国的影响和启发,我国国内也开始尝试在农业机械自动化技术中,加入计算机控制技术的内容。但是由于我国的经济技术发展还不够成熟,要实现对计算机视觉技术的应用,还需要科学家们进行努力。
4.2实现农业施肥和灌溉技术的自动化
我国水资源总量虽然比较大,但是人均资源占有量却很小,而且我国水资源分配的不够合理,使得我国水资源长期处于短缺的状态。要促进农业的发展,充足的水资源是必要的条件。在保证农业生产用水的同时,保证对水资源的节约,是我国农业发展过程中必须要面对的问题。农业自动化灌溉技术的应用可以很好地解决这一问题。所谓农业自动化灌溉技术,是把传感器与电子计算机进行有机结合,把农作物生长过程中对环境的需求及对用水量的需求,通过软件的形式加以呈现,从而避免水资源的浪费。对农业施肥技术来说也是如此,实现农业施肥和灌溉技术的自动化,是节约水资源、降低农业生产成本、避免浪费以及保护环境的必然选择。
4.3实现农业的精准化
农业精准化是指将我国的传统农业与农业机械自动化技术相结合,实现农业生产管理的科技化。精准农业是未来农业发展的主要方向之一。农业生产自动化,是一项以计算机网络和控制器等为基础的技术。我国对精准农业的研究,已经取得了一定的科技成果。世界上第一台观测农业气象的自动化仪器,已经在我国郑州气象站开始投入使用。农业气象观测仪,可以对农业生产的小环境进行合理化监测,并且通过网络把监测到的信息及时反映给当地农业部门。
总之,在经济全球化进程不断加快和城市化进程高速发展的今天,给各个行业带来机遇的同时,也带来了挑战。为了在经济发展的大潮中处于不败的地位,加强科技创新是一项必不可少的选择,同时也是长远发展的根本要求。对于农业产业而言,为了使我国农业能够更好更快的发展,政府要提高对农业机械自动化技术研究的投入,并将新的科技成果不断应用到农业生产中。作为科技工作者要努力钻研农业机械自动化技术,并且要对农业机械自动化技术的应用措施进行优化,从而实现农业的智能化时代,创造出我国农科发展的新道路。
作者:杨亚杰 单位:河北农业大学
参考文献:
[1]刘洋.我国农业机械自动化应用现状和推进模式探讨[J].化工中间体,2015(11):11-19.
关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物
中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3
计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。
1 计算机视觉中与摄像机定标解析
计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。
2 传统的摄影机定标方法及应用特点
传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。
2.1 基于3D立体靶标的摄像机定标
这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。
这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。
2.2 基于2D平面靶标的摄像机定标
基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。
这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。
2.3 基于径向约束的摄像机定标
基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。
总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。
3 摄像机自定标方法及其应用特点
摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。
3.1 基于主动视觉的自定标法
目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。
这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。
3.2 基于Kruppa方程的自定标方法
基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。
这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。
3.3 分层逐步定标法
分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。
这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。
3.4 基于二次曲面的自定标方法
基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。
在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。
4 传统摄像机定标方法与自定标方法优缺点分析
从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。
4.1 传统的摄像机定标方法弊端
传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。
总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。
4.2 摄像机自定标方法相关问题
目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。
5 结束语
随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。
参考文献
[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.
[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.
[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.
[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.
[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.
[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.
[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.
[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.
本文深入地分析了当前实施人脸检测技术的可行性,并对本方案实施的优势进行了概括。
【关键词】人脸检测技术 计算机技术 识别技术
1 人脸检测的前景
人脸检测作为近年来生物识别领域的一个热门研究方向,具有操作方便,用户易于接受,事后追踪能力强等优点。但是因为人脸检测与识别运行的过程往往需要大量的运算,并且其算法并不简单,因此目前大部分人脸检测与识别系统的设计与开发都需要立足于计算机技术。下面笔者将会对以计算机平台为基础的人脸检测的实现过程展开详细的论述与分析。
2 相关技术研究现状
2.1 人脸图像的获取与预处理
一般情况下,摄像头负责对人脸图像的摄取,除此之外,专门的图像库也是人脸图像的来源之一。前者多应用于系统的应用阶段,一般来说,它不仅仅可以作为应用系统存在,也可以作为研究系统存在;而后者多应用于研究阶段,并且它只能作为研究系统存在,是基于标准人脸图像库而存在的。
获得需要的图像之后,接下来就要对图像进行预处理,这一环节对于人脸检测与识别系统的应用来说,是非常关键的。在获取图像的过程中,会受到外部复杂环境的影响,例如灯光亮度、配套设施好坏、噪声干扰、对比不明显等等。并且,由于距离与焦距存在的差异,导致无法确定人脸所处的具置。因此,图像预处理这一环节是必不可少的,有了这一环节才能确保图像上人脸所处位置与大小比较恰当。人脸扶正、人脸图像增强及其几何归一化和灰度归一化等都是图像预处理环节主要的工作内容。而图像变换增强、直方图均衡法、非线性平滑滤波、图像的归一化等则是图像预处理过程之中所运用的主要方法。
2.2 人脸检测技术
人脸识别是否能够具有较好的识别性能,取决于人脸检测的性能水平的高低,因此可以说,人脸检测是人脸识别得以实现的前提条件。借助人脸检测算法技术,检查并测验静态图像(动态视频帧),从而准确的对此图像(视频)进行判断,从而知道此图像是否具有人脸图像,假若判断此图像具有人脸图像,则需要明确其所处区域及图像数值大小,这就是人脸检测。高效率与检测精准是用户对人脸检测的一个普遍性评价,现如今这项技术已经获得了用户的认可,专家学者也对其展开了更深入的分析研究。
人脸图像所囊概的特征是非常丰富的,例如肤色、人的轮廓、结构等特征都是极具代表性的,此外其系列图像往往还会涉及到一些其他信息,例如运动状态等。基于这些特征信息,研究者设计了许多人脸识别的检测算法,按照这些方法的思想策略大致可将人脸检测方法分为4类:基于知识的方法、基于模块匹配的方法、基于外观形状的方法和基于特征的方法。
2.3 人脸识别技术
借助对相应的人脸识别算法的运用,辨别出图像上的人脸的身份信息,第一步是对图像进行搜索,从而找出图像上的人脸目标,然后识别人脸目标体的身份信息,这就是人脸识别。
以人脸识别技术的发展状况作为划分的依据,研究工作往往将人脸识别技术划分为四种类别,分别为:其一是几何特征为基础的;其二是以统计特征为基础的;其三是以机器靴子为基础的;其四是以局部模式为基础的;
3 选择的硬件平台
3.1 图像输入
人脸图像的输入部分可以是普通的USB摄像机、网络摄像机等,也可以将已经拍摄好的图像存储在硬盘等存储设备。因此其应用往往不会受限于特定的场所。
如果摄像机选择的性能比较差一些,会增加后面算法的复杂度;此外还会对人脸检测与识别的最终效果造成一定的影响;为了提高系统的性能,所以应该选择性能比较好,产生的相片噪声比较小的相机。
3.2 中央处理
本方案中的中央处理部分选取的是计算机的CPU;因为现在CPU的功能强大,再加上良好的微软系统,使得系统的性能大大的提升。
作为系统的中心处理部分,应该选择一台专门的服务器来处理图像的检测和识别。这是由于图像往往需要占据大量的内存,在实施算法的过程之中会耗用较多的资源。
4 检测系统的组成
4.1 计算机视觉库OpenCV的介绍
Open CV是计算机视觉库,它是跨平台的,并且以(开源)发行为基础,能够在很多操作系统上运用,例如Linux、Windows、Mac OS,其具有的C函数跨平台的中、高层API高达五百个。由于其有着丰富的视觉处理算法,因此在数字图像处理领域之中的运用非常普遍,例如物体、人体、人脸等的识别。本文后面分析工作的开展都是以Open CV计算机视觉库为基础的。
4.2 人脸图像采集模块
原始的人脸图像一般是在用户注册时采集的,一般会在几副到十几幅之间, 且采集到的这些人脸图像需包含该人脸的不同的表情和多种姿态。人脸采集是人脸检测的第一个步骤,笔者在前文现状分析的基础上,为使人脸检测更加精确,结合了人眼与人脸检测两种技术。成功获取人脸图像后将会步入图像预处理这一步骤,相应的工作内容不再赘述。
当然进行人脸识别时的图像采集工作也是由此模块来完成,采集完需要进行归一化、图像均衡、灰度化、直方图增强等预处理,之后根据当前处于训练阶段还是识别阶段将其送入人脸特征提取模块。
4.3 人脸特征提取模块
这一模块的主要工作是提取人脸图片的特征,随后开展降维处理,最终在数据库之中录入该特征,方便人脸图像识别模块对图像的识别。在前文人脸识别技术研究现状分析的基础上,笔者认为此模块工作的开展,首先可以采取人脸区域先分块再提取特征的方法。
4.4 人脸图像识别模块
人脸识别系统的好坏很大程度上取决于人脸识别的设计水平与其所挑选的计算方法,因此可以说,人脸识别系统的关键在于人脸识别。现如今,以小波分析为基础、以视觉联想为基础、以人脸表情为基础的人脸识别技术是运用最普遍的。因此,本文的关键点就在于此,要查阅相关资料,从而挑选出最恰当的算法。
5 结论
我们以OpenCV和计算机为平台,对人脸图像的预处理、人脸图像的特征提取和人脸图像的识别算法进行仿真分析和优化。这样,我们就可以充分利用人脸识别现有的算法,并进行优化,来实现快速高效的检测和识别系统。
参考文献
[1]朱文佳,戚飞虎.快速人脸检测与特征定位 [J].中国图像图形学报,2005,10(11):1455-1458.
[2]王志良,孟秀艳.人脸工程学[M].北京:机械工业出版社,2008.
作者简介
宋家慧(1978-),女,山东省苍山县人。大学本科学历。现为广西机电职业技术学院讲师。研究方向为计算机应用、数据库应用和数据挖掘。