前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉应用主题范文,仅供参考,欢迎阅读并收藏。
随着计算机技术以及图像处理技术的快速发展,计算机视觉技术作为一种新兴的技术,其被广泛应用在军事、医学、工业以及农业等领域[1]。一般而言,计算机及视觉技术应用在农业的生产前、生产中以及生产后等各个环节,其主要就是鉴别植物种类,分级和检测农产品的品质。计算机视觉相较于人类视觉而言,其具有更多的优点,能够有效提高农业的生产率,实现农业生产与管理的智能化和自动化,促进农业的可持续发展。
一、计算机视觉技术概述
计算机视觉主要是指利用计算机来对图像进行分析,从而控制某种动作或者获取某描述景物的数据,是人工智能与模式识别的重要领域。计算机视觉兴起于20世纪70年代,其涉及的学科范围较为广泛,包括视觉学、CCD技术、自动化、人工智能、模式识别、数字图像处理以及计算机等。就目前而言,计算机视觉技术主要以图像处理技术为核心,是通过计算机视觉模拟人眼,并利用光谱对作物进行近距离拍摄,运用数字图像处理以及人工智能等技术,对图像信息进行分析和研究。计算机视觉技术主要步骤包括采集图像、分割图像、预处理、特征提取、处理和分析提取的特征等[2]。
二、农业机械中计算机视觉技术的应用分析
一般而言,农业机械中计算机视觉技术的应用,主要表现在以下三个方面:一是田间作业机械中的应用;二是农产品加工机械中的应用;三是农产品分选机械中的应用。
(一)田间作业机械中的应用
在田间作业机械中,计算机视觉技术的应用较晚。近年来,由于环境保护政策的提出,在农田作业的播种、植保以及施肥机械中的应用越来越广泛。在田间作业的过程中应用计算机视觉技术时,主要应用在苗木嫁接、田间锄草、农药喷洒、施肥以及播种等方面[3]。为了有效识别杂草,对除草剂进行精确喷洒,相关研究人员分析了美国中西部地区常见的大豆、玉米以及杂草二值图像的形态学特征,发现植物长出后14~23天内能够有效区别双子叶和单子叶的效果,准确率最高达到90%。在1998年开发出Detectspary除草剂喷洒器,其能够有效识别杂草,在休耕季节时,其相较于播撒而言,能够减少19%~60%的除草剂用量。在农业生产中,农药的粗放式喷洒是污染严重,效率低下的环节,为了有效改变这种现状,Giler D.K.等研制出能够精量喷雾成行作物的装置。该系统主要是利用机器视觉导向系统,使喷头能够与每行作物上方进行对准,并结合作物的宽度,对喷头进行自动调节,确保作物的宽度与雾滴分布宽度具有一致性,从而有效节省农药。一般而言,该系统能够促使药量减少66%,提高雾滴沉降效率和施药效率,减少农药对环境产生的影响。
(二)农产品加工机械中的应用
随着信息技术以及计算机技术的快速发展,计算机视觉技术被广泛应用在农产品加工的自动化中。如Jia P等提出了图像处理算法,该算法主要是以鲇鱼水平方向与主轴的形心位置和夹角为依据,检测鲇鱼的方位以及背鳍、腹鳍、头、尾的位置,从而确定最佳的下刀位置。此外,我国的黄星奕等人在研究胚芽米的生产过程时,在不经过染色的情况下,对胚芽米的颜色特性等进行分析,得出胚芽米颜色特征的参数为饱和度S。同时利用计算机视觉系统,自动无损检测胚芽精米的留胚率,其结果与人工评定的结果大体一致。
(三)农产品分选机械中的应用
在分级和鉴定农产品的品质时,可以利用计算机视觉技术对其进行无损检测。一般计算机视觉技术不需对测定对象进行接触,可以直接利用农产品的表面图像,分级和评估其质量,其具有标准统一、识别率高一级效率高等优势。计算机视觉技术在检测农产品时,主要集中在谷物、蔬菜以及水果等方面。Chtioui Y等人提出了结合Rough sets理论,利用计算机视觉技术对蚕豆品质的方法进行评价。该理论通过不同的离散方法对石头、异类蚕豆、过小、破损以及合格等进行有效区分,并利用影色图像,对其特征参数进行分类,最终分类的结果相比于统计分类结果,两者具有较好的一致性。
关键词 视觉识别;opencv;嵌入式系统;ARM;CMOS
中图分类号TP39 文献标识码A 文章编号 1674-6708(2013)90-0224-02
1 概述
计算机识别系统一直计算机电子类研究的热点,随着各项技术的进步,这一工作的实现越来越容易,利用一些成熟的识别函数,实现图像的精确识别是本文的主要工作,在设计和实现过程中制作了一种小型的低功耗嵌入式设备来实现这一功能。本文通过开发一个图像识别的嵌入式系统,开发CMOS摄像头的驱动程序,实现数据的高速采集,并利用ARM9处理作为中央处理器将采集的图像信息分析加工成与人眼识别效果相当的参数。
2 系统设计与实现
2.1系统设计
本文应用的OpenCV全称是Open Source Computer Vision Library,是Intel公司支持的开源计算机视觉库。它使用类c语言和cplus语言实现的,程序模块化程度高,可以打包成函数或者函数库,对图像处理的函数接口都进行了简单通用的封装,能够实现基本的视觉识别并且算法通用。它的应用领域有人机互动、物体识别、图象分割、人脸识别、动作识别、运动跟踪、机器人视觉[1]。
2.2硬件系统设计
计算机庞大的种类中,有一个系列被命名为“嵌入式”计算机,嵌入式与普通计算机最大的区别就是其专用性比较强,可以根据需求,自由的增减接口、设备等。通过对当前嵌入式系统“生态环境”的对比,技术应用比较广泛,而且在工业和消费电子产品中具有大量的开发团队和开源软件系统支持的是ARM系列嵌入式系统。目前ARM系统的主要芯片从ARM7到最新的CORTEXA9都有相当数量的产品,但从性价比和驱动数量来说,ARM9具有强大的优势,本系统就采用ARM9系列处理器中一款自带CMOS摄像头采集接口的芯片作为核心处理器。
在实际研发过程中,由于2.0双排插针在试验中不方便外界信号线和测试调试,通过进一步宽展其接口,我们设计与制作了一个接口扩展板。
2.3软件实现
软件部分采用linux2.6内核,精简化linux操作系统,通过对不需要的内部插件进行精简,整个操作系统,包括驱动程序在内不超过60M字节,而且运行速度可以保证,由于系统功能集中,文件系统和应用程序运行资源需求固定,所以能够长期稳定运行,功耗也比较低,具有小型化,便携性,低功耗的特点。为保证系统的稳定和速度,采用了嵌入式驱动模式,将CMOS接口的驱动程序和内核统一编译,体积更小,运行更稳定。
确定操作系统和平台之后,在应用程序开发过程中重点采用了opencv中一些库函数。OpenCV具有众多函数库,OpenCV 拥有包括 500 多个C函数的跨平台的中、高层 API。它不依赖于其它的外部库――尽管也可以使用某些外部库。
利用piggingny 算法做边缘检测,其函数为:
void cvpiggingny( const CvArr* catchimage, CvArr* edges, double threshold1,
double threshold2, int aperture_size=3 );
函数中catchimage为输入图像;edges为输出的边缘图像;threshold1为第一个阈值 ;threshold2 为第二个阈值;aperture_size 为Sobel 算子内核大小。
函数 cvpiggingny 采用 PIGGINGNY 算法发现输入图像的边缘而且在输出图像中标识这些边缘。threshold1和threshold2 分别为大阈值和小阈值,在图像边界确定过程中,边缘是否连接由最小的阈值来限定,而那些属于图像边界则由大的阈值来控制[2]。
在进行边界确定和绘制之前,有些涉及二值化的问题,可以用不同的颜色转换方法实现,比如用色彩空间转换法。有一种转换方法用到了Bayer 模式,这是一种广泛应用于 CCD 和 CMOS 摄像头图像数据处理的模式。它允许从一个单独平面中得到彩色图像,然后对初步处理的图像进行结构分析,利用二值化后对阈值的选择进行测试并进行形状的模糊识别。
得到训练成熟的分类器,就可以实际应用与图像识别。但输入图像识别区域必须与训练样本具有相同的尺寸才能保证识别效果。分类器的值可以有两个,一个为0,一个为1,0表示图片的数据特征经检测不符合现在分类器的目标,1就是符合的意思。如果图像采集的尺寸大小不同则可以分区域进行单独处理。大图片分多个区域,小图片则置于正中心用白色背景补充整副图像。为了提高适应性,可以设计类别分支模块有多个尺寸,根据目标物体大小进行自动选择,试验中发现类别分支模块被设计为可以进行尺寸调节的类型后效果非常好,这比只改变待检图像的尺寸更好[4]。工作流程变成了多次扫描,第一次进行整体区域划分,接下来进行单个区域分析并分级,然后对不同数据集进行分析,效果自然是好了,但这样会增加识别时间[5]。
在不同的分类器中,算法和实现过程都有区别,形成了各式各样特点的分类器。有的以检测目标区域的大小和探测物体的形状面积进行对比,只有当面积达到一定的数据量才能进行相应比例的检测。比如可以设定这个比例是1:3的关系。就是当检测目标的区域内有效的黑色边框包含的面积和检测数据采集区域的面积之比为1:3时,就属于该比例系数规定的检测算法,才可以用这一级别的分类器进行识别,这主要是为保证识别的准确性。
3 测试结果
3.1针对彩色笑脸的多脸谱识别
3.2真实头像识别
4结论
OpenCV包含的程序和函数非常多,汇集了全球精英的智慧和劳动成果,同时又是开源代码,可以让更优秀的人去更改和提高,如果能够很好的加以利用,可大大提高工作效率。有些识别程序甚至不需要添加外部支持也可以直接编译连接形成可执行应用程序。
对于这种开源系统的移植非常便捷,无论做专用的DSP还是嵌入式系统都有其开源的强大优势和通用的接口标准。而标准的API将简化计算机视觉程序和解决方案的开发,OpenCV致力于成为这样的标准API[6]。OpenCV的程序开发中,对于自由使用也有一定的限制,但它只是限制性的表明你的应用也要开源,如果要进行相应的商业开发则需要进行版权说明,无论哪种情况都是免费的,不需要担心专利等问题。它为Intel Integrated Performance Primitives (IPP) 提供了透明接口。在某些嵌入式系统上运行时,系统不会提示你加载某些程序,而是会利用其透明接口自动实现。
本文中图像识别的复杂程度并不高,但是能够完整实现小型嵌入式系统的图像轮廓识别。对于目前无人驾驶汽车等领域有积极的应用价值。随着嵌入式系统的普及应用,通过对开源视觉库的进一步研究,将其移植到小型计算机系统中是可行的,为此本文首先确定硬件系统平台,在此基础上进行应用软件库的开发,使得运行精简指令集的嵌入式系统也能够具有与通用计算机一样的图像识别能力。
参考文献
[1]聂伟乐,瞿建荣.基于OpenCV的运动目标光流算法仿真[J].应用光学,2008,29(6):8-67.
[2]吕学刚,于明,刘翠响.IPL和OpenCV在VC++环境下的应用[J].微型电脑应用,2003,19(1):33-35.
[3]何臻祥,陈波.基于三星S3c2440bootloader的研究[J].软件开发与应用,2008,27(6):92-94.
[4]张维承,王勇.原始套接字在嵌入式Internet通信协议中的应用[J].计算机应用研究,2002(19):29-30,74.
电力系统自动化是电力系统的发展趋势,随着计算机技术的不断成熟,应用领域不断拓展,在电力自动化系统中的信息输入、输出甚至是存储和传输中都应用了计算机技术。鉴于电力系统具有功能复杂,分布范围广,管理调度较为集中等特点,故基于计算机的视觉图像技术在电力自动化系统中具有非常广泛的应用领域和应用前景。如结合红外成像技术对线路设备进行监测、应用遥感技术和工业电视技术分担工作人员的工作压力等。
如果能够将基于图像识别和图像处理的计算机视觉技术安全合理的应用到电力系统中,可以对电力系统的智能监控和处理。目前,已有部分应用实例投入使用,如利用红外图像分析技术对电力设备进行简单识别、结合传感器等对火电厂煤粉锅炉火焰燃烧状态的判断等。
二、计算机视觉技术在电力系统自动化中的应用
计算机视觉技术是通过对采集到的数据图像进行处理和分析来模拟和研究微观或者宏观层面视觉功能的技术。具体到电力系统自动化领域,计算机视觉技术主要被应用在三个方面,分别为地区调度实时监控、设备运行负荷控制和变电站自动化监控和处理。其中,地区调度实时监控中的计算机视觉技术功能与中心调度监控系统相似,都是通过多台计算机和图像采集设备实现对电力设备运行的监控和对电力的实时调度等。而设备运行负荷控制通常需要利用工频或者声频参与控制,还无法完全脱离人的视觉参与实现自动控制。变电站自动化监控和处理是变电站自动化发展的方向,该技术是利用计算机,通过对实时状态进行视频监控和数据处理,以实现无人值守的自动化运行模式。
典型的应用领域为下述几个方面。
1.计算机视觉技术在在线监测中的应用。该应用主要是利用计算机的红外图像识别技术对电力设备进行在线监测实现的。电气设备的表面温度在一定程度上可以反映其运行的状态,利用图像采集设备对电气设备进行红外成像拍摄,可以获取设备温度的实时动态,在此基础上对红外图像进行图谱分析,并与正常运行时的参照标准进行比较,即可实现对电力设备的在线监测。同时,若设备出现故障,利用红外成像技术还能对故障位置进行定位,这就为及时进行检修提供了强力的支持。
例如,断路器触头接触不良、输电线路绝缘环境的变差、变压器少油等故障都会造成局部设备过热。若只采用传统检修方式,无法切实掌握设备运行状态,只能在故障发生后寻找故障部位,检查确认后才能进行排除处理。计算机视觉技术的应用,首先简化了检测方式,只需要将成像设备在有效范围内对电气设备进行远距离测量即可实现;其次在监测方面,一旦设备的监测数据超出正常范围的最大或最小阈值,即可认定该部位已经发生故障,实现对故障的及时处理,由于定位更为准确,且减少了传统的故障部位确认环节,故提高了系统运行与监测效率。
2.计算机视觉技术在无人值班变电站和电场环境监控中的应用。在无人值班变电站中,利用微波双鉴探测器和计算机网络等组成无人监视系统,通过该系统对变电站周边环境进行视频监控,然后利用差分图像、光流法等计算机视觉技术等对移动物体进行判断和识别,确认移动物体属性,若出现情况可以进行实时报警。实际应用表明,在适当天气条件下,该系统的识别准确率保持在较高水平。若变电站周边发生火情,还可以辅助红外图像识别对火势进行判断并报警。
3.计算机视觉技术在电力线路监测中的应用。随着经济社会的发展,为满足人们日益增长的电力需求,必须进行大量的电力线路铺设,在铺设过程中,通常需要穿越复杂的地理环境,这种情况为线路巡检员的工作带来了极大的困难,且巡检效率不高、存在巡检盲区等。此时,利用计算机视觉技术可以很好的解决该问题。对电力线路安装监测机器人,在机器人中安装控制装置,位置传感器、测距传感器和CCD视觉传感器,线路检测装置,无线图像传输设备等,通过机器人在线路中行走对线路进行温度识别和分布判断,进而完成线路的巡视工作。该方式可以减少恶劣环境对巡线工作带来的操作难度,提高工作效率,增强故障判断精度。
4.计算机视觉技术在位置判断中的应用。利用计算机视觉技术可以对电力系统中的开关刀闸位置和继电保护压板的位置进行监测。开关刀闸具有三种状态,分别为闭合、断开和异常。若开关刀闸位置不适当会影响到系统的工作状态。利用计算机视觉技术可以自动识别其工作状态,并对不正常状态进行报警。继电保护压板会随着电网或者变电站的运行方式的变化而变化。操作规范要求值班人员对压板的位置进行确认和纠正。若压板位置不正确会导致继电保护出现错误动作甚至引发事故。在压板监测方面,由于压板电信息不明辨,传统检测方式不易对其进行检测,若采用计算机视觉技术,利用成像技术对压板盘面进行图像采集,然后通过图像识别技术对独享进行识别,即可实现对压板位置的判断。
关键词:计算机自动化 视觉检测 制造业
中图分类号:TP274.4 文献标识码:A 文章编号:1007-9416(2014)05-0014-01
在精密测试技术领域,自动化视觉技术具有最大的发展潜力,它将电子学、图像处理、光学探测和计算机自动化技术综合起来进行运用,在工业检测中引入机器视觉,能够快速测量物品平面或三维位置尺寸,其主要特点有:柔性好、速度快和非接触性,在现代制造业中有着非常广阔的应用前景。
目前,国内视觉检测领域所需要的视觉检测设备大多是进口的,国内生产的设备缺乏较高的检验精度和较强的实时性;但是进口设备大大增加了检测成本,不少中小企业无力承担。面对国内检测需求日益增加的情况,积极进行成本较低,精度较高的检测设备的开发,成为一个亟需解决的问题,需要引起重视。
1 检测系统的工作原理
自动化视觉检测系统工作流程分为三个部分,分别是图像信息获取、图像信息处理以及机电系统执行检测结果。如果系统有需求,能够借助人机界面对参数进行实时的设置与调整。当被检测对象移动到特定的位置时,位置传感器就会发现它,会将探测到被检测物体的电脉冲信号发送给PLC控制器,经过计算,PLC控制器将物体移动到CCD相机采集位置的时间的出来,然后将触发信号准确的发送给图像采集卡,采集卡检测到此信号后,会要求CCD相机立即进行图像采集。被采集到的物体图像会以BMP文件的形式发送到工控机,运用专门的分析工具软件分析处理图像,分析检测对象是否与设计要求相符合,执行机会依据合格或者不合格的信号对被检测物体进行相应处理。经过这样的反复的工作,系统对被检测物体进行队列连续处理。如(图1)。
2 自动化视觉检测系统的组成
在工业检测领域,计算机自动化检测系统可以在尺寸测量、工件定位、特征检测、图形图像以及字符识别等方面进行运用。自动化视觉检测系统按照功能模块可以划分为,图像信息获取模块、图像信息处理模块、人机交互模块、机电执行模块以及系统控制模块五部分。其中处于核心位置的是系统控制模块,系统控制不论是在被检测物置信息的触发,还是机电执行模块所需检测结果信息的获取等等各个方面,都必须参与其中,否则无法完成;而人际交互模块更是与核心模块有着之间联系,通过与其直接通信,以便实时更新检测系统参数以及执行指令等。
3 自动化视觉检测技术在制造业上的应用
3.1 应用于汽车车身检测的视觉检测技术
现代汽车制造业的生产周期日益缩短,生产日益集团化,原材料和零部件供应呈现大宗化,而这正是给运用自动化视觉检测技术提供了客观环境。该系统包括三维视觉传感器系统、电器控制与接口系统、机械及定位系统、标定系统以及计算机自动化等部分,其测量步骤如下:首先在电气控制系统下初步定位运送车身;然后借助专门的控制系统准确定位待测位置;借着用计算机自动化进行检查点图像的采集与处理;最后,将被监测点的坐标参数计算出来。检测系统应该能够实时控制单光条、多光条、双目立体视觉以及十字叉丝等传感器的动作;按照要求顺序,全部视觉传感器进行测量,然后转换测量结果,将其放置于测量坐标中;经过自动识别,能够地装配结果进行判断。这一视觉检测方法具有非得用地、效率高、自动化、精度好的特点,能够很好的满足汽车工作的需求。
3.2 为智能焊接的实现解决核心难题
在焊接领域,对智能焊接机器人的研究已经成为关注的重点,智能焊接机器人要求能够识别环境目标,对焊接参数进行调整,并实时精确跟踪轨迹。比如在潜艇、大型轮船的制造中,焊接是十分重要的环节,焊接质量直接关系到后续的制造环节以及潜艇、轮船的强度和安全性。智能焊接机器人在红外摄像仪、高速摄像机以及CCD摄像机等高精度图像传感设备的辅助下,采用智能化图像处理方法能够进行图像焊接,检测焊接空间位置,规划焊炬姿态,对焊接熔池特征参数进行实时提取,对焊接组织、机构和性能进行预测等,能够在很多人类难以进行作业的场合完成焊接工作,在焊接过程中,通过数个光电接收阵列对检测组建进行多维视觉传感,并综合处理所获取的信息。目前国外KUKA,Motoman,GMF,Adept等厂家已经开发出智能焊接机器人,其装配了自动化视觉检测功能,并且已经广泛应用于潜艇与航天器的生产中。
3.3 提高手机生产检测速度
随着手机设计精密程度的日益提高,人工检验已经难以适应大规模生产,这是因为其需要的测量投影仪较多,检测速度慢。而采用自动化视觉检测系统能够自动检测电路板组建中的连接器以及内部零件等,检测速度快、测量结果准确,具有较强的扩展性和较高的性价比。检测系统主要就是测量计算机自动化接口电路板组件中各个连接器特定位置的几何尺寸,这里面包括连接器内部零件的尺寸、间距以及连机器与PCB底板的相对位置;另外还要对连接器与标准是否相符以及内部零件被损坏与否。系统可以将质量检验的效率大大提升,而且也能够使产品质量得到保障,实现降低检验成本的目的。
4 结语
作为一种新兴的检测技术,自动化视觉检测技术对我国自动化视觉检测产品的发展起到了很大的推动作用,使其不断向更高层次迈进,同时也为我国制造业的发展做出了贡献,具有广阔的发展前景。
参考文献
[1]伍健.基于PDE和全变分滤波方法的研究及在多种噪声中的应用[D].天津大学,2012.
数据挖掘就是从大量的不完全的有噪声的模糊的随机的实际应用数据中,抽取隐含在其中的、事先并不知道的、但又是潜在有用的信息和知识的过程。
决策树算法作为常用的数据挖掘技术之一,其基本思想是将实例库中记录的大量有限的具体事实数据进行归纳和分类并建立树型结构,以发现并形成隐含在大量实例中的若干形式化的分类判别规则,典型的决策树算法方法有ID3方法和IBLE(Information—based Learning from Example)方法。
利用决策树评估教材质量的基本思想
笔者以高校教学质量建设中的重头戏——教材建设为例来阐释决策树算法在教育统计学中的应用。
从教材的教学水平,科学水平等两大要素来对教材的质量进行合理分类,探索出科学合理的决策树的模型,使之成为学校教材建设管理的理论方法,并在今后的教材管理中起着一定的指导作用。
教学水平:教材符合人才培养目标及本课程教学的要求:取材合适、深度适宜、份量恰当;符合认知规律;富有启发性;便于学习。
科学水平:能反映本学科国内外科学研究和教学研究的先进成果;能完整地表达本课程应包含的知识;反映其相互联系及发展规律;结构严谨。
构建决策树模型
即利用训练集(教材建设数据库)建立并精化一棵决策树。该过程可分为建树和剪枝两阶段。其中,建树是用每一个属性将训练集划分成一个或多个子集,递归地调用该过程,直到每个子集中的记录都属于同一类,最终得到决策树。剪枝是为提高树的精度及分类效率,而去掉因训练数据中的噪声和孤立点等引起的不可靠或可能是噪声的一些枝条。
利用决策树研究影响教材质量的因素
首先,将学生问卷调查数据库和教学管理部门所掌握的资料结合起来,分类整理,同时进行规范化的数据清洗,得到创建决策树模型的训练集,如表1所示。
根据评估预期的要求,将所有教材的评估结果分为两类:
Class p:综合评价=“优秀”
Class n:综合评价=“一般”
从上表显示的数据可知,综合评价为“一般”的教材有9种, 综合评价为“优秀”的教材有6种,从而可以计算出样本分类的期望信息:
—∑Pi log2(pi)=
I(p,n)=I(9,6)= —[(9/15)×log2(9/15)+6/15×log2=(6/15)]
=—(—0.444—0.53)=0.974
下面以综合评价是否为“优秀”作为衡量标准分别计算由各个属性划分子集的信息熵,以及各自的信息增益度。
计算“教学水平”的信息增加益度
从而算出信息熵E(教学水平)=
I(3,1)+I(3,2)+I(0,3)+I(0,3)=0.43
再计算出其信息增益度
GainI(p,n)—E(教学水平)=0.974—0.507=0.467
计算“科学水平”的信息增益度
计算信息熵E(科学水平)=I(2,1)+I(3,2)+I(1,6)+I(0,0)—0.783再计算出其信息增益度GainI(科学水平)=I(p,n)—E(科学水平)=0.974—0.783=0.191
计算“教材编者职称”的信息增益度
从而算出信息熵E(教材编者职称)=I(4,1)+I(2,1)+I(0,4)+I(0,3)=0.424再计算出其信息增益度GainI(教材编者职称)—I(p,n)—E(教材编者职称)=0.974—0.424=0.55
计算“教材编者学历”的信息增益度
计算信息熵E(教材编者学历)=I(3,1)+I(3,3)+I(0,5)=0.667再计算出其信息增益度GainI(教材编者学历)=(p,n)—(教材编者学历)=0.974—0.667=0.307
由此可以得知“教材编者职称”的信息增益度最大,它是最能区别训练集实例中教材质量的属性,应作为决策树的根节点。根据各个属性的信息增益度的大小,可以构建该训练集实例的决策树如下图1所示:
由该决策树可以得出诸如以下结论:
关键词:会计电算化 应用问题 解决对策
随着电子信息产业的飞速发展,会计电算化在各行各业得到广泛运用,但是由于在各行业受到各种条件的限制,导致会计电算化的应用水平参差不齐,从而影响了会计电算化在实践中向更深层次的发展,也使会计电算化的功能发挥大打折扣。希望通过本文的论述,能够提高公路施工企业会计的认识,加快会计电算化在本行业的发展。并希望能对广大会计及管理工作者提供一点点帮助,让会计电算化在公路施工行业效果有一定的改观。
一、目前本行业中会计电算化的应用问题及分析
(一)思想认识问题
随着我国综合国力的提高,社会主义经济突飞猛进的发展,各行业的现代化水平不断改善,目前会计电算化在我国迅速推广,但是人们对电算化的认识还不足,多数单位电算化都是应用于代替手工核算,仅仅是从减轻会计人员负担、提高核算效率方面入手,根本没认识到建立完整的会计信息系统对企业的重要性,使现有会计提供的信息不能及时、有效地为企业决策及管理服务。同时,在软件更新及硬件投入等方面支持力度不够,根本没能利用信息技术优势来提高企业运作效率。例如:在山西有一公路施工企业的下属分公司,由于长期野外作业,信息比较封闭,项目经理思想较为传统,不注重员工的培训学习,知识的更新意识不强,甚至反对员工后续教育,认为员工的培训学习会耽误施工时间,没有知识照样能修路。就这样,当上级要求全面推行会计电算化的时候,该分公司很多人不能理解,认为原始的手工记账就很好,有的财务人员思想意识落后,不但不认为这是财务核算的一个进步,而是找各种理由排斥电算化的推行。在电算化勉强施行以后,其它部门不予配合,造成财务部门工作量大大增加,处于电算化与传统记账的两难当中,从这个例子可以看出,解决人们对电算化的思想认识问题是非常关键的,而且电算化的推行不仅仅是财务部门的事情,不仅要得到领导的支持,还要各部门各岗位人员的密切配合。
我国电算化事业起步较晚,人们还未充分认识到电算化的意义及重要性。并且我国现在大多数企事业单位的领导都是六、七十年代的人,其中部分领导受教育水平比较低,思想意识比较传统,而且传统的经营模式在他们的思想意识中已经根深蒂固。任何改革对他们都是考验。会计电算化的推行是一个长期复杂的过程,但是经过大量的事实表明会计电算化的推行具有可行性,会计电算化不仅改变了会计核算方式及数据处理程序和方法,扩大了会计数据领域,提高了会计信息质量,而且改变了会计内部控制与审计的方法和技术,因而推动了会计理论与会计技术的进一步发展,促进了会计管理制度的改革。所以,会计电算化决不仅仅是核算工具和核算方法的改进,而是会引起会计工作组织和人员分工的改变,促进会计工作效率和质量的全面提高。
(二)公路施工企业会计电算化实行后,受到人力资源的限制,电算化程度和发展前景受到制约
公路施工企业由于受到其行业自身特殊性的影响,长期野外作业,条件艰苦,信息相对封闭,人才的引进也较为困难,任何一项技术的更新对人才的要求都相对较高,因而就产生人力资源与技术发展之间的矛盾。不少公路施工企业在手工核算转向电算化的过渡中,各相关岗位人员基本不变,每个人对新模式的接受程度参差不齐,再加上人才的缺乏,施工企业通常在材料机械核算岗位临时使用没有会计基础的人员,只经过简单的培训,对核算工作没有深层次的认识,导致会计核算工作十分被动,会计电算化的推行和应用受到很大的制约。
(三)会计电算化实行后,对传统的模式没有彻底的改造,对新的管理模式没有全面的规划
手工核算模式下,长期以来已形成一套系统的管理方式,但由于手工效率低下,限制了会计核算过程中的一些环节。手工模式下由于工作效率的关系,可能会用多人分工记账,各负其责,实行电算化后,如果不对人员进行必要的调整,就造成人力资源的浪费。手工模式下的一些工作流程和会计电算化也存在差异,导致传统模式和电算化核算程序上无法兼容,不能合理接轨,工作效率必将受到影响。要想对新模式的合理调整规划,必须对整个企业的管理有个全面的分析和探讨,从人力、物力全方位进行合理的配置。否则,电算化的意义就大打折扣。
(四)电算化实行后,财务管理功能没有得到很好的发挥
会计电算化是会计史上的一项技术革命,很大程度上减轻了会计人员的工作量。在手工模式下,由于繁重的记账、报账工作使财务人员的工作重点主要放在了核算上,没有太多的精力去搞财务预算和财务管理工作,使财务工作仅局限于事后核算。
电算化的实行,使财务人员从繁琐的手工核算中解放出来,但是目前很多财务软件在会计核算方面的功能较强,而对财务管理、财务指标分析、资金供求预测等功能方面较为薄弱,限制了财务管理功能的有效发挥。
公路施工企业的财务管理重点是项目成本控制,因而项目成本预算、经营过程控制、项目利润预测都显的尤为重要,如果仅限于项目核算而不能很好地发挥财务管理功能,那施工项目的经营过程就非常盲目。
(五)目前公路施工企业会计电算化网络化进程缓慢,信息资源不能得到充分利用
由于公路施工企业中项目经营有自身的弊病,项目经营期限较短,流动性较大,受到项目所在地网络资源限制,大多项目会计电算化长期使用较陈旧的单机版软件,而且同一企业中的不同项目所用软件不同,导致同一公司财务信息的共享和传递不能顺利进行,从而导致总公司对分公司及工程项目不能进行及时、有效的监管和控制,也影响了会计核算和财务管理的效率。
二、针对以上几个问题提出以下对策
(一)加强理论学习,提高思想认识
理论是行动的先导,电算化会计理论研究是会计电算化高速发展的基础,会计电算化关系着整个企业的各个方面,必须引起领导的重视,在学习中提高各部门各环节的理论水平,组织和协调好内部管理机制,让会计电算化理论有效地运用到企业的管理中,使会计电算化的优越性得到充分体现,让大家都认识到新技术带来的进步。加强理论学习的重点是要建设一支业务熟练,技术过硬的会计队伍,通过学习让会计人员对自已的工作有一个本质的认识。由于我们公路企业的电算化管理方面整体理论基础欠缺,只有领导亲自抓,才能统筹规划,周密部署,确保会计电算化的有效实施, 会计电算化才可能健康、有序地发展。
(二)引进和培养管理型人才,搞好新模式下的整体规划和调整
目前高新技术的发展日新月异,为了适顺应市场经济的要求,结合公路施工企业的具体情况,必须引进和重点培养业务精、能力强的人才,全面负责会计信息系统的整体规划和调整,统筹新形势下会计电算化与内部各个环节的协调,使会计核算的效率和水平得到不断提高,从而使会计电算化在公路建设中发挥出空前的作用。
(三)改善和提高软件功能,加快网络化步伐,使会计电算化向管理型方面迈进
为更好更快地促使本行业的发展,我们要合理选用适合本行业的软件,必要时可以对软件进行二次开发。在有限的施工环境下,加大投入,尽全力保证网络化进程,充分发挥会计电算化的优势。目前会计电算化软件已相当成熟,网络版软件已广泛应用于会计核算和财务管理工作中,会计核算的网络化不仅建立了资源共享的平台,也给会计信息的调用、查询提供了方便。我们财务人员在日常工作中,要充分利用先进的网络资源,加强学习,在准确核算的基础上,更深层次地应用电算化搞好财务数据的预测分析工作,为管理者的决策提供及时有效的依据,为企业的发展提供科学的保障。
参考文献:
[1]李守明,靳兰春.我国电算化会计与电算化审计的比较分析[J].财会月刊(会计),2001,(4)
[2]罗辅维.对开展计算机审计的认识[J].中国内部审计,2002
【关键词】计算机 视觉 图像处理 技术
一、引言
随着计算机技术的不断发展,在20世纪60年底产生了计算机视觉学这一学科。计算机视觉是借助计算机以及各种设备,进行生物视觉模拟的一种技术。计算机视觉学的主要任务,是借助已掌握的图片、视频等资料,进行计算与处理,和人类及其他生物的视觉过程一样,
得到相应形式的三维数据信息。计算机视觉学的发展,在工业、农业的生产中,地质勘探、天文、医学观察等领域也有着重要的应用价值。因此,视觉学的研究和应用转化受到了越来越多的重视。
二、计算机视觉学的图像分割研究
(一)数据驱动的分割研究
在计算机视觉学应用过程中,经常进行的数据驱动分割有下面几项内容:第一种是边缘检测的分割、第二种是区域分割、第三种是边缘和区域相互结合的分割。第一种基于边缘检测的分割,这种分割的基本方法:首先对检测图像的边缘点进行检测,然后根据一定的法则进行轮廓的连接,获得分割的区域。基于边缘检测的分割其难点是边缘检测时如何处理好抗噪声性能、检测的精度之间的矛盾。所以,在研究的过程中,提出了多种多尺度边缘检测的方法,按照实际问题进行多尺度边缘信息设计等方案,以获得更为合适的抗噪性能和检测的精度。第二种基于区域的分割,它的基本思想是按照图像数据的特点,将整个图像的空间划分成为几个不同的区域进行图像处理。
(二)计算机视觉学模型驱动的分割
经常使用的模型驱动分割有下面三种,第一种模型是基于动态轮廓的模型、第二种模型是组合优化模型、第三种模型是目标几何与统计模型。第一种是基于动态轮廓的模型用在进行分割目标的动态轮廓,因为其能量函数使用的是积分运算,有着很好的抗噪性能,对于目标的局部模糊也不敏感,所以其适用性很广。但这种分割方法容易收敛到局部最优,因此要求初始轮廓应尽可能靠近真实轮廓。通过组合优化的方法进行分割问题的处理,是使用一目标函数综合表示分割的相关要求以及约束,把分割变为目标函数的优化求解。因为目标函数多数情况下作为多变量函数存在的,因此可以通过使用随机优化的方法来实现。
(三)计算机视觉学图像分割的半自动方法
通过对人工参与程度的分,我们可以得出图像分割,主要有三种类型即:人工图像分割、半自动图像分割、自动图像分割等。人工图像分割指的是操作者使用鼠标,将分割区域的轮廓进行勾画的方法,人工图像分割的缺点是费时费力,而且很容易就会受到一些主观因素的影响,并且人工图像分割的可重复性较差。自动图像分割不需要借助人机交互就能完成,但是也很难实现同一批图像处理的满意分割效果。半自动分割这种形式指的是将人机交互同自动分割结合在一起,半自动分割可以实现对不同图像与处理需求的适应,并且可以大大降低计算过程的复杂性。在计算机技术不断发展的背景下,计算速度和容量有了大幅度的提升,计算机图像处理及视觉应用取得了丰硕的成果。
三、计算机视觉技术的分析
(一)以模型为研究对象的处理方法
在以模型世界作为研究对象的视觉学研究过程中,以Roberts的开创性工作作为一种标志,在他的工作过程中,引进了三维物体与二维物体成像的关系,使用较为简单的边缘特征提取、组合线段等手段和方法。他对三维关系的分析只是按照简单的边缘线段的约束关系,缺乏对人类或其他动物视觉系统感知三维空间关系的充分考虑。但是早期的这些研究工作,对计算机视觉学的研究和发展发挥了良好的促进意义,但是对于较为复杂的景物就不能够奏效。
(二)以计算理论为主体的视觉模型
随着计算机视觉研究的不断深入,在二十世纪七十年代,计算机视觉技术的研究,开始向着更为理性的阶段发展,主要表现在:不同本征特性的恢复,恢复的内容有三维形状恢复、运动恢复、光源恢复等等。研究的出发点是光学、生理学以及射影几何的视角出发,对成像及其逆等问题进行研究。在这个过程中,一些学者提出了以表示作为核心、通过算法作为中间转换过程的视觉处理模型,例如:著名的计算机视觉学研究者Marr就提出了这些观点,在他的理论里面,对表示的重要意义进行强调,并且从不同层面上对信息处理问题进行了研究。
(三)计算机视觉的应用研究
在现实生活和生产的过程中,计算机视觉主要应用在照片资料、视频资料处理上,例如:航空照片的处理、卫星照片的编译、医学领域的辅诊断、移动机器人视觉导航等等。其中,工业机器人手眼系统的研发,成为计算机视觉应用最具代表性的成果之一。因为工业生产、施工等现场等因素具有一定的复杂性,这种环境下的光照、成像特点等等可以控制,这就使得计算机视觉的应用更为简单,对于系统的实际构成有着很好的作用。移动机器人与工业机器人不同之处就是移动机器人具有一定的行为能力,这就需要研究者解决机器人的行为规划问题。在移动机器人种类、智能化水平不断提升的背景下,对视觉能力的要求也越来越高,这也使得计算机视觉有了更为广阔的应用前景。
四、结语
综上所述,计算机视觉学作为人类科技发展和社会进步的一种学科体现,在前进和发展的过程中,通过研究者和应用者的不断总结和探究,取得了丰硕的成果。在未来视觉技术发展的道路上,仍然有大量的工作需要进行研究。
参考文献:
[1]韩祥波, 刘战丽. 计算机图像处理技术在农产品检测分级中的应用[J]. 安徽农业科学 , 2013,(34)
[2]赵萍, 李永奎, 林静, 白雪卫. 数字图像处理技术在农产品方面的应用[J]. 农机化研究 , 2012,(11)
关键词:计算机视觉图像 精密测量 构造几何模型 信号源的接收
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)05-1211-02
新型计算机视觉图像精密测量是一种基于计算机程序设计以及图像显示的高精度的关键技术,它广泛用于测量的领域,对于测量的准确性有很好的保证。这种关键技术是几何了光学的特性,发挥了图像学的显影性,把普通的测量技术瞬间提升到了一个新的高度。在这项关键技术中包含了物理学中光的效应,图像中的传感器以及计算机中的编程软件,这还不完全,还有一些其他科学领域知识的辅助,可以说这项关键技术是一个非常有技术含量的技术,很值得学者进行研究。
1 计算机视觉图像精密测量的关键技术的具体形式
在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机视觉图像精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机视觉图像测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供技术人员使用参照。
在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:
1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;
2) 得出观察点到目标控制点之间的三维的运动几何参数;
3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉);
4) 还通过观察可以判断出目标物体的几何坐标方位。
在整个计算机视觉图像精密测量的关键技术中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机视觉图像系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。
当无法观察到控制点是,计算机视觉图像精密测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。
2 计算机视觉图像精密测量的关键技术分析
在计算机视觉图像精密测量的关键技术中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在视觉图像的选择中,无法使用高帧数的图片显示,无法将计算机视觉图像精密测量的关键技术的优点发挥出来。我们就计算机视觉图像精密测量的关键技术中常见的问题进行讨论。
2.1 降低失误的概率
在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。
2.2 对于权限的控制
权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机视觉图像精密测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机视觉图像精密测量的关键技术。
2.3 开启自动建立备份系统
计算机视觉图像精密测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。
3 计算机视觉图像精密测量的关键技术遇到的困难和使用前景
计算机视觉图像精密测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了测量单位的广泛青睐。在测量方面的这些可靠性和稳定性也是有目共睹的。在土木和机械测量的行业计算机视觉图像精密测量的关键技术都会有广泛和良好的使用,前景也是十分的广阔。但是不容忽视该技术也有一些弊端。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。
我们都知道,人的眼睛是可以受到吱声的控制,想要完成观测是十分简单的,但是在计算机视觉图像技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。
上文中也谈到了,计算机视觉图像精密测量的关键技术中最主要的构建是传感器,一个合理的传感器是体统的“心脏”,我们在仪器的操作中,不能时时刻刻对传感器进行检查,甚至这种高精度的元件在检查上也并不是一件简单的事情,通过不断的研究,将传感器的等级和使用方法上进行一定的创新也是一项科研任务。
4 结束语
在测量工程发展的今天,很多的测量技术已经离不了计算机视觉图像技术的辅助,该文中详细的谈到了基于计算机视觉图像精密测量的关键技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案。测量工程中计算机视觉图像精密测量的关键技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题。
将基于计算机视觉图像精密测量的关键技术引入到测量工程中来,也是加强了工程建设的信息化水平。可以预见的是,在未来使用计算机视觉图像技术建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让计算机视觉图像精密测量的关键技术在测量中作用发挥的更好。
参考文献:
[1] 汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36.
[2] 段发阶,等. 拔丝模孔形计算机视觉检测技术[J]. 光电工程时报, 1996,23(13):189-190.
【关键词】Opencv;计算机视觉技术;系统;研究
随着计算机技术的快速发展,计算机设备逐渐被应用到社会生活的各个方面,尤其是在当前计算机视觉技术和图像处理技术快速发展的时期,各个科技领域中的计算机视觉技术已经逐渐成熟。计算机视觉技术主要是利用计算机智能化来替代人眼,即对于客观存在的三维立体化世界的理解和识别,整个实现过程均是以计算机技术作为基础。随着计算机视觉技术的不断发展,现今其已逐渐成为了一门神经生理学、计算机工程、信号学、物理学、应用数学等综合性学科。计算机视觉技术系统其在高性能计算机基础之上来实现对大量数据的获取,并且通过智能算法来对获取数据进行处理,从而完成对数据集成。
一、视频中运动物体检测原理
对于视频中的运动物体检测主要分为两中方法,其一为宏观检测法;其二为微观检测法。宏观检测法是对获得的整幅图像进行检测,而微观检测法则是对所需要的区域进行图像检测。视觉技术在检测运动物体的时候,首先对图像进行采集,并对采集的信息数据进行预处理,将图像进行分割,然后分别提取运动物体的影象,从而实现参数的更新。图像采集过程中采用背景差分法,实现对背景图像的提取,其通过一定算法采用人为手段获取没有背景的图像。另外在进行运动物体检测的时候还可以采用帧间差分法,其主要是实时获取帧图,然后实现一帧一帧图像比值的比较,从而获取具有差值的图像。运动物体进行检测的时候需连续获取帧图,将这些帧图组合起来,其实就是物体的运动轨迹,然后同分割技术就能勾勒出物体的轮廓。随着计算机视觉技术的不断深入研究,发现此两种方法单独使用仍然存在的一些缺点,于是研究人员将二种检测方法进行融合,形成一种综合检测方法。综合检测法将两者检测方法的优势进行了融合,并将其灵活的应用到了生产和生活之中,取得了十分不错的效用。
二、基于Opencv的计算机视觉技术探究
(一)基于Opencv的运动物体检测
运动物体在进行检测的时候,基于Opencv的检测原理主要为:根据物体某项特定信息,例如,颜色、轮廓、性状等,在复杂背景中利用这些特定的信息将物体分离出来。整个图像的分离过程首先是进行视频流捕捉,然后是进行视频的格式转换,再将图像进行预处理,从而提取前景物体,减少环境因素对图像处理的误差,最后根据物体特征提取,并完成对运动物体的跟踪。从图像中提取所需的目标物体,其实质就是对整个屋里轮廓进行检测和分割,根据每个图像的帧差异来进行提取。
(二)基于Opencv图像预处理
视觉技术应用于复杂的环境之中,由于存在着光照的变化,其场景中所出现的环境因素对视频采集设备性能影响很大。环境因素会使得获取的图像信息的质量降低,并且在图像中无法避免的存在着噪点,这对于运动物体的检测和图像采集会造成很大的影响。当获取视频帧图像之后需对其数据进行预处理,通常有平滑度滤波处理、图像填充、图像背景更新等。
1.平滑度滤波处理
由于在进行视频图像采集的时候存在着噪点,那么我们就需要对其进行噪点处理,以求减小噪声。滤波平滑度滤波处理,其具有线性和非线性两种方式,其中线性方式进行处理器运算简单、运算速度快,但是在进行处理之后的图像都会呈现不清晰的情况。而非线性方式尽心给处理之后,虽然能够很好的减小噪点,确保信号的局部特点,但是其运算的速度会较慢。
2.图像填充
对于帧图像进行处理,通常采用检测边缘填充法或者是腐蚀膨胀法来完成,其中填充法是指当检测出目标物体之后,利用边缘检测方法来对物体进行辨识,然后利用形态学的漫水填充法进行填充。图像的腐蚀膨胀则主要是由于摄像机的性能等问题造成的。
3.实时背景更新
在进行图像差分之前,需要对背景图样进行确定,并且需要对其进行初始化处理。以方便以后在进行检测时候能够对实时背景图进行差分计算,只有这样,才能够获得极佳的前景效果。在进行图像差分时,首先需要根据指定法来确定第一帧背景的图像,并将其指定为第一张背景图片,然后在检测过程中根据算法对背景实施更新。整个图像在进行更新时,其主要的流程为:判断并读取图像是否为第一帧;将Opencv处理的图像转化为单通道灰度值;将实时采集的图像进行高斯平滑度处理,去除噪点;最后使用形态学滤波处理噪点。
(三)提取前景运动物体图像
检测运动物体的时候,只有在检测流程中确保精确度,才能够获取满意的前景跟踪效果。此过程中主要分为两个步骤,第一步为二值化图像之后进行分割;第二步,图像分析前处理,进行充分填充,确保前景图的完整性。其中,前景图的提取主要分为下面几个步骤:首先对前景图像和背景图像进行差分,然后对差分的图像进行二值化,再对背景中的前景图像边缘进行检测,根据轮廓进行填充图像。由于摄像头存在于不同的场景和环境之中,不论是室外或者是室内随着场景的变化都会对图像的采集产生影响。那么在前景图中提取目标就需要在检测系统中采用有效手段来完成背景实时更新。
阀值二值化分割法可以对检测的物体进行前景和背景差图分割,从而使目标物体能够分离出图像,且阀值分割先要确定每个像素的点是否处于灰度范围值之内。将图像中的像素灰度与确定的阀值进行比较,其结果解释所有像素点分为2类,一类像素的灰度小于阀值,另外一类就是大于阀值。阀值二值化分割时,确定分割的阀值T,然后分割图像。选取合适的阀值进行分割,可以有效的减少光照因素影响,常用的动态阀值主要有直方图来法与最大类方差法这另种分割方法。
三、计算机视觉三维技术
计算机视觉技术的核心为分割问题、运动分析、3D立体场景重构等,立体视觉主要是从多幅图像的参照中获取目标物体的三维几何信息。计算机视觉所模拟出的3D立体画面只需要摄像机从不同的角度同一时间针进行图像捕获,将2D信息进行3D重构,进而将计算机程序重建于真实的三维场景之中,以恢复物体的真实空间信息。
(一)视觉系统
视觉系统捕获图像的过程,实则可以看成为对大量信息进行处理过程,整个系统处理可以分为三个层次,其一,理论层次;其二,描述层次;其三,实现层次。在摄像机视觉系统之中,输入的是2D图像,但是输出为3D信息,而这就可以实现对图像的位置、距离等信息的如实描述。视觉系统分为三个进阶层次,第一阶段为基础框架;第二阶段为2.5D表达;第三阶段为三维阶段。在第二阶段中实现的2.5D表达,其原理是将不完整的3D图像信息进行表达,即以一个点为坐标,从此点看去某一些物体的部分被遮挡。第三阶段的三维阶段,则是人眼观察之后可以从不同的角度来观察物体的整体框架,从而实现了将2.5D图像信息的叠加重合运算,进一步处理之后得到了3D图像。
(二)双目视觉
人们从不同角度观看同一时间内的同一物体的时候,可以利用算法测量物体间的距离。此法被称为双目立体感觉,其依据的原理是视觉差原理,利用两台摄像机或者一台摄像机,对两幅不同的图像进行不同角度观察,并且对其观察的数据进行对比分析。实现双目立体视觉与平面视觉图像获取,其主要的步骤为:
(1)图像获取
从两台不同的摄像机,捕获帧图像,由于环境因素会造成图像差异困难。为了更好的跟踪目标、检测,当捕获图像之后,需要对图像进行预处理。
(2)摄像标定方式
获得真实坐标系中的场景点中的与平面成像点占比见的对应关系,借用三维立体空间中的三维坐标,标定之后确定摄像机的位置以及属性参数,并建立起成像的模型。
(3)特征提取方式
所谓的特征提取方式主要是为了提升检测、跟踪目标的准确性,需要对目标物体进行特征提取,从而实现对图像分割提取。
(4)深度计算
深度信息主要是根据几何光学原理,从三维世界进行客观分析,因为距离会产生不同的位置,会使得成像位置与两眼视网膜上有所不同。简单来说,客观景物的深度可以反映出双目的视觉差,而利用视觉差的信息结合三角原理进行计算,可呈现出深度的图像信息。
(三)摄像机模型
摄像机在标定过程中确定了其建立的基础为摄像机的模型,摄像机模型在标定过程中关系到三个不同坐标系的转换,分别为2D图像平面坐标系、摄像机自身坐标系以及真实的世界坐标系。摄像机在摄像的时候起本质是2D图像坐标转换,首先要定义摄像机的自身坐标系,将坐标系的原点设置为光心,X、Y、Z成立三维坐标系。其次则是建立平面的图像坐标系,用以透视模型表示,其原点也在广心的位置,称之为主点。实际应用中,物理的距离光心的位置d≠f焦距,而且会远远大于焦距,为了解决如此问题就提出了平面概念。在光轴z上设置一个虚拟的图像平面,然后在此位置于平面关于光心对称。接着,在设置的虚拟2D坐标系中,光轴和原点重合,并且摄像机与垂直平面的垂直方向相同,真实图像上的点影射到摄像机坐标系。
(四)3D重构算法
视频流的采集,主要是采用Kinect设备、彩色摄像头、红外发射摄像头、红外接收摄像头。使用微软提供API控制Kinect设备,在操作之前需调用NUI初始化函数,将函数的参数设置为用户信息深度图数据、彩色图数据、骨骼追踪图数据、深度图数据。上述的视频流的打开方式不同,既可以是一种打开方式,也可以是多种打开方式,尤其在进行Kinect传输数据处理的时候,需遵循三条步骤的运行管线。此三条管线分别为:第一条为处理彩色和深度数据,第二条为根据用索引添加颜色信息,并将其放入到深度图之中,第三条为骨骼追踪数据。
四、总结
随着计算技术的快速发展,视觉技术逐渐被广泛的应用于我们日常的研究之中。本文通过对视觉技术的相关问题进行分析,探究了图像处理、分割、前景提取、运动物体观测以及重构3D图等问题,为实现视觉技术更加深入研究做出了相应的贡献;为广大参与计算机视觉技术研究同仁提供一个研究的思路,为实现视觉技术的腾飞贡献薄力。
参考文献
[1]张海科.基于Opencv的人手识别与跟踪定位技术研究与实现[D].云南大学,2013.