公务员期刊网 精选范文 计算机视觉的意义范文

计算机视觉的意义精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的意义主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉的意义

第1篇:计算机视觉的意义范文

关键词:视觉原理;计算机视觉艺术;数字媒体;应用

利用计算机所具有的视觉艺术,大众仅仅利用需要实施身体动作来直接性的操作以及控制,根本就不需要学习就能够启动以及进行一定的操作,这样更加方便老年人以及儿童的实际操作。在数字媒体当中,应该对计算机视觉艺术进行充分利用,更加方便人们的实际操作,同时还能够保证其更好的感受艺术方面所具有的魅力,让群众在足够放松的时刻能够对创作者的实际思想以及意图进行充分的了解以及掌握,对艺术价值进行充分发挥,进而来有效提升艺术人文的实际价值。

1对计算机视觉原理进行分析

通常来讲,计算机视觉还称为机械视觉,属于是机械来对人类视觉进行一定的模仿的光学识别系统,利用光学系统、感应器、光源等来实现物体定位、动作的追踪以及视线的判断等相关的功能。一般情况下,工程技术所运用的基本都是计算机视觉,当有着一定的环境以及模式时,计算机视觉在进行持续性的工作时,能够有效保证持续工作有着非常高的正确性以及准确性,还能够对人工不可以完成的任务进行很好的完成。当计算机视觉在进行实际的工作过程中,最为基本的条件是先对映像进行处理,之后输入模拟讯号,对数字影像进行一定的处理以及分析。实际的工作流程是:影像在摄入之后,应该对其进行一定的强化,除去噪声,之后对图像特征进行一定的压缩以及获取。在对数据库样本进行一定的对比之后,对程序进行有效的分析以及判断,做出有效的指令。

2对数字媒体当中计算机视觉艺术的实际应用进行分析

2.1艺术与计算机进行一定的融合时,应该对动画、声音以及图像等因素进行有效结合,在对艺术语言表现形式进行丰富的同时,应该提高作品的感染力

在有些结合视觉艺术以及数字媒体时,应该保证在对画面进行观看时,应该有效的欣赏画面,还可以有效的感受到声色等。利用高度仿真的听觉、触觉以及视觉,保证大众在进行玩游戏时,可以对虚拟世界进行真实的感受,还能够利用动作以及肢体语言等来和计算机实现有效的交流。保证大众不是对电影单独的进行欣赏,还应该更好的参与到其中,体会艺术的表演。

2.2在数字媒体当中运用计算机视觉艺术能够对艺术的实际表达形式进行有效的丰富

随着交互技术的逐渐成熟以及发展,让该技术得到了有效的拓展以及广泛的运用。运用交互技术,应该让人们不受到被动的欣赏,应该积极的参与到视觉艺术当中,保证大众的积极参与以及做出判断,同能够利用各种选择来呈现出过程以及解决,对观众的兴趣进行充分的调动,进而来有效提高大众的参与积极性。

2.3在电子游戏当中,运用计算机视觉艺术,应该在相对比较大型的电子游戏当中进行计算机视觉技术的运用

在实际的游戏过程当中,大部分的玩家基本上不再是仅仅运用键盘以及鼠标来实施游戏,大部分都是利用身体行动来移动。通常情况下,机器利用摄像机部来对玩家的具体身体动作进行一定的捕捉,玩家能够与机器相连接的手枪进行有效的操作,射中屏幕当中的对象。同时,手机上的相对比较小型的电子游戏,仅仅需要手指来滑动屏幕,就能够实现实物的运动以及跳跃等,进而来躲避障碍。除此之外,仅仅需要稍微的倾斜一些收集,就能够实现人物两侧的奔跑,同时还能够保证声光效果,实现互动,具有非常大的震撼力,会在很大程度上促进大众参与的积极性。

2.4分析数字媒体中计算机视觉技术的应用,保证数字媒体技术有效表现艺术

同时在实用艺术以及纯艺术当中,也会运用到数字媒体,该技术能够让相对比较单纯的个人视觉实现有效的创造,同时还能够把艺术箱社会性视觉产品进行转化,并得到一定的经济效益。同时,大众能够通过剪切以及拷贝等相关的方式来有效获取视觉技术,之后有效的转化艺术资源,有效奠定了创作视觉艺术的基础。现阶段,大众对于个性化以及独特性有着逐渐提高的需求,在对相对比较独特的视觉技术进行追求时,在一定程度上提高了评价视觉作品的标准。在数字媒体当中运用计算机视觉技术,会在很大程度上提高大众对美的享受,保证大众能够充分感受到舒适以及愉快的感觉,同时还能够得到审美方面的评价,在该过程当中,不能够参杂任何的因素,应该让计算机视觉因素仅仅对视觉美感以及视觉形式进行充分的追求,可以有效体现艺术的本质。同时,数字媒体有着美方面的品格,有效结合计算机视觉艺术,保证数字媒体艺术的美以及真。这个实际的运用过程能够有效提升审美方面的机制,更好的领悟视觉艺术当中所存在的美。

3结语

综上所述,在数字媒体当中,计算机视觉技术的运用,应该有效结合图像、动画、声音以及文本等多个因素,在对语言表现的具体形式进行一定的丰富时,应该让作品具有更大的感染力。除此之外,还应该保证视觉技术有何足够的光声效果,利用一定的互动,会具有非常大的震撼能力,积极促进大众的参与程度。还可以在很大程度上满足大众对于美方面的追求,进而对其所具有的艺术价值进行充分发挥,有效提升艺术所具有的人文价值。

参考文献

[1]刘晓,王会霞.计算机视觉艺术在数字媒体领域的应用研究[J].互联网天地,2015,07:21-24.

[2]丛婧.浅谈计算机视觉艺术在数字媒体的应用[J].电子制作,2013,18:75.

第2篇:计算机视觉的意义范文

[关键词]科技项目经费;预算;决算

一、科技项目经费预算与决算中存在的问题

(一)缺乏完善的经费预算管理制度

科技项目的经费预算需要完善的预算编制理论,同时需要配套的科学合理的预算编制标准和严格的审批制度,从而避免预算的随意性和主观性。而在我国,许多科研人员在对科技项目经费进行预算时,由于自身缺乏预算相关知识,往往只是针对项目内容简单的计算和估算,缺乏预算的总体概念和标准,也没有财务方面专业的人员和专门的机构进行指导和审核,致使预算科学性和可行性大大降低,随意性较大,造成预算大多只是简单的收支平衡。同时由于我国科技项目经费是按照项目类别来划分经费标准的,这样一刀切的方式致使经费预算很多时候流于形式,很多科研人员在进行预算时只考虑将划拨的经费用完即可,对项目难度大小、项目质量缺乏合理的分析,这样缺乏标准和审核的预算要么造成经费不够用而影响项目质量,要么产生经费用不完而浪费资源。

(二)缺乏经费使用过程中的监督体制

对科技项目经费使用情况的监督,就是要在项目立项、使用和决算环节都进行严格的监督管理,保证经费的科学合理使用。我国很多科研人员都是只重视科技项目的立项,而忽略对科技项目经费的管理。虽然实施科技项目负责人制,但是在项目实施过程中,只是对负责人进行管理,对于科技项目活动本身,以及项目经费的具体使用情况,都没有相应的管理制度和标准,更缺乏监督体制。项目负责人只要签字,相关凭据真实,都能够进行费用的报销,相关审计部门只是对财务部门的记账、报账情况进行审核,不会对经费使用情况是否合理进行查证,这样就造成了科技项目的经费在预算和决算过程中没有合理有效的监督措施。

(三)缺乏经费决算时的责任追究制

我国科技项目经费的管理和财务监督主要是由项目负责人所在的单位负责,当在进行科技项目经费的决算时,如果出现了经费的违规、违法利用行为,负责人单位为了自身利益往往会出现包庇、隐瞒的状况。同时负责科技项目经费审计的主要是我国的科技相关部门,它主要进行的是事后审计,涉及财务的报表审计和合规性审计,这些审计并不能够真正发现经费的违规使用,这就在一定程度上助长了科技项目经费领域的职务犯罪。由于我国缺乏明确的责任追究制度,相应的处罚也很少,由此更加滋生了此类违法违规使用科技项目经费的行为。

二、实现科技项目经费预算与决算相统一的对策

(一)理清预算与决算的关系

理清预算与决算的关系是科技项目经费管理过程中的一个重要方面,两者之间具有重要的相关性和一致性。科技项目经费的预算是经费支出的依据,决算是经费预算执行的结果,预算时为决算提供预见性和可控性,决算督促预算的科学性和合理性,两者科技项目经费的管理过程中都有不可替代的作用。为加强科技项目经费管理的科学性,需要不断的强调预算与决算的统一性,建立预算与决算相互协调的工作规范,统一科技项目过程中的费用科目,使预算与决算在内容上保持一致。同时消除两者之间的不对等事项,保证决算的结果和预算的结果相一致。

(二)提高预算与决算的工作水平

首先应该完善科技项目经费的预算管理制度,聘请专业的人员和机构对项目的经费进行全面预算,设置预算项目内容和预算标准,对科研经费所涉及的各个环节都进行预算,严格控制好项目实施过程中各种经费的支出符合相关规定,而且还必须明确经费收入的时间与进度、收入方式与要求,以及资金的垫付与补偿。预算编制完成以后要严格按照预算的内容来进行,将预算落到实处。同时可以与财务合作设立监督机构,监督项目经费是否按照预算进行,监督科研人员是否有违规使用经费的情况,明确规定项目负责人的管理职责,促使项目负责人在项目执行过程中监督经费的支出是否符合规定以及跟进项目的进展情况,确保预算的执行和项目的顺利完成。在决算时要提高经费决算的效力,保证决算的结果能够得到主管部门的重视,并建立起相应的惩处机制。

(三)完善经费管理的绩效考核机制

科技项目经费的管理需要引入绩效考核评价机制,对项目立项前要有评估考核,确保项目的投入产出比,同时也重视项目进行中的绩效考核,确保项目经费的使用效益,这能保证科研项目成果的质量,避免只重数量不重质量。在进行绩效考核同时需要注意一些问题,避免短视行为,结合科技项目的实际情况进行定量和定性的分析,要遵循科学性、合理性和可操作性的原则,保证绩效考核的公正性和公开性。

总之,在进行科技项目经费的管理过程中,建立完善的预算编制体制,提高经费决算的效力,实现预算与决算的统一,是保护科研资产,防止科研资产流失,提高我国科研水平的重要途径。

参考文献

[1]张思强.科技项目经费预算存在的问题及对策[J].中国科技论坛,2008

[2]张羽.科技项目经费及预算管理系统研究[J].安徽科技,2012

第3篇:计算机视觉的意义范文

关键词:计算机视觉;地图匹配;SLAM;机器人导航;路径规划

1概述

计算机视觉在人工智能学科占据重要地位,为自主移动机器人视觉导航做了深厚的理论铺垫。目前,机器人导航技术有很多种,传感器导航技术如里程计、激光雷达、超声波、红外线、微波雷达、陀螺仪、指南针、速度、加速度计或触觉等得到了普遍应用,与上述非计算机视觉导航技术相比较,计算机视觉导航技术如人眼般具有灵敏度高且可捕获的信息量大以及成本低等优点。由于室内相对室外空间比较狭小且内部环境复杂,所以普通移动机器人在作业过程中,完成躲避眼前障碍物、自主导航以及为自身找出一条可行路径等一系列操作会相对比较困难。计算机视觉导航技术可利用本身的摄像头获得室内周围的环境信息,实时对其周身的场景进行快速反馈,对视野前方障碍物进行快速识别和检测,从而确定一条高效的可行的安全路径。本文对计算机视觉导航技术进行分类研究,主要分为3类:第一类是环境地图事先已知,提前对外界环境特征进行提取和处理,建立全局地图,并将地图信息存储在机器人内存数据库中,在导航的时候实时进行地图匹配;第二类是同时定位与地图构建,移动机器人在自身位置不确定的情况下根据自身的摄像头获取周围未知环境信息,在作业时逐步构建周围的环境地图,根据构建的增量式地图自主实时定位和导航;第三类是不依赖环境地图,自主移动机器人不需要依赖任何的环境地图,其在作业活动时的可行区域主要取决于摄像头实时识别和检测的环境相对信息。

2环境地图的表示方法

目前,计算机视觉导航技术多采用栅格地图、几何地图、拓扑地图和混合地图构建环境地图信息。

2.1栅格地图

栅格地图,将栅格图像考虑为一矩形,均分为一系列栅格单元,将每个栅格单元赋予一个平均概率值,并利用传感信息估计每个单元内部内存障碍物的概率。构建栅格地图的优点是其地图表达形式直观,创建和维护比较容易;但当划分的栅格单元数量不断增多时,实时性就会慢慢变差;当划分的栅格单元越大时,环境地图的分辨率越低。

2.2几何地图

几何地图利用几何特征如点、直线、平面等来构成环境主要框架,需要知道这些特征在环境中信息的具置,所以几何地图通常使用其对应的三维空间坐标来表示。几何地图构建过程相对简单,保留了室内环境的各种重要信息,是基于计算机视觉的定位与地图构建算法中最常用的一种表示方式。但是为了完成环境的建模需要标记大量的特征,从而计算量也非常的大,降低了实时性,其重建的地图也容易出现与全局不一致的情况。

2.3拓扑地图

拓扑地图用许多节点和连接这些节点的曲线来表示环境信息。其中,每个节点相对应真实环境中的特征点(如门角、窗户、椅子、桌子角及拐角等),而节点之间的曲线表示两个节点对应的地点是相联通的。拓扑地图把环境信息表上在一线图上,不需要精确表示不同节点间的地理位置关系,图像较为抽象,表示起来方便且简单。机器人首先识别这些节点进而根据识别的节点选择节点与节点间的曲线作为可作业的路径。

2.4混合地图

混合地图主要包括3种形式:栅格一几何地图、几何一拓扑地图以及栅格一拓扑地图。混合地图采用多种地图表示,可结合多种地图的优势,与单一的地图表示相比更具有灵活性、准确性和鲁棒性,但其不同类别的地图结合起来管理会比较复杂,难以协调,增加了地图构建的难度。文献针对室内环境所建立的模型分为全局拓扑和局部几何表述部分,整体环境通过拓扑节点串连起来,维护了整体环境表述的全局一致性;而以每个拓扑节点为核心所采用的几何表述则可确保局部精确定位的实现,这样建立的几何一拓扑混合环境模型可将二者的优势都表现出来,使得移动机器人定位和地图构建同时进行,实现容易。

3基于计算机视觉的室内导航

基于计算机视觉的室内导航技术可利用摄像头捕获机器人周围环境的全部信息,对其周身的场景进行反馈,对障碍物进行快速识别和检测,从而确定一条高效的可行的安全路径。本文将计算机视觉室内导航技术主要分为3类:第一类是环境地图事先已知;第二类是定位与地图构建同时进行;第三类是不依赖环境地图。

3.1环境地图事先已知

提前对外界环境特征进行提取和处理,建立全局地图,并将地图信息存储在机器人内存数据库中,在导航的时候实时进行地图匹配,即预存环境地图。在环境地图事先已知的导航中,路标信息保存在计算机内存的数据库中,视觉系统中心利用图像特征直接或间接向移动机器人提供一系列路标信息,一旦路标被确定后,通过匹配观察到的图像和所期望图像,机器人借助地图实现自身精确定位和导航。该导航技术过程可分为以下步骤:

a)图像获取:摄像头获取其周围的视频图像;

b)路标识别及检测:利用相关图像处理算法对图像进行一系列预处理如进行边缘检测和提取、平滑、滤波、区域分割;

c)路标匹配标志:在观察到的图像和所期望图像之间进行匹配,搜索现有的路标数据库进行标志路标;

d)位置计算:当有特征点进行匹配时,视觉系统会根据数据库中的路标位置进行自身精确定位和导航。

在基于计算机视觉的地图匹配定位过程中,主要有2种地图匹配较为典型。

①已知起点,已知地图。这种条件下的定位称为局部定位,采用的是一种相对定位的方法,如图1所示为其位姿估计过程,这种情况目前导航技术研究得最多。

②不知起点,已知地图。这种条件下的定位称为全局定位。当机器人需要重置时,通常使用这种定位方法来检索机器人的当前位置(即姿态初始化)。常用的辅助方法是在环境中添加一些人造信标,如无线收发器,几何信标,条码技术,红外或超声波接收系统进行位置识别,利用视觉系统识别自然标志,自主定位。

3.2定位与地图构建同时进行

不知起点,不知地图。SLAM技术最早由Smith等人于1986年提出,移动机器人在自身位置不确定的情况下根据自身的摄像头获取周围未知环境信息,在作业时逐步构建周围的环境地图,根据构建的增量式地图自主实时定位和导航。在日后的导航研究中,混合地图中的几何一拓扑混合环境模型被得到广泛应用,主要用来解决SLAM问题。

2003年,在解决SLAM技术难题上,Arras等人采用基于Kalman滤波器和最邻近(nearest neighbor)匹配策略的随机地图创建方法。下面是该算法步骤:

a)数据采集:首先初始化系统,从摄像头传感器采集距离数据;

b)状态预测:视觉系统预测机器人运动状态,实时返回新位姿信息和协方差矩阵,预测地图;

c)观测:从原始捕获的信息中提取主要特征信息并将此信息返回给局部地图;

d)测量预测:预测机器人当前位姿的全局地图;

e)位置匹配:应用最邻近滤波器匹配局部地图中的观测点和预测点;

f)估计:使用扩展Kalman滤波器更新地图;

g)创建:将非相关的观测点加入地图,对机器人返回增量式地图;

h)输出地图。

制约机器人视觉系统性能的重要因素是信息实时处理的计算复杂度和处理效率,SLAM算法需要在地图密度与计算效率之间取得权衡。

3.3无环境地图

在这类系统中,机器人不需要依赖任何的环境地图信息,机器人的活动取决于其当时识别和提取出来的环境信息,这些环境信息可能是桌子、椅子和门等,不需要知道这些环境元素的绝对位置。无环境地图的导航技术典型的技术有3大类:基于光流的导航技术、基于外观信息的导航技术、基于目标识别的导航技术和基于目标跟踪的导航技术。

3.3.1基于光流的导航技术

光流是三维空间运动物体在观测成像面上的像素运动的瞬时速度,也是图像亮度的运动信息描述。光流法计算最初是由Horn和Schunck于1981年提出的,其利用二维速度场与灰度,引入光流约束方程,得到光流计算的基本算法。光流计算基于物体移动的光学特性提出了2个假设:①运动物体的灰度在很短的间隔时间内保持不变;②给定邻域内的速度向量场变化是缓慢的。如Santos-Victor等人研发了一种基于光流的robee视觉系统,该系统模拟了蜜蜂的视觉行为。在robee视觉系统中,使用单独的双目视觉方法来模拟蜜蜂的中心反射(Centering Reflex):当机器人移动到走廊两侧的墙壁中心时,左眼捕获场景的瞬时速度与右眼捕获场景的瞬时速度是相同的,几乎没有差别,那么机器人就可以知道他们在走廊的中心。如果眼睛两侧的眼睛的瞬时变化速度不同,则机器人移动到较慢的速度。在自动机器人导航的实现中,基于这个想法是测量摄像机捕获图像场景瞬时速度差异。这种导航技术只能用于室内单通道直走道导航,不能引导机器人改变方向,具有一定的局限性。

3.3.2基于外观信息的导航技术

基于外观的机器人导航方法,不需要构建真实的地图导航,机器人通过自身所携带的摄像头和传感器感知周围目标的外观信息进行自主定位和导航。其中,所述的外观信息多为目标信息的颜色、亮度、形状、空间大小和物理纹路等。机器人在导航时存储连续视频帧的环境图像信息,并将连续视频帧与控制指令相关联,从而再执行指令规划有效路径到达目的地。

3.3.3基于目标识别导航技术

为了达到目标点或是识别目标,机器人很多时候只能获取少量的图像信息。Kim等人提出了一种用符号代替导航各个位置的赋值方法。该赋值方法中,机器人执行命令如“去窗边”“去你后面的椅子旁”等。这样,通过相关的符号命令,机器人自动识别并建立路标,通过符号指令到达目标点。例如“去你后面的椅子旁”,这样的命令就是告诉机器人路标是椅子、路径向后。该导航技术的难点在于目标是否可以准确实时识别路标。第一,识别大量不同类别的物体,室内环境有许多不同类别的物体,需要将它们组织到一个在给定的容易搜索图像数据结构中去,起到容易识别是用什么度量来区分物体;第二,识别大量不同背景下的物体,一个合适的物体表达式有助于将图像组织成片断,而这些片断来自于物体的种类且与物体无关的;第三,在抽象层次上识别物体,机器人可以不需要在看到一个具体的杯子之前便能知道它是一个杯子,相关程序能够类似的物体进行识别和区分。

3.3.4基于目标跟踪的导航技术

基于目标跟踪的导航技术,为机器人构造一个虚拟地图,机器人通过摄像头获取连续的视频序定一个跟踪的目标,为了达到对目标的精确定位和实时跟踪,可以利用粒子滤波算法对需要跟踪的目标进行建模。基于粒子滤波的目标跟踪主要包含四个阶段,分别是初始化目标区域,概率转移,目标区域权重计算,目标区域重采样。在机器人导航之前,通过视频序列的当前几帧标注机器人所需要跟踪的目标,在导航时,机器人通过连续的视频帧感知周围的待跟踪目标,同时对所需要跟踪的目标散播粒子,当获取的视频帧对目标区域重采样后足以让机器人确定所需要跟踪的目标时,机器人通过确定的目标为自己规划最有效的路径到达目的地。获取视频序列目标跟踪是算机视觉领域中的重要分支,它在工业生产、交通导航、国防建设、航空导航等各个领域有着广泛的应用。

第4篇:计算机视觉的意义范文

关键词:云计算 数据挖掘 平台设计

中图分类号:TP311.11 文献标识码:A 文章编号:1007-9416(2015)09-0000-00

云计算作为网络计算的升级,其规模大、可靠性高、扩展性好,在构建数据挖掘系统中具有十分大的应用优势。用户不需要担心系统会出现存储不足的问题,只需要考虑算法选择、数据处理内容等等,真正实现了数据利用的方便、快捷。

1云计算概述

云计算指的是一种分布于大规模的数据中心,能够提供大量的服务器资源的计算平台,其能够有效满足科研或是电子商务等方面的需求。云计算涉及到多个领域内容,如:虚拟化技术,基础设施即服务、平台即服务和Saris软件即服务,并行计算和分布式计算等概念。

总的来看,以计算能对不同的客户提供不同的资源,使得普通用户也能够进行海量数据的操作,在云计算基础上,通过构建数据挖掘平台,能够为终端用户提供一个高透明化的界面服务以及开放式接口支持。该平台的出现很好得解决了用户系统存储能力不足的问题,只需要选择合适的算法进行数据挖掘即可。

2基于云计算的数据挖掘平台架构设计

2.1基于云计算的数据挖掘平台架构

基于云计算的数据挖掘平台的功能层次主要包括算法层、应用层以及用户层,具体如下所示:(1)算法层:算法层主要利用的是下一层所提供的数据进行相应的计算,同时还需做好接口的管理工作。因为数据挖掘算法不同,其想要的执行顺序与结果也存在一定的差异。例如:当进行数据清洗算法服务时,其主要挖掘的是噪声数据,在应用数据挖掘算法前要做好接口服务的调用工作,以便及时将完成清洗的数据通过数据层保存在云计算平台内,以便为后续的数据挖掘工作提供更加优良的服务。值得注意的是,在进行数据挖掘调用服务时,其对象主要包括已经完成清洗的数据和不需要清洗的数据。(2)应用层:与其他的几层相比,应用层具有较强的抽象性,其主要工作是将海量数据挖掘所包含的数据和算法见的关系描述成为任务,同时还负责提供应用调用以及接口维护的工作。(3)用户层:数据挖掘平台中用户层的设计设计目的,就是为了向广大用户提供相应的身份验证以及授权。

2.2基于云计算的数据挖掘平台架构设计关键

2.2.1插件系统设计

插件主要是通过采用一定的应用程序,实现接口的合理开发。通常情况下,插件可以分为三个组成部分:一是扩展点;二是业务逻辑;三是调用下层扩展点,这三者均是由一个绑定包与各种服务构成。其中绑定包的主要任务在于进行模块管理,其含有一个服务说明接口、多种服务调用接口。在进行插件系统设计时,必须保证绑定包接口与相关规范要求相符,如果将插件放在某一个特定的目录下,可以被数据挖掘平台识别、加载。

值得注意的是,当前主要是使用原子类型数据组合作为算法插件服务接口函数参数,算法的实现更加具有兼容性,可以说虽然算法实现的难度有了一定的提高,但是使用性大大加强,能够被众多用户用于数据处理。

2.2.2开放接口设计

开放接口主要是其他应用在数据挖掘平台的基础上进行开始需要使用到的接口,通过开放接口,应用开发者能够充分利用数据挖掘平台中的海量数据服务。开放接口设计主要要求为高效、简单直观以及具有高伸缩性,因此本文主要针对表述性状态转移接口(简称REST)进行了具体探讨。

REST接口具有无态的优点,因此当在同一个局域网内对服务器进行重复的调用时,浏览器内的缓冲装置可以起到一定的替代作用才,从而最大限度地减轻服务器运行的压力,避免因为用户量过多而造成服务器崩溃的现象。云计算平台的应用在很大程度上实现了无穷大的数据吞吐,满足系统平台的性能要求。

3基于云计算数据挖掘平台架构的实现

下文主要是以EClipse34为开发工具、Python为开发语言、以Google开放的云计算开发平台AppEngi为开发环境,具体探讨了基于云计算数据挖掘平台架构的实现。

3.1算法模块插件系统

算法模块涵盖了多种算法,例如:数据清洗算法、数据挖掘算法以及结果可视化算法等等。一个完整的数据挖掘过程应包括以下几个部分:(1)云计算中的大量数据都是不规则的、噪声严重的,基于此,必须先通过数据集清洗算法的应用,将原始数据整理为规则的数据集;(2)利用数据挖掘算法对所得到的规则数据集进行处理,以得到需求信息;(3)通过可视化算法,将目标信息传送至客户处。在上述一系列数据处理过程中,数据的调用离不开REST接口的应用。

3.2数据集访问模块

数据集访问模块的实现同算法模块插件系统有着相似之处,也是利用插件实现数据的调用,特别是在进行数据集的访问时,访问模块文件中被检索的地方也处于被用户调用的状态之下。但是,数据集访问模块的不同之处在于,系统会将数据文件分解为很多个元数据的组合和物理访问地址,然后将这些数据组合成字典类型结构的参数传送至数据机访问模块内。

4结语

综上所述,目前云计算平台已经趋于成熟,例如:GoogleAppEngine、GoogleBigtabl等等均能够为数据挖掘平台架构设计与实现提供底层的架构支持,开发者只需要上传应用程序即可,不需要考虑存储量等问题,方便快捷、可靠性高。

参考文献

[1]李凯,.基于云计算的并行数据挖掘系统设计与实现[J].微计算机信息,2011,27(6):121-123.

[2]黄章树,刘晴晴.基于云计算服务模式的数据挖掘应用平台的构建[J].电信科学,2012,28(1):53-57.

第5篇:计算机视觉的意义范文

关键词:知识规则挖掘;城市公共交通;服务质量评价;遗传算法

中图分类号:TP301.6 文献标识码:A

1引言

知识规则挖掘就是从大量的、不完全的、有噪声的知识规则中,提取隐含在其中的、人们事先不知道的有用的知识规则的过程。知识规则挖掘方法[1,2,3]有多种,如机器学习、决策树、神经网络、粗糙集方法、遗传算法等。在这些方法中,遗传算法由于具有高度的鲁棒性和极佳的全局搜索能力而倍受众多学者的青睐。在城市公共交通服务质量评价知识规则体系中,由于评价指标较多,在进行知识规则挖掘时,使用遗传算法尤为有效。利用遗传算法进行城市公共交通服务质量评价知识规则挖掘,就是在已有的知识规则的基础上进一步进行优化,得到隐含在知识规则库中的、更为满意的、新的知识规则。

2城市公共交通服务质量评价指标体系构建

城市公共交通服务质量可以从硬件和软件两个大的方面进行评价。硬件方面包括道路公共交通网络和公交企业本身的设施投入;软件方面则主要指道路交通通行的实际水平与公交企业的软。上述方面还可以进一步细分,直至一些基础性的指标。结合综合评价加指标体系建立的方法,建立城市公共交通服务质量评价指标体系[4-6]。评价指标体系包括四个方面:公共交通网络、公交企业硬性投入、公共交通通行服务水平、公交企业软,具体评价指标有15个,如图1所示。

遗传算法是模拟生物界自然选择和自然遗传机制进化过程来求解复杂问题的全局随机搜索算法[7,8],它以编码空间代替问题空间,以适应度函数为评价依据,以编码群体为进化基础,以对群体中个串的遗传操作实现选择和遗传机制,建立起一个迭代过程。在这一过程中,通过随机重组编码位串中重要的基因,使新一代的位串集合优于老一代的位串集合,群体的个体不断进化,逐渐接近最优解,最终达到求解问题的目的。

由于传统遗传算法存在收敛速度慢、容易出现早熟收敛等缺点[9],本文采用文献[10]中的改进遗传算法(IGA),这种改进遗传算法的工作流程如图2所示。

4.3遗传算子

在本文使用的改进遗传算法中,遗传算子包括选择算子、助长算子、交叉算子和变异算子。选择算子采用两代竞争排序的选择方法来对遗传个体进行优选,遗传个体被区分为雄性和雌性两种不同的性别,把父代与子代的所有雄性个体与雌性个体分别进行重新排序,再按群体规模N分别从排序后的雄性个体集与雌性个体集中截取前N/2个优秀的个体进入匹配池,作为交叉操作的对象。助长算子用来对种群中的个体进行一定概率下的助长,助长操作在选择操作之后及配对操作之前进行,本文是采用基于个体适应度的助长。在交叉操作中,同性别个体之间是不能进行配对的,雄性个体只能同雌性个体进行配对,配对是按个体优劣顺序进行的,个体配对之后还要进行亲缘关系的检测,以保证个体之间的繁殖属于严格的远缘繁殖。在二进制编码方式下,变异操作就是以很小的变异概率从群体中随机选取若干个体,对于选中的个体又随机选取表现型编码中的某一位或多位进行数码翻转,即将1变为0或0变为1。

4.4新知识规则的检验

遗传算法运行结束后,要对挖掘出的新知识规则的有效性进行检验。一方面要检验新知识规则是否被知识规则库中已有的规则所包含,如果被已有的规则所包含,则新知识规则无效;另一方面是检验新知识规则是否与知识规则库中已有的规则相矛盾,如果与已有的规则相矛盾,则新知识规则同样无效。无效的新知识规则将被剔除,有效地新知识规则将被加入知识规则库中。

5实例

一城市公共交通服务质量评价知识规则库(部分知识规则)如表1所示,这个知识规则库即为测试数据集。表1的知识规则编码及适应度值如表2所示。

这二条新的有效的知识规则将被加入到城市公共交通服务质量评价知识规则库中,使知识规则库得以更新。

6结论

本文将一种改进的遗传算法用于城市公共交通服务质量评价的知识规则挖掘,提出了一种基于遗传算法的城市公共交通服务质量评价知识规则挖掘方法。实例表明,遗传算法在进行知识规则挖掘时是完全有效的,能够得到比知识规则库中已有的一些知识规则更优的知识规则。这为知识规则挖掘提供了一种重要途径。

参考文献

[1]刁力力. 数据挖掘与组合学习[J].计算机科学,2001, 28(7):73-78.

[2]Dasarathy, B.V Nearest Neighbor(NN)Norms. NN Pattern Classification Techniques[M]. Washington, D.C.: IEEE Computer Society, 1991.

[3]ZIARKO W. Rough sets, Fuzzy Sets and Knowledge Discovery[J]. New York: Springer-Verlag, 1994.

[4]邵祖峰. 基于神经网络的城市公共交通服务质量评价[J]. 城市交通,2005,7(4):178-180.

[5]张丽花, 张好智, 杨小宝. 基于乘客出行链的公共交通服务质量评价研究[J]. 公路与汽车,2011,7(4):48-51.

[6]邵祖峰. 城市公共交通服务质量评价神经网络模型[J]. 城市交通,2006,4(6):38-41.

[7]雷英杰,张善文,李续武,等. MATLAB遗传算法工具箱及应用[M].西安:西安电子科技大学出版社,2005.

[8]王小平,曹立明. 遗传算法——理论、应用与软件实现[M].西安:西安交通大学出版社,2002.

第6篇:计算机视觉的意义范文

对于同塔双回路,存在两个回路同时受雷击闪络的可能性,双回路同时跳闸将对系统产生较大的冲击,严重影响系统的可靠性,有效防止两个回路同时闪络很重要。根据国内外经验,调整两回路之间的绝缘水平,采取平衡高绝缘配置,对降低或避免因塔顶受雷击而引起的双回路同时跳闸事故是有效的措施;并根据《高电压技术》两回路绝缘水平的差异宜为倍相电压(峰值),差异过大将使线路投资增加。笔者根据以上理由及DL/T620-1997《交流电气装置的过电压保护和绝缘配合》相关规范,针对SZA32和SZ22塔型(占线路70%的直线塔)进行计算和比较,从而提出双回路绝缘配置的建议方案。

关键词:双回线路;绝缘;水平差异;

中图分类号:P619.27 文献标识码: A 文章编号:

一、计算条件及参数选取

为比较方便选用山区线路进行分析计算,导线选用LGJ-300/30,地线采用JLB1A-95,水平档距取450m。

SZA32-24直线塔地线采用了负保护角,SZ22-24直线塔地线采用常规的保护角,杆塔单线图详见图1-1和图1-2。

由于玻璃和合成材料的性质不同,为分析比较方便,在计算时两回路均采用玻璃绝缘子,其型号为LXHY-70。

以上具体相关参数见表1-1。

图1-1SZ22塔单线图图1-2SZA32塔单线图

表1-1线路防雷保护计算参数表

注:上表中有关参数摘自《电力工程高电压送电线路设计手册》(第二版)。

二、双回路不平衡绝缘水平差异程度初估

根据《高电压技术》两回路绝缘水平的差异宜为倍相电压(峰值)和DL/T620-1997《交流电气装置的过电压保护和绝缘配合》规范,雷电冲击u50%放电电压与绝缘子串放电距离的关系式,即u50%,u50%,对110kV线路则有下式成立:

则采用LHXP-70两线路绝缘子片数差额值:片。

可见两回线路均采用LHXP-70绝缘子时,一回按标准配置,另一回以增加2片为宜。

三、SZA32塔防雷保护参数计算

1、线路雷击次数(N)

导线平均高度

地线平均高度

线路雷击次数次/100km・年。

2、线路绕击率()

3、雷击杆塔时的耐雷水平(I1)

有电晕下的耦合系数

杆塔电感

耐雷水平(7×LXHY-70):

若Rsu=5Ω时,则I1=72.34kA。

耐雷水平(9×LXHY-70):

若Rsu=5Ω时,则I1=91.04kA。

耐雷水平(10×LXHY-70):

若Rsu=5Ω时,则I1=99.77kA。

4、雷电流超过I1的概率(P1)

使用7×LXHY-70时:

若Rsu=5Ω时,则P1=15.07%。

使用9×LXHY-70时:

若Rsu=5Ω时,则P1=9.22%。

使用10×LXHY-70时:

若Rsu=5Ω时,则P1=7.35%。

5、雷绕击导线时的耐雷水平(I2)

使用7×LXHY-70时:

使用9×LXHY-70时:

使用10×LXHY-70时:

6、雷电流超过I2的概率(P2)

使用7×LXHY-70时:

使用9×LXHY-70时:

使用10×LXHY-70时:

7、建弧率(η)

使用7×LXHY-70时:

绝缘子串的平均运行电压(有效值)梯度

使用9×LXHY-70时:

绝缘子串的平均运行电压(有效值)梯度

使用10×LXHY-70时:

绝缘子串的平均运行电压(有效值)梯度

8、跳闸率(n)

使用7×LXHY-70时:

若Rsu=5Ω时,则n=2.65。

使用9×LXHY-70时:

若Rsu=5Ω时,则n=1.3。

使用10×LXHY-70时:

若Rsu=5Ω时,则n=0.94。

四、SZ22塔防雷保护参数计算

1、线路雷击次数(N)

导线平均高度

地线平均高度

线路雷击次数次/100km・年。

2、线路绕击率()

3、雷击杆塔时的耐雷水平(I1)

有电晕下的耦合系数

杆塔电感

耐雷水平(7×LXHY-70):

若Rsu=5Ω时,则I1=74.42kA。

耐雷水平(9×LXHY-70):

若Rsu=5Ω时,则I1=93.67kA。

4、雷电流超过I1的概率(P1)

使用7×LXHY-70时:

若Rsu=5Ω时,则P1=14.3%。

使用9×LXHY-70时:

若Rsu=5Ω时,则P1=8.63%。

5、雷绕击导线时的耐雷水平(I2)

使用7×LXHY-70时:

使用9×LXHY-70时:

6、雷电流超过I2的概率(P2)

使用7×LXHY-70时:

使用9×LXHY-70时:

7、建弧率(η)

使用7×LXHY-70时:

绝缘子串的平均运行电压(有效值)梯度

使用9×LXHY-70时:

绝缘子串的平均运行电压(有效值)梯度

8、跳闸率(n)

使用7×LXHY-70时:

若Rsu=5Ω时,则n=1.96。

使用9×LXHY-70时:

若Rsu=5Ω时,则n=0.98。

五、计算结果比较

根据以上计算,同种塔型的不同绝缘水平和不同塔型的防雷保护计算结果详见表1-2、表1-3及表1-4。

表1-2SZA32-24塔不平衡绝缘方式计算结果比较表

注:差异1表示9片绝缘子与7片绝缘子比较的差异百分比;差异2表示10片绝缘子与7片绝缘子比较的差异百分比;差异3表示10片绝缘子与9片绝缘子比较的差异百分比。

表1-3SZ22-24塔不平衡绝缘方式计算结果比较表

表1-4SZ22-24、SZA32-24塔计算结果比较表

六、结论

第7篇:计算机视觉的意义范文

【关键词】计算机;视觉系统;框架构思

在现代计算机技术的支持下,对人类视觉功能进行模拟的计算机系统被称为计算机视觉系统,因为视觉系统本身兼具科学性和应用性,所以计算机视觉系统本身既具有科学学科的特性又具有工程学科的特性。对其的研究不仅能够进一步了解人类本身,而且能够在工业生产领域发挥更大的作用。

1 计算机视觉系统现有理论框架

1.1 计算机世界理论框架

20世纪80年代,麻省理工学院教授Marr在视觉理论研究领域获得突破,提出了利用计算机实现视觉能力的理论框架――计算机视觉理论,这一理论主要特点是以现代信息处理的方式对人类视觉能力作用机制进行了分析,并以人类的视觉能力为基础在计算机技术的支持下形成了三个不同的计算机层次。分别是计算机理论层次、表示层次和算法层次。这三个层次分别对应着人类对视觉信息进行处理的三个环节,通过各个环节的仿生设置,计算机视觉系统就能够将初步的视觉处理能力赋予计算机。这一理论中的核心是计算机理论层次,Marr认为人类的视觉能力主要是从图像中建立物体形状和位置的描述,所以在这一层次中设计者设计的主要环节是从初步获取的二维图像中提取和细化物体的三维结构和位置,并将这些信息在一个二维平面上反映出来,即三维重建。

1.2 基于知识的视觉理论框架

基于知识的视觉理论框架最早产生于20世纪90年代,最早的提出者是Lowe。认为在人类的视觉能力发挥过程中,对三维物体的实际测算是不必要的,人类的视觉能力与三维测算能力没有直接的关系,虽然使用三维测算技术也能够实现计算机视觉系统的功能,但并不是对人类视觉功能的模仿。Lowe认为在人类的视觉活动中,会将三维物体看成二维物体,也会将二维物体看成三维物体。这种现象本身并不是偶然性的,而是一种视觉作用机制的必然。既然人类肉眼能够借助一定的作用机制和处理能力实现二维的三维化,在计算机视觉系统中就完全有可能设计出这种对人类肉眼直接模拟的机制。以感知系统感知物体的二维特性,并在其基础上直接生成三维图像,而不需要借助复杂的测量过程。

1.3 主动视觉理论框架

主动视觉理论是在现有计算机理论的基础上形成的新型理论框架,是根据人类视觉功能实现的主动性提出的。在人类实现视觉功能的过程中,人类的视觉系统并不是被动的,而是会根据视觉系统的要求调动身体的其他部位进行配合的、具有主动性的,所以在人类视觉功能的发挥过程中,视觉系统是具有主动性的,人类视觉系统的视角、关注点都会是动态变化的。

基于这一理论,主动视觉理论框架认为人类的视觉活动是一种“感知――动作”过程。根据这一原则,主动视觉理论框架认为计算机视觉系统并不需要精准的三维测算系统。而应该以计算机视觉获取系统为核心,设置主动的视觉系统。这一理念在实际的应用中主要通过对图像获取系统技术参数的调整和控制来实现,例如摄像机的位置、取向、焦距、光圈等,通过对这些参数的调整图像信息获取系统就能够从不同的视角对物体进行观察,进而获取物体的三维图像信息。

2 计算机视觉理论框架中存在的问题

计算机视觉理论框架的产生极大的支持了计算机视觉系统的研发工作,但是在计算机视觉系统的实际研发工作中,也逐渐暴露出了计算机理论框架的缺陷。当前主流的计算机视觉系统框架中,计算机视觉理论是最早产生的也是唯一一种被动的计算机视觉技术。在其理论系统中更多的强调人类视觉系统的测算能力,而没有意识到人类的视觉系统是一种主观性很强的、目的性很强的信息获取系统,完全建立在测算基础上的计算机视觉理论框架是不必要的。

基于知识的理论框架,认为人类视觉系统的功能实现主要环节是反馈,强调了人类视觉活动中主观意识的指导作用。但是它过于强调系统的目的性和主观性,完全否定了计算机视觉理论,认为人类视觉系统是个完全脱离计算机的认识过程,这种认识显然是错误的,在判断物体尺寸大小、距离远近时,测算无疑是极为必然的。

主动视觉理论并不完全排除三维重建,认为计算机视觉系统的三维重建应该建立在图像获取系统的主动性上。通过改变图像获取摄像机的角度、参数对时间、空间和分辨率等进行有选择的感知,解决了计算机视觉系统认知过程中的不稳定问题,降低了计算机视觉系统实现的难度。但是在其理论框架内部缺乏主观、高层的指导,从整体上看并不完善。

3 计算机视觉系统框架的新构思

在计算机视觉系统的研究领域,三种理论构建各有优劣。但是无疑反应了当前计算机视觉系统研发的主流思想,因此计算机视觉系统框架的新构思应该在其基础上进行,致力于克服各个理论的缺点。综合比较三种理论框架,笔者认为计算机视觉理论虽然存在某些问题,但是从整体上看这一理论框架是最具实践性和操作性的,其存在的问题完全可以借助其他理论框架加以解决,因此笔者以计算机视觉理论为主体,结合基于知识的视觉理论和主动视觉理论,提出一个更加完善和通用的计算机视觉系统构架。

计算机视觉系统视觉功能实现的主体结构还是建立在计算理论结构的基础上的,将计算理论框架中的早期视觉处理环节分为图像预处理、图像分割和二维模式识别两个部分,因为图像的预处理是在平面图像基础上的简单处理,不需要主观主导意识和目的性的参与,同时图像分割和二维模式识别能够最大限度的提升后继图像处理的效果。

在早期处理完成以后,后继的中后期处理还是分别情调了二维模式识别和三维模式识别,虽然这两种模式本身的识别原理是一样的,但是其面对的对象不同,物体的模型也不同。一般来讲,在我们的世界中二维信息具有很强的重要性,图形、文字、指纹等关键二维信息在通常情况下作用更大、应用范围更广,所以计算机视觉系统矿建的新思路中,要对二维信息进行进一步的处理。

模型库提供具体物体模型的表示。知识库不但要对物体进行抽象表示而且还要对抽象知识进行推理。人类经验的积累和知识的获取是通过学习而得到的,所以加人模型库、知识库管理,并让其从输出结果中进行学习。这将使模型库和知识库更加丰富和完善。

视觉活动本身是带有目的性的,所以在有些时候视觉系统的应用确实需要视物体的实际情况来决定,有时只需识别场景中存在的是什么物体或某物是否存在,而不要求定量恢复场景中的物体。因此,在计算机视觉系统中引人视觉目的来判断输出是否满足要求。同时,用视觉目的对图象分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别加以控制。如果需要三维重建则由主动视觉控制成象来获得景物更完整的信息。

计算机视觉系统框架是支持计算机视觉系统实现的重要基础,所以在计算机视觉系统的研发、设计工作中,对理论框架的研究具有鲜明的现实意义,本文简单介绍了现有框架思想,并分析了其各自的优缺点,最后再这些理论框架的基础上形成了计算机视觉系统框架的新构思。认为计算机视觉系统构架应该以计算机理论为基础,以视觉活动的主观性和目的性为指导,以具体的视觉实现形式为方法。

【参考文献】

第8篇:计算机视觉的意义范文

关键词:计算机视觉;案例推理;图像处理;图像描述

中图分类号:TP391.41 文献标识码:A文章编号:1009-3044(2007)04-11102-03

1 引言

基于案例推理(case-base reasoning)是人工智能中正不断发展的一项重要推理技术。基于案例推理与类比推理方法相似,案例推理将旧经验或教训转换为知识,出现新问题时,首先查找以前是否有相似的案例,并用相似案例解决新问题。如果没遇到相似案例的,经过推理后解决新问题的方法,又会成为新的案例或新经验,下一次再遇到相同问题时,就可以复用这些案例或经验。

这与人遇到问题时,首先会用经验思考解决问题的方式相似,这也是解决问题较好的方法。基于案例推理应用于工业产品检测或故障诊断时具有以下特点:

CBR智能化程度较高。利用案例中隐含的难以规则化的知识,以辅助规则推理的不足,提高故障诊断系统的智能化程度。

CBR较好解决“知识获取”的瓶颈。CBR知识表示以案例为基础,案例的获取比规则获取要容易,大大简化知识获取的过。

CBR求解效率较高。是对过去的求解结果进行复用,而不是再次从头开始推导,可以提高对新问题的求解效率。

CBR求解的质量较高。CBR以过去求解成功或失败的经历,可以指导当前求解时该怎样走向成功或避开失败。

CBR持续不断的学习能力,使得它可以适应于将来问题的解决。

所以基于案例推理方法正不断应用在产品质量检测和设备故障诊断方面,并取得较好的经济效益。为了产品检测和设备故障诊断中,更为智能化,更容易实现现场检测和诊断,计算机视觉技术起到很大的作用。

计算机视觉是研究用计算机来模拟人和生物的视觉系统功能的技术学科,使计算机具有感知周围视觉世界的能力。通过计算机视觉,进行图像的获取预处理、图像分割与特征抽取、识别与分类、三维信息理解、景物描述、图像解释,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。

计算机视觉随着科学技术发展,特别计算机技术、通信技术、图像采集技术、传感器技术等,以及神经网络理论、模糊数学理论、小波的分析理论等计算机视觉理论的不断发展和日趋成熟,使计算机视觉从上世纪60年代开始兴起发展到现在,取得快速发展,已经从简单图像质量处理发展到围绕着纹理分析、图像编码、图像分割和滤波等研究。图像的分析与处理,也由静止转向运动,由二维转向三维,并主要着眼于对图像的识别和理解上,也使计算机视觉的应用领域更为广泛,为案例推理中运用计算机视觉打下基础。

2 案例推理系统的主要关键技术

(1)案例的表示与组织

案例的表示与组织即是如何抽取案例的特征变量,并以一定的结构在计算机中组织存储。如何将信息抽取出特征变量,选择什么语言描述案例和选择什么内容存放在案例中,案例按什么组织结构存放在存储器中,这关系到基于案例推理方法的效率,而且对于案例数量越来越多,结构十分复杂的案例库,尤其重要。

(2)案例的索引与检索

案例的索引与检索即是为了查找最佳相似案例,如何建立案例索引和相似度算法,利用检索信息从案例库中检索并选择潜在可用相似案例。后面的工作能否发挥出应有的作用,很大程度上依赖于这一阶段得到的案例质量的高低,因此这一步非常关键。

(3)案例的复用和调整

案例的复用即是如何根据旧案例得出新解,涉及到找出案例与新问题之间的不同之处,案例中的哪些部分可以用于新问题,哪些部分不适合应用于新问题的解决。而复用还分案例的结果复用,案例的求解方法复用。

(4)案例的学习

案例的学习即是将新解添加到案例库中,扩充案例库的案例种类与数量,这过程也是知识获取。此过程涉及选取哪些信息保留,以及如何把新案例有机集成到案例库中,包括如何存储,如何建立索引等等。

针对案例推理的关键技术,根据检测和故障诊断系统的特点,计算机视觉主要解决如何将产品图像输入系统,如何将产品图像特征进行抽取和描述,如何区别产品不同之处。以便案例推理系统进行案例建模,确立案例的表示形成和案例相似度的计算。本文主要从计算机视觉如何运用在案例推理系统进行探讨。

3 产品输入系统

产品输入系统在不同产品类型和生产环境可能有不同之处,主要应有传感器单元和图像采集单元。如图1。

图1 产品输入系统结构

传感器单元主要判断是否有产品存在,是否需要进行图像采集,是否继续下一个产品图像的采集。这简单传感器可使用光电开关,配合光源,当产品经过时,产品遮挡住光源,使光电开关产生一个0值,而没有产品经过时,光电开关产生相反的1值,系统通过判断光电开关的值,从而判断是否有产品。

图像采集单元简单地说是将产品拍摄并形成数字化图像,主要包括光源、反射镜、CCD相机和图像采集卡等组成。光源和反射镜作用主要使图像中的物体和背景之间有较大灰度。CCD相机主要是拍摄设备。图像采集卡主要是将图像数字化。通过传感器判断有产品后,光源发出的光均匀地照在被测件上,CCD相机拍摄,拍摄图像经过图像采集卡数字化后输入存储设备。存储设备即为计算机硬盘。存放原始图像、数据、处理结果等。

这是案例推理系统的原始数据,是图像处理、图像特征抽取描述的基础。

4 图像处理

在案例推理系统中,需要对案例的组织和案例建模,案例的组织即案例的表示,相对计算机而言,即图像特征的抽取,即某图像具有与其它图像不同之处,用于区别其它图像,具有唯一性。同时,又能完整地表示该图像。所以案例的表示要体现案例的完整性、唯一性、操作容易性。

图像中有颜色区别、又有物体大小之分以及图像由不同的物体组成。如何表示图像,或说图像内部包含表示的本质,即图像的描述。根据图像特点,确立图像案例的表示,以图像的像素、图像的数字化外观、图像物体的数字组成等属性。这需要对产品输入的原始图像进行处理。

在计算机视觉技术中,对原始图像主要进行图像增强、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。具体工作流程如图2所示:

图2 计算机视觉的任务与工作流程

图像预处理是将产品的数字图像输入计算机后,首先要进行图像的预处理,主要完成对图像噪声的消除以及零件的边缘提取。预处理的步骤为:图像二值化处理;图像的平滑处理;图像的边缘提取。

图像二值化处理主将灰度图形二值化的关键是阈值的选取,由于物体与背景有明显的灰度差,可以选取根据灰度直方图中两峰之间的谷值作为阈值来分割目标和背景。

图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息。

图像边缘提取是为了将图像中有意义的对象与其背景分开,并使之具有某种指定的数学或符号表达形式,使计算机能够理解对象的具体含义,检测出边缘的图像就可以进行特征提取和形状分析了。可采用多种算法,如采用Sobel算子提取边缘。

图像预处理是为下一步的特征描述打基础,预处理的好坏直接影响案例推理的结果和检测诊断的效率。

特征提取是对图像进行描述,是案例建模关键,案例建模是根据案例组织要求抽取图像特征,是建立案例索引和检索的关键。如果图像没有特征,就谈不上进行检索。图像特征可通过图像边界、图像分割、图像的纹理等方法,确定图像特征,包括是什么产品、产品形状大小、产品颜色,产品有什么缺陷、产品缺陷在什么位置等特征,根据这些图像特征进行描述,形成计算机中属性值,并从数据库查找相应信息资料,从而确定产品之间的关系,相似度,也就是案例推理的方向。

5 系统的检索

根据案例推理原理和相应算法,建立案例推理系统模型,如图3所示。

图3 案例推理系统

对话系统:完成人机交互、问题描述、结果显示和系统总控制。

案例库系统:由案例库及案例库管理系统组成。

数据析取系统:对各种已有的源数据库的数据通过转换而形成所需的数据。

多库协同器:根据问题求解的需要,按照一定的数据抽取策略,完成问题求解过程中对模型库系统、方法库系统、知识库系统和数据库系统等资源的调度与协调。

知识库系统:由产生式规则组成,这些知识包括专家经验和以规则形式表示的有关知识,也可以是数据挖掘结论,支持案例检索、案例分析、案例调整等。 模型库系统:由模型库、算法库、模型库管理系统组成。完成模型识别和调用,并把结果综合,送入对话系统显示,作为补充信息供案例检索、调整使用。

数据库系统:存放待决策支持的所有问题,并完成其维护与查询等功能。

由于系统主要应用产品的现场实时检测监控或故障诊断,所以系统的检索时,也必须输入检索值,即输入现场产品的图像,在通过产品预处理、图像的二值化、分割和边界处理后,进行图像特征描述,根据图像描述进行分类识别。根据案例推理的算法检索案例库中,是否有相似的案例。即确定相似度。相似度确定主要由案例推理的算法确定,如贴近分析法。确定相似度最大作为结果,并将案例的解输出,给相关控制系统进行决策。如产品质量检测,确定产品质量是否合格,是否有不合格产品,不合格产品是什么原因造成,故障源是什么,如何解决和排除故障,等等。

6 结论

案例推理方法有效地解决计算机视觉技术中图像检索问题。对提高图像检索的效率和准确度提供了平台。

计算机视觉技术也为案例推理系统实现产品现场实时检测、监控、诊断提供技术支持。计算机视觉技术现场的数据采集、处理为案例推理打好基础。

两者的结合设计的系统适用范围很广,只要产品需要进行质量检测、监控,或设备需要进行故障诊断和维护,都可以适用。

系统提供的实时检测、监控和诊断功能,提高企业的生产效益,降低了生产成本。

参考文献:

[1](美)桑肯(Sonka,M).图像处理分析与机器视觉[M].人民邮电出版社.

[2]王宏等译.计算机视觉[M].电子工业出版社.

[3]蔡建荣.自然场景下成熟水果的计算机视觉识别[J].农业机械,36(2):61-64.

[4]王宇辉.基于计算机视觉的锥体零件尺寸在线检测算法[J].重型机械,2005,2:4-6

[5]骆志坚.基于计算机视觉检测技术自动计数系统的研究与应用[J].仪表技术与传感器,2005,3:41-43.

[6]左小德.贴近度分析法在案例库推理中的应用[J],南大学学报(自然科学版),1997,18(1):21-26.

[7]姜丽红.案例推理在智能化预测支持系统中的应用研究[J].决策与决策支持系统,1996,6(4):63-69.

第9篇:计算机视觉的意义范文

关键词OpenCV;科学教育;推广价值

1、OpenCV库简介

OpenCV是由Intel微处理器研究实验室的视觉交互组开发的一个跨平台计算机视觉库,它的代码都是开源的而且都经过非常好的优化,并且具有很好的移植性,可以根据需求导入到合适的环境中使用。它可以实现有关图像识别与处理和计算机视觉技术方面的很多通用算法。它的优势是可以运行在当代社会使用热门的各大操作系统上,适用性强,还可以脱离外部库而独立运行。OpenCV的C和C++都是经过优化的开源代码,采用灵活的接口,提升计算机的运行速度。其中包含的函数就有500多个,包括的种类有C和C++等。OpenCV因为免费面向市场,已经被社会各界广泛使用。现已应用于人机互动、图像识别、图像分割、目标追踪、3D重建、机器视觉、结构分析等数个领域。OpenCV主要包括以下几个部分:①cxcore:核心功能模块,包含一些基本函数,运用于各种数据类型的计算。②cv:图像处理和计算机视觉功能。③ml:机器学习模块,主要内容是分类器。④cvaux:包括大部分实验性的函数,例如ViewMorph-ing、三维跟踪、PCA、HMM等。⑤Highgui:图像界面接口,支持摄像头的读取和转换。

2、OpenCV处理图像的功能

OpenCV中有很多的函数,可以实现很多不同的功能,其中最具有学习价值的部分就是图像处理。处理图像主要分为三部分:加载图像,显示图像,处理图像。

2.1加载图像

不同类型的图像有着不同的内部结构。我们需要根据图像的结构采用合适的方法将图像文件中的数据读入内存。OpenCV中的cvLoadImage()函数,可以加载图像数据。而且图像的格式不影响加载的效果,加载后它以一个指向IplImage结构体的指针形式返回,大大方便了后续处理的过程。2.2显示图像加载图像后需要通过函数使其显示。cvNamedWindow()函数由HighGUI库提供,它可以在屏幕上创建一个窗口,将图像显示出来。cvShowImage()函数的作用是在这个创建的窗口中显示出加载过后的图像。观察图像时经常用到的重要函数还有可以使程序暂停的函数cvWaitKey(),以及用于释放内存的函数cvReleaseImage()和cvDestoryWindow(),掌握并运用这些函数,就可以轻松的实现观察图像的功能。

2.3处理图像

OpenCV中包含的多种函数,可以达到图像处理技术方面的很多效果,包括图像灰度化函数cvtColor(),边缘检测函数Sobel()、Laplacian()、Canny(),其中Canny算子只能处理8位灰度图,其余两种8位32位都可以,合并梯度函数addWeighted(),放大缩小函数resize(),阈值化操作函数imshow()等等。适当选用合适的函数并加以运用即可达到目标所需。

3、OpenCV的推广价值体现

OpenCV可以应用在社会的各个领域,价值就体现在每个科学的产物当中。举个近在身边的例子,随着社会的发展,生活质量的提高,人们的居住环境也在逐渐改善,楼层越盖越高,无数摩天大楼,商业大厦群起而立,电梯已经成为了我们日常生活中必不可少的工具。尽管现在电梯的功能、质量不断地提升,但是仍然存在些许不足,当我们在学校的教学楼内等电梯时发现了一个问题,那就是在电梯使用的高峰期时,比如在上下课时段,有很多人都在同一楼层等电梯。但是此时只有一台离该楼层最近的电梯会过来,而其余的电梯都会自动向其它叫梯楼层运行或是闲置。可是此时这一台电梯只能容纳有限数量的人,时常不能使所有人坐上电梯,这样就无法满足全部人的需求,由此就导致了有部分人无法及时地坐上电梯,需要继续等候,而闲置的电梯又不能及时地被利用。这样不仅不能合理地利用资源,反而浪费了许多不必要的时间。因此,我们想到可以通过利用图像识别与处理的方法来弥补这个不足,首先通过硬件设备连接拍照捕获候梯人像,后台运行判断出候梯人数,然后运用语言编程来确定调动电梯的个数,从而来达到实现自动控制每个电梯的运行的目的,使所有人都能在第一时间乘坐电梯。而上文中提到的OpenCV就可以完成这项艰巨的任务。我们将OpenCV导入编程环境,其次修改电梯工作系统的运行程序,将软件与硬件设备相连通,这样通过调度程序,就可以轻松高效地解决这个问题。使用这种方法,不仅可以节约人们的候梯时间,方便学生、老师上课,而且可以合理有效地调度电梯,使电梯的价值得到最大化。见微知著,OpenCV可以应用在每个领域,对各界的发展起到推动作用,造福社会的科技发展,方便人们的生活。

4、科学教育存在的问题

在历年的教学模式中,老师们往往会强调理论知识的重要性,但却忽略了对学生使用动手能力的培养,学生不能独立完成实践性的技术操作,也就是说教学模式缺乏实践性。只有将理论与实践相结合,才能实现知识价值的最大化,因此,应当在教学中配合着实践课程,举一反三,让学生们更加深刻地学习和了解所学到的知识。而如今虽然一部分学校也开设了实践课程,但也只是浅尝辄止,并没有过多地讲授计算机技术实践方面的知识,学生们也没有真正拥有动手实践能力,这使学生们的技术知识十分受限。虽然现在多数学生对计算机略懂一二,但是实际上仅仅会使用类似Word等简单的软件,而技术要求较高的一些软件及工具却全然不知,甚至对自己所学过的课程软件的使用也是马马虎虎,这对于未来工作所需的能力来讲,实在是九牛一毛。目前中学生使用电脑的重心更多放在了社交软件和游戏上,很少有人利用计算机学习更多的技能,这对青少年的发展实在是利大于弊的,而且这样也失去了计算机的正向价值。因此,我们应该改变现有的教学模式,一边教授理论知识,一边配合指导学生动手操作,将理论与实践相结合,也能让学生更好地消化和吸收所学到的知识,并且引导学生正确使用计算机,发挥计算机的价值,让学生们都能够在计算机中获得更多的知识。

5OpenCV开源算法库在各个领域的实例化体现

OpenCV在医学领域、军事领域、安全防护领域等都有很大的重要意义。在医学领域中,由于有了这个开源算法库,我们可以尽可能地调用它,从而来进行图像处理、对象检测,让医生更好更快速观测人体结构,及时发现病症。在军事领域中,大多数无人操作的机器运作,比如无人机飞行、水下无人驾驶仪、无人驾驶汽车等等,都需要用到OpenCV来对图像进行处理,并进行分析,并且可以检测出人眼看不到的事物,这是OpenCV能够带来人类的巨大的进步。在安全防护领域中,我们现实生活中常见的汽车的安全驾驶,房屋入侵的检测、自动监视报警系统等等,正是由于这些技术,让我们的环境更加安全,这都是我们生活中息息相关不可缺少的。现如今,国家的科学技术飞速发展,日益强盛,OpenCV的成绩有目共睹,未来的发展需要科学技术的不断推进,才能为祖国未来的其他事业提供强有力的后盾。

6OpenCV在科学教育中的作用

在文化改革的大背景下,文盲的概念早已从没有文化转变成了不会使用计算机。因为随着科技的进步,计算机的使用已经越来越广泛,计算机已经逐步取代了以往人工可以完成的许多工作,比如在超市生成的结账单、用计算机控制动力系统的运行、人造卫星轨迹的计算等等,这些都依赖于计算机强大的功能。计算机的推广证明着我国科技的发展和人类文明的进步,由此可见,计算机技术知识的掌握对现代人来说是十分重要的。如果想要成为一个真正有技术、有能力的人才,就务必要熟练掌握计算机技术的使用。但是目前当代社会的教育在计算机技术方面的内容还不够丰富。减压政策开放以来,教育课时被压缩,技术知识的传输也相应减少,学生们的能力也因此日益下降。而科学教育,顾名思义,是使科学技术在教育过程中得以传承。想要科学地教育学生,就必须要多多讲授科学技术方面有关的知识。说到科学技术,它的重点自然是计算机技术,而OpenCV作为计算机视觉技术的核心,可以说也是计算机技术甚至科学教育中的一个重要部分。在教育中普及并传承这个技术无疑可以提高学生们的技术水平。但是,相信有大多数的人在此之前从未听说过计算机视觉技术,也并不了解OpenCV库,更加不会学习到与之有关的技术知识。在这样严峻的形势下,我们更应该将类似OpenCV方面技术有关的知识通过教育传递下去。各大高校应积极开展有关计算机的活动,开设与计算机技术有关的课程。这样才能根据社会的需求来培养更多的综合性人才。如果可以将其投入到现代教育当中,定会使现在的教育事业更加辉煌,也能使祖国的未来更加璀璨。

参考文献

[1]于仕琪,刘瑞祯.学习OpenCV(中文版)[M].北京:清华大学出版社,2009.

[2]阴法名.基于OpenCV图像处理[J].科技信息,2009(32):220.

[3]贾小军,喻擎苍.基于开源计算机视觉库OpenCV的图像处理[J].计算机应用与软件,2008,25(4):276-278.

[4]陈胜勇.基于OpenCV的计算机视觉技术实现[M].北京:科学出版社,2008.

[5]刘洁,冯贵玉,张汗灵.一种图像处理和计算机视觉的开发工具[J].计算机仿真,2006(11).