公务员期刊网 精选范文 计算机视觉技术范文

计算机视觉技术精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉技术主题范文,仅供参考,欢迎阅读并收藏。

计算机视觉技术

第1篇:计算机视觉技术范文

关键词:增强现实;计算机视觉;三维注册

中图分类号:TP242 文献标识码:A 文章编号:1007-9599 (2012) 19-0000-02

1 引言

随着计算机技术的迅速发展,计算机视觉、虚拟现实技术、人工智能、计算机图形学等技术被广泛地研究和应用,这些技术引导着人们进入了一个信息数字化的虚拟时代。

增强现实技术(Augmented Reality,AR)作为虚拟现实技术和计算机图形学相结合的产物,它是在通过计算机渲染生成虚拟的物体或文字信息模型的同时,对真实的场景进行标定,从而使虚拟的物体能够被准确地放置到真实的场景中,最终通过显示设备显示出来,使用户处于虚拟和现实相融合的亦真亦幻的新环境中,无法清楚地分辨出真实和虚拟。增强现实技术增强了用户的观感及其与真实场景之间的交互。

增强现实技术作为虚拟现实的一个重要分支,是虚拟现实技术发展过程中的产物。如图1.1所示,该图为Milgram提出的增强现实和虚拟现实关系的一种分类学表示方法。由图我们可以看出,虚拟现实所创建出来的是一种完全虚拟的三维世界,它与真实的世界相隔离。而增强现实是以现实场景为基础,场景中的虚拟物体随着真实物体的变化而变化,提供给用户的是一种复合的视觉效果,就好像这些虚拟物体真实的存在于场景中。

2 增强现实技术的应用

增强现实技术在20世纪90年代真正兴起,其发展与20世纪60年代计算机图形学的迅速发展密不可分。增强现实技术不仅拥有虚拟现实的各种优点,同时又有其独特的视觉增强功能,因此成为了国内外研究机构和知名大学的研究热点,并广泛的被应用于教育、医疗、工业、娱乐、军事等多个领域。

2.1 教育

增强现实丰富了教育学习生活。传统的书籍中只存在文字信息,通过增强现实技术,我们可以透过书籍看见文字相关的动态画面或是影像,图文并茂,极大的增强了学生的学习兴趣。目前的魔法书系统就是这一技术的很好运用,用户通过头盔显示器可以看到书中描述的场景,使读者可以完全沉浸在虚实结合的环境中,提高学习兴趣和效率。

2.2 医疗

增强现实技术可以帮助医生实现可视化手术或手术培训。准确地定位真实场景是增强现实技术的一个重要方面,在医疗中,运用增强现实技术可以进行手术定位,实时地收集病人体内的3D影像,并将其与真实的人体相结合,使得医生可以“透视”病人体内,从而减少手术的风险,该技术对微创手术也有着深远的意义。手术培训方面,通过加入虚拟的提示注解,可以提醒医生手术中的一些必要步骤,降低手术风险。

2.3 工业

增强现实的另一个应用是工业组装和维修。通过增强现实技术可以显示出各种设备零件的内部结构图、使用说明等,方便安装和维修。显示的内容可以不仅仅是简单的文字或图片,更能直接渲染生成3D的图形,并按步骤一步一步的显示出来,方便操作。

2.4 娱乐

电影、广告、游戏、体育比赛转播中,增强现实技术也得到了广泛的运用。体育比赛中,能够在直播现场实时地插入三维的图形、动画、视频等虚拟的比赛相关信息或广告。日常生活中,出现一种增强现实浏览器,它利用多种传感器将日常需求通过实景与虚景结合后呈现在用户面前,用户可以通过增强现实浏览器看到实景的文字介绍、三维模型等,并可以搜索定位。

3 增强现实相关技术

增强现实系统具有虚实结合、三维注册、实时交互三个特点。三个特点之间紧密联系,要求在合成的场景中虚拟的物体能够拥有真实的存在感和位置感。因此显示技术、定位技术、虚实融合技术、用户交互技术是实现增强现实系统的基础支撑技术。

3.1 显示技术

理想的AR系统的显示器具有体积小、移动方便、图像绘制清晰、交互自然等特点,但是目前仍不能制造出完成符合这些特点的显示器。常用的显示设备可以分为四类:普通液晶现实器;头戴式显示器;手持式显示器;投影式显示器。

液晶显示器是最为常见,也最容易得到的显示设备。但是液晶显示器体积较大,移动不方便,限制了用户的活动范围。头戴式显示器,佩戴于用户的头部,这种显示器本身提供了一路或两路摄像机,采用视频合成技术,为用户提供场景的显示。但是头戴式显示器在户外长时间佩戴很不舒服,因此也不能为用户广泛接受。手持式显示器,较头戴式显示器稍有改进,但是也限制了用户手部的活动。投影式显示器能够将场景投影到较大范围的环境中,位置固定,适合于室内的AR系统。

3.2 定位技术

增强现实系统需要将虚拟的物体准确地放置到真实的场景中,因此定位技术显得尤为重要。目前的定位技术主要分为两种:一种是基于硬件的定位技术;一种是基于计算机视觉技术的定位技术。

基于硬件的定位技术一般使用硬件设备定位,主要包括:全球卫星定位系统、测距仪、导航仪、机械装置等。

基于计算机视觉的定位技术一般是从真实场景中获得一幅或多幅图像,根据图像中的信息,计算出摄像机和图形中物体的相对信息,最终恢复出三维场景的结构,从而达到定位的目的。

基于计算机视觉的定位技术主要包括以下几种:

(1)单视图法:在一幅图像中找到六个以上特征点进行跟踪,通过已知的特征点的三维坐标和其成像坐标进行定位。

(2)多视图法:从多个角度拍摄场景,根据常用的角点检测法,检测多幅图像的角点并进行匹配,从而计算出真实场景中物体的景深,最终实现定位。

(3)运动目标的序列图像:根据序列图像估算运动目标的各项参数。

(4)模板匹配法:从多个视角出发寻找真实图像中的物体作为模板数字化图像,继而将虚拟物体叠加到真实场景。

3.3 虚实融合技术

增强现实技术中的虚拟融合主要指虚拟物体在真实场景中的配准,以及虚拟物体与真实场景的一致性。

在增强现实系统的实现过程中,一致性是一个关键性问题。虚实融合的一致性包括动态一致性和静态一致性。其中,动态一致性通常指场景的实时绘制,跟踪过程中虚拟物体和真实场景的空间位置的一致性等;静态一致性通常指虚拟物体与真实场景外观的一致性变化等。

另一方面,为了实现很好的虚实融合效果,必须对拍摄真实场景的相机进行标定,并与绘制虚拟物体的虚拟相机参数进行匹配。摄像机标定主要是对摄像机的内外参数的确定。目前,摄像机标定技术已经较为成熟,主要可以分为三类:传统的标定法,如张正友标定法;自标定法,如基于Kruppa方程的自标定法;基于主动视觉的标定法,如基于射影重建的标定法。三类标定法各有利弊,并没有一种可以普遍适用,因此摄像机标定技术仍是一个研究重点。

3.4 用户交互技术

人们总是向往能够使用自然的方式和虚拟的物体交互,但这是十分困难的,增强现实系统根据跟踪定位获得的有关真实场景的信息对虚拟物体发出指令。目前,交互技术主要使用以下三种方式:

(1)在场景中选择一个或多个特征点作为标记点,这是增强现实系统中最基本的交互方式。

(2)使用计算机识别出人或物体的姿态,进而交互操作。

(3)制作特殊工具,能够通过按键等简单方式触发事件。

4 结束语

本文总结了现阶段增强现实技术的应用领域,并对其涉及到的关键技术进行了阐述。增强现实技术作为一个多学科交叉的研究领域,必将飞速发展,更多的融入到我们的生活中。

参考文献:

[1]纪庆革,潘志庚,李祥晨.虚拟现实在体育体育仿真中的应用综述[J].计算机辅助设计与图形学学报,2003,15(11):1333-1338.

[2]陈靖,王涌天,闫达远.增强现实系统及其应用[J].计算机工程与应用,2001,15:72-75.

[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.

第2篇:计算机视觉技术范文

【关键词】视频跟踪 手部识别

1 引言

计算机从诞生至今,其输入设备从最初的机电开关,逐渐发展为打孔纸带、磁带,再到今天的键盘、鼠标和游戏手柄,向计算机输入数据的效率越来越高,但方法的本质并未改变,都要将自然信息通过机械式方式输入计算机。这些方式都是基于2D的图形界面,将用户的操作限制于特定的外部设备上,无法实现自然而随意的人机交互。长时间使用,会使用户感到疲惫,导致用户体验下降。

对于用户来说,人的语音、手势等可以说是最为自然、最为方便的交流手段,同时手势在3D环境中意义明确、方向精确,是极好的人机交互手段。许多大型互联网公司与游戏公司早就对此进行了探索。微软,索尼,任天堂等公司有着自己研发的外部设备,如游戏手套和传感器等,以此来捕捉并记录手部的运动轨迹,实现特定的操作乃至体感游戏。但这类外部设备的缺陷也是很明显的:这类设备一般为机械传感器式或光纤传感器式,带有传感器、机械部件甚至用来与主机连接的电缆等,沉重、累赘、不灵活;且通常价格昂贵、极易损坏,用户体验不佳;更重要的是限制于特定平台,不具备通用性,普及度不高。

若能实现基于计算机视觉技术的手势识别及操作系统,不仅可以将我们的双手从特定外部设备上解放出来,使操作更加轻松、随意,还能获得更好的人机交互体验,推动“虚拟现实”的研究。目前已经有了大量的跟踪算法和相关设别,如微软的Kinect摄像头及最新的Hololens头盔已经能达到很好的效果,但都较为复杂。因此本文研究一种简单通用的基于计算机视觉的手部跟踪算法。

2 手部区域提取

2.1 样本采集

为了保证研究的顺利进行,首先需要采集手部样本图片。为保证实验结果的准确性,样本图片数量最好在100张以上,并记录不同姿态,其中男性样本和女性样本的数量保持相等。

2.2 肤色信息分析

肤色信息近似为皮肤的颜色信息,物体表面的颜色即表面色是因光照而呈现的颜色[6]。我们采用RGB颜色模型对手部表面肤色进行分析,发现肤色处于某个范围之内。方法如下:手动提取样本图像中的手部,对其进行RGB颜色分量统计,得到各分量直方图。由于各分量直方图上手部体现为一个近似波峰,所以可取波峰的半峰全宽(Full Width at Half Maxium)作为手部的肤色阈值。

根据肤色阈值提取手部,设HandSkin表示肤色阈值范围,RGB(m, n)表示点(m, n)处的颜色信息,而bw(m, n)代表该点是否是手部,则:

2.3 模式识别

通过肤色信息初步提取手部后,可能会有孤立的局部点集出现。为此,统计所有互相连接的点集,提取点集对应的几何特征,建立规则来选取符合手部的点集。

几何特征一般包括面积、周长、重心等。而手部可以分为手掌和手指部分,手掌形状近似于椭圆,手指为细长的柱体,因此整个手部的周长面积比会与其他物体有所区分,所以根据周长面积比将手部从背景中提取出来:

面积:指物体区域包含的像素数,用符号s表示。

周长:物体轮廓线上像素间距离之和,用符号c表示。在进行周长计算时,需根据像素间的连接方式,分别计算距离。像素间距离可分为并列连接像素与倾斜连接像素。并列有上下左右四个方向,像素间距离为1;倾斜方向有左上、左下、右上、右下,其像素间距离等于单位正方体的对角线长度。本文中先获取二值图像的边缘信息,再使用8向链码求周长。

周长面积比:用r表示,r = c/s。

求得所有样本的面积周长比后,通过统计建立规则,并排除异常数据。设h表示点集,hand表示手部,handrule表示手部点集所必需满足的规则,noise表示噪声,s.t.表示满足,则最终的手部点集为:

3 手部跟踪

基于计算机视觉的手部跟踪算法具体步骤:

步骤1:第一帧图像预处理。根据上文所述方法进行第一帧的初始化。通过肤色信息和面积周长比特征提取出第一帧图像中的手。为了方便描述手的运动轨迹,用几何图形来近似表示手部区域,本文选用包围手部区域的最小椭圆来表示手部,该椭圆的中心O1表示手部中心点。

步骤2:依次扫描视频的每一帧。对于第n帧,由于相邻帧的时间相隔较短,手部不会有太大位移。根据上一帧手部区域的位置,设置该帧的扫描范围。通过第2章方法,得出当前帧手部的中心点On。不断重复算法直至视频结束。

步骤3:描绘运动轨迹。从视频最后一帧的中心点On开始,逆序依次连接On与On-1,直至视频第一帧的中心点O1,得到完整的手部运动轨迹。

4 结论

本文所提出的以手部肤色信息为基础的手部跟踪算法,工程实现上较为简答,算法效率高,经试验测试,能够较为准确地再现手部运动轨迹。同时,该种方法也具有缺点,在手部快速移动或做复杂运动时,算法所描绘的运动轨迹可能会出现断裂,且该算法对光照敏感,在过强或过弱光照条件下,算法的准确性都会受到影响。今后的工作将继续完善本算法,将尝试以HSI颜色模型进行分析,考虑引入手部纹理与边缘信息,减弱算法的光照敏感性,采用专家系统、智能优化、神经网络、特征降维等高级技术。

参考文献

[1]俞烈彬,孟凡文.武器装备系统中的人机交互新技术[J].电子世界,2013(12): 164-165.

[2]孟艳丽,郭建.二语演讲中手势功能的实证分析[J].河南科技大学学报(社会科学版),2014,32(3):62-67.

[3]刘晋钢,刘卫斌,刘晋霞.Kinect与Unity3D数据整合技术在体感游戏中的应用研究[J].电脑开发与应用,2014, 27(11):7-14.

[4]张蓬,王晓冲,陈建义.多自由度机械臂的虚拟现实仿真实现[J].机械设计与制造,2015(01):128-134.

[5]闫庆森,李临生,徐晓峰,等.视频跟踪算法研究综述[J].计算机科学,2013, 40(6A):204-209.

[6]奚吉,赵晓铃,张煜东.改进的沃尔什滤波的图像插值算法[J].计算机工程, 2010,36(22):211-213.

[7]张煜东,吴乐南,王水花.专家系统发展综述[J].计算机工程与应用,2010, 46(19):43-47.

[8]王水花,张煜东,吉根林.群智能算法的理论及应用综述[J].南京师范大学学报(工程技术版),2014,14(4):31-38.

[9]张煜东,吴乐南,韦耿.神经网络泛化增强技术研究[J].科学技术与工程,2009(17):4997-5002.

[10]张煜东,霍元铠,吴乐南,等.降维技术与方法综述[J].四川兵工学报,2010, 31(10):1-7.

作者简介

罗伟,男,江西省景德镇市人。现供职于南京师范大学计算机科学与技术学院。研究方向为手势跟踪。

通讯作者

张煜东,男,江苏省南京市人。博士学位。现为南京师范大学计算机科学与技术学院教授。研究方向为图像处理。

作者单位

第3篇:计算机视觉技术范文

诞生于20世纪40年代的电子计算机是人类最伟大的发明之一。并且一直以飞快的速度发展着。进入21世纪的现代社会,计算机已经进入各个行业,并成为各行业必不可少的工具。如今的计算机发展的更加智能化,就如今来说,人们最什么事情都非常重视信息,人类和社会的发展,时刻都离不开信息。计算机如今重视的方面就是对信息的阅读和控制,人脸检测与识别技术也是应运而生。

人脸识别的论述

人脸识别是人类视觉中的一大特色,因为能对身边的人进行识别,才不会对身边的信息进行混淆,简单来说,根据人脸可以对人的年龄,性别进行初步判断。随着计算机技术的智能化,计算机业已经通过视觉能进行人脸的识别。其中在对人脸识别的同时进行有关信息的收集、识别、提取、变换、存储、传递、处理、检索、检测、分析和利用等技术。如今人脸识别已经应用于很多的领域,但是要人脸检测与识别是需要基于本来已经收集和整理的信息本库才能进行。再加上现在计算机技术虽然已经接近成熟,然而在人脸识别方面的表情传达出什么信息还是无从下手进行编程和设计。所以,基于计算机视觉的人脸检测与识别技术还是会有很广的发展空间,再加上人脸识别还可以维护人们的财产安全和隐私保护,必然会引起社会各界人士的广泛关注。

从19世纪末开始就已经有人对人脸识别进行了研究,因为当时没有先进的科学技术做后盾,所以经过了数百年的研究仍然没有什么显著的进展和成果。直到20世纪90年代人脸识别才成立了自己的学科,在加上当时的科技发展水平已经达到了不错的水平,人脸识别这个学科得到了快速的发展。如今,我国的计算机技术也已经居于世界的前列,我国也已经拥有比较完善的一套东方面孔的人脸数据库。

人脸识别在发展过程中大概经历了三个阶段:第一阶段就是对人脸特征进行整理,整理出所需要的数据库,并且应用当时的计算机技术做出一套质量不错的人脸灰度模型,这个阶段的识别工作全部由操作人员来完成;第二阶段比第一阶段要先进,有了基础人机互交,将人脸的特征经过多维度的矢量在模型上表示出来,并也可以设计出一套人脸识别的系统,这个阶段的识别不再是仅仅依靠操作人员,而是操作者和计算机一起完成;第三个阶段是计算机智能识别的最高峰,一切操作和识别都依靠机器全自动化进行,在人脸识别过程中也不再是每台计算机都需要完成一整套的工作,也实现了计算机与计算机之间的互联,多台计算机一起完成人脸识别的过程,都人力也是一种解放。

积极践行人脸检测识别技术

人脸检测识别技术是计算机实现智能化特征后的又一重要发展方向之一,它已经在世界范围内得到了广泛的普及与应用。人们可以通过人脸识别来进行定位,来起到保护人们财产安全的作用,通过人脸识别来抵制社会中的造假率,之前曾经有一些不法分子利用假身份来做损害公共利益和侵犯人们隐私权的事情,有了人脸识别让不法分子没有可乘之机,也应用人脸识别来对财务密码进行联系,起到对人们的财产有绝对的保护作用,对社会的安定何尝不是一项有意义的发明。

人脸识别一直是计算机智能化发展过程中的一个重要领域,因为人脸的识别与检测是一个很难做到完善的项目,由于人类的面部表情丰富,要对人类的面部表情做出判断和分析会存在一定的困难。再加上人脸识别的过程中,每个独立存在的个体都有一张专属于自己的脸。它的轮廓没有明显的特征界限,同时对眼、鼻子、嘴等器官在脸上的分布情况也没有明确的界限,这就使得对人脸识别来进行算法设计有一定的困难,所以只有通过轮廓特征来进行初步的判断,分辩出各种器官,再根据器官来完成人脸的分布情况设计灰度模型的完成工作。

第4篇:计算机视觉技术范文

1 双目立体视觉概述

双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。

双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。

视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。

2 双目立体视觉技术的原理

立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。

三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。

双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。

双目立体视觉在计算机技术中实现三维重建的大致流程

如下。

1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。

2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。

3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。

4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。

5)根据得到的视差图最终实现场景的三维图形的重建。

3 双目立体匹配技术的研究难点和未来的发展方向

尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。

立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。

1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。

2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。

3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。

从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。

4 结束语

人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。

参考文献

[1]高文,陈熙霖.计算机视觉算法与系统原理[M].北京:清华大学出版社,2002.

[2]明祖衡.双目立体视觉测距算法研究[M].北京:北京理工大学,2008.

[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SAD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.

[4]陈蛟.双目立体匹配的算法研究及其多核并行化[M].南京:南京邮电大学,2012.

第5篇:计算机视觉技术范文

【关键词】计算机视觉技术 马铃薯外部品质 检测

随着计算机技术的不断发展,计算机视觉技术应运而生并在工业自动化以及农产品检验检测等领域成功应用。其中,将计算机视觉技术用于以自动化采集和品级分级为代表的果蔬商品化处理具有非常广阔的发展空间。我国政府将“农产品深加工技术与设备研究开发”列为我国“十五”重大科技攻关项目的第一项,这标志着计算机视觉技术在果蔬外部品质检测中会发挥越来越重要的作用。

马铃薯是世界上仅仅排在小麦、水稻和玉米之后的第四种主要农作物,种植区域非常广泛。马铃薯品质检测是马铃薯深加工的一个关键步骤,目前,该检验过程多数采用人工检测,不仅成本高、效率低,而且与检验员的专业素质有密切的关系,受到人为因素影响的程度较大,严重制约的马铃薯加工企业的发展。计算机视觉技术能对农产品的某些特性变化和缺陷进行识别,具有客观、无损害等特点。本文对基于计算机视觉的马铃薯外部品质检测的应用进行了研究。

1 应用计算机视觉技术对马铃薯进行外部品质检测的必要性

随着“麦当劳”、“肯德基”的餐饮服务业的快速发展,炸薯条、炸薯片已经成为一种休闲食品深受消费者的喜爱,推动了我国马铃薯产业的发展。然而,情况并不十分乐观,与国外的马铃薯企业相比,我国马铃薯加工企业生产规模小、生产产品单一、技术设备落后、产品质量不高的现象导致我国的马铃薯产品销售困难,经济效益逐渐下滑。

基于以上现状,对马铃薯的加工研究还有很长的一段路程。企业要扩大生产规模,针对中国的消费趋势与消费水平开发出新的马铃薯产品,从而提高我国马铃薯产品的竞争力。这就要求马铃薯加工企业要对马铃薯的加工技术进行创新,保证产品质量。其中,马铃薯外部品质检测对马铃薯产品的最终品质起着决定性作用。当前的人工检测方式已经不再适应社会发展的要求,利用计算机视觉检验代替人工检验成为社会发展的必然趋势,这是因为计算机视觉技术具有以下优点:

(1)精度高,能够进行定量测量。

(2)自动化程度高,一次就可完成包括大小、形状、颜色以及缺陷在内的检测和分析,并能进行综合识别。

(3)无损检测,计算机视觉检测过程不需要接触产品,是通过传感器扫面获取图像的,不会造成产品的损伤。

(4)信息量大,可对大量信息进行采集,对光谱的敏感范围也很广。

2 基于计算机视觉的马铃薯外部品质检测的应用研究

2.1 马铃薯大小的检测方法

马铃薯的大小检测不仅影响马铃薯深加工的商业价值,在在遗传和育种方面也有很高的应用价值。

利用计算机视觉技术对马铃薯大小的检测步骤如下:先从摄像机中获取马铃薯的图像信息,在图像信息的基础上对马铃薯三维空间的几何信息进行计算,并由此重建和识别马铃薯。而马铃薯物体表面某点的三维几何位置与其在图像中对应点之间的相互关系是由摄像机成像的几何模型决定的,这些几何参数成为摄像机参数。要想准确的获取这些摄像机参数,就必须将实验与计算相结合,此过程成为系统定标。

系统定标的基本步骤:根据设定好的摄像机模型和特定的实验条件包括形状、尺寸等已知的定标参照物,经过对马铃薯图像的处理,并利用一系列的数学转换和计算方法将摄像机模型的内部和外部参数计算出来,从而建立照片与实物的联系推算出马铃薯的真实尺寸。

2.2 马铃薯形状的检测方法

根据《中国马铃薯栽培学》中的知识,我们可以把马铃薯的块茎形状分为三类,分别是圆形、长筒形和椭圆形,除了这三种形状,其余都是这三种形状的变形。此次研究将马铃薯分为圆形、椭圆形和长筒形,并且采用椭圆的短长轴比来模拟马铃薯的纵横直径之间的关系。

2.2.1 马铃薯形状特征参数的提取

将马铃薯椭圆的短长轴比R作为形状特征参数,并按照R的大小将马铃薯进行分类。当R小于0.67时,称之为长筒马铃薯;当R大于0.85时,称之为圆形马铃薯;当R介于0.67到0.85之间时,称之为椭圆形马铃薯。

2.2.2 结果与分析

随机抽取114块马铃薯,对抽取的马铃薯进行正反两面拍照,挑选清晰度最高的228张图片。人工分类后进行计算机视觉分类,操作步骤具体如下:

(1)用DIPS预处理:B通道灰度化,中值滤波和Otsu分割;

(2)通过计算机视觉技术提取马铃薯图片的短长轴比R;

(3)将人工分类与计算机视觉分类进行对比,并得出正确率。

根据图表,我们可以看出在228张仅有两张图片被分类错误,正确率高达99.1%,而这两个分类错误的马铃薯的短长轴比处于0.67周围,分别为0.667604 , 0.67193和0.671887, 0.661063,又因为对马铃薯形状的分类不需要类似工业生产那样精密,所以,当正反两面短长轴比接近时都可看作是椭圆形。

2.3 马铃薯的缺陷检测

计算机视觉技术具有实时、客观、无损的检测特点,能对马铃薯的表面缺陷和某些特征要素进行快速检测。基于此,国内外很多研究学者进行了大量的实验研究,在1998年开发了利用PC机辅助的实时马铃薯检测系统,能够对马铃薯的重量、颜色以及形状进行快速检测;2000年,相关研究者在此基础上建立了计算机视觉检测系统,不仅能实现大小、形状的检测,还能对马铃薯表面的生长裂缝、机械裂缝、绿皮等表面缺陷进行检测。当前对马铃薯表面缺陷进行检测的主要计算机视觉技术包括缺陷分割法和缺陷识别法两种方法。

3 结论

本文应用计算机视觉技术对马铃薯的大小、形状和表面缺陷等外部品质进行了检测,但是还未能实现利用计算机视觉技术对马铃薯的表面缺陷进行分类这一技术。因此,相关部门要加大研究力度,争取早日完善计算机视觉技术,从而推动我国马铃薯加工企业快速高效的发展。

参考文献

[1]鲁永萍.基于机器视觉的马铃薯外部品质检测与分级.机械设计及理论[D].内蒙古农业大学.2013(学位年度).

[2]史崇升.基于高光谱成像技术的马铃薯外部品质无损检测建模及优化研究.电子与通信工程[D].宁夏大学.2014(学位年度).

作者单位

第6篇:计算机视觉技术范文

【 关键词 】 云计算;关联规则;Apriori Map/Reduce

1 引言

随着我国开放大学建立及网络学院的发展,高中起点升本科,专科起点升本科,高中起点升大专三个层次的多个不同专业吸引了更多的人选择参加远程教育完成学习,网络学习云平台上及网络考试系统中也就保存了大量数据,在这些数据中隐藏很多对远程教学有价值的信息,有助于教学管理人员及时分析学生学习情况,更好地整合网络学习平台上的教育资源。如果仅使用传统数据挖掘方法,就会由于数据量巨大而导致系统处理速度缓慢,频繁的输入输出会影响系统响应时间,节点效率不同也会出现挖掘效率不高的情况。为此在对网上考试系统所存储的海量数据信息进行挖掘时,引入能够在云计算环境下运行的数据挖掘算法,利用云计算环境中分布的计算节点,来支持数据挖掘算法的并行执行,弥补传统数据挖掘算法的不足,能从海量的考试数据资源中找出有价值的数据信息。

2 云计算与数据挖掘相关概念

2.1 云计算下MAP/REDUCE并行编程模型介绍

云计算的概念最先由Google埃里克·施密特在2006年首次提出,其基本原理是将大的海量数据的计算任务分割成小的微量的计算任务,将计算任务细分后由分布在网络上的计算节点通过并行计算实现,最后将细化的计算结果数据汇总,得到最后的计算结果。在当前的网络教学平台中就已经开始引入云的概念,将优质的教学资源作为云,学习者只访问自己学习相关的资源而不用考虑该资源所在位置,学习结束后通过网上考试系统完成测试。

MapReduce 是 Google 发明的并行分布式编程模型,被广泛应用于云数据计算中,用MapReduce来处理的数据任务必须能分解成独立的小数据集,而且各个小数据集能够并行处理,通过 Map阶段将待处理数据分割成小的独立数据块,分别让不同的空闲计算节点来进行计算,达到分布式运算的效果,再通过 Reduce 程序将计算结果汇总输出。

2.2 关联规则及Apriori算法介绍

数据挖掘目前公认的定义是:数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

关联规则由Agrawal 等于1993年首先提出,就是要从当前数据库中挖掘出各个项集间存在的某种规则,形成关联规则的项目集必须是频繁项目集,也应满足最小支持度和最小可信度。

对于云计算平台上的海量考试数据进行挖掘,主要目的之一就是希望能通过挖掘大量的考试信息发现试题之间隐藏的内在联系,这在功能上属于关联分析。例如,关联规则可以表示为“答对了题目3的考生中有80%的人也答对了题目9”。从这些规则可找出试题中题目之间的关联性,帮助教师分析学生知识掌握情况以及分析题目之间的互相影响性,以便帮助提高教学质量。

Apriori算法的基本思想是找出所有的频繁项集,这些频繁项集出现的频繁性要大于等于预先定义的最小支持度,由找出的这些频繁项集产生同时满足最小支持度和最小可信度的强关联规则。

3 云计算环境下Apriori算法的Map/Reduce模型化设计

要在云计算环境下应用Apriori算法,要将算法按照Map/Reduce的编程模型并行化设计并执行,然后由主控程序控制算法应用云存储环境中的数据运行。主程序按照使用者指定的数据块大小将云存储中数据分成独立的N个数据块,并将这些数据块分发到云平台中各个空闲的计算节点去运行,在进行数据预处理后,Map进程对处理好的目标数据进行计算,得到局部的频繁候选项集,再由Reduce进程对Map过程产生的局部候选频繁项目集做归并处理,产生总体的全部候选项目集,然后按照给定的最小可信度和最小支持度找出全局的频繁候选项目集,得到有关的关联规则。

云计算环境下的 Apriori 算法Map/Reduce化包括3个过程,首先是数据准备过程;其次是Map函数过程找到各个独立数据块的局部频繁项集;最后由Reduce过程通过归并处理接收Map过程得到的局部频繁项集,从中找出全局频繁项集,得到所需要的强关联规则。

Map/Reduce 化后 Apriori 算法的执行步骤如下:

(1) 数据库中待处理数据首先要按照要求分割成相对独立的N个小数据块,并按照所需要求进行数据清理处理和筛选处理,得到处理后的N个候选数据项集。

(2) 由Master将N个候选数据项集分派给不同的工作节点,每个节点执行不同的Map进程,利用参数KEY,产生的VALUE,按照系统设定的最小支持度和最小可信度要求计算出局部的频繁项集。

(3) 由Map过程得到的局部频繁项集保存到本节点硬盘上,准备交给Reduce过程处理归并。

(4) Map过程结束后,由Master主程序将本次硬盘存储的局部频繁项集具置信息传递给Reduce归并过程,由主程序决定让云计算环境中的空闲计算节点来运行完成Reduce过程。

(5) Reduce过程主要是从存储区读取局部频繁项集数据,然后通过归并处理得到全局的数据候选项集,再找出满足大于系统给定的最小可信度和最小支持度的频繁项目集。

(6) Reduce过程得到的数据传递给用户,由用户对数据进行整理找出符合要求的强关联规则。

4 实验过程及分析

4.1 MapReduce化的Apriori算法考试数据挖掘应用

网上考试系统中保存海量的学生考试信息,其中学生考试成绩是很重要的一项数据信息,利用MapReduce化的Apriori算法对海量考试数据信息进行挖掘,主要是对学生成绩信息进行挖掘,找出所学课程之间的相关性,可以更科学地帮助教师制订合理的教学计划进程,以指导学生顺利完成学业。

如在对网络云平台上考试系统中的数据信息挖掘时,要找出学生的学习课程之间的相互关联性,可以从学生的课程考试成绩入手。首先要处理数据,将学生课程成绩92分以上的设置为1,表示该门课程成绩为优秀,其它低于该分数的成绩设置为0,表示该门课程成绩不优秀。该数据库表中有三门课程,包括程序设计基础,计算机基础和VB课程,选取部分学生成绩数据,要对上述优秀课程进行云计算环境下的关联规则挖掘,假定最小支持度为40%、最小可信度为60%时,设定key和value参数值,首先由Master分配数据块给各个Map,找出局部的频繁项目集,再由Reduce过程归纳局部频繁项目集得到全局候选项集,根据设定的最小支持度和最小可信度,找出全局频繁项目集。可以得出如下规则:

(1)程序基础成绩优秀,VB成绩优秀=〉计算机基础成绩优秀的可能性大于100%;

(2)VB成绩优秀,计算机基础成绩优秀=〉程序基础成绩优秀的可能性大于100%。

根据以上挖掘得到的规则可以得知,VB程序设计课程与程序设计基础课程之间有某种联系,能够相互影响,程序设计基础这门课程成绩会影响到VB课程成绩,计算机专业责任教师在设计教学计划时,可以将程序设计基础课程作为VB程序设计课程的先修课,这样学生成绩为优秀的可能性就更大。

同样的可以利用MapReduce化的Apriori算法在网络考试数据信息中挖掘出相关学科之间不同知识点的影响程度,以实现在教学中在讲授某一知识点时的知识扩展和准备。我们设定最小支持度为96% 最小置信度为97%

通过挖掘后,得到如下的规则:

站点颜色与主题 =〉网站风格的设计 96.8% 98.3%

网站风格的设计=〉站点颜色和主题 96.8% 97.2%

网页信息的强势 =〉页面设计 97.6% 96.5%

其中,每一行为一条关联规则,数字分别表示他们的支持度和可信度。如第2条规则表示,网站风格设计的知识点与站点颜色和主题的知识点有很强的关联性,由于有96.8%的学生对这两个知识点的掌握都比较好,同时有97.2%的学生属于对网站风格设计知识点掌握的好也对站点颜色和主题知识点掌握的好。这就说明网站风格设计的知识点可以作为站点颜色和主题知识点的知识准备,教师在讲解网络信息制作与时要重点强调该部分内容,也可以在讲解DREAMWEAVER课程中将网站风格设计的相关概念给出,这对学生学习会有很大的帮助。同时,该规则可以帮助教师在进行试卷设计时,将这两个知识点的内容同时考察,这样学生的得分率会更高。

4.2 MapReduce化的Apriori算法和传统的Apriori算法挖掘效率对比

为了验证使用基于云计算环境的Apriori算法与传统的Apriori算法在对海量的考试数据信息挖掘方面的优越性能,进行数据实验测试。本测试环境是在局域网范围内配置一定数量节点的集群环境,每个单一节点的软硬件配置都统一,利用Hadoop 自带的 MapReduce Tools for Eclipse ,配置好 MapReduce分布式编程环境。测试数据来源于网上考试系统保存的学生考试数据信息。设定最小支持度为0.2,最小可信度为0.1。通过使用MapReduce化的Apriori算法和传统的Apriori算法对海量的考试数据信息进行挖掘,将得到的测试结果进行比较,得到的结果是在数据规模比较小的情况下,传统的挖掘方法和云计算环境下的挖掘方法耗费的时间差别并不大,但是随着数据规模的增大,使用传统的Apriori算法进行的单节点数据挖掘所耗费的时间越来越多,而使用MapReduce化的Apriori算法则显现出了更好的计算效能,在对网络考试系统的大规模数据信息进行挖掘时系统性能表现很好,解决了传统数据挖掘在面对海量数据信息进行挖掘时的系统响应速度慢,各个节点的输入输出量巨大时负载不均衡,挖掘效率不高的问题。

5 结束语

通过对网络考试系统的海量考试数据信息进行挖掘,验证了云计算环境下应用基于Map/Reduce编程模型的Apriori算法进行数据挖掘,能够解决传统数据挖掘算法在对大规模数据挖掘时出现的系统响应速度慢,整体挖掘效率不高的问题,希望在数据量越来越多的云教育时代,基于云计算环境的数据挖掘能发挥出更大的作用。

参考文献

[1] 陈嘉恒.分布式系统及云计算概论.清华大学出版社, 2011.5.

[2] 赵虎.云计算环境下的关联数据挖掘算法实现.电子科技大学,2011.6.

[3] 苏海英.数据挖掘中关联规则算法的分析与优化研究.吉林大学,2006.

[4] 孟小峰.数据挖掘:概念与技术(M).机械工业出版社, 2001.

[5] 安淑芝.数据仓库与数据挖掘.清华大学出版社,2005.6.

[6] 戎翔.基于MapReduce的频繁项集挖掘方法.西安邮电学院学报,2011.7.

[7] 谢桂兰.基于Hadoop模型的应用研究.微型机与应用, 2010.8.

[8] 季一木,康家邦,潘俏羽等.一种云计算安全模型与架构设计研究[J].信息网络安全,2012,(06):6-8.

[9] 胡春辉.云计算安全风险与保护技术框架分析[J].信息网络安全,2012,(07):87-89.

[10] 江伟玉,高能,刘泽艺等.一种云计算中的多重身份认证与授权方案[J].信息网络安全,2012,(08):7-10.

第7篇:计算机视觉技术范文

关键词:视觉技术;太阳视位置;算法

DOI:10.16640/ki.37-1222/t.2017.06.204

1 引言

基于太阳能利用涉及的太阳位置算法的研究源于20世纪60年代。1969年的Copper算法、年的Spencer算法、1988年Michalsky提出的基于天文算法的太阳位置算法,以及2004年Reda提出的精度较高的SPA算法。这些算法均需计算出太阳视赤纬、当地太阳时角,并以此为变量,利用球面三角公式或矢量法计算太阳视位置的地平坐标(高度角、方位角)[1],算法复杂、计算量大,影响太阳位置时时准确地获取,不利于实现自动化跟踪控制。基于视觉技术的太阳视位置算法是借助视觉技术代替人眼通过采集地平坐标系下的影子图像,经图像处理分析后,建立太阳方位角和高度角的算法,从而确定太阳视位置。这样的研究是基于机器视觉技术的新的尝试,也是目前太阳能跟踪众多方法中尚未涉及的新领域。

2 图像处理

视觉系统采集的图像,在形成、传输、接受和处理的整个过程中,由于受到噪声和图像特征衰减等方面的影响,会降低图像的质量。因此,对图像进行分析之前,必须先对图像进行处理,以便为后续图像分析处理等高层操作提供基础[2]。处理技术主要是对被处理图像进行灰度变换、平滑滤波、图像增强、几何变换、灰度均衡化处理[3] ,目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改善图像数据,提高特征抽取、图像分割、匹配和识别的可靠性。

2.1 图像翻转

图像翻转是一种几何变换,可以将原图像绕着中心点翻转180度,只改变坐标不改变图像像素值。采集到的影子图像如图1(a)所示,处于倒置状态,不利于获取影子坐标系,因此在预处理前应当将图像翻转,如图1(b)所示。

2.2 阀值分割

阈值分割就是确定一个阀值,把图像中每个像素点的灰度值与阀值进行比较,根据比较结果将像素分为前景和背景[4]。经过图像分割后,图像变成了二值图像,使后续图像轮廓的提取和分析就变得非常简单[5]。

研究中采集到的图像是灰度图像,图中的影子边界和坐标标量边界与背景有些模糊,但图像和背景的对比度比较高,产生的假边缘点少,因此通过阀值分割就能将图像与背景分割(见图2)。

图像阀值分割的关键技术是阀值的选取,常用的阈值选取方法有直方图谷底阀值法、迭代选择阀值法、最大熵法、最大类间方差法以及其它一些方法。用以上方法依次对图1(b)图像进行分割,所得结果如表1所示。经过数据和分割效果对比,迭代选择阀值法获取的阀值为最佳阀值。

2.3 边缘检测

要想准确获取太阳高度角和方位角就需要准确检测出影子的像素长度、图像标准长度像素值和坐标方向。为了获取这些参数,采用了边缘检测算子。

检测步骤如下:

(1)对坐标方块的坐标位置(左方格的左上方坐标和右下方坐标、右方格的右上方坐标和左下方坐标)进行初始化;

(2)通过双重循环逐行逐列的扫描搜索获取四个坐标位置的真实坐标值;

(3)设计算法,构建东西方向向量,计算标准长度的像素值,并标出影子图像所在区域;

(4)在区域下方扫描搜索影子图像标出边缘点;

(5)设计算法,构建影子的方向向量,计算影子的像素长度。

3 太阳方位角和高度角计算

经边缘检测,获取了坐标标量方块的四个坐标点和影子图像的两端边缘点,并已通过算法确定了东西方向向量、影子方向向量、标准长度的像素值和影子的像素长度值。通过GUI界面输入直杆的长度和坐标标定单位长度就可准确地计算出太阳方位角和高度角。

将基于视觉技术检测到太阳高度角和方位角与精度较高的SPA算法计算[6,7,8]的太阳高度角和方位角进行对比。

实验数据采集地点为北纬N39°37′2.67″ 、东经E109°48′50.29″;采集日期为2016年3月5日。

4 结论

基于觉技术检测获取的太阳视位置精度高,采集原理可行性高,影子图像轮廓易于提取,图像前期处理所需步骤少,大大提高了算法处理速度,消除了以往太阳跟踪时间滞后和实时性低的不利影响[9]。

参考文献:

[1]杜春旭,王普,马重芳等.一种高精度太阳位置算法[J].新能源及工艺,2010(02):41-48.

[2]张春雪.图像的边缘检测方法研究[D].无锡:江南大学,2011.

[3]王东江,刘亚军.太阳自动跟踪控制系统的设计[J].数字技术与应用,2010(07):19-25.

[4]张铮,王艳平,薛桂香等.数字图像处理与机器视觉――Visual C++与Matlab实现[M].北京:人民邮电出版社,2010:361.

[5]徐平,邵定宏,魏楹等.最佳阀值分割和轮廓提取技术及其应用[J].计算机工程与设计.2009,30(02):437-439.

[6]张菲菲.关于日出日落方位的浅析[J].城市地理,2015:76.

[7]金卫东.揭开太阳方位角的神秘面纱[J].求学,2015(05):53-54.

[8]王国安,米鸿涛,邓天宏等.太阳高度角和日出日落时刻太阳方位角一年变化范围的计算[J].气象与环境科学,2007(30):161-164.

[9]李平阳.基于图像处理的太阳质心位置检测算法研究[D].太阳科技大学,2013.

第8篇:计算机视觉技术范文

【关键词】云计算 web数据挖掘 运用 控制层

1 云计算与web数据挖掘

1.1 云计算的概念

所谓云计算,具体是指将分布式、网络存储、网格计算、并行计算以及虚拟化技术有效融合而形成的技术,是计算机技术蓬勃发展的最终产物。

1.2 云计算的关键技术

1.2.1 数据管理技术

系统处理能够为用户提供更为优质的高质量服务,进而可以通过此技术手段进行管理数据。此外,管理技术的广泛应用,还能够进一步解决存在的问题,对于数据集的整合和处理来说,提供了充足的数据参考。

1.2.2 虚拟化技术

作为一种特别有效资源合理分配划分的方式,可以将不同等级的系统进行孤立,进而实现存储、服务器与设备之间的划分,从中凸显出应用系统的实质性作用,实现体系结构与管理技术的广泛应用。

1.2.3 分布式存储技术

运存储数据主要就是采用分布式的存储方式,这种方式在某种程度上来说,可以有效的保障数据的可靠性,同时也具备一定的经济性。

1.3 web数据挖掘技术

通常情况下,我们将web数据挖掘成为网络挖掘,其根本原因是基于互联网与数据挖掘技术而形成的。由于当前互联网中数量是非常庞大的,而运用web能够准确的寻找到有价值的信息。在web数据挖掘技术领域当中,主要是基于机器学习、统计学、数据库技术以及神经网络等分支来构成的。在web数据挖掘技术运用的过程中,由于和传统挖掘技术相比,在挖掘方式与挖掘对象方面是存在着较大差异的,因此在流程方面是完全不同的。通常来说,web数据挖掘的流程主要可分为四个部分,分别为搜索信息、信息预处理、模式发现以及模式分析。

2 基于云计算平台的web数据挖掘体系架构

2.1 服务层

服务层的功能是用户与web数据挖掘之间的交互。在操作过程中,服务层能够将用户的请求接收,并通过转化的方式向web数据挖掘发送指令,然后web数据挖掘将得到的资源返回到用户。

2.2 控制层

在web数据挖掘执行的过程中,控制层处于核心地位,其根本原因是在云计算平台当中,所有的数据挖掘的相关操作都是由控制层来操作与控制的。具体来说,主控节点会根据用户所提出的需求,来对最合理的web数据挖掘算法来进行选择,然后将算法的阶段传输到体系架构当中的各个节点当中,在挖掘任务完成后则会传输到服务层,最终展现给用户。

2.3 算法和数据存储层

在基于云计算平台的web数据挖掘的体系架构当中,数据存储层的功能是对各种类型的算法进行存储,当接收到用户所发出的信息后,在算法进行选择后存储到数据存储层,以实现对数据的备份。即便在挖掘过程中出现意外,也能够瞬间将数据恢复。

2.4 业务处理层

众所周知,在web挖掘技术当中得到的数据与信息,是经过数据存储层的解析后,转化为XML文件。对此,业务处理层的职责就是将分配的任务进行处理,在操作完成后返回到控制层,最终由控制层传输到服务层。

3 基于云计算的web数据挖掘技术运用

3.1 数据的收集和处理

在数据的收集和处理过程中,需要将用户访问数据与web机器人访问数据相分离,那么则需要运用到决策树工具。除此之外,基于云计算平台的web数据挖掘算法,在对数据进行筛选与整合后,将其转化为半结构化的XML文件,并将其保存到分布式文件体系当中。其中,具有代表性的谷歌公司所研发的Map-Reduce编程,这种编程模式将负载均衡、并行化以及数据布局有效的融合。在操作阶段,数据的流程包含两个阶段,分别为Map阶段与Reduce阶段。借助于此编程方式,所收集得到的数据量更大,但是需注意的是,系统本身并不包含搜集数据与保存扫面的功能,再加上应用程序在使用的过程中,还会运用到历史数据的功能,因此对于系统的性能具有一定的负面影响。截止到目前,构建相关系统项目的研究机构是逐渐增多的,其中具有代表性的有Aurora以及STREAM等。

3.2 数据存储

当数据进行收集之后,需要进行科学合理的数据处理,当完成收集和处理任务之后,应该将数据存储起来,以保证可以对日后的使用起到一定的便捷作用,数据在存储的同时,应该始终坚持以云计算为重要的存储数据流程设定基础,这样可以有效的保障数据的稳定性,对数据的存储起到一定的促进作用。在现阶段以云计算为核心的web数据存储领域当中,主要被划分为开源系统与非开源系统。其中,前者运用最多的为hdfs系统,该系统是由hadoop公司所开发的;而后者运用最多的是gfs系统,该系统是由谷歌公司所开发的。总的来说,在各项技术蓬勃发展的过程中,在云计算平台中,web数据挖掘技术的运用范围是不断扩展与延伸的。在此背景下,云计算平台的web数据挖掘技术不但搜索效率方面有着明显的提升,同时在数据处理效率方面的提升也是非常显著的。

4 结论

通过全文的分析,能够看出重点是对于云计算以及数据挖掘技术进行具体的探索和分析,明确在云计算技术基础上,数据挖掘技术得到了较大程度上的创新发展,其未来的发展前景非常的宽广。与此同时,相信在云计算领域蓬勃发展的背景下,web数据挖掘在云计算的未来发展发挥出了巨大的推动力。

参考文献

[1]蔡兴旺,段梦博.云计算及其在数据挖掘上的应用研究[J].电脑知识与技术,2010(22).

[2]刘帅,蒋贵凰.数据挖掘的现状及发展趋势研究分析[J].现代商业,2015(33).

[3]吴锐,孙银香.云计算平台下的Web数据挖掘研究[J].网络安全技术与应用,2014(08).

第9篇:计算机视觉技术范文

【 关键词 】 云计算;数据挖掘;平台架构;设计和实现;探究

1 引言

近年来,随着科学技术的飞速发展,大量的数据被存储到计算机等存储介质当中。通常情况下,所存储的数据多是复杂的、数据量较大的等。因此,难以通过人工而直接获得。尤其是在科研或是商业发展领域中,需要对海量的数据进行分析,从而找出更多有价值的信息。为解决上述问题,很多研究人员聚集在一起,研究出一种新型的数据挖掘技术。

近来,由于计算机技术、云计算技术的飞速发展,大量的数据都存储到了网络当中,而这些海量的、复杂式的数据信息给数据挖掘系统的实现带来很多的难题,如数据相对复杂,现有的计算能力难以达到技术要求,而可以借助云计算数据挖掘技术可提升处理复杂数据的能力。

2 云计算数据挖掘系统架构设计的分析

2.1 目标系统模型

在云计算环境下,构建目标系统为各种终端用户提供高透明化的界面服务,并且在此基础上也提供了开放式的接口支持。这样一来,用户不仅能够通过终端访问用户访问来使用系统,也或是利用其它应用程序调用开放式接口间接式的应用系统服务。不管遇到上述哪一种情形,用户都无需对系统实现而担心其存储能力,只需考虑要选择何种算法进行处理,最后通过任务形式部署给系统获得所需的挖掘结果。除此之外,云计算环境下的数据挖据平台中得模块都是利用用户界面和开放式接口提供服务的。其中,由开放式接口提供的服务均为外部可见服务。而当涉及到高级权限使用功能时,可通过用户界面直接调用开放式接口服务功能。

2.2 功能层次框架设计

2.2.1算法层

该层主要是利用下一层所提供的统一数据源来调用相关算法及对接口进行合理的管理。由于不同算法的执行顺序和得到的结果有所不同而分开的。例如数据清洗算法服务,它是针对具有噪声数据的数据及在应用数据挖掘算法前需要进行接口服务调用,把清洗后的数据利用数据层再储存到云计算平台中,为后续数据挖掘工作提供更好的服务;数据挖掘调用服务,在应用该服务之前,将已清洗的及不需要清洗的数据利用数据挖掘技术统一对数据进行调用。

2.2.2应用层

和其它层相比,该层的抽象性较强,它是把海量数据挖掘涉及到的数据、算法等之间的内在关系描述成任务,同时提供提供应用调用服务和维护接口等。

2.2.3用户层

该层主要为用户提供身份验证和授权等功能。

2.3 设计关键点

2.3.1插件系统设计

插件是结合相应的应用程序开发接口规范而实现的一种程序。其中,任何一个插件都是由三大部分构成的,即扩展点、业务逻辑、调用下层扩展点,并且这三者都是由相同的负责模块管理帮顶包跟各种服务所构成的。另外,每个绑定包涉及到一个服务说明接口与多个服务调用接口两种类型的接口。要求绑定包接口必须满足相关规范要求,若把插件防止到平台的某个特定目录下,能够识别和加载该动态。除此之外,算法实现不同于以往针对特定个数、排列数据而实现。它是在满足实现算法的基础上,利用抽象数据提供更多的兼容性。尽管这种算法实现存在很大的难度,但其算法的复用性有了显著提升。

2.3.2开放接口设计

通常情况下,开放接口主要被应用数据挖掘平台的开发使用。利用上述接口,开发者能够更好地利用数据挖掘平台提供的资源及数据服务。为实现开放接口高效性、直观性的目的,其平台接口主要应用的是表述性状态转移接口,英文缩写为:REST。该类接口的优势在于为无态型。也就是说,在同一个局域网中,浏览器中的缓冲装置可替代服务的重复调用。这样一来,不仅能够有效减轻服务器的运行负担,而且若用户量过多造成底层服务影响整个系统的运行,而此时可利用横向服务器数量的增加扩展线性的吞吐量。因此,利用云计算平台,能够为用户提供无穷大的数据吞吐能力,满足系统的性能要求。

3 云计算数据挖掘平台架构的实现

3.1 开发环境

Google的云计算开发环境主要为App Engine。当遇到重载或是数据量非常的情形时,也能轻松构建安全的应用程序。这是因为此环境的优势在于可提供动态服务、自动扩展等。

3.2 开发思想和技术

3.2.1原型开发模型

首先,需进行快速分析。在相关人员和用户的共同合作下,可准确确定出系统的需求,再结合原型的特征描述需求,来满足开发原型的需求。其次,原型的建构。在经过分析的基础上,结合需求快速建构一可行性较高的系统。在此情况下,需要有相应的软件工具提供可靠的技术支持,同时不考虑系统细节方面的具体要求。再次,原型的运行。此环节是为及时发现问题,从而快速消除问题的一个关键环节。最后,对原型的评价。原型运行的前提下,对原型的特性予以科学性的考核,对运行结果能否满足用户期望而进行分析。而针对该过程中存在的错误或是增添的新要求等,提供合理性的修改建议和意见。

3.2.2基于WSGI规范的开发

通过分析可知,在基于WSGI规范基础上的开发具有很多的优势。其根本目的是提升系统的可用性和实现跨平台性操作。因此,基于WSGI规范的实现远比传统的C/S模块使用简单的多。用户通过对浏览器来访问系统,同时增加了用户的终端的可选择性。此外,由于WSGI规范是在Python的语言环境下而实现的。而该种语言属于一种跨平台性开发语言。这样一来,不管是把已开发的系统放置到云计算平台上还是在本地开发应用都是极其方便的。

3.3 开发步骤

3.3.1算法模块插件系统

算法模块主要涉及到数据集清洗算法、数据挖掘算法、结果可视化算法等多种。而一个完整的执行过程必须在原始数据集的噪声及不规则数据的情况下借助数据集清洗算法把数据集统一进行整理。也或者是由异狗、分布式等数据源中转化而得到,再自动生成规则的数据集。将这些规则的数据集利用数据挖掘算法予以处理,进而获得数据挖掘结果信息,再经过可视化算法的处理,最终将数据信息传递给用户。其中,任何一个环节数据的调用都必须利用REST接口而实现,并且接口间的数据信息转换和传递都是采用XML格式。特别是近年来,由于数据挖掘平台各种算法模块插件的出现,这样一来,云计算平台下的数据挖掘平台所提供的功能也会逐步增多。

3.3.2数据集访问模块

该模块的实现和上述算法模块插件系统实现具有很多相同点。它也是通过插件方式进行维护和调用的。尤其是在访问数据集的过程中,其访问模块文件被索引处在被用户调用的状态。而和算法模块插件系统的不同之处是在调用数据集访问模块前,系统自动把数据机实例文件解析成若干个元数据组合及物理访问地址,最后把此类数据组合成字典类型结构的参数传递到数据机访问模块中。

4 结束语

总体来说,在云计算平台下的数据挖掘系统逐步趋于完善,增强了数据规约的功能,从而更好地解决异构数据访问的问题。同时在App Engin开发平台上,设计出一套更为完善的数据挖掘系统,提升了云计算和数据挖掘技术结合的可靠性与高效性。文章主要针对基于云计算的数据挖掘平台架构设计与实现予以深入的研究,并且对今后云计算环境下的数据挖掘系统的延伸发展予以展望,希望能够通过论述对读者产生一些积极影响。

参考文献

[1] 杨庆平.基于云计算的数据挖掘平台架构及其关键技术研究[J].中兴通讯技术,2013,19(1);122-123.

[2] 黄章树.基于云计算服务模式的数据挖掘应用平台的构建[J].电信科学,2012,28(1);138-139.

[3] 庄福振.基于云计算的大数据挖掘平台[J].中兴通讯技术,2013,19(4);130-131.

作者简介: