前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉与应用主题范文,仅供参考,欢迎阅读并收藏。
关键词:计算机;视觉技术;玉米种子;质量;检测
中图分类号:S513 文献标识码:A 文章编号:1003-4374(2015)01-0047-04
引言
计算机视觉是提高人类生产、生活自动化和智能化程度的有效手段。目前,农产品分级与品质检测、种子品质检测、果实的采摘、病害检测等方面,机器视觉都有广泛研究。作为世界三大粮食作物之一,玉米在粮食贸易中所占比重不断升高。随着计算机技术进步,尤其是图像技术的发展,建立在视觉技术的测量方法也高速发展,要适应测量的现代化步伐,算法快速并且精度要高是图像实现测量途径的必然要求。在玉米生产中,种子质量是最为关键的因素之一,玉米的收获产量和产品品质与种子质量的优劣息息相关。十多年来,国内学者对应用机器视觉技术进行玉米种子检测方面开展了深入研究。本文主要综述这类研究,为今后该领域学者提供参考信息,从而加快系列研究的深入开展。
图像采集与模式识别
目前,CCD相机、扫描仪或数码相机是主要的图像采集设备。CCD相机在生产线的开发当中是最好的选择,而对静态检测设备而言面阵相机则是上选,如果应用场合是既有设备,那么数码相机等更为适用。由于在封闭的环境光照足够稳定,此时图像噪声干扰较小,免除标定这一环节,在后续处理时非常方便,所以图像采集通常是在封闭环境中进行。用于移动设备的相关软件的研究中,则有四个方面的情况需要着重考虑:第一,当前采集玉米图像时所用背景都是单一颜色,而在生产具体应用中则完全有可能是非单一颜色;第二,在用户使用过程中,光照条件不确定、特别是颜色特征对图像质量有影响。第三,玉米种子体积不大,当玉米种子的空间位置发生移动时,图像中种子的特征会随着改变。第四,在图像采集时,如采集的角度存在偏移,图像中玉米种子的形态也不会保持不变。
玉米种子纯度检测
种子最主要的质量指标之一是纯度,目前,形态学鉴定和蛋白质电泳分析法是主要的鉴定籽粒纯度方法。
国外学者从图像当中提取玉米种子形态方面的参数,并结合判别函数实现对玉米统计学的种子外形判断,实现玉米种子从非完整玉米种识别。当然,该方法效率不高,所费时间过多。
朱晓利用高光谱反射图像技术,提取多个波段种子图像特征,然后通过遗传算法选择最优波段图像,建立分级模型,达到对玉米种子纯度检测的目的。所建立的分类模型测试精度达到97.22%。
另一批学者针对纯度考虑图像识别这一方法实现识别玉米种子,首先是彩色相机获得图谱,通过基于阈值的二值化处理图像灰度变换、图像均衡化,实现和电泳图谱进行比对以期判断纯度水平,玉米种子纯度在计算机和人眼检测结果,得到一种高效测玉米种子纯度的方法,而这个技术对2个品种玉米的平均识别准确度接近100%。
综合几种玉米种子纯度检测方案,形态鉴定法方法简单,但效率与精度不高。随着检测识别算法的改进和计算机处理能力的提高,计算机视觉技术将比其他方法更高效更准确。
玉米种子品质自动检测
周红等为实现对种子评级,借助图像处理技术得到玉米种子轮廓。通过计算机模糊识别代替玉米种子形态传统鉴定法,目的是将识别水平大幅度提高;基于模糊数学以及统计学,得到隶属函数,从而制定对品种进行判别的规律,玉米种子得以判别,所构建的系统投资低,而且玉米种子品质的识别率为88%。
闫小梅等通过CCD相机,对玉米种子冠部和无胚芽面图像进行提取,利用图像预处理将单个籽粒分割出来,通过图像分割,将冠部核心区域和侧面黄色区域6个颜色特征提取出来,以Fisher判别理论和K-均值聚类为依据,将特征投影到一维空间,进行纯度识别,识别率不低于93.75%。
玉米收获后加工的重要环节之一就是对玉米种子质量进行分级,在玉米种子质量分级工作中,机器视觉技术优势明显,例如不会对玉米种子造成损坏、更好实现分级。相关学者提出从特征值按照一定的等级进行分类,采用典型神经网络与隶属函数方法对玉米种子实现分级,发现:BP神经网络处理时间更短,具有更好的实时性,为现实应用打下良好的基础。有学者将形态学加上种子分级设备,能够实现准确率高达90%以上的将种子分为4级的方法。吴继华等开发了一种种子品种实时检测系统,该系统是基于机器视觉,由CCD摄像机进行图像采集,每隔2s停止1次,在分析结束时就可以得到特征参数,二十粒种子只需一秒钟时间。Wan等18-19]将机器视觉应用在谷物类进行动态识别,并进行分类,得到图像就进行处理,并将信号传给对应的PLC,从而闭合电磁阀,以达到吹离目的。宋鹏等就分级系统在动态玉米品质检测,抓住玉米种子的特征,把种子分类形态以及颜色分别分为4级和3级,合格率分别为8 1.8%和93.04%,还能够实现玉米种子品种,应用Bayes分类器以及模式识别法实现识别玉米种子品种达到5种,识别准确率不低于92%;结合玉米颜色等信息,实现单倍体籽粒分类,待识别玉米单倍体后,将用气吸方式和二自由度并联机器人机构相结合进行分拣,精度不低于80%。
目前的玉米种子品质自动检测中,多采用可见光进行图像采集,然后通过综合处理分析种子的外部特征来确定品质等级。鲜有利用红外等不可见光生成的图像来进行品质分级,因而无法精确分析种子内部的品质特征,影响到检测精度。因此,运用不同波段图像分析玉米种子品质,将成为以后种子品质检测的一个重要方向。
玉米种子活力检测
漫射光法、热浸法、电导率测定、四唑染色法、冷浸法、发芽实验等是种子活力的常规检测方法。目前,有效结合图像识别与处理等技术以及发芽试验和四唑染色法等方法的优势,能够准确测定种子活力。赵新子等对活力识别进行论述,染色种胚后获取彩色图像,判断染色区域在种胚的面积占比,得到活力水平评判,识别率为94%。
张晓宇等通过处理和分析种苗图像,根据玉米种苗特征建立起可以方便、快速地获取苗高、苗鲜重等信息的相关统计模型,该模型直接用于玉米种子的发芽试验,以便获得准确可靠实验结果。该技术将作为玉米种子发芽试验新的检测手段,同时应用于其它植物种子发芽试验。
Zayas等通过形态学参数把玉米种子从被破坏的玉米种识别,结合统计学方面的判别函数,将被破坏的玉米种子剔除。为了检验播种材料,需要对种子发芽的规律以及所需条件进行研究,研究必须将玉米种子发芽进行系列实验,这时候对于发芽粒数以及苗高等种子的信息大多由人工获取。
玉米种子机械和霉菌损害检测
玉米种子质量检测的重要指标之一是种子是否有裂纹和发生霉变,采用视觉无损检测,我们发现如果光线对应入射孔直径设定在2.4mm时,所得背景是黑色的,如果入射光是白色光,采集得到的图像采用高速滤波法识别玉米籽粒裂纹处与其他部位的像素灰度值的不同,检测精度不低于百分之九十。有学者利用生霉粒对光照变化非常敏感的特点,光照变化对颜色标定是鉴定生霉粒的主要途径,认为机器视觉算法在精确性以及一致性方面具有非常明显的优势,这给玉米种子质量检测的提高打下良好的实践基础。
有学者基于图像分析等途径分析玉米应力裂纹,主要结论是重度裂纹最易于被识别出,达到完全被识别的水平;无裂纹以及中度裂纹则朝着变差方向发展,不能完全被识别,占比约有30%-12%。
张俊雄等实现表面裂纹检测:在获取单粒玉米种子的图像后采用Sobel算子得到玉米种子边缘并通过分割阈值、腐蚀以及膨胀等传统图像处理,从而可以判断满足什么样的条件可以判定为种子尖端点,并能实现尖端部分拿掉;将R通道膨胀,同时细线化处理B通道图像结果,并执行减运算操作,根据连通性判别有无裂纹,识别率超过90%。
关键词:高校教师教育技术培训;决策树ID3算法;应用
中图分类号:G451.2 文献标志码:A 文章编号:1002-0845(2012)10-0098-02
信息技术的迅猛发展引起了教育的深刻变革。为此,提高教师的信息素养已成为推动我国高等教育信息化建设的必由之路。高教司于2000年发出的《关于开展高校教师教育技术培训工作的通知》(高教司【2000】79号)[1]中指出,“教育技术培训”是“新世纪教改工程”和“现代远程教育工程”的重要组成部分,是深化教学改革、提高教学质量的重要举措。
常熟理工学院自2001年6月开始,对教师进行教育技术培训,2003年1月起申报江苏省教育技术培训点,次年申报成功。2007年,学校正式下发的《常熟理工学院讲师等中级职称资格条件》(常理工[2007]73号)第二章第七条规定:教师申报教学系列、思政系列的中级职称应参加学校现代教育技术培训并取得合格证书。近几年来,学校先后举办了十期教师教育技术中级培训班,共400多名中青年教师参加了培训,极大地提高了教师的多媒体教学水平,加快了学校信息化建设的步伐。
一、高校教师教育技术培训存在的问题
教师教育技术培训的研究对象是教学过程与教学资源,研究范畴包括对教学过程的设计以及教学资源的开发、应用、管理与评价。目前,各高校的教师教育技术培训工作虽已取得了一定的成绩,但从培训的实际效果来看,仍存在着一些问题,主要表现在以下三个方面。
1.培训时间安排不够合理
目前,教师教育培训基本采用集体面授的方式。由于参训教师自身所承担的教学工作和科研任务比较繁重,很难抽出一段相对集中的时间来参加教育技术培训。为解决上述矛盾,高校通常会选择利用寒暑假时间安排培训,这需要牺牲培训教师和参训教师的许多休息时间,容易引发不满情绪,严重影响了教师参训的积极性,极大地降低了培训效果。
2.培训内容安排不科学
由于培训内容是根据全校教师需求统一安排的,基本没有考虑到参训教师自身所具备的知识层次、学科背景、思想意识等方面的差异,因此很难体现学科差别。各学科教师混合在一起集中学习,导致理论知识讲解过多而与教学实际联系较少,参训教师难以从根本上真正掌握教育技术。
3.考核方式单一,培训评价体系不健全
目前,高校教师培训采取的考核方式往往比较单一,通常以参加理论考试或者提交相关论文、作业等作为培训的最终考核结果。此外,各级培训机构大多未能及时地对培训过程做出评价,同时缺少参训教师的自我评价环节,因而不利于教育技术培训工作的后续支持和进一步开展。如此看来,建立和完善培训评价体系显得尤为重要,这也是建立教师培训长效机制的关键所在。
二、分类技术与决策树ID3 算法的相关理论
针对参训教师在知识层次、学科背景、思想意识等方面存在的差异,笔者提出了“先分类后培训”的思路。在培训正式开始之前,可采用数据挖掘领域内的分类技术对参训教师进行分类,这样有利于激发参训教师的积极性,从而增强他们运用现代教育技术辅助教学的主动性和自觉性。
1.分类
作为数据挖掘的重要任务之一,分类[4]就是要找出一个类别的概念描述或预测未来的数据趋势,它代表了这类数据的整体信息。分类的目的是为了构造一个分类函数或分类模型(也称分类器),该模型能够把数据库中的数据项映射到给定的类别中。
2.相关概念及定义
根据信息论中的有关定义,熵一般用于测量一个非叶节点的信息量的大小。若存在n个相同概率的消息,则每个消息的概率p是1/n,此时一个消息传递的信息量应为-log2(p)=log2(n)。若给定的概率分布P=(p1, p2, … , pn),则由该分布传递的信息量称为P的熵I(P)。
若一个记录的集合T根据类别属性的值被分成相互独立的类C1,C2,…,Ck,则识别T的一个元素所属哪一类所需要的信息量是INFO(T)=I(P),其中P是(C1, C2, … , Ck)的概率分布。
若先根据非类别属性X的值将T分成集合T1,T2,…,Tn,则INFO(X, T)是在已得到X的值后确定T中一个元素的类别属性时所需要的信息量,可通过确定Ti的加权平均值来得到,增益Gain(X,T)=INFO(T)-INFO(X, T)。
因此,可利用Gain(X, T)将属性进行排列,并可构造一棵决策树,其中每一个节点在属性中都是具有最大增益的一个,从而不必考虑来自于根的路径。
3.决策树ID3算法
决策树ID3算法[4]是由Quinlan首先提出来的。该算法是以信息论为基础、以信息熵和信息增益度为衡量标准实现对数据的归纳分类的。给定一个非类别属性C1,C2,…,Cn的集合、类别属性C及记录的训练集T之后,可以用ID3算法构造一棵决策树,其中R是一个非类别属性集合,具体算法如下:
若T为空,返回一个值为无效的单个节点;
若T是由其他均为相同类别属性值的记录组成,返回一个带有该值的单个节点;
若R为空,则返回一个单节点,其值为在T的记录中找出的频率最高的类别属性值(这时将出错,即对记录进行了误分类),将R中属性之间具有最大Gain(D, T)值的属性赋给D;
关键词 计算机;视觉技术;应用研究
中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2013)16-0114-01
计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。
1 计算机视觉技术
计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。
2 计算机视觉技术在各领域的应用分析
随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。
2.1 在工业领域中的应用
工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。
2.2 在农业生产领域中的应用
该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。
2.3 在林业生产中的应用
该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。
2.4 在农产品检测中的应用
农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。
2.5 在电力系统自动化中的应用
计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。
2.6 在图书馆工作中的应用
随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。
3 结束语
通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。
参考文献
关键词:计算机图形学;计算机视觉;可视化技术
中图分类号:TM862 文献标识码:A 文章编号:1671-2064(2017)01-0054-02
计算机图形学、计算机视觉以及可视化技术三者均是计算机领域重要组成部分,要做好计算机知识,就要先学好计算机图形学,但计算机图形学学习相对枯燥,尤其是算法教学难以理解,为解决这一问题,计算机视觉与可视化技术被应用到计算机图形学中。可见,三者之间存在一定的联系,因此,有必要对计算机图形学、计算机视觉以及可视化技术展开研究。
1 计算机图形学概述
1.1 计算机图形学目的
所谓的计算机图形学实际上就是怎样利用计算机表示图形,并利用计算机完成图形计算与处理,而这一过程的实现需要得到相关算法的支持。学习计算机图形学的目的是利用计算机技术为人们呈现既带有美感又不缺真实的图形(如下图1所示),为实现这一目标,就需要按照图形的要求创设合适的场景,并在一些光照模型的作用下,做好光照效果设计,在这一过程中需要计算机图形学能够与其他计算机技术相配合。经过计算机图形学出来的图像,多会以数字图像的方式展示出来,总的来说,计算机图形学与图像处理之间存在着一定的联系[1]。计算机图形学的涉及范围相对宽泛,不仅有图形硬件设计,还包括动画制作,虚拟现实等多个部分。此外,计算机图形学在动画制作中的应用频率也很高,如45分钟一集的动画影片中,85%的画面都需要用算机图形学来完成,由此可见,计算机图形学的应用频率极高,并在动画制作中发挥着不可替代的作用。因此,应重视计算机图形学的应用。
1.2 计算机图形学应用
随着计算机图形学的发展,它被应用到各个领域中,并发挥着重要作用。首先,在计算机辅助设计与制造中的应用,这是计算机图形学应用最多的领域,在计算机图形学被应用以后,不仅可以设计出更精准的图形,还能做好人机交互设计,强化修改能力。计算机图形学还被应用到三维形体重建中,利用该技术可以将原理的二维信息转化为三维信息,如在某次工程图纸设计中就应用了计算机图形学,经过一系列的处理以后,三维形体逐渐形成,最终实现了重建。其次,在医学领域中的应用。计算机图形学在医学领域中的应用多以计算可视化的形式展示出来,如在脑部手术中,医生为看清患处真实情况,经常需要利用在可视化技术的作用下将复杂的数据转化为图像,这时就体现了计算机图形学在其中的应用[2]。再者,在计算机动画中的应用,人们看到的动画影片就是计算机图形学作用的结果,以动画人物的行走为例,为保证动画人物的行走与自然人不存在过大差异,就需要应用大量的计算机技术,并在计算机图形学的作用下完成设计。最后,在计算机艺术中的应用。计算机图形学在计算机艺术中也有广泛应用,它不仅可以用于艺术制作,很多场景都是通过计算机图形学来完成的,现阶段,一些人正在利用计算机图形学创设人体模拟系统,其目的是让已故人士再次出现在荧屏上,这一目标的实现就需要得到计算机图形学的支持。
2 计算机视觉技术
2.1 计算机视觉技术含义
所谓的计算机视觉技术,实际上就是用计算机取代人眼做识别、跟踪以及测量等,同时也兼顾图形处理,其目的是让图像在计算机被处理以后更适于识别。对于计算机视觉技术来说,意在实现人工智能,主要是从图像与多维数据等方面实现人工智能系统设计[3]。计算机视觉是一种在相关理论与模型基础上发展起来的视觉系统,其主要构成部分有以下几种:
(1)程序控制,这一点主要体现在机器人设计上;(2)事件检测,多体现在图像监测上;(3)信息组织,主要体现在图像数据库等方面。计算机视觉三个阶段如图2所示,通过观察图1可以发现,计算机视觉存在于图像处理始终,从早期处理直到后期结束都存在,最终实现了3D描述,可见,计算机视觉具有十分重要的作用[4]。
2.2 计算机视觉技术的应用
现阶段,现代社会已经进入信息化时代,计算机技术也被应用到各个领域,并发挥着重要作用。计算机视觉的应用促使计算机实现了智能化,在该技术的支持下,计算机可以像人一样透过视觉看待世界万物,且具有良好的适应能力,但这一目标的实现还需要很长时间,需要一系列的努力才能实现。现阶段,计算机视觉应用最多的就是车辆视觉导航,然而,这种导航还没有实现完全自主导航,这也是需要进一步研究的地方。计算机视觉技术的适应性较好,特别适合在工业领域应用,即便是存在电子在干扰或温度变化较大的地方都能很好的运行,其整体效果也不会受到影响,再者,计算机视觉技术的嵌入性较好,成本相对较低,尤其适合在PC方案中使用,同时,具有一定的非接触能力,能够获取大量信息,且不受距离限制,总的来说,计算机视觉技术总体效果较好,适合利用在各种工业环境中应用,因此,应重视计算机视觉技术的应用[5]。同时计算机视觉还被应用到移动机器人设计中,主要是利用小波模板展示人体形态,然后做图像扫描,这样就可以顺利完成小波变换,进而了解到人的存在。同样,将计算机视觉应用到机器人设计上,可以自动检测出正在行动的人或车辆,而无法检测到静止的人,之所以会出现这样情况,主要是由于其中采用率步态分析法。
3 可视化技术
3.1 可视化技术含义
可视化技术是一种综合了计算机图形学与图像处理于一体的技术,它可以将复杂的数据转化为图像并在屏幕上展示出来。在可视化技术中,融合了以上两种技术的特点,并在多个领域都有应用,随着可视化技术的应用,不仅有效实现了数据表示,还强化了数据处理能力,更对数据决策分析有一定作用[6]。现阶段,虚拟现实技术已经成为可视化技术主要发展方向。
3.2 可视化技术的应用
首先,在计算机图形学教学中的应用,计算机图形学相对枯燥,相关知识也很抽象,不便于学生理解,在计算机图形学中最重要的部分是曲线曲面,而这些曲线曲面多是与数学模型有关,具有一定的抽象性,学生理解难度较大,以往教师只能通过一系列的公式演算帮助学生理解,尽管这样依然难以让学生掌握曲线变化情况,学生依旧无法正确理解。为减少这种情况的发生,可视化技术被应用到计算机图形学教学中,教师将抽象的知识用动画的形式展示出来,学生只要观看动画,拖动一定的控制点就可以了解到曲线变化情况,这样一来不仅增加了教学趣味性,学生也可以随意变动曲线,让复杂的知识变得简单,深化学生对计算机图形学知识的深度理解,同时,利用可视化技术在一定条件下,还可以完成代码编译,如在Actoin ScriPt中做编译,这样也可以增强学生的理解能力[7]。
其次,在医学领域中的应用。医学领域对于可视化技术的应用主要体现在放射治疗与矫正手术上。通过可视化技术可以屏幕上看到手术整个过程,并将原来细节部位放大,手术医生观察的更加细致,手术成功几率也会大幅度提升,患者生命也能得到保证(如图3所示)。如在对某名患者进行身体检查的过程中需要应用到可视化技术,由于通过检查会获得大量数据,而这些数据又相对复杂,但在可视化技术下就可以通过图表、曲线图或立柱图的方式展示出来,经过可视化技术的作用,了解到患者的血糖为5.6mmol/L,医生可以根这一数据做出诊断,而不必再分析这些数据。据不完全统计,80%的医疗检查工作都是需要利用可视化技术。
地质勘探是我国最重要的工作之一,由于多数矿藏都深埋地下,即便使用探测仪受多种因素影响也无法了解到实际矿藏情况,这就需要应用到可视化技术,在可视化技术的作用下,相关工作人员可以了解到地下有无矿藏,如果存在矿藏,相关工作人员也可以了解到矿藏所在位置与实际储备量,进而为矿藏开采奠定基础。如在地质勘探中,相关工作人员利用可视化技术做地形图整理,然后从中提取地形数据,再用CATIA做导入,这样就可以完成地形模型创建,这样就完成了三维地质模型创建工作,同时在相关工作台的影响下,还可以完成地形数据导入,进而生成一定的地形云点,如果其中存在错误,可视化技术也可以将其中的错误内容删除,这些都是可视化技术所带来的好处[8]。由此可见,可视化技术已经成为地质勘探中不缺少的技术。
最后,在气象预报中的应用(如图4所示)。利用可视化技术能够将数据转化为图像,通过观察图像就可以了解到云层变化情况,同时也能了解到实际风力大小与风走向等,气象预报人员就可以根据图像做出精准分析,需要了解气象变化的人也能了解到现实情况,如果气象条件恶劣,相关工作人员也可以及时做出工作调整,减少危险事件的发生。据不完全统计,可视化技术在气象预报中的应用频率高达100%,由此挽回的经济损失高达13.2亿元,可见,可视化技术在气象预报中的应用十分有必要,因此,应重视可视化技术在气象预报中的应用。
4 结语
通过以上研究得知,计算机图形学、计算机视觉以及可视化技术三者各具特色,三者间也存在一定的关系,尤其是可视化技术综合了前两者的特点,并融合了其他技术,在很多领域中都有应用。可视化技术是现阶段应用最多的一种技术,在计算机图形学教学中也有应用,并发挥着不可替代的作用。本文分析了计算机图形学、计算机视觉以及可视化技术的含义与应用,希望能为相关人士带来有效参考,正确利用这些技术。
参考文献:
[1]陈敏雅,金旭东.浅谈计算机图形学与图形图像处理技术[J].长春理工大学学报,2011(01):138-139+146.
[2]柳海兰.浅谈计算机图形学的发展及应用[J].电脑知识与技术,2010(33):9551-9552.
[3]滑瑞朋.计算机图形学的应用及研究[J].山西科技,2012(05):37-38+45.
[4]刘涛,仲晓春,孙成明,郭文善,陈瑛瑛,孙娟.基于计算机视觉的水稻叶部病害识别研究[J].中国农业科学,2014(04):664-674.
[5]关然,徐向民,罗雅愉,苗捷,裘索.基于计算机视觉的手势检测识别技术[J].计算机应用与软件,2013(01):155-159+164.
[6]许志杰,王晶,刘颖,范九伦.计算机视觉核心技术现状与展望[J].西安邮电学院学报,2012(06):1-8.
关键词:计算机视觉图像 精密测量 构造几何模型 信号源的接收
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)05-1211-02
新型计算机视觉图像精密测量是一种基于计算机程序设计以及图像显示的高精度的关键技术,它广泛用于测量的领域,对于测量的准确性有很好的保证。这种关键技术是几何了光学的特性,发挥了图像学的显影性,把普通的测量技术瞬间提升到了一个新的高度。在这项关键技术中包含了物理学中光的效应,图像中的传感器以及计算机中的编程软件,这还不完全,还有一些其他科学领域知识的辅助,可以说这项关键技术是一个非常有技术含量的技术,很值得学者进行研究。
1 计算机视觉图像精密测量的关键技术的具体形式
在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机视觉图像精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机视觉图像测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供技术人员使用参照。
在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:
1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;
2) 得出观察点到目标控制点之间的三维的运动几何参数;
3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉);
4) 还通过观察可以判断出目标物体的几何坐标方位。
在整个计算机视觉图像精密测量的关键技术中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机视觉图像系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。
当无法观察到控制点是,计算机视觉图像精密测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。
2 计算机视觉图像精密测量的关键技术分析
在计算机视觉图像精密测量的关键技术中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在视觉图像的选择中,无法使用高帧数的图片显示,无法将计算机视觉图像精密测量的关键技术的优点发挥出来。我们就计算机视觉图像精密测量的关键技术中常见的问题进行讨论。
2.1 降低失误的概率
在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。
2.2 对于权限的控制
权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机视觉图像精密测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机视觉图像精密测量的关键技术。
2.3 开启自动建立备份系统
计算机视觉图像精密测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。
3 计算机视觉图像精密测量的关键技术遇到的困难和使用前景
计算机视觉图像精密测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了测量单位的广泛青睐。在测量方面的这些可靠性和稳定性也是有目共睹的。在土木和机械测量的行业计算机视觉图像精密测量的关键技术都会有广泛和良好的使用,前景也是十分的广阔。但是不容忽视该技术也有一些弊端。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。
我们都知道,人的眼睛是可以受到吱声的控制,想要完成观测是十分简单的,但是在计算机视觉图像技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。
上文中也谈到了,计算机视觉图像精密测量的关键技术中最主要的构建是传感器,一个合理的传感器是体统的“心脏”,我们在仪器的操作中,不能时时刻刻对传感器进行检查,甚至这种高精度的元件在检查上也并不是一件简单的事情,通过不断的研究,将传感器的等级和使用方法上进行一定的创新也是一项科研任务。
4 结束语
在测量工程发展的今天,很多的测量技术已经离不了计算机视觉图像技术的辅助,该文中详细的谈到了基于计算机视觉图像精密测量的关键技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案。测量工程中计算机视觉图像精密测量的关键技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题。
将基于计算机视觉图像精密测量的关键技术引入到测量工程中来,也是加强了工程建设的信息化水平。可以预见的是,在未来使用计算机视觉图像技术建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让计算机视觉图像精密测量的关键技术在测量中作用发挥的更好。
参考文献:
[1] 汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36.
[2] 段发阶,等. 拔丝模孔形计算机视觉检测技术[J]. 光电工程时报, 1996,23(13):189-190.
1计算机视觉概述
1.1计算机视觉学概述
从某种意义上说,计算机视觉学是一门在20世纪60年代兴起的新学科。它是一门边缘学科,融入了很多学科的特点,具有很强的工程性特征。比如,图像处理、应用数学、光电技术。换个角度来说,计算机视觉同属于工程领域、科学领域。
1.2计算机视觉的应用
计算机视觉的应用能够使计算机具有和人一样的视觉功能。在生活和生产过程中,照片资料、视频资料的处理是计算机视觉应用的主要方面。比如,在航空事业方面,对卫星照片的翻译;在医学领域中,主要用于辅方面的诊断;在工业生产方面,由于各种复杂因素的影响,计算机视觉在这方面的应用显得特别简单,有利于相关系统的实际构成。
2目标图像检索存在的问题
从某种角度来说,目标图像检索需要分为特征匹配、特征提取两个方面。它们表达了不同的含义。对于特征提取来说,它是图像进行检索的第一步,其提取结果会对进一步的研究造成直接的影响。而对于特征匹配来说,其匹配的准确度会直接影响图像检索系统的返回结果。但在目标图像检索完善的过程中,遇到一些问题阻碍了这两个方面的完善。因此,本文作者对其中的一些予以了相关的探讨。
2.1环境因素不断变化
对于目标图像来说,环境因素是影响其准确率的重要因素。同时,在复杂混乱的环境中,由于受到众多干扰物的影响,加上部分目标图像区域被遮盖,致使目标图像信息不够全面,使目标物体特征的提取难度进一步加大。
2.2图像噪声的影响
子为了更好地模仿生活中的图像检索,数据库中的图像也会随之发生一系列的变化。比如,尺度、角度、光照。而其中图像噪音的影响会使目标物体的外观发生对应的变化。在此基础上,严重降低了目标图像信息获取的准确度。
2.3目标图像检索训练数据的自动标注
由于处于网络中的图像资源信息过于繁多,需要采用手工的方式对它们进行标注。但这种方法非常浪费时间,准确率也比较低。很显然,这就需要目标检索图像能够具有自动标注的能力。实际上,图像检索方法过分依赖人工标注信息。而这些信息很多收到来自各方面因素的影响。比如,认识差异因素、个人经验。以至于对图像产生误解。
3基于计算机视觉下的目标图像检索技术
3.1以多尺度视觉为纽带的目标图像检索方法
该种目标检索技术的应用主要是为了提高目标图像检索的准确率,能够实现目标图像训练数据的自动化标注。该类技术主要是用于那些没有遮挡,不需要进行监督的目标图像检索方面。具体来说,它需要经过一系列的训练。在训练的过程中,以统计学习为纽带,对相应多尺度的目标检测模型进行适当的训练。在此基础上,以该模型为基点,对图像中那些显著性的区域进行合理地提取。比如,该区域的亮度、颜色。最后,需要对用于该实验研究中的概率潜在语义分析模型进行合理地利用。总之,利用这种检索方法可以对图像中那些显著目标所处的区域自动进行检测。同时,对其中目标图像的显著性进行合理地排序,能够提高检索引擎所返回图像结果的准确度。
3.2以彩色LBP局部纹理特点为媒介的目标图像检索方法
这种目标图像检索方法能够有效地解决图像信息采集过程图像噪声以及其它相关因素对所提取纹理特征的影响,提高了图像目标的准确率。对于这种图像目标检索方法来说,它把图像彩色空间特征和简化的LBP特征有机地相融合。在此基础上,该类方法增加了光照的不变特性,却保留了LBP局部的旋转特点。在提高图像检索速度方面,主要是利用原来的LBP特征来丢失其中的彩色信息。以此,使其中的特征维度能够在一定程度上降低。同时,这种目标图像检索方法的应用可以使对应计算方法的难度得以降低,还能对角度等变化状态下的目标图像进行准确地识别以及检索。
3.3以视觉一致性为桥梁的目标图像检索方法
从某个角度来说,它的应用主要是为了提高图像搜索引擎的返回效果,使局部噪声图形具有更高的显著性特征。一是:站在客观的角度,对搜索引擎返回结果的目标显著图予以准确的计算。此外,还要对其中的目标显著系数进行适当地过滤。二是:以所有图像为基点,以显著目标为导向,采取视觉一致性的模式。三是:以视觉一致性为基础,对其中的不同目标图像信息进行客观地分类。这种以视觉一致性为核心的方法能够有效地提高图像检索结果的准确率。更重要的是,在提高图像搜索引擎检索性能的同时,能够及时为用户选出最优的图像信息。而这些信息资源和用户寻找的主题信息密切相关。
4结语
关键词:计算机视觉系统 工业机器人 探究
中图分类号:TP242 文献标识码:A 文章编号:1007-9416(2015)05-0000-00
计算机视觉系统主要是为了工业机器人更好的工作而研发出来的,是一套装有摄像机视场的自动跟踪与定位的计算机视觉系统。近年来,机器人已经广泛使用于工业生产,但是多数机器人都是通过“示教-再现”的模式工作,在工业机器人工作是都是由操作员进行操作示范再由机器人跟着示范进行工作。由于机器人缺乏对外界事物的识别能力,工作中经常发生偏差或者位移等情况。由于工作环境的恶劣以及各种阻碍,为了提高工业机器人的工作效率、灵活性、适应性等,让机器人更好的识别外部环境并及时调整运作方向,能更好的发挥其作用,在原有的机器人系统中添加了一套计算机视觉系统,利用计算机视觉图像装置的信息,通过图像使机器人进行外部环境的识别处理,采用三维的重建,通过作业中利用三维图像的信息进行计算,采用Motocom32软件和机器人控制柜通讯等设备,对工业机器人进行控制,更好的实现机器人对空间特点的跟踪与定位。
1系统的结构与原理
本文主要针对Motoman UP6工业机器人系统的二次研究,在原有的工业机器人的系统中,增加了一套计算机视觉系统, 使工业机器人更好的识别外界环境的系统。计算机视觉系统主要包括:Panasonic CCD摄像机、Motoman UP6工业机器人系统、工控机、OK C-50图像采集卡等外部设备。工业机器人的整个系统由原有系统与计算机视觉系统组成,在原有的系统中包含了YASNAC-XRC- UP6机器人控制柜、Motoman UP6工业机器人本体、示教编程器、Motocom32系统以及相关的外部设备等[1]。计算机视觉系统的设备主要有Panasonic CCTV摄像机、AVENIR TV镜头、OK系列C-50图像采集卡、工控机、AVENIR TV镜头、Panasonic CCD摄像机、OK系列C-50图像采集卡形成的视频采集系统主要是捕获物体的图像,该功能主要是分三个层次进行图像处理、计算、变换以及通信等功能来实施工控机。利用远程控制来对工业机器人进行Motocom32系统进行通信。
2计算机视觉系统的构建
2.1硬件的组成
CCD摄像头:选用的CCD摄像机采用PAP-VIVC810AOZ型彩色摄像头,如图1。摄像机的像素为P:500(H)x582(V),N:510(H)x 492(V),摄像机的分辨率为420。摄像机的成像器使用1/33"CCD,信噪>48 dB,同时摄像机具有自动背景光补偿、自动增益控制等功能。
图像采集卡:图像采集卡主要采用CCD摄像头配套的MV-200工业图像处理。如图2所示。MV-200图像采集卡的分辨率、图像清晰度具有较高的稳定性,其真彩色实施工业图像采集卡,该图像采集卡的硬件构造、地层函数都具有稳定性,同时在恶例的环境中都可以稳定运行[2]。图像采集卡的图像采集效果非常好,画面效果非常流畅。
MV-200图像采集卡性能特点:其分辨率为768 x 576,具有独特的视频过滤技术,使图像质量的采集、显示更加清晰流畅。主要支持的系统为Win98 /2K/XP,主要用于人工智能、事物识别、监控等多种领域。
工控机:工控机以奔4系列为主。
2.2软件组成
图像匹配软件。
图像处理与获取软件。
定标和定位算法软件,功能分布如图3所示。
3视觉系统的原理及流程图
工业机器人的主要系统包括是由工业机器人本体、相关的外部设备、控制器(供电系统、执行器等)计算机视觉系统主要由三部分组成:图像处理和获取、图像匹配、摄像机的定位等组成。通过借助OpenCV的视觉库进行VC++.NET实行,流程如下图表4所示。
在本视觉系统运行中,需要对摄像机实行定标,建立实际空间点和摄像机的对应点。在定标的过程中,就需要标记基准点,使摄像机在采集图像时可以准确的把这些基准点投放到摄像机的坐标上[3]。同时在采集卡的图像中,对图像进行处理并计算出该基准点图像的坐标,通过定标计算法,从而得出摄像机的参数。
在机器人系统中的反馈,计算机通过C语言的调节图像采集卡进行动态链接来控制函数[4]。同时,对摄像机中的数据、视频信号进行采集,构成数字化的图像资料,采用BMP格式存储进行计算,在计算机上显示活动视频,然后系统对获取的图像进行分析处理,以及对噪声的去除、图像的平滑等进行处理,利用二值化处理对那些灰度阀值的图像进行处理,同时检测计算机获取图像的特征量并计算[5]。在完成图像的处理后,就需要确立图像的匹配特征,对图像进行匹配[6]。如果两个图像不重叠,就需要建立3D数据库进行模型重新选择,再把模型进行计算、投影计算、坐标更换等指令,直到找到与图像相匹配的数据模型,才能真正得到真实有效的图像。重叠时,要获得有效的图像,以工业机器人识别物体为目的,才能建立机器人系统之间的通信。同时,通过三维图像重建,进行机器人空间定位[7]。如下图表5所示。
4结语
综上所述,计算机视觉系统主要是为了工业机器人更好的工作而研发出来的,是一套装有摄像机视场的自动跟踪与定位的计算机视觉系统。通过3D数据模型指定目标,机器人系统利用计算机视觉图像的采集装置来识别外界环境的数据,经过图像的姿态预算、影像的投影计算产生图像,通过图片的合成比较,以此来实现机器人在工作中对物体的识别。利用计算机系统对机器人进行有效的控制,在工业机器人工作中对事物目标的搬运、跟踪、夹持等指令。计算机视觉系统具备清晰的视觉功能,有利于提高工业机器人的灵活性以及适应性。
参考文献
[1]夏群峰,彭勇刚.基于视觉的机器人抓取系统应用研究综述[J].机电工程,2014(06):221-223.
[2]华永明,杨春玉.机器人视觉系统在立体编织自动铺纱过程中的应用研究[J].玻璃纤维,2011(01):189-191.
[3]王培屹.基于多传感器多目标实时跟踪视觉系统在全自主机器人上的应用[J].软件导刊,2011(01):263-264.
[4]谭民,王硕.机器人技术研究进展[J].自动化学报,2013(07):123-125.
[5]鲍官军,荀一,戚利勇,杨庆华,高峰.机器视觉在黄瓜采摘机器人中的应用研究[J].浙江工业大学学报,201(01):93-95.
2013年4月,何搏飞辞去了一家美国上市公司中国区总经理的职务。他用几个月的时间在中国寻找创业伙伴,结果却让人失望。当时,他已经做好打算,和这个团队随便聊半个小时,然后就飞去美国硅谷。
何搏飞推开门,看见几个光着上身的年轻人坐在电脑前,整个屋子被各种大小的显示屏围绕。随后,他和团队CTO赵勇从下午两点一直聊到了凌晨两点,就决定加入担任CEO。这家公司的名字叫做“格灵深瞳”。
格灵深瞳是一家计算机视觉和人工智能的技术公司,通过深度数据和机器学习算法让计算机主动获取三维视觉信息,并进行精确的实时智能分析。简单来说,他们想让计算机像人一样,看见并理解这个世界。
“计算机视觉的技术已经存在了几十年,我们想要做第一个将计算机视觉商业化的公司。”何搏飞说。切入智能安防监控领域是格灵深瞳选择将计算机视觉商业化的第一步。今年6月,格灵深瞳获得了红杉资本数千万美元的A轮融资。10月,其智能安防系统开始在国有四大银行中的三大银行进行试点。
格灵深瞳CTO赵勇创业之前在Google工作,是Google Glass的核心研发团队成员之一。Google的工作原则是80/20,员工可以利用20%的时间自由创新。赵勇利用空闲的时间,重新开始研究自己在美国博士期间的研究方向―计算机视觉的人工智能。
计算机视觉过去主要建立在光学镜头采集的二维图像上。光学镜头在生成图像时,会丢失掉一个维度“深度”,只保留长度和宽度。当时人们觉得,通过二维图像加上算法,就能够让计算机看懂世界。但赵勇和他布朗大学的博士导师并不同意这个观点。他们坚持认为,计算机必须要通过三维信号才能够看懂这个世界。因此,他们主张要增加“深度”这一维度的信息。“我们有两只眼睛,就是为了判断深度。人脑比计算机聪明多少倍?人脑进行判断还需要三个维度的信息,计算机只通过两个维度怎么能够准确判断?”何搏飞对《第一财经周刊》说。格灵深瞳的这一代智能安防系统上一共装有3个镜头。一个是和普通安防系统一样的RGB摄像头,另外两个用来发射和接收激光。激光发射镜头能够在1/30秒的时间里发送36万束激光,安防系统借助它们扫描出现实世界的三维立体图像。
这3个镜头就相当于计算机的“眼睛”。格灵深瞳所做的,不仅是给计算机装上“眼睛”,而且给计算机设置了一套“视网膜神经系统”,让计算机能够看懂“眼睛”里出现的东西。
借助机器学习算法,格灵深瞳的系统能够同时分辨多人的运动轨迹和行动速度,并一一精确记录。比如早上8时的北京地铁站,人群正处于早高峰极端拥挤的状态,格灵深瞳可以从中分辨出一个穿红衣服的女孩,精确跟踪她在人群中的行走轨迹。同时,格灵深瞳的系统还能够监测人类肢体的运动幅度和速度,从而精确识别人们的姿势和正在做的事情。
最初,赵勇和团队已经解决了基本的技术问题,但还没有想好商业化应该选择的行业。办公区域前的大黑板上密密麻麻地写着80多条可能的商业化方向,包括安防、教育、医疗等等。这些是格灵深瞳团队的工程师们一个晚上头脑风暴之后的成果。
“你们这是科学家在实验室里想问题的方式。”熟悉商业的何搏飞对赵勇说。“如果格灵深瞳的目标是成为全球最好的计算机视觉和人工智能公司,最需要的是什么?”“海量的数据。”赵勇说。
要获得海量的数据,有两种方法。第一个是像Google街景一样,自己到各地去拍摄采集。另外一种,是通过现成的行业和设备实现。有没有一个行业,已经在所有能够采集数据的地方都装上了摄像头?赵勇和何搏飞同时想到了安防。安防是一个足够大的市场。2013年中国安防市场的复合增长率为30%,销售收入约为4000亿元。美国的摄像头与人口比是1:10,但在中国的北京和上海这个数字还只是1:50。
更难得的是,格灵深瞳的技术正可以解决安防领域目前面临的两个难题―看不见和找不到。一方面,一个安保人员往往要同时负责监看100多个摄像头,随便里面某个摄像头拍摄到突发事件,当时就被监控人员发现的可能性非常小。另一方面,想要查找监控录像中的某一段录像也非常困难,就算快进,一段6个小时的视频也得近1个小时才能看完。而格灵深瞳的智能计算机视觉系统可以很好地解决这些问题。
选择安防领域作为商业化切入口之后,赵勇和何搏飞开始分析市场和客户。他们发现安防系统在机场、火车站、广场等场景应用最多。但场景一多,很多东西就无法控制。他们希望首先找到一个具有高度可复制性的场景,他们将目光投向了银行。“中国的银行几乎都长得一模一样。由于银监会有严格的条例规定,它们的需求也都一样。而且银行本身底子厚,它们有很强的应用安防新技术的动力。”何搏飞告诉《第一财经周刊》。
一开始跟银行谈合作时,何搏飞和赵勇将重点放在了暴力事件的监控和报警上面。但他们发现实际情况并不如自己所想。暴力事件的概率极小,因此在很长一段时间内,格灵深瞳无法向银行展示出产品优势。
银行的工作人员告诉他们,比起外部风险,银行更头疼的是内部风险。银行一直有双人加钞的规定,一个人保管钥匙,一个人保管密码。但这条规定执行得并不好,就算排班排了两人,也常出现一个人出去抽支烟,另一个人自己加钞的情况。媒体曾经报道有顾客在ATM机中取出过假钞,就是加钞过程中出了问题。
何搏飞和赵勇将这点作为了产品的突破口。经过一段时间的研发,他们的安防监控已经能够确保当ATM机的加钞盖子被打开的时候,必须有两个人在场。甚至当一个人输入密码时,另一个人没有转过身,系统都能够自动报警。银行长久以来的难题被格灵深瞳解决了,它们开始接受格灵深瞳成为自己的安防合作伙伴。2013年12月,格灵深瞳进入全国网点最多的银行中国农业银行进行无人监控安防测试。2014年10月,格灵深瞳在国有四大银行的三大银行中进行大规模推广试点,测试地区包括北京、重庆等省市。
分布式计算是一种计算方法,和集中式计算是相对的。随着计算技术的发展,有些计算应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长的时间来完成。简单来说,分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。本书使用开源工具及相应技术的开发并实现了大规模分布式处理系统,提出了构建高性能分布式计算系统的先进材料,提供实际的指导、相关练习以及软件框架的理论描述。
全书分为2部分,共8章。第1部分 高性能分布式计算的编程基础,包括1-4章:1.引言:包括分布式系统的介绍、分类,分布式计算体系结构与分布式文件系统,最后指出分布式系统面对的挑战与发展趋势;2.开始使用Hadoop:包括Hadoop的发展历史、生态系统、HDFS的特性、单个节点的集群安装与多个节点的集群安装,最后介绍Hadoop编程与流;3.从Spark开始:包括Spark装置、应用实例、Python编程及应用等内容;4.Spark和Scalding的内部编程:包括其安装步骤与编程指南。第2部分 使用Hadoop、Scalding和Spark的实例,包括5-8章:5. 案例研究1:使用Scalding和Spark进行数据聚类:包括聚类技术、聚类过程、K均值算法和相应的例子,最后进行实现;6.案例研究2:使用Scalding和Spark进行数据分类:包括分类及概率论的相关概念,朴素贝叶斯及其分类器的实现,最后对Scalding的实现进行实验并说明结果;7.案例研究3:使用Scalding和Spark进行回归分析:包括线性回归的代数方法和梯度下降法,并分别使用Scalding和Spark进行了实现;8.案例研究4:使用Scalding和Spark的推荐系统:包括推荐系统的介绍、技术应用、实现规则并使用Scalding和Spark进行了实现。
作者K.G. Srinivasa是卡内基梅隆大学计算机科学学院机器人研究所的副教授;是电脑专业资格认定协会(ICCP,International Conformity Certification Programm)、国际计算机视觉期刊(IJCV,International Journal Computer Vision)、国际计算机视觉与模式识别会议(CVPR,Computer Vision and Pattern Recognition)等多个国际会议的委员会委员,发表超过20篇期刊及会议论文。他的研究领域包括计算机视觉、图像处理、动态场景的计算机视觉监控、基于人的行为和生物特征的人物识别与身份鉴定以及数字多媒体数据的水印处理等。
本书描述了构建高性能分布式计算大规模数据处理的软件系统新模式的基本原理;介绍了Hadoop生态系统并一步步地指导安装、编程和执行;对Spark的基础知识,包括弹性分布式数据集进行了介绍,并对使用Spark和Scalding进行数据聚类、分类和回归进行了分析,提供了详细的案例研究方法;最后使用Scalding和Spark实现了一个实用推荐系统。本书适合计算机体系结构、计算智能、数据挖掘等专业的科研人员及研究生阅读参考。