计算机视觉前沿方向精选(九篇)

前言：一篇好文章的诞生，需要你不断地搜集资料、整理思路，本站小编为你收集了丰富的计算机视觉前沿方向主题范文，仅供参考，欢迎阅读并收藏。

计算机视觉前沿方向

第1篇：计算机视觉前沿方向范文

最近几年，自动驾驶成为当下最为热门的科技领域之一，许多企业纷纷将目光转向该领域，诸如谷歌、百度、英特尔、Uber、丰田、本田、福特等科技和车企巨头都在该领域有相关研究。在国内，除了高举无人车大旗的百度，许多创业公司也在研究自动驾驶技术，图森互联即其中之一。

9月19日，国内计算机视觉与人工智能创业企业图森互联宣布，他们研发的计算机视觉与深度学习算法在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得世界第一。仅KITTI数据集中，图森互联获得目标检测三个单项、目标追踪两个单项、道路分割四个单项，共计九个单项的全部世界第一。

那么，在当前，自动驾驶技术究竟有哪些等级？市面上的自动驾驶技术都有哪些阵营？产品落地情况又如何？基于这些问题，《汽车观察》记者对有着十年并行和分布式运算研究经历、曾是淡马锡国家实验室研究员、现为图森互联联合创始人的南洋理工大学博士郝佳男进行了独家采访。以下为部分采访实录：

《汽车观察》：图森做自动驾驶技术项目的初衷是什么，单纯就是看到了这块的市场需求与前景吗？

郝佳男：首先，图森是做图像识别SaaS起家，在技术上有一定的积累，自动驾驶所用到的计算机视觉感知技术和图像识别SaaS在很多方面是同源的；另外，对于自动驾驶，特别是主要基于视觉传感器的自动驾驶，有很高的技术壁垒，图森能够很好地发挥自己的长处；第三，运营车辆对自动驾驶和无人驾驶存在较大的需求，因为自动驾驶和无人驾驶可以极大地减少这些运营车辆企业的人力成本和潜在的安全风险，而且无人车可以持续运营，这对企业来说是生产效率的飞跃。

《汽车观察》：目前，在国际上自动驾驶技术分为几个等级？图森的自动驾驶技术又是几级的技术？在国内外算是一个什么水平？

郝佳男：目前自动驾驶有L1-L5五个等级，L5是人们最期待的完全无人驾驶水平，众人熟知的谷歌无人驾驶在目前只能算是L4级水平。图森的主要目标是通过低成本传感器实现可靠的L3级别无人驾驶。

目前行业内的标杆是以色列的Mobileye。但目前Mobileye量产的芯片依然使用传统非深度学习算法，因此在一些特定场景中（如车侧面、非常见车型等）会出现错误。最近Tesla发生的车毁人亡事故就一个例子。图森的技术方案基于深度学习构建，能够实现更可靠的性能。

《汽车观察》：目前的自动驾驶技术有哪几类？它们的本质区别在哪里？分别有哪些优势？

郝佳男：目前，市面上共有两种解决方案：一种是计算机视觉为主、毫米波雷达为辅的低价解决方案；另一种是激光雷达为主、以摄像头为辅的高价解决方案。

以谷歌和百度为代表的是以激光雷达为主、摄像头为辅的高价解决方案，成本在50万以上。比如Google的无人驾驶车辆，在这个技术路线中，车辆完全由人工智能来驾驶，可以将车辆的方向盘、油门和刹车去掉，同时，为了增加技术的可靠性，Google无人驾驶汽车以激光雷达为核心，一个64线的激光雷达成本在7万美元左右，整体解决方案较贵。另外，激光雷达的硬件可靠性一般，也很难达到车规需求。但是这两家上市企业出于市值管理的考虑，在这方面不计成本。对他们来说，新技术所能达到的程度带来的新闻和公关效力，会大幅地抬高股价。但这种成本过高的技术，在商业化应用时会比较困难。

而选择低价解决方案更容易被车厂、受众所接受。以特斯拉、奔驰、沃尔沃等车厂为代表的渐进型自动驾驶，即先从辅助驾驶开始做起，在特定场景、或是特定的封闭结构化路段适用，做出紧急刹车、自适应巡航、车道保持、自动泊车等动作，后续涉入高度自动驾驶，即除了结构化路段外，还能在非结构化道路上自动驾驶。

图森就属于低价解决方案，即选择低成本的硬件（毫米波雷达、视觉传感器、高性能SoC），配合计算机视觉算法来降低总成本。传感器承担的精度要求降下来，那么对算法的要求就比较高了。

《汽车观察》：目前的自动驾驶技术是如何实现自动驾驶的？能实现到怎样程度的自动驾驶？

郝佳男：自动驾驶系统使用了多种传感器来感知，其中可视为广义“视觉”的有超声波雷达、毫米波雷达、激光雷达（LiDAR）和摄像头等。毫米波雷达和激光雷达承担了主要的中长距测距和环境感知，而摄像头主要用于交通信号灯、车辆、行人等物体的识别。

摄像头拍到的视频其实也是由一帧帧图像形成。拍下来是一回事，通过计算得出图像里的行人、车辆、信号灯等结构化数据则是另一回事。在过去，这被视为不可想象的任务。但深度学习的发展让基于视觉的感知技术获得了大幅度提升，基于视觉的环境感知变得可行了。

《汽车观察》：目前，市面上的自动驾驶技术在产品化的情况如何？有没有落地的产品正在运营？

郝佳男：对于整个自动驾驶行业来说，产品化需要漫长的时间，可能需要2-3年的时间。图森主要还是为主机厂和Tier1（一级零部件供应商）提供以摄像头为主、配合毫米波雷达和视觉芯片的、低成本的自动驾驶解决方案。

《汽车观察》：自长安的无人驾驶路试后，国家开始出台相关禁止自动驾驶路试的政策，这样一来，整个研发自动驾驶技术的企业又该如何测试自己的技术？如何看待国家有关自动驾驶这方面的政策？

第2篇：计算机视觉前沿方向范文

【关键词】虚拟现实数字媒体艺术设计

虚拟现实，英文名为Virtual Reality，简称VR技术，也称灵境技术或人工环境。VR技术领域几乎是所有发达国家都在大力研究的前沿领域，它的发展速度非常迅速。作为一项尖端科技，虚拟现实集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术的最新发展成果，是一种由计算机生成的高技术模拟系统。这种技术的特点在于计算机产生一种人为虚拟的环境，这种虚拟的环境是通过计算机图形构成的三维数字模型，并编制到计算机中去生成一个以视觉感受为主，也包括听觉、触觉的综合可感知的人工环境，从而使得在视觉上产生一种沉浸于这个环境的感觉，可以直接观察、操作、触摸、检测周围环境及事物的内在变化，并能与之发生“交互”作用，使人和计算机很好地“融为一体”，给人一种“身临其境”的感觉。

一、虚拟现实课程简介

随着国内宽带网络的普及和多媒体技术的发展，虚拟现实技术逐渐应用于信息多媒体展示方面。而三维网络展示系统将是虚拟现实技术未来发展的重要方向之一，因此全国各高校相继开设数字媒体艺术设计专业，其中的虚拟现实技术的课程成为国内外教育技术学及媒体传播领域的研究热点和发展趋势之一，它集成了计算机图形学、多媒体、人工智能、多传感器、网络等技术的最新成果，以其沉浸性、交互性和构想性等无可比拟的优点。虚拟现实技术在各行各业得到了广泛的应用和重视，比如在教育培训、城市规划、文物保护、游戏娱乐等领域取得了巨大的发展，市场前景广阔；同时国家自然科学基金会、国家高技术研究发展计划和863计划等都已将虚拟现实技术列入了研究项目。

虚拟现实课程是以往多个计算机辅助设计软件的一个综合运用，课程主要涉及到多个软件与课程的结合，软件包含有Photoshop、AutoCad、3dsmax、Virtools 等，涉及课程有建筑制图、建筑场景漫游、景观绿地设计等专业范围。课程主要运用虚拟现实技术完成一个三维场景的漫游浏览系统，使其能够流畅，完整的再现一个实际的环境或建筑。其中主要运用virtools 这个软件来实现交互浏览的制作，这一步骤是整个系统实现人机交互的核心，最后完成系统的制作并。

二、虚拟现实在国内高校的研究现状

国内在VR方面有较多研究成果的其他单位有国防科技大学、天津大学、北京理工大学、中国科学院自动化研究所、西北大学、山东大学、大连海事大学和香港中文大学等。

北京航空航天大学计算机系是国内最早进行VR研究的机构之一，他们首先进行了一些基础知识方面的研究，并着重研究了虚拟世界中物体物理特性的表示与处理，在VR中的视觉接口方面开发出了部分硬件，并提出了有关算法及实现方法。他们还实现了分布式虚拟世界网络设计，建立了网上VR研究论坛，可以提供实时三维动态数据库，提供VR演示世界，提供用行员训练的VR系统，提供开发VR系统的开发平台，并将要实现与有关单位的远程连接。

清华大学计算机科学和技术系对VR和临场感的方面进行了研究，他们还针对室内环境中水平特征丰富的特点，提出借助图像变换，使立体视觉图像中对应水平特征呈现形状一致性，以利于实现特征匹配，并获取物体三维结构的新颖算法。

西安交通大学信息工程研究所对VR中的关键技术——立体显示技术——进行了研究。他们在分析人类视觉特性的基础上提出了一种基于JPEG标准压缩编码的新方案，并获得了较高的压缩比、信噪比以及解压速度，并且已经通过实验结果证明了这种方案的优越性。

2004年南京大学成立了南京大学虚拟现实与数字媒体研究中心，对VR技术及应用进行研究，并把重点放在虚拟体育仿真、数字文化遗产保护和自然人机交互等方面。

三、虚拟现实课程开设的重要性

虚拟现实技术是利用计算机生成一个逼真的三维虚拟环境，并通过传感设备与之交互的新技术。作为一门新兴的学科，它已经被众多高校纳入计算机科学与技术专业的选修课范畴，但是却没有在数字媒体技术专业中普遍开设。其实无论从技术特点，还是从社会需求来讲，虚拟现实技术都与数字媒体技术有着非常密切的关系，具体体现在如下几个方面。

1）虚拟现实是一门典型的交叉学科，它所涵盖的知识结构与数字媒体技术具有非常大相似性，例如计算机图形学、数字图像处理、计算机视觉、视音频技术等。除此之外，它还涉及了仿真技术、人工智能技术、计算机网络技术、多传感器技术等内容。虚拟现实强调这些技术的综合应用。

2）虚拟现实强调技术创新性和应用创新性。从技术上来讲，虚拟现实在不同学科的交叉融合中，能够不断产生新思想和新方法，例如近几年出现的各种人机交互新方法，各种立体显示新技术等；从应用上来讲，虚拟现实具有强烈的“身临其境”的沉浸感和发人想象的刺激性。因此，利用虚拟现实技术，学生们能够将自己的任何创意和想象进行实践，在虚拟场景中进行规划、设计和测试，从而激发出新的创意。

第3篇：计算机视觉前沿方向范文

【关键词】OpenCV；智能视频监控；目标检测；目标跟踪

1.引言

近年来，随着我国职业院校的不断发展，校园建筑面积和规模逐步扩大，校园的流动人口大量增加，治安形势错综复杂，做好校园的安保工作，仅靠简单的增加人力和物力，采取常规的防范措施已经很难适应新形势的需要。为了加强校园安全防范整体力量，有效保护校园与学生的财产安全，利用先进的科技手段建立一套功能完善、覆盖范围广泛的监控系统是维护学生正常学习、生活，创造平安校园的必要条件。

智能视频监控是综合利用图像处理、机器视觉和计算机视觉知识进行研究的一个新兴的研究方向和备受关注的前沿课题。与传统的模拟监控不同，智能监控系统能实时的对摄像机捕捉到的视频序列进行处理和分析，自动完成动态目标的检测、识别和跟踪，并在此基础上可以进一步对目标的行为进行分析和理解。本文构建的校园智能视频监控系统利用OpenCV实现了对视频图像中动态目标的行为快速有效地进行监控和分析，并实现了对动态目标的精确跟踪。

2.OpenCV视觉库简介

OpenCV是Intel公司开发的用于数字图像处理和计算机视觉的函数库[1]。它由一系列C函数和少量C++类构成，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV其源代码完全开放，运行速度快，由于具有良好的可移植性和统一的结构及其稳定性，因此可以缩短系统设计的开发周期，使系统运行更加稳定。

鉴于OpenCV的特点，它主要用于对视频图像进行一些高级处理，如人脸识别、动态跟踪、图像分割及人机互动等。

3.校园智能视频监控系统的实现

3.1 系统工作流程

当动态目标出现在可视范围内，首先通过背景差分法将前景图像与背景图像分离，再对差值进行二值化判断，利用给定的阈值去除噪声等干扰后，从场景中检测出动态目标。与之前检测出的目标做特征比对，如果是新目标则加入到跟踪序列中，如果是旧目标则舍弃。目标跟踪阶段，对跟踪序列中的目标采用CamShift跟踪算法，提取目标特征信息，并获得其运动轨迹，对目标进行实时跟踪。其关键点在于目标的特征信息提取和匹配，这是决定目标跟踪效果的重大因素。

3.2 动态目标检测

动态目标检测是校园智能视频监控系统的重要组成部分。动态目标检测的主要目的是从视频图像中实时的提取出动态目标并获得动态目标的特征信息，如色彩、形状、轮廓等[2]。动态目标提取的过程就是在连续的视频图像序列中寻找差异，并把由于目标运动和表现出来的差异提取出来。

动态目标检测常用的有四种常用方法：连续帧间差分法、背景差分法、光流法和运动能量法[3]。由于背景差分法具有实现简单，运算速度快，因此最常用。它通过当前帧图像与背景图像相减并提取出感兴趣区域来检测动态目标，固定场景下应用背景差分法进行动态目标检测，关键在于创建和维护一个可靠的背景。针对这种情况，背景模型应运而生。评价一个好的背景模型，应该从两个方面进行考虑：第一，背景模型对背景变化的响应速度要足够快；第二，背景模型对运动目标要有较强的抗干扰能力。

3.2.1 提取前景图像

假设环境温度不变，视频图像的背景也不变，当动态目标出现时.图像相应像素点的灰度值会发生明显的改变，利用图像减法就可以得到差分灰度图像[4]。差分灰度图像包含了动态目标信息，相对于背景图像又称之为前景图像。相减的结果中每一像素的值和一个预先设定的阈值相比较，若这个像素的值大于阈值，则认为这点是前景图像，否则是背景图像。假设利用图像平均法可得到当前背景图像BK（x，y），当前的输入图像为CK（x，y），则前景图像DK（x，y）可以表示为当前图像与背景图像差的绝对值即：DK（x，y）=|CK（x，y）-BK（x，y）|

3.2.2 差分图像二值化

选取T为阈值，对差分图像进行二值化[5]：

1，DK（x，y）≥T

EK=

0，DK（x，y）

其中，EK为进行二值化后的图像，当差分图像中像素值大于某一给定的阈值T时，则认为该像素为前景像素，即认为该像素可能为目标上的一点，反之则认为是背景像素。

在OpenCV中，差分图像的二值化是由函数void cvTheshold实现的。

由于背景差分法受外界光线的变化、背景中含有轻微扰动的对象，如树枝、树叶的摇动等的影响，因此对前景图像还要进行一系列的图像处理。包括：平滑处理，形态学膨胀、腐蚀，二值化操作，轮廓提取等。但是并不是所有的轮廓都是由目标产生的，有些是目标的子轮廓或者是噪声产生的轮廓，因此必须对轮廓进行筛选，淘汰伪目标的轮廓，把目标轮廓筛选出来后加入到跟踪队列。

3.3 动态目标跟踪

在校园智能视频监控系统中，动态目标跟踪起着承上启下的作用，它是利用图像处理和计算机视觉等相关技术对视频图像序列进行处理和分析，在连续的图像序列中找到动态目标的位置和相关信息，比如动态目标的速度、形状等。为了实现该功能，本文采用了OpenCV中的CamShift目标跟踪算法。它主要通过视频图像中动态目标的颜色信息来达到跟踪的目的。

3.3.1 CamShift算法简介

Gary R.Bradski提出的CamShift算法，是以颜色直方图为目标模式的目标跟踪算法，是对MeanShift算法的改良，可以有效地解决目标变形和部分遮挡的问题，而且运算效率很高。它的基本思想是将视频图像的所有帧做MeanShift运算，将上一帧的运算信息作为搜索窗口的初始值，并将初始值作为对下一帧图像运算的输入，进行迭代后实现对动态目标在每一帧图像序列中的连续跟踪。由于RGB颜色空间对光照亮度变化比较敏感，为了减少光照亮度变化对跟踪效果的影响，CamShift算法将图像由RGB颜色空间转化到HSV颜色模型，方便对动态目标特征的提取。

3.3.2 CamShift算法实现

在OpenCV库中，CvCamShiftTracker类就是用来实现CamShift算法的，使得进行二次开发变得很简单[7]。

其中，prob_image为目标直方图的反向投影；Window为初始搜索窗口；criteria为确定窗口搜索停止的准则；comp为生成的结果，包含收敛的搜索窗口坐标（comprect字段）与窗口内部所有像素点的和（comparea字段）；box为目标的最小矩形。如果非NULL，则包含目标的尺寸和方向。

利用该函数，在VC++2010开发环境下，就很容易实现CamShift算法跟踪动态目标。

4.结束语

本文设计的基于OpenCV的校园智能视频监控系统，由于其较低的计算复杂度和较高的鲁棒性，具有广阔的应用前景。采用了背景差分法作为动态目标检测的方法。检测是跟踪的前提，检测结果的精确性直接影响跟踪的可靠性。利用CamShift跟踪算法提取每个动态目标的颜色特征信息，实现对多个动态目标的精确跟踪，最后将动态目标的轮廓和运动轨迹描述出来。

该系统平台简单，大大缩短工作人员的开发周期，只需根据不同的需要进行简单的改进，就可以实现多种场合的不同应用。实验证明，系统运行稳定，检测结果真实可靠，具有较高的精确度。

参考文献

[1]Gary Bradski，Adrian Kaehler.学习OpenCV[M].北京：清华大学出版社，2009.

[2]谭歆，武岳.基于OpenCV的运动目标检测方法研究与应用[J].视频应用与工程，2010，34（S1）：184-187.

[3]尹俊超，刘直芳.基于OpenCV的运动目标检测与跟踪[J].计算机工程与设计，2011，32（8）：2817-2820.

[4]林洪文，姚作，涂丹，李国辉.基于减背景技术的运动目标检测方法研究[J].国防科技大学学报，2003， 25（3）：66-69.

[5]侯宏录，李宁乌，刘迪迪，陈杰.智能视频监控中运动目标检测的研究[J].计算机技术与发展，2012，22（2）：49-52.

第4篇：计算机视觉前沿方向范文

关键词：机器视觉；三维重建；图像处理

中图分类号：TP301

文献标识码：A 文章编号：1672-7800（2014）003-0013-02

作者简介：罗尤春（1989-），男，华中科技大学机械科学与工程学院硕士研究生，研究方向为机器视觉。

1 Marr机器视觉框架

在漫漫进化历程中，人类和大部分动物通过视觉、听觉、触觉等来获取周围世界的信息，并通过大脑处理这些信息。而根据调查，人类大脑处理的信息有80%是来自视觉，我们通过双目感受深度信息，通过对不同频率光信号进行判别来获取颜色信息[1]。通过运用摄像机来达到模拟人眼的识别和测量功能，机器视觉成为人工智能研究的重要环节。机器视觉区别于计算机视觉，更偏向于应用，一个机器视觉系统一般通过摄像机之类的光学仪器以图像的形式获取周围世界的信息，通过计算机进行图像处理和图像理解，再根据相应的控制程序和机械驱动设备对智能输出设备发出操作指令，实现智能控制和操作功能。

早期的机器视觉局限于对二维图像的分析、识别和理解上[2]。20世纪80年代初，Marr第一次融合图像处理、神经科学的相关研究，提出了里程碑式的视觉系统框架。具体来说，Marr框架包括三个层次：计算理论层次、表达与算法层次、硬件实现层次。计算理论层次，可以理解为通过对二维图像的理解来重建三维客观世界的视觉三维重建理论研究。因为现实世界是复杂多变的，如何建立一种通过二维图像来实现三维重建的普适性方法成为机器视觉系统中最重要也是终极的目的。Marr提出的这一层次是想通过建立某种普适性模型来获取客观世界任何物体的形状、位置以及运动的信息；表达与算法层次低于计算理论层次，是要解决“软件”的问题，即如何实现机器视觉系统各个模块之间信息输入、输出和信息表达的问题，亦即各种算法的实现；硬件实现层次可理解为如何组建机器视觉系统的硬件实体设备，与表达与算法层次一起为计算理论层次服务。

Marr提出的视觉框架中研究最多的是计算理论层次和表达与算法层次，分别对应下节要介绍的三维重建理论和图像处理。

2 三维重建

视觉三维重建理论是整个视觉领域研究的重点和前沿。客观世界的物体都是由基本的几何要素组成的：点、直线、二次曲线等。因此，要实现对客观世界的描绘，利用这些最基本的几何要素来组建客观世界是可以实现的。在很多研究中，通过大量的点对匹配得到三维世界中物体的三维点云模型，从而模拟出真实物体的形状。在三维重建研究中，立体视觉或称双目（多目）视觉是最重要的手段。仿照人眼的原理，要获得对周围三维世界的认知，必须知道深度信息，最少需要两个眼睛。与此同理，立体视觉一般都需要两个或者多个摄像机同时工作，才能较好地得到周围世界的三维信息。

2.1 摄像机针孔模型

摄像机的普适模型——针孔模型来源于小孔成像现象。简单地说，针孔模型是指空间中一点P与摄像机中一特定点C（称为光心）的连线交摄像机的图像平面于点p，这个点p便是空间点P的成像点，蕴含了空间点P的几何信息。从数学的观点，摄像机的成像模型是一个从三维到二维的映射f：Pp，是一个降维映射，丢失掉了深度信息，即处于光心C—空间点P的直线上任意一点Q的投影也都是p。从数学上可以证明，至少需要两幅或以上图像才能重建出空间点P的深度信息zP。

2.2 空间点三维重建

采用两个不同的摄像机位拍摄空间中同一点P的图像，分别得到P在左右摄像机图像平面上的投影点p＼-L和p＼-R，如果事先知道左右摄像机的相对位置关系——称为双目摄像机标定，那么就知道了左右摄像机的光心C＼-L和C＼-R的位置。简而言之，双目视觉系统能够提供给我们一个坐标系（左或者右摄像机坐标系），在这个坐标系下通过摄像机标定知道两个光心C＼-L和C＼-R的位置以及投影点p＼-L和p＼-R的位置，直线C＼-Lp＼-L和C＼-Rp＼-R的交点就是要重建的空间点P。

2.3 空间直线三维重建

空间直线的重建原理和空间点的重建类似，假如要重建空间直线L，得到L在左右摄像机图像平面上的投影直线l＼-L和l＼-R，那么左摄像机光心C＼-L和左投影l＼-L形成一个平面S＼-L，同理右摄像机光心C＼-R和右投影l＼-R形成一个平面S＼-R，则空间直线L就是平面S＼-L和S＼-R的相交直线。

2.4 二次曲线三维重建

实二次曲线一般包括椭圆、双曲线、抛物线和圆[3]。关于二次曲线的三维重建，司少华等[4]在1993年提出了一种特征值的方法，其开创性贡献在于首先将二次曲线视为一个几何元素来进行重建，而非利用二次曲线由其上的若干点（至少5个点）决定的原理，更不是利用点云的思想来重建二次曲线。将要重建的对象视作整体而非利用局部元素（点）去拟合逼近的思想是视觉理论更进一步的发展。圆作为最常见的二次曲线特征被广泛应用在物体空间定位上[5]。

3 图像处理

图像处理是指利用计算机对图像进行分析，得到需要的信息。所谓图像，其数学模型即一个二元向量函数f（x，y），其坐标（x，y）表示图像的横纵坐标。对于灰度图像，这个向量函数成为一个标量函数，f（x，y）表示对应平面坐标（x，y）的灰度值。对于彩色图像，一般使用RGB三原色来表征，即f=[R，G，B]＼+T。图像处理的内容非常丰富，包括了图像滤波去噪、边缘检测、图像复原、形态学处理、图像分割等。其中，为了得到三维重建所必须知道的点、直线、二次曲线等图像信息，边缘检测至关重要。所谓边缘检测，目的是要识别出图像中灰度值变化明显的图像点。图像中突变的位置一般代表了三维世界中的不同属性。现有的边缘检测算子包括Canny算子[6]、Sobel算子、Prewitt算子、Roberts Cross算子、罗盘算子、Marr-Hildreth算子等。

A=imread（'Beach.jpg'）；

B=rgb2gray（A）；

C=edge（B，'canny'，0.1）；

imshow（C）

4 机器视觉应用及前景

机器视觉技术广泛应用于机器人、工业检测等领域。由于机器视觉系统是一套光学系统，因此具有非接触式测量的优点。由于计算机的运算速度不断刷新纪录，使得图像处理效率也不断提升，运用机器视觉系统能够为工业中的不同应用提供实时数据。加载视觉系统的智能机器人不仅拥有灵活、快捷的操作手臂，而且配置了灵敏的摄像机充当“眼睛”，还有超强计算能力的计算机充当“大脑”，真正实现了手—眼—脑同体。在工业检测以及测量领域，机器视觉利用自身的独特优势在质量缺陷、生产监控等方面占据了重要地位。机器视觉是一种人工智能技术，在未来的智能化时代，视觉技术必定能成为人机交互的最重要途径之一。

参考文献：

[1] 张广军.机器视觉[M].北京：科学出版社，2005.

[2] 马颂德，张正友.计算机视觉：计算理论与算法基础[M].北京：科学出版社，2003.

[3] 吕林根，许子道.解析几何[M].北京：高等教育出版社，2006.

[4] 司少华，马颂德.基于二次曲线的立体视觉[J].自动化学报，1993，19（4）：420-427.

第5篇：计算机视觉前沿方向范文

关键词：烟叶数字图像；边缘处理；形态学变换；特征抽取；智能识别

1引言

烟叶是烟草工业的基础原料，对烟草工业生产质量和烟草行业经营效益具有举足轻重的作用。对烟叶生产过程的各个环节包括烟叶品质的智能识别进行技术创新，提高品质和效率，是一个前沿研究方向[1][5]。

当前这一方面的研究，主要集中在数字图像处理方面，把烟叶品质的数字图像处理与神经网络技术相结合，实现烟叶品质的智能识别，是一个极有价值的工作。以下在此方面作出一个系统的、较为完备的、易于实际操作的研究。

2主要技术手段

2．1 MAⅡAB图像处理工具箱

在MATLAB平台上，借助图像处理工具箱，可以简易明快地实现对烟叶数字图像的图像处理。在烟叶生产一线，用数码照相机对各种烟叶样本进行拍照，输入计算机，用MAT_LAB将它转换为各(．bmp；．jpeg；．gif；．png；．t 图片以便进行图像处理。成本低，精确度高，宜于普及推广。获取各种类型的烟叶数字图像以后，经阈值使用权图像二值化，可以当即辨识出这一图像是否具有何种类型的病虫害或品质异变。利用烟叶数字图像的边缘检测、轮廓提取等分析命令，获得待测烟叶的图像参数和特征，再由神经网络技术，完成对烟叶品质的智能识别。

2．2神经网络技术

神经网络是一个新的智能识别工具。毕业论文经过训练的神经网络能够存储与过程有关的信息，能直接从历史数据中学习，经过用各种烟叶样本训练和学习的神经网络，能自动地识别出待测烟叶样本的品质类型。而且，神经网络具有滤除噪声及在有噪声情况下得出正确结论的能力。这一点对于烟叶生产实际中大量存在各种噪声信息的情况而言，特别重要。它特别适合在线识别。

3应用MATLAB图像处理工具箱和神经网络技术对烟叶品质智能识别的操作过程

3．1烟叶图片样本库的建立

用数码相机或其它数字图像采集工具，采集各种类型的烟叶的标准图片，分类归档，借助MATLAB图像变换功能，将各种类型的烟叶的标准图片，转换成各种图片形式：．bmp；．jpeg；．sir；．png；．tif等，以便随时调用。这些烟叶图片，有不同品质的样本；还有各种病虫害标本和变异标本。

3．2用直方图均衡来实现图像增强

当从生产一线采集的烟叶待测样本的图像对比度较低，硕士论文即灰度直方图分布区间较窄时，可用直方图均衡实现灰度分布区间展宽而达到图像增强的效果。

3．3烟叶图像的边缘检测和特征提取

烟叶图像的基本特征之一是图像边缘。图像边缘是图像周围像素灰度有阶跃性变化或屋顶变化的像素的集合。烟叶的边缘是由灰度的不连续性所致，因此考察图像每个像素在某个邻域内灰度的变化，利用边缘邻近一阶或二阶方向导数变化规律可以检测烟叶图像边缘。图像特征反映烟叶的几何结构，如面积、周长、分形分维数、孔洞数、欧拉数等等。图像特征的选择是图像识别的重要环节。运用二叉分类法在找出判别特征后，对不同的图像特征由分类阈值按二分的方法进行分类；运用相似距离分类方法把待判图像与一个标准图像相比，标准图像用样本图像特征向量的均值来表示。通过计算待判图像与标准图像之问的在相空间中的距离来判别图像和进行分类。这一过程还为用神经网络技术实现对烟叶品质进行智能识别作出必要的准备。

3．4数字图像矩阵数据的显示及其傅立叶

变换这一变换的目的是为提取特征、进行神经网络模式识别等作出必要的准备。

转贴于 3．5直方图均匀化

这是使烟叶图像性质更为优良而采取的一个技术操作，源代码如下：

I=imread ("yangshuo．tif')；imshow (I)；

figure，imhist(I)；

[J，T]=histeq (I，64)；

％图像灰度扩展到0-255，但是只有64个灰度级

figure，imshow (J)；

figure，imhist(J)；

figure，Dlot((0：255)／255，T)；％转移函数的变换曲线

J=histeq (I，32)；

figure，imshow 0)；

％图像灰度扩展到0～255，但是只有32个灰度级

figure，imhist(J)；

3．6采用二维中值滤波函数对受椒盐噪声干扰的图像滤波

MATLA图像处理工具箱具有强大的功能，能够对噪声干扰的烟叶图片进行消噪处理，模拟源代码如下：

I=imread ("eight．tif')；

imshow (I)；

J2=imnoise (I，"salt&pepper ，0．04)；

％叠加密度为0．04 的椒盐噪声

figure，imshow 02)；

I_Filterl=medfdt2 （J2，[3 ，3])；

％窗口大小为3x3

figure．imshow (I Fiher1)；

I_Filter 2=medfdt2 （J2，[5， 5])；

％窗口大小为5x5

figure，imshow (I_Filter2)；

I_Filter3=medf'dt2 （J2，[7， 7])；

％窗口大小为7x7

figure，imshow (I_Filter3)；

3．7用神经网络技术对烟叶图像进行智能识别

神经网络作为一种自适应的模式识别技术，并不需要预选给定有关模式的经验知识和判别函数，它能通过自身的学习机制自动形成所要求的决策区域。网络的我由其拓朴结构、神经元特性、学习和训练规则所决定，它可以充分利用状态信息，对不同状态一一进行训练而获得某种映射关系，并且，网络可以连续学习，即使环境变异，这咱映射关系可以自适应调整。在上面各节获取烟叶图像特征基础之上，可以用神经网络技术进行图像模式识别。例如，基于概率神经网络PNN的烟叶品质智能识别，它的主要优点是：快速训练，训练时问仅略大于读取数据时间；无论分类多么复杂，只要有足够的训练数据(而这是烟叶生产一线可以做到的)，就可以保证获得贝斯叶准则下的最优解，允许增加或减少训练数据而无需重新进行长时间训练。这一神经网络对于烟叶品质的图像识别，具有重要意义。 4结论

基于计算机视觉和神经网络技术的烟叶品质识别的数字图像处理方法，医学论文是烟叶生产环节的一种技术创新，它可以在烟叶生产一线普及推广，简便易行，能够较大地提高烟叶品质检测的效率和质量，以及自动化程度和智能化水平。

参考文献

[1]于润伟．基于图像处理的稻米垩白自动检测研究[J]．中国粮油学报，2007，1：122—124．

第6篇：计算机视觉前沿方向范文

关键词智能视频监控；运动目标检测技术

中图分类号：TN941 文献标识码：A 文章编号：1671-7597（2014）03-0160-02

智能视频的监控指的是：不需要人为干预的情况下，利用视频、数字图像处理，分析相关的技术，对视频中的活动或者监控中实时、现在的目标，进行跟踪与检测，可对异常的情况，及时做出的反应效果；又可满足日常的监控工作。运动目标的检测是：用计算方法的视频以及数字图像的处理，运动目标的区域，提取出来的。运动目标，视觉技术分析的第一个步骤是对运动目标的检测、后续运动的目标跟踪、分类、行为分析理解等；作为后续处理及分析的前提。随着科技的不断发展，社会上一系列安全事件频繁发生，视频监控系统无疑是一种安全防范的手段，在诸多方面取得了广泛应用。然而，传统的模拟和数字视频监控系统只提供了一个简单的视频捕捉、传输、存储、再现等功能。对视频中的内容也只能靠人为判定，不能主动的向监控者提供监测信息。属于视频图像序列内的智能视频监控是从中自动对监控目标场景进行实时同步分析，并且跟踪与识别其目标，把信息反馈出来和异常现象的警报等。所以，在动态目标检测是视频监控中的视频序列的首要任务。一般背景物体的特性应在一段时间内固定的物体，活动物体应该为移动或短时间出现的物体。但是在现实中，由于背景图像的动态变化所带来的诸多影响，运动目标检测是一个非常困难的工作。

1 运动目标的检测

1.1 运动目标的检测是什么

运动目标检测是指：变化区域中的部分图像，从背景图像序列中被提取出来，使之成为一个有意义的实体。运动目标的检测是智能监控中一个基础但很关键的部分，是实现运动目标跟踪、在识别与事件监测的前提下，运动目标的分割、精确检测都会影响到运动目标的分类及跟踪；而目标检测的好坏将决定后续处理的效果。

1.2 视频监控系统中运动目标检测流程

1.2.1 视频监控体系的硬件是怎样构成的

如今已分为，实时监控系统和非实时监控系统。实时监控系统就是：把摄像头装在，需监控的场所中合适的位置，随时监控该场景的景象，将其传输到监控中心，监控中心再对信号进行分析、判断，由于实时的监控系统其对计算机的信息处理速度要求高，故而其不能兼顾准确性、实时性，所以实际的行业应用还是无法得到大范围推广。非实时视频监控系统是指对已经存在的“过去时”的视频进行分析和判断，是目前视频监控实际应用中的常用方法。

1.2.2 视频监控系统的处理流程是怎样的

不管是非实时的还是实时的视频监控系统，其关键所在都是计算机对视频的处理。视频监控系统对视频的处理流程主要有5个部分：1）获取序列图；2）图像的预处理；3）目标分割的提取；4）目标的匹配跟踪；5）目标的行为分析。对视频进行处理的时，整个系统之基石是如何处理噪声，处理了噪声后，将运动目标从图像中找到，提取出运动目标的信息，然后，计算机通过原目标信息，与提取出运动目标的信息对比，最终，得到目标的真实信息，对运动目标进行检测。

2 运动目标检测技术

作为计算机视觉领域中，一项很重要而又很高效的研究方向——运动目标检测。人们一直都在对运动目标检测技术进行研究，希望可以研究出一种适应所有普遍场景的运动目标检测技术，不过因为有着复杂、多样的监控背景的运动目标，可用于各行业各类监控场景的运动目标检测技术还能大范围得到应用和推广。当前只能根据特定的场景和特定少量的运动目标进行智能分析，需要利用不同的检测方法来进行运动目标检测。目前，常用的运动目标检测技术有以下几种。

2.1 光流法

光流是指：空间运动着的物体，被观测面上像素点运动的时候，产生瞬时的速度场，其携带的信息有：动态行为及物体表面的结构等。给图像中各个像素点，一个速度矢量就形成了一个图像运动场；其运动时用投影将三维物体上的点对应图像上的点，根据各个像素点、动态分析和速度矢量计算。这便是光流法检测运动目标的基本原理。光流计算法由：基于频域的、匹配的及梯度的光流计算法所组成。

2.1.1 基于频域的光流计算法

基于频域的光流计算法是利用速度可调的滤波组输出频率或相应的信息，可以获得高精度的初始光流估计；但其计算非常复杂也很难进行可靠性的评价。

2.1.2 基于匹配的光流计算法

基于匹配的光流计算法又分为基于特征和区域两种方法。前者是通过对目标的主要特征进行实时监控，不断进行定位和跟踪，对大目标的运动和亮度变化的监测具有较好的效果，但由于光流的稀疏性使得对特征的提取和匹配难度较大，精确度不高。基于区域的方法是指：通过对相似区域进行的定位以及位移计算光流，此法在视频编码中有着上佳效果；不过光流稠密性的计算上仍然存在问题。

2.1.3 基于梯度的光流计算法

基于梯度的光流计算法是利用图像序列的时空微分来计算光流，它的计算方法简单，而且在早期的试验中取得较好的效果，因此目前在广泛的研究中，但由于在选择计算光流时需要的可调参数的人工选取和可靠性评价因子上比较困难，即使基于梯度的计算方法虽然在光流估计上取得好的实验效果，但在利用其对目标进行检测与自动跟踪上仍存在问题。

基于光流场，分析的运动目标之检测方法是根据：各个光流矢量中所包含的各个像素之动态的信息，精确的计算出运动目标之速度，且还能检测出，运动目标运动。不过噪声会影响到光流矢量。所以光流不是单一的，且此法采用的是计算量很大的求解计算，要实时检测运动目标，需有特殊的硬件支持。所以其多适用于目标运动速度和图像噪声均较小的场合。

2.2 背景差值的方法

背景差值的方法是指：常用的运动目标检测法，运用于静态背景下的运动目标检测。背景差值法的原理是将前帧图像和已有的背景模型图像做差，得到的不同部分就作为运动目标的信息。此法的基础是构造背景模型，常用的背景建模算法是高斯背景建模算法，而且这种算法还可以进行实时更新。背景差值法的优点是可以提取出运动目标的完整信息；但视频监控中的场景是真实的场景，会受到很多外在因素环节的影响，比如天气影响、以及噪声影响等等，这些因素都会影响到运动目标的信息提取，有时甚至会被当成运动目标的信息被提取出来，所以当使用此法时需二次处理才能适用于视频监控系统当中，从而确能保证检测的效果。

2.3 帧间差分法

帧间差分法是通过对连续两帧或多帧的视频图像进行相减来得到差分图像，在差分图像上检测运动变化的区域，再用区域上的灰度信息恢复之前的运动目标。此法是，在运动目标的检测中，用得最多的算法之一。计算简单、检测目标速度快、自适应性较强、易于实现，是帧间差分法，在检测运动目标中的优点。但缺点是不能检测到完整的目标，不能对目标进行深入分析和识别，增加后续处理的难度，容易空洞运动实体内部所产生的现象。

2.4 运动的能量法

运动的能量法是指：把连续图像看成三维空间并计算空时梯度。运动的对象经过的位置像素空时梯度的一致性越高，梯度的能量就越大；因此可用来检测运动目标。此法可以突出相同方向运动的对象，从而有效消除振动、非需的像素点，适合于复杂监控环境。不过此法不能准确分割对象，方法非常复杂，实现难度很大。

2.5 人工的神经网络

当前，在运动目标的检测中，基于发展很快的是人工神经网络的方法，这种方法通过将每帧图像分成图像块，预处理图像块后将影像投到线性滤波器组，得到图像模式，再把图像分类，最后判断运动目标是哪个图像模式中的，这种方法可以识别出尺度和旋转变形的目标，获得的效果较好。

3 结束语

智能视频监控中的运动目标检测是智能视频监控技术中的一项核心技术，而随着社会生活和生产的进步和发展，人们对视频监控将会提出更高的要求，智能视频监控将会在人们的生产和生活中运用的越来越广泛，作为核心技术之一的运动目标检测技术将会得到越来越多的关注。因此，应加强对运动目标检测技术的研究和运用，促进其技术的完善和发展，从而推动智能视频监控的广泛运用，推动社会和谐和生活品质的提高。

参考文献

[1]张正友，马颂德.计算机视觉[M].北京：科学出版社，2001：53-59.

[2]代科学，李国辉，涂丹，袁见.监控视频运动目标检测背景技术的究现状和展望[J].中国图像图形学报，2006，11（7）：919，927.

[3]李宏，杨延梧，任朴舟，等.基于光流技术的复杂背景下运动目标跟踪[J].光电工程，2006（10）：13-17.

[4]万卫兵，霍宏，赵宇明.智能视频监控中目标检测与识别[M].上海：上海交通大学出版社，2009.

第7篇：计算机视觉前沿方向范文

[关键词]物联网智能视频技术现状和分析

中图分类号：TP393 文献标识码：A 文章编号：1009-914X（2016）05-0358-01

引言

视频监控是物联网中的重要组成部分。在以往的安防行业中视频监控只是其一个重要的应用领域，并没有将系统、互联网这些概念掺杂其中。而随着我国经济的不断发展，越来越多的领域需要视频监控，从而也将视频监控原本只是安防行业的传统狭窄领域给打破，越来越多的新需求也在物联网的背景下被人们所提出来。信息的采集点是摄像头的本质，而编码设备的本质则在于数字信息化的变化，而将摄像头和编码设备进行有效的结合，也就形成的第一步功能的物联网。而随着第一步功能的完成接下来就是全面的IT化互联网化，也就是对架构、系统以及技术的IP化[1]。在当下物联网的趋势和背景下，有效的结合IT和安防是必须要做的工作，因此，联网对于监控来说也是必不可少的。

1.物联网中智能视频的作用和发展现状

1.1 智能视频的发展作用

随着我国科技的不断发展，全数字化时代已经在视频监控中得到全面使用，也就是当下视频监控系统的网络化，它是通过标准的TCP/IP协议而建立的，因此它又叫做IP监控系统，是在2001年被发明并使用的。视频监控的数字化的优点就在于可以使模拟闭路电视监控的局限性得到很好的解决，例如可以在计算机网络上不受距离限制的传输数字化视频的图像数据，而且也不会干扰到传输信号，使图像的品质和稳定性得到大幅度的提升；视频监控的数字化可以很好的运用计算机网络进行联网，可以重复使用网络宽带，而且对于网线的布置上也可以不用重新布置；数字化存储功能也得以实现，通过对视频数据的压缩处理，使其可以有效的在磁盘阵列中得到存储或者在光盘中得以保存，从而更加方便快捷的进行数据查询[2]。

在智能化方面，目前的视频监控系统都试图对摄像机采集的视频信息上运用计算机视觉技术来进行理解、分析和处理，过滤和排除掉一些无关紧要的信息，报告给监控人员处理的都是一些提取出的有用信息，从而让预警、防范以及主动监测等功能得到实现，进而使代替人来进行监控任务的目的得以实现。

1.2 智能视频技术的应用领域

目前，智能视频技术已经得到了广泛的应用，很多行业都开始依赖智能视频技术来促进行业的发展。例如，（1）高级视频的移动侦测：在雨雪或者大风、大雾等复杂环境中，可以对一个或者多个物体的动作方向、运动特征等一系列的运动情况做到精准的侦测和识别。（2）物体追踪：在对移动物体侦测到后，可以结合物体的运动状况自动的进行控制指令的发送，从而使的摄像机可以对物体进行自动跟踪，而当跟踪物体超出跟踪范围后还能自动的对物体所在区域的摄像机发出通知，从而让物体区域的摄像机进行再次跟踪和监控。（3）识别任务的面部：通过对任务的面部特征进行识别，将人物的面部特征和数据库进行对比，从而对人物的身份进行识别和验证。这种面部识别主要分为两种，一种是需要人物在摄像机面前停留一段时间，在一些门禁系统中比较普遍，还有一种是在一群人中对一些特定的个体进行识别，这种在机场、火车站等安防工作中的运用比较普遍。除此之外还有很多地方都得到了广泛的应用，如通过对车辆的形状等信息进行识别、对交通流量进行控制等[3]。

2.智能视频监控技术的技术介绍

所谓的运动目标检测是从视频序列的图像中将目标物体所在区域给分离出来。在对目标物体进行正确检测盒识别的基础上进行后续工作中的运动目标提取、跟踪以及行为理解。可以说视频监控中运动目标的检测是前导工作。在运动目标的检测中主要分为两种检测，分别是背景检测和目标检测。

当下的背景检测方法主要有四种：背景模型法、背景统计法、卡尔曼滤波法以及Surendra背景更新算法。背景模型法是建立各个像素点的统计模型，通过对像素点的灰度分别来找出最为符合的概率分布，例如非参数化模型。背景统计法是对像素点的灰度进行统计，在结合其平均值估计背景点的灰度，对剧烈变化的部分进行过滤。卡尔曼滤波法是通过将灰度的时间序列看成具有噪音的观测值，结合时域递归低通滤波对缓变的实际图像进行估计[4]。Surendra背景更新算法是对侦察图像进行计算，得出物体运动的区域，保持区域的背景的不变，更新非运动区域，从而估计背景图像。

目标检测算法中光流法、帧间差分法以及背景减法最为常用。光流法是对运动目标的光流特点，通过对光流场进行计算，从而进行运动目标的提取。这种方法在计算上较为复杂，且耗时比较长，对一些实时性检测很难满足。帧间差分法对相邻两个图像灰度值存在的差异进行对比进行运动目标的提取。这种方法在计算上较为简单，也能很好的感应到运动物体区域的变化，但是会拉伸检测出的物体运动方向，不能明确的确定运动目标位置，还会去除掉部分运动目标的信息数据，使得运动目标不能被完整的提取出来。背景减法对当前的帧图像与背景图像之间的数据进行相减，若某个像素点比域值要大，则这个点出现在运动目标上，目标的位置、形状以及大小等信息都通过相减的结果而确定。这种方法可以很好的估计和更新出背景，却对运动物体的定位也非常的精准，但是对一些变化的光照以及环境非常的敏感[5]。

3.总结

总而言之，物联网实现智能交通、智能安防、智能监控以及一些其他智能化控制的方法就是物体和物体之间相连的庞大网络。在物联网中最早得到应用的重要技术之一就是智能视频监控。因此，物联网能够直接影响到职能视频监控的发展。智能视觉监控技术所涉及到的诸多领域的研究，属于综合性跨学科问题，是非常具有挑战性的一种前沿课题。当下，对智能视频技术的相关研究依旧还存在于探索和研究的一个阶段，需要大量的工作才能真正的使监控技术的智能化得以实现。

参考文献

[1] 李万才.物联网中智能视频技术的现状与分析[J].警察技术，2010，06：8-10.

[2] 沈沛意，杨刚，张亮，肖潇，张小平，常启鹏，于公.物联网的智能视频接入终端――高清晰智能相机的研制与应用[J].物联网技术，2011，03：41-45.

[3] 朱方，吴莉，陈飞凌，袁卫忠.智能视频监控终端在物联网中的应用和发展研究[J].中国电子科学研究院学报，2011，06：561-566.

[4] 奚吉，蒋银忠.基于物联网和视频分析技术的监狱智能监控系统[J].电子器件，2014，06：1183-1188.

[5] 雷玉堂.浅析几种视频异常事件的智能视频分析技术与方法[J].中国公共安全，2013，12：129-132+134-136+138+140.

第8篇：计算机视觉前沿方向范文

关键词: 自动化; 发展; 应用

Abstract: The emergence, development and application of automation technology in mechanical manufacture design, the introduction of artificial intelligence technology is introduced in this paper.

Key words: automation; development; application

中图分类号: TP317 文献标识码: A文章编号:

1 自动化的基本概念

何谓“自动化”? 简单地说，自动化就是在无人的情况下，用各种传感器执行控制功能。它始于人们用机器实现按固定程序自动进行的各种操作，把人类从笨重、单调、重复性的劳动中解放出来。但仅仅如此是不够的，要进一步解放人力就要求机器不断提高在不确定或变化的环境中自动保持必要的功能以达到预定目标的能力。因此，自动化系统必须是开放和可控的，不断从外界环境中获取信息并进行必要的分析、处理、判断、决策、调整和控制。自动化技术研究的是如何通过各种技术工具和系统( 包括计算机) 延伸人的信息获取、处理和决策控制的功能，从而更好地进行生产和生活，以提高劳动生产率和生活质量。

2 自动化技术的发展

具有低层次“自动化”功能的装置古已有之。我国古代的木牛流马、指南车、铜壶滴漏，欧洲的钟表报时装置和一些手工机械，无一不反映出人类追求自动化的聪明才智。但真正刻意设计出来取代或增强人的智能，从而能在不确定的条件下保证实现预定目标的自动装置最早应属木制水轮灌溉系统。其后瓦特发明的蒸汽机的离心调速器，也自觉地运用了自动原理，从而能在锅炉压力和负荷变化的条件下把转速保持在一定的范围。20 世纪20 年代，电子信息技术的发展提供了信息反馈和随机处理的各种强有力手段，使得自动控制和信息处理技术有了质的飞跃，并逐渐形成了一门新兴学科－自动化。到了五六十年代，数字计算机广泛的应用大大提高了进行复杂数值计算和简单逻辑判断的能力，使得自动化技术真正应用于从工业生产到航空航天的各个领域。钱学森的“控制论”在此基础上应运而生，从而为人类自觉地实现自动化奠定了理论基础。但由于当时的“老式”计算机体积庞大功能不全，所以一些较为复杂的问题，仍然不能得到很好的解决。七八十年代以来，芯片集成技术飞速提升，使计算机拥有了更加全面的功能: 可以高速地对图象、声音等各种信息进行存取和运算，可以对数据和符号进行定性、模糊的推理和判断，可以容许局部出现错误或故障而保持整体的优良性能。人们可以在这些计算机中存入“专家知识”，使它更善于处理未曾遇到过的问题，例如火星探测车，从而满足人类无法身临其境实现的更高要求。总之，自动化进一步深入发展和其它一些学科发展的相互作用，将彻底改变人类的生产结构体系和生活质量体系，成为影响未来社会进程最具影响力的

前沿科学。

3 自动化技术的内容及应用

自动化技术的内容按其理论归纳、技术手段和处理对象的不同，可以大致划分为控制理论、工程系统与控制、系统科学与系统工程、模式信息处理、智能系统与知识工程，以及机器人学和机器人技术六大部分。

3. 1 控制理论

控制理论研究的是根据被控对象和所处环境的特性，能动地运用信息施加控制作用而使系统正常运行并达到预定的功能。控制理论为解决当今社会的许多挑战性问题发挥了重大作用，提供了科学的思想方法论，这是人类实现自动化的理论基础。

3. 2 工程系统与控制

工程系统与控制技术是研究各种工程系统控制和设计的问题。从单一的自动控制装置到一个生产( 生活) 过程的自动化，直到整个工厂、企业的控制、管理和经营决策一体化，都是其研究的内容。工程系统与控制技术广泛应用于生产的各个领域。其中最具影响力的、发展前景最为可观的当属现代集成运行系统。从最广的意义说，可以包括从企业长远规划、市场分析、研发策略、产品规划、设计投产、资源分配，到全系统的具体计划调度、生产活动的全程监控、质量控制、产品检验，直到销售服务、市场反馈等整个企业经营的全过程。这样一种全盘、综合自动化的生产过程可以使企业以更高效高质的服务更好地满足市场需求，提高企业效益，增强企业的市场竞争力。航天工程和具有世界先进水平的中国高速铁路运行客车是这一现代集成运行系统的最好典范。

3. 3 系统科学与系统工程

系统科学研究的是在最一般意义下，由相互作用、相互联系的事物按一定结构组成并具有某种总体功能的各种系统的运动规律、行为特征以及如何进行设计和控制的问题。它主要应用了运筹学、控制论、信息论等多个学科分支，成为自动化学科的一个重要研究领域并得到蓬勃的发展。数控机床、无人飞机、探测月球、火星的工程车是这一工程的杰出代表。

3. 4 模式信息处理

模式识别，亦称模式信息处理，其本来意义是研究用计算机对一般由人类感觉器官接受的图象、文字、语音等模式信息进行处理、描述和分类的学科。模式识别也可泛指任何对一般事物抽取概念特征进行判断和分类的过程。模式识别的应用方向包括计算机视觉，文字、文本识别，语音识别和理解等多个领域。中国在模式识别领域正处于世界领先地位，许多中国学者都为此做出了重要贡献。自动翻译系统，自动识别系统显示了这一技术广阔发展远景。

3. 5 人工智能

人工智能研究的主要是如何用机器模仿人类智能活动的某些方面，延伸人脑功能的问题。现代科学技术的迅速发展和重大进步，已经对控制和系统科学提出了新的更高的要求，自动化控制理论正面临着新的发展机遇和严峻挑战。传统控制理论在解决一些具有不确定性、难以构建精确数学模型、复杂多变的问题上遇到了不少难题。这就需要建造出这样的机器，使它在复杂多变的环境中，能够实时应变，灵活判断、迅速决策以实现更高层次的自动化系统智能控制。简单地说，自动控制的最高要求就是实现控制系统的智能化。人工智能作为一个前沿科学，发展极为迅速，最具影响力的分支有“知识表达”的专家系统和“简单处理器的复杂系统”———人工神经元网络。这些领域不仅具有深刻的认识论意义，而且在自动控制、信息处理以及将计算机用于判断决策和问题求解的应用领域里都得到了广泛的应用，人、机象棋对决，而象棋大师屡屡败北显示了这一技术的巨大的生命力。各种自动运行中的车辆、农业机械、飞机、舰船等都是这一技术应用的主要领域。它也是彻底代替人工完成各种复杂技能的主要工具。

3. 6 机器人学与机器人技术

机器人学与机器人技术是一类特殊的自动化机器，它具有与人的四肢相比拟的运动机构，接受视觉、听觉、触觉等传感信息，在中央处理器( 相当于人脑) 的指挥下完成各种操作功能。机器人不仅可以把人类从恶劣条件、繁重单调的作业中解放出来，而且在力量、精度和速度，以及在特殊环境下生存和工作能力各方面都有人类无法替代的优点。正因如此，机器人技术在工业、农业、国防和科学实验中得到了日益广泛的应用，并且有力地推动了相关学科和技术领域的发展，从而使它成为现代自动化学科中一个活跃而富有魅力的研究领域。战场上的机器人、恶劣环境中作业的机器人是将人类从各个危险领域中彻底解放出来的主要替代者。

第9篇：计算机视觉前沿方向范文

【关键词】智能时代；云计算；安全架构

一、前言

当今世界，新一轮的科技革命和产业变革正在持续深入，工业互联网、智能制造、人工智能、大数据、物联网等领域正在加速布局，“智能时代”企业信息系统最显著的变化是虚拟化、数字化一切、软件定义，促使企业信息化的不断发展，公司信息化资产数量日趋增多、系统的关联性和复杂度不断增强，使企业信息安全形势日益严峻，信息安全防护工作面临前所未有的困难和挑战。为了更好监控和保障信息系统运行，及时识别和防范安全风险，同时满足国家和行业监管要求，保证信息安全管理工作的依法合规，企业亟需建立一个全数据、集中管理的企业安全平台，做到事前预警、事中监控、事后分析以及响应，全面的提升信息安全管理与防护水平。

二、智能时代的变化趋势

我们正处在一个变革的时刻，“智能”是这个时代最显著的标志。在今年春天首届世界智能大会上马云提出，智能时代有三个最主要的要素：互联网、大数据、云计算；李彦宏也指出，未来30年推动社会进步的动力，就是智能科技的进步；浪潮董事长孙丕恕表示，智能从实现形式上就是要通过物联网、互联网将企业生产数据、互联网数据和企业自身的管理数据全部打通，实现无边界信息流和大数据分析。由此看来，一个企业走向智能化首先要完成业务在线化和流程服务软件化，然后完成应用软件的SaaS(Software-as-a-Service)化，从而助企业实现智能生产、智能维护、智慧服务。1.安全技术的变化基于云计算、虚拟化、大数据、智能制造、移动办公的持续推进，都是基于企业信息基础架构所实施的，开放式计算环境和更灵活的支持架构，要求安全技术随之匹配发展，才能适应新环境，新技术下的安全需求。中国工程院倪光南院士在《云安全的思考》主题演讲中指出，云安全一定会呈现出多维度、多层次、跨领域、多学科技术交叉等方面的特征。对于云计算的安全保护，需要一个完备体系，从技术、监管、法律三个层面上，形成可感知、可预防的智能云安全体系。2.企业智能架构从应用架构上看，未来的应用都是角色化、场景化的，可连接互联网资源，全员应用，实现移动化和智能化。虚拟化、数字化一切、软件定义促使企业信息架构的变革，以业务为导向和驱动，在企业管理、集成等方向上提供基础共性平台，为企业快速构建和集成应用软件提供基础支持，从而实现工程经验模块化、产品实际协同化、项目流程一体化结构，实现由统一业务层、统一界面构架层、应用系统层、统一工作台面、大数据分析、云计算层组成的一种新模式。在企业IT系统的业务基础机构层面，引入先进的统一软件平台，为上层应用开发提供统一标准，接口和规范，同时基于“平台+组件”的架构实现各类应用的组合和复用，助企业实现数字化转型。3.云架构在人工智能一日千里的时代，云计算已成为产业革新的原动力、新型管理的主平台、人工智能的强载体。在新的云时代，整个社会都在发生数字化的迭代。云成为数字化最重要的基础架构。腾讯董事局主席兼首席执行官马化腾指出：“用云量将成为一个重要的经济指标，能够衡量一个行业数字经济发展程度。”他还表示：“传统企业的未来就是在云端用人工智能处理大数据。”“云+AI”是当前最主流的方向，其核心包括三项核心能力（计算机视觉、智能语音识别、自然语言处理）。在计算机视觉领域实现开放OCR识别、人脸核身、图片处理等多项智能云服务；在智能语音识别领域实现语音转文字、语音合成、声纹识别、情绪识别等功能；在自然语言处理领域，以“数据+算法+系统”为核心，提供毫秒级响应的个性化服务。

三、企业信息安全措施

VMware首席执行官帕特•基辛格表示：“抵御安全攻击，响应速度不是核心，而是如何将支离破碎的安全保护进行更有效的整合，实现安全架构的简化，这才是企业安全转型的关键。”安全技术在智能时代必须跟上发展的变化，“智慧安全”的理念正在深入，着力点从网络系统安全、数据安全深入到业务应用安全等各个层面，AI防火墙、态势感知平台、云安全产品、企业移动化信息安全管理平台、智慧眼监控雷达、业务应用安全审计平台成为保护企业信息安全的前沿技术。1.企业数据的安全阿里巴巴董事局主席马云说：“数据是新能源。”随着数据量的持续增长，应用数量不断增加，数据将成为社会创新的重要驱动力。随着“网络强国战略”、“互联网+”行动计划、大数据战略的推进，网络安全风险和威胁也进入到企业：非对称的业务流量、定制化的应用程序、需要被路由到计算层之外并达到数据中心周边的高流量数据、跨多个虚拟化应用，以及地理上分散的移动应用，都造成数据泄露的机会，随着中央网络安全和信息化领导小组的成立，信息安全已上升到国家安全层面。因此数据保护十分重要，最好的选择是本源的防护，既做到保护数据本源的同时，又能灵活应对各种安全环境的需求。而符合这种要求的安全技术就是基于专业的安全分析模型和大数据管理工具，可准确、高效地感知整个网络的安全状态以及变化趋势，通过企业本地部署安全大数据分析平台，打通云端情报与本地设备的联动，形成情报触发预警，预警触发防护的闭环。对外部的攻击与危害行为可以及时的发现，并采取相应的响应措施，保障企业信息系统安全。2.企业网络安全2016年，在“4.19讲话”中再一次强调网络安全建设的重要性，并提出：“要树立正确的网络安全观，加快构建关键信息基础设施安全保障体系，全天候全方位感知网络安全态势，增强网络安全防御能力和威慑能力，要加快网络立法进程，完善依法监管措施，化解网络风险。此外根据网络安全法相关规定，我们也可以看出，网络安全法在原有信息系统安全等级保护制度的基础上，创新了网络安全等级保护的工作方法，企业的信息安全建设需在原有信息系统安全等级保护制度建设的基础上，将新技术新应用带来的重要信息系统建设诸如云计算、移动互联、物联网、工业控制、大数据等领域的国家关键信息基础设施建设都纳入国家安全等级保护制度进行管理，将风险评估、安全监测、通报预警、应急演练、灾难备份、自主可控等重点措施也纳入了国家网络安全等级保护制度的管理范畴。企业紧跟网络技术的发展，以“智慧安全2.0战略”为指导，将“智慧安全”的核心从网络系统安全、数据安全深入到业务应用安全等各个层面。现在已可以采用AI、机器学习、行为分析等技术手段进行动态分析、静态分析、异常检测、深度解析等手段，更有效地防范未知威胁。3.物联网安全预计到2021年，全球将有超过460亿台设备，传感器和执行器连接在一起，更广阔，更强大和更稳定的物联网时代即将到来，并且最终将给企业带来全新业务方式。物联网(IoT)为企业创新提供了广阔的前景。企业通过监控、分析收集来的数据量，来确保业务的正常发展。其中数据大都是从传感器、应用、门禁系统、配电单元、UPS、发电机和太阳能电池板产生的数据，但随着这些应用的增长，物联网带给企业的安全风险也很大。要应对物联网的安全挑战，企业应从智能设备的离线安全、入网安全、在线安全等维度进行整体安全检测与防护，在云端接入大数据感知威胁和安全态势分析平台，获取威胁情报；在本地端通过减少威胁“检测时间（TTD）”，即减少发生威胁到发现威胁的时间差，缩短检测时间，可有效限制攻击者的操作空间，和最大限度减少损失。①及时更新基础设施和应用，让攻击者无法利用公开的漏洞；②利用集成防御对抗复杂性，采取平衡防御与主动应对的安全控制；③密切监控网络流量（这在网络流量模式可预测性非常高的IoT环境中非常重要）；④追踪物联网设备如何接触网络并与其他设备进行交互（例如，如果物联网设备正在扫描其他设备，则可能是表示恶意活动的红色警报）。

四、结论

神州控股董事局主席郭为对未来的预测时说：“云计算将成为未来主流IT运算模式，大数据会成为最重要核心资源；自上而下的创新将是智能时代推动社会进步的主流方式，借助云计算、大数据这两项关键技术实现互联网化、协同化和智能化。”智能是我们这个时代的标志，对于企业信息化来说，它的路很长，首先要完成核心业务在线化和所有的业务流程服务软件化，然后完成应用软件的SaaS(Soft-as-a-Service)化，当企业的核心业务完全建立在互联网上，并有软件SaaS平台驱动，企业才能够向智能化方向演进——低成本积累大数据，并通过数据分析进行商业决策，最终向实时数据分析、实时智能商业决策演进。由此，企业信息智能化任重道远，从现在开始制定适当的安全策略，以此加快IT新趋势的适应能力，在不断采用新技术的过程中建立适合企业的安全管理系统，做到覆盖企业安全运维的所有场景，监视安全威胁，预测安全风险。

参考文献

[1]维克多•迈克热•舍恩伯格.大数据时代:生活、工作与思维的大变革[M].浙江人民出版社.

计算机视觉前沿方向精选(九篇)

第1篇：计算机视觉前沿方向范文

第2篇：计算机视觉前沿方向范文

第3篇：计算机视觉前沿方向范文

第4篇：计算机视觉前沿方向范文

第5篇：计算机视觉前沿方向范文

第6篇：计算机视觉前沿方向范文

第7篇：计算机视觉前沿方向范文

第8篇：计算机视觉前沿方向范文

第9篇：计算机视觉前沿方向范文

相关热门标签

相关文章阅读

相关期刊推荐

计算物理

计算机

计算数学

航空计算技术

现代计算机

精选范文推荐