前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的计算机视觉的概念主题范文,仅供参考,欢迎阅读并收藏。
关键词:计算机视觉图像 精密测量 构造几何模型 信号源的接收
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)05-1211-02
新型计算机视觉图像精密测量是一种基于计算机程序设计以及图像显示的高精度的关键技术,它广泛用于测量的领域,对于测量的准确性有很好的保证。这种关键技术是几何了光学的特性,发挥了图像学的显影性,把普通的测量技术瞬间提升到了一个新的高度。在这项关键技术中包含了物理学中光的效应,图像中的传感器以及计算机中的编程软件,这还不完全,还有一些其他科学领域知识的辅助,可以说这项关键技术是一个非常有技术含量的技术,很值得学者进行研究。
1 计算机视觉图像精密测量的关键技术的具体形式
在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机视觉图像精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机视觉图像测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供技术人员使用参照。
在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:
1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;
2) 得出观察点到目标控制点之间的三维的运动几何参数;
3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉);
4) 还通过观察可以判断出目标物体的几何坐标方位。
在整个计算机视觉图像精密测量的关键技术中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机视觉图像系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。
当无法观察到控制点是,计算机视觉图像精密测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。
2 计算机视觉图像精密测量的关键技术分析
在计算机视觉图像精密测量的关键技术中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在视觉图像的选择中,无法使用高帧数的图片显示,无法将计算机视觉图像精密测量的关键技术的优点发挥出来。我们就计算机视觉图像精密测量的关键技术中常见的问题进行讨论。
2.1 降低失误的概率
在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。
2.2 对于权限的控制
权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机视觉图像精密测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机视觉图像精密测量的关键技术。
2.3 开启自动建立备份系统
计算机视觉图像精密测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。
3 计算机视觉图像精密测量的关键技术遇到的困难和使用前景
计算机视觉图像精密测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了测量单位的广泛青睐。在测量方面的这些可靠性和稳定性也是有目共睹的。在土木和机械测量的行业计算机视觉图像精密测量的关键技术都会有广泛和良好的使用,前景也是十分的广阔。但是不容忽视该技术也有一些弊端。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。
我们都知道,人的眼睛是可以受到吱声的控制,想要完成观测是十分简单的,但是在计算机视觉图像技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。
上文中也谈到了,计算机视觉图像精密测量的关键技术中最主要的构建是传感器,一个合理的传感器是体统的“心脏”,我们在仪器的操作中,不能时时刻刻对传感器进行检查,甚至这种高精度的元件在检查上也并不是一件简单的事情,通过不断的研究,将传感器的等级和使用方法上进行一定的创新也是一项科研任务。
4 结束语
在测量工程发展的今天,很多的测量技术已经离不了计算机视觉图像技术的辅助,该文中详细的谈到了基于计算机视觉图像精密测量的关键技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案。测量工程中计算机视觉图像精密测量的关键技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题。
将基于计算机视觉图像精密测量的关键技术引入到测量工程中来,也是加强了工程建设的信息化水平。可以预见的是,在未来使用计算机视觉图像技术建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让计算机视觉图像精密测量的关键技术在测量中作用发挥的更好。
参考文献:
[1] 汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36.
[2] 段发阶,等. 拔丝模孔形计算机视觉检测技术[J]. 光电工程时报, 1996,23(13):189-190.
关键词 计算机图形学 第三方演示 课程群 分组实践
Abstract At present, computer graphics has become an important part of undergraduate computer education, and it is also plays an important role to cultivate innovative talents to adapt to the information age. Based on the teaching of computer graphics course by the author as an example, analyzes the existing problems in the teaching of computer graphics, and put forward improvement ideas from three aspects: according to the different needs of students utilizing the third party demonstration teaching and cross curriculum interpretation, introducing course group to replace single course, employing group practice examination instead of individual, and other forms to improve the quality of teaching.
Keywords computer graphics; third party demonstration; course group; group practic
计算机图形学是一门介绍显示、生成和处理计算机图形的原理和方法的课程。它在计算机总体教学体系中属内容综合性较强且发展迅速的方向之一。该课程既有具体的图形软硬件实现,又有抽象的理论和算法,旨在为学生从事相关工作打下坚实基础。学生须以高等数学和线性代数的基本理论和较熟练的程序设计能力作为本课程学习的基础。课程的难点在于计算机图形学研究范围广,与其他学科交叉性强,且知识不断更新变化。在教学实施过程中,难点是理解和掌握相应的基础理论和算法,以及利用计算机图形学相关工具进行图形学实际问题的解决。
本课程对学生的培养学生围绕以下三个方面展开: (1)建立对计算机图形学的基本认识,理解图形的表示与数据结构、曲线曲面的基本概念。(2)理解并掌握基本图形的生成算法,并能对现有的算法进行改进,理解图形的变换和裁减算法。 (3)面向算机图形的程序设计能力,以底层图形生成算法为核心构建应用程序。相应的考查方式由理论授课、上机实习和课外作业三个单元构成。从近年的授课实践和考试情况分析,该教学内容难度设置合理,深入浅出且相互承接成为体系,学生总体反馈良好。但也存在一些矛盾和问题。以下将对几个问题进行重点阐述与思考,并提出课程改革思路。
1 计算机图形学与计算机辅助设计衔接问题
笔者所在院校是具有航空航天背景的工科院校,“CAD计算机辅助设计”是飞行器设计、机械设计与制造等多学科的重要课程。相关学科学生期望通过对计算机图形学知识的深入理解,促进CAD设计工具诸如Catia、Solidwork和Rhino等先进工具的运用能力。然而,目前的计算机图形学课程的教学和考察环节倚重低层算法讲解与基于OPENGL等的程序设计,除综述外并未具体引入CAD相关内容。产生的问题是,一方面,飞行器设计及机械设计与制造等专业的学生由于程序设计能力不足,难以驾驭较复杂的程序设计任务,在学习过程中心理压力较大;另一方面,由于授课均为教师为计算机相关专业背景,该课程的讲授并未衔接CAD相关技术,学生难以构建二者之间的联系。
解决方案:
本质上,该问题是由于选课学生的学习动机和基础不同造成的。以单一的教学和考查方式难以兼顾这类面向具体应用的学习需求。在教学方法上,采用第三方案例教学法和交叉讲解法相结合以解决此问题。具体的,将CAD等应用场合以具体案例形式讲解,授课教师邀请飞行器、机械设计相关教研组研究生以4~6学时的讲台演示的形式呈现CAD工具完整设计过程。授课教师则以交叉讲解方式为学生讲解运用到的计算机图形学知识点,同时与学生交互式的问答和探讨。在考查形式上,考虑到不同的学习动机和基础,采用多样化实践环节考查。计算机专业学生以OPENGL程序设计为考点,而外专业学生以CAD等面向应用的实践工具为考点,以兼顾各专业的学习需求。
2 计算机图形学与计算机视觉相结合的问题
当前,虚拟现实技术(VR)和人工智能技术(AI)两个最重要最热门的研究领域。虚拟现实的基础理论支撑是计算机图形学,例如三维场景的生成与显示。而人工智能的一个重要应用场景是计算机视觉,例如基于图像智能识别的自动驾驶技术和场景理解技术。很多学生对以计算机视觉为代表的人工智能技术怀有浓厚兴趣,同时,学生又难以区分计算机图形学和计算机视觉的关系。同时,二者在近年来的研究中呈现相互融合的趋势。如基于三维立体视觉的机器人与场景实时定位与重建。如何在计算机图形学课程中,很好地体现两门课程的不同,避免学生的混淆,拓展学生的知识面,都是具有现实意义的课题。
解决方案:
实际上,计算机图形学和计算机视觉可不失一般性的概括为互逆的关系:计算机图形学是由概念设计到模型生成,最终绘制图形图像的过程;而计算机视觉则是从原始图像中再加工并分析理解、以产生新图像(如二维到三维)或输出语义信息(如图像自动标注与理解、目标检测与识别)。将计算机图形学纳入“视觉处理课程群”框架,使学生首先掌握课程群中各课程的侧重点,着重理解图形学在课程群中的作用。精心选取2~3个计算机视觉和图形学交叉的当前主流研究方向,展开概念层面的演示讲解,不深究具体算法,着重阐述两种技术的相互依赖关系并对比二者的区别。相关领域的演示还包括增强现实、人机交互、计算机辅助诊断等等。鼓励学生自主学习,最终使学生在做中学、用中学,提高独立分析新问题和综合运用知识解决问题的能力。
3 如何平衡算法讲解和程序应用技能
计算机图形学涉及的算法多,核心算法是该课程的必讲内容,在算法细节的讲解过程中学生容易产生畏难厌学情绪,注意教学方法以调动学生的兴趣尤为重要。另一方面,对学生的考察方式最终是通过编程实践完成。学生在编程实践中常常遇到大量调试问题,同时要阅读大量文档以了解OPENGL接口函数的调用方法,这个过程占用了很大工作量。
解决方案:
在理论教学部分,着重讲清计算机图形学原理和概念、全面解析经典算法思想。课程强调对理论核心思想的阐述,用通俗易懂的语言,条例清晰的逻辑,进行简明透彻的阐述,附以直观、形象的动态演示系统,力图使学生在较短的时间内、有效地掌握基本理论。分析图形学各种经典算法的原理、可行性及几何复杂性,尽可能多地比较算法之间的思想差异,分别指出它们的优缺点和应用场合,并促进学生思考如何在保证算法的准确性、可靠性的前提下,提高算法的效率。同时注重接近国际前沿的研究内容,注重讲授经典知识和最新进展相结合,以激发学生的学习兴趣,提高课堂效率和活跃度,力争以较少的课时阐述计算机图形学的基本原理、基本方法,加大实践环节比重。通过往年学生完成的优秀课程作业作品的展示,激发学生的创造热情。改革实践环节的考查方式,以项目小组形式取代对个体的考查。原则上每组3~5人,自由组合。在课程结束前,采用小组现场演示讲解的方式,展示小组成员通过编程实践环节完成的一个项目。学生在项目小M中锻炼了团队协作能力,降低了个人工作强度,同时互相学习和督促的氛围使课程作业的质量得以大幅提高。以基础实验――目标性重建实验――自主性训练的层次化实践框架模式,逐步培养学生自主研究,独立解决问题、分析问题,确定解决方案的能力,树立正确的科学研究习惯,培养学生的科学研究能力。
总之,合理设计实践教学案例,进一步实现课程体系和实践内容的统一,建立一个多层次、立体化的实践教学体系,注重学生的参与性与实践性,引导和鼓励学生进行创新实践和课外研学。改革考核方式和考试形式,加大实践环节在成绩中的比重,强化实践能力培养,寓教于乐的同时引导学生追求卓越。此外,计算机图形学技术是发展非常快的一个研究及应用领域,且对编程要求较高,应注重实验室机房投入更新必要硬件,并保障软件编程环境的正常运行。
L鼙疚氖苤泄┦亢蠡YBA15035,江苏省教改项目JGLX13_008资助
参考文献
[1] 孙家广,胡事民.计算机图形学基础教程.北京:清华大学出版社,2005.2.
[2] 唐荣锡,汪嘉业,彭群生等.计算机图形学教程(修订版).北京:科学出版社,2000.
[3] LIU Hailan.On development and application of computer graphics[J].Computer Knowledge and Technology,2010(3):9551-9552.
[4] 娄凤伟.创造性思维与计算机基础教学[J].教育探索,2002.
1引言
利用摄影测量和遥感为制图和GIS获取数据,传统方法的特点是人工有效地从影像__匕提取高精度的三维数据,在距离_匕这些影像从空间平台获取的图像到近景固定目标图像。一般来说,这些生产程序是费时并且很昂贵。在目前的制图和GIS预算基础上,传统的方法限制了能提取的地形信息的数量和分辨率。另外,山于数据获取当局采用了不合理的数据更新周期,在很多情况下,数据趋向于过时。数据获取系统总是技术驱动的,并且适应最新的方法和设备。将来,当数字系统成为现实时,这将毫无疑问会继续.在提高自动化水平的基础上,数字系统为提取制图和GIS所需信息提供新方法。新方法中也包括计算机视觉中的边缘裁剪技术,该技术利用了人工智能和机器学习等领域知识。凶此,摄影测量与遥感和计算机视觉与人工智能等领域的研究人员触合他们各自的技能来解决这个应用领域的一些具体的问题。在摄影测量与遥感领域自动提取地面地形信息需要过程的简洁表达和压缩影像范围的知识。这是一个很重要的工作,因为影像中储存着极其复杂的信息。摄影测量中获得的地表地形的影像的比例尺可从l:3000到l:90000,而遥感获得的影像的像素分辨率可从!米到30米不等。地形的影像特征的结构很复杂.它是由很多不同的亮度组合而成的,这些亮度可以表达例如,核物、地表、水文等这样的自然特征:也可以表达例如,房屋、道路等人工建筑,还能表达像阴影或亮度所造成影明的人造物体。另外,遥感影像中,一些特征之间的关系比一般照片上的特征之间的关系复杂。这些特征意味着航天和卫星影像的信息提取是很大的挑战。信息提取的研究首先得考虑数据的语义方面的问题。可是,提取的信息的几何性质也必须被考虑,以至于可以确保空间数据的相关规范性。计算机视觉是一门自动和集成广泛可用于可视处理和表达方法的科学,通过建立清晰、有意义的影像上的对象描述,应用方法和技术很广泛,其中包括数字影像处理,模式识别,几何建模,理解和认知处理.计算机视觉本身主要涉及影像解译和图像识别问题,并且试图通过目标和场景识别来解决这些问题。在这个过程中,使用从影像中提取属性和关系的技术、形状表达和描述技术,最后,利用提取和描述的特征进行基于模型的识别。由于影像获取的方法,在从数字遥感影像提取信息的过程中计算机视觉方法的应用是很复杂的,因而,当使用针对普通照片影像的提取方法时,要仔细考虑遥感影像的数据特征。在计算机视觉应用中很难处理的特征,在航空和卫星影像同样也是很难处理。普通的影响因素包括获取影像过程中的噪音,阴影的影响,由于照相机的角度和定位引起的几何变形的影响和光照的影响,由于封闭和部分目标等问题所引起的影响.解译航空(卫星)影像和其他的图像时采用的方法是不同的.三维物体几何形状是航空影像判读过程中的最基本的元素,这并不是因为要提取高程的原因,而且是因为在判读中三维对象可提供更多的信息。是三维还是二维信息更有利于特征的描述,这样的问题便被提出来了。在计算机科学领域里,对大多数研究而言,二维图像数据一般认为是足够的,尽管有研究小组正从事立体视觉和深度信息提取方面的研究。尽管有些例外,但大多数形状和位置描述决定了计算机视觉中的对象模型,对于中、低分辨率的航空影像,使用纂于形状的识别是令人质疑的。然而,上下文信息对遥感影像的解译有很大的作用。比如,桥作为穿过河流的道路的一部分可能很容易被识别。航空影像中的目标很密集,并有很多的组成部分,这一现象己被认识到了。这与计算机视觉最近的发展趋势是一致,计算机视觉识别图像上的目标,首先是分离不同目标的组成部分和它们之间的关系。这篇文章将回顾一些在计算机视觉中己使用的知识描述和建模的方法,并给出他们在研究遥感影像理解方面的例子。方法很多,要讨论这个领域中所有正在被研究者所使用的方法是不可能的。其他方法的讨论可能会涉及其他的领域,如Crevicr和LePage基于知识的影像理解的方法.Hancock和Kittler方法是两种松弛技术,sriniva犯n是人工智能技术在遥感方面的探索等。第二部分将介绍机器视觉领域中的知识的定义、知识表达的方法、控制问题、特征建模方法。第三部分介绍特征表达和特征识别的过程。第四部分介绍知识表达方法在航空测量和遥感中的应用实例.
2知识、表达和模型
2.1知识的定义•MerriamWebsterDictionary把知识定义为己知的事实和条件,知识是通过经验和联想获得,它的范围包括人所获得的信息和理解,是己知的总和。表达是描述的行为,状态和行为的描述.表达成与本质相应的具有特殊特征或品质的符号、副本或图像。模型是事物的仿真表达,是仿真的实例。在计算机视觉和人工智能中,这些术语的应用不是很严格.与它们的字典中的意思和技术定义相适应,很难确切定义。计算机视觉必须获取影像中场景的有用的描述,最初的描述就是图像强度值的阵列。在低层视觉阶段,进行图像的初步处理。中级阶段应用独立的邻域处理方法提取图像的特征和标识不同的部分。高级阶段归纳更多图像特征表达,在这个阶段进行初步识别.为了处理光线和视角的变化、形状和阴影的影响、图像处理如,相机角度和位置的变化和低层处理中的嗓声问题,我们需要现实世界有关图像获取和应用等方面的知识,这些知识是较高层的丰富的表达,这在计算机视觉中称为模型。这些模型解释、描述或抽象了图像信息。图像和模型之间的桥梁就是一定范围的表达,它联结着输入图像和输出解释。(l)生成图像,图像是输入数据的图像和模拟表达例如:二值图像和侧面影像。(2)分割图像,分割后的图像由与实际目标相应的一些像素组成,例如:分割算法的输出。(3)关系模型,它是经过编码后的知识,用于高层推理和解译.每种表达方法有它的应用范围的局限性。所以,在图像解译中,所有四种类型的表达方法都是重要的。我们应该重点放在第四种上,即关系模型,它包含了用于图像理解目的的知识表达和模型。2.2知识表达知识表达的目的是用计算机易于处理的形式表达知识。一个好的计算机表达语言应该易于表达、简洁、意义明了的、独立的。FOL(FirstOrderLoglc)语言是人工智能中表达方案的基础.FOL有规范的语法和语义,在这种语言里,一个句子的解译也就是上面谈及的。FOL的推断过程允许从旧语句中推断出新语句。这种规范的推断过程可以用于自动的从已知的事实中获取正确的结论.逻辑编程语言和产品系统二者都以FOL为基础.像Prolog这样的逻辑编程语言允许用FOL的严格模式描述知识,也能完成推断过程,可以从通用的知识里提取新的信息。逻辑编程语言通常使用“后向链”控制,用后向的逻辑推理法:为证明一些事物,他们发现数据库中的逻辑关系有助于结论的形成。因此,当一个目标确定后,“后向链”是推理中的最佳方式。产品系统由现存的事物的知识库、一组规则或“产品”组成,这些都是用逻辑关系表达的。下面是一个产品系统的例子。如果一个区域是一个长型的、性质相同的目标,那么他属于道路。产品系统以匹配,选择,产生结果这种方式永不停息地循环,应用数据库的知识,产生新的信息。在匹配阶段,系统寻找所有已有的、满足当前数据的法则。在选择阶段,系统运用第一阶段的匹配原则,选择一个规则来执行。选择的规则在结果产生阶段被执行,在这个阶段可能会牵涉知识库里知识的增加或侧除,和数据的输入、输出。在人工智能和航空侧里与遥感领域,框架和语义网络是最近最流行的值时表达结构。它应用隐喻,把对象表达为曲线图中的节点,这些节点用分类的结构组织,节点之间的关系表述为二进制的关系.在框架系统中,二进制的关系被认为是其他框架填充过来的空槽;在语义网络中,它们之间的关系被认作是节点中的有向线。这两个系统的意义和所要完成的任务是相同的.描述逻辑系统是从语义网络发展而来的,最基本的思想是利用目标和类别的复杂定义和它们之间来进行表达和推理。描述逻辑语言提供三种推理支持:(l)概念描述的分类,在特殊的层次中概念的自动整理。(2)对独立目标根据它们的属性分类。(3)知识库所有知识一致性维护。对于这些逻辑所支持的语言几乎无法表达,并且很难详细阐述复杂的制约条件.这些语言的优点是他们有依据推理服务的正式的语义和简单的逻辑操作.简言之,像Prolog这样的逻辑编程语言有一个执行模型,这种执行模型很简单,以至于一个程序设计员就可处理。近来,Pr。109编译器被推荐作为小型人工智能项目一c产品系统的首选开发工具,该产品系统是一个流行的人工建模推理系统;与Prolog不同的是,产品系统不是基于查询的,而是开放的、不间断的系统,它处于连续的操作中。语义系统提供一个比基于文本式的形式主义更容易理解的图形界面。它可以像FOL一样富有表现力,尽管大多数并不是这样,因为这种系统强加严厉的拘束于可以表达的对象之上.他的优点其中包括能表模块方法中的层次关系,并且相对比较简单。描述逻辑把清楚的语义与简单的逻辑操结合起来.所以,当所有的方案都依据FOL语言,就有这种或那种方法的折衷.2.3控制问题不管选择什么样的影像表达,影像数据的处理和影像数据的表达处理可以称为影像数据驱动,称为从下而上的控制,或可称为内部模型控制,叫做从上而下的控制。自下而上的数据驱动包括从影像处理、分割到描述,每一阶段为下阶段准备数据。如果邻域影像处理方法成本底,而且输入的数据是准确、可信的话,从下而上的控制是有用的.马尔(Marr)和Ullman致力于自下而上的方法研究.这种自下而上的方法是基于人类视觉数据不变的自下而上的处理基础上的。Marr认为这个系统导致一个中间描述叫做21/2维的结构,包括地表定位、参考视场中的距离和方位。另外,Ullman假设高水平的处理叫做可视化程序,它检测中间表达中的感兴趣特征。自上而下的模型驱动控制是被知识库里产生的可能性和先决条件驱动的。因而,模型驱动控制尝试用一种目标指向的行为去执行内部的模型证明.一个普通的自上而下的控制方法是假设和证明。这个一般可以控制低层次的操作.好像支持的人类可视化某些方面的关系并不是自上而下,这个发现促进了模型驱动方法的发展。降低低水平处理过程的设想亦如此。在实际操作中,计算机视觉系统趋向于混合使用自上而下和自下而上两中控制方法,系统的重点在方法效率和实用上.并行和串行计算可能在所有的设计中都用上了。自上而下和自下而上这两种控制隐含了一种层次处理关系.在层次控制中,控制程序看作是合作收集和竞争专家,在任何时候,“专家”帮助大多数选择。黑板结构是这种方法的一个例子,在黑板结构中模块化的知识源之间通过一个公共的黑板(存储器)进行通讯,它们可以通过这个公共的黑板进行输入和输出。2.4建模问题在计算机视觉中的基于模型的方法中,在一类图象中可按优先次序定义了一些模型,并利用这些模型来进行目标识别。这些模型对现实世界和应用中的一些外部知识进行编码二目标模型可能是外观模型,形状模型,物理模型等。在目标表达上,每一个模型应该适应一定的变化范围,这些变化可能是由于视角的变化、光照的变化、柔韧目标的形状变化等因素引起的.另外,影像获取本身的多变性、每组对象中单个对象的多变性,也要考虑进去.感兴趣的目标可能是二维的或三维的:这些目标可能是刚性的、有链接的或有韧性的。图像可能是距离图像或是强度图像.识别就是确定图像上不同的特征和在匹配阶段对比模型特征。模型(图像)的关联特征可以用前面己经讨论过的方法中的一种来表达。在一幅没有限制场景的强度图像识别一个三维目标是很困难的,航片和卫星影像就属于这类情况。深度信息的丢失、遮挡和混乱的细节信息产生了很多问题:另外,图像的强度间接与目标的形状相关.
3特征的自动提取
绝大多数影像解译系统的目的是在影像中提取/识别目标.在基于模型的方法中,它通过首先提取目标属性,然后再将他们与模型匹配。3.1特征属性的描述在计算机可视中,目标的属性、性质和可以从影像中提取的场景都叫做特征.这些属性有时被分类为全局属性和局部属性。然而,在摄影测量与遥感领域,“特征”这个术语是指图像上可识别的目标或者结构,如道路、建筑物,特征的分类依赖于具体应用:举个例子,对航空影像来说,全局性的描述可以包括航影像覆盖的地区例如:城区或郊区。避免过多的名字和定义,文章中的混淆就会减少。在这篇文章里,摄影测量中的术语“特征”即是影像中可识别的对象。若涉及对象的性质,我们就要用术语:“属性”了。目标的全局属性可以概括为目标完全可视化部分的信息,如面积、周长、长度等。理论上讲,为了处理多分辨率和多变的图像,这些全局性属性应是缩放和平移不变的。特征不应该重叠,这样可以避免混乱和遮挡:另外,目标每个不同视角需要独立的模型,这样可以处理多视角图像。例如,在摄影测量中,局部属性可能是联结和分割的边缘,这些可以看作特征的独立属性。然而,在计算机可视化中,局部属性大多数时候被看作属性之间的联系,或者是上下文。相关的属性在图表中构成。评价特征属性表达方案的标准是敏感度、范围、稳定性、有效性和独特性.根据这些标准,研究者总结出一个基于模型方法的好的表达,.其中包括局部属性和图像特定区域和目标的组合。这是因为局部属性可以根据输入数据的有限部分有效计算出来;这些属性很稳定,因为表象的一点变化仅仅影响某些属性,目标的局部遮挡仅仅影响局部特征。边缘连接就是边缘分析基础上的局部特征的一个例子.多尺度表达是可取的,因为在大尺度上,两个大体上相似的目标具有相似的描述,即使在小尺度上有一些不同。不管是从影像数据库还是从经过高分辨率重采样的影像上,对于航空影像和卫星影像而言,这种多尺度描述是比较容易获得的。这个选择项并不是对大多数计算机视觉应用都有用。唯一的模型判断标准在特征识别过程中并不重要,因为识别的方法能够允许由于噪音和遮挡等原因造成的错误匹配。比较航空影像、卫星影像和计算机视觉中的图像而言,前者局部特征的定位比较容易,因为前者的外方位元素和相机参数是己知的或者可以推倒出来。对于大多数航空影像计算机视觉研究而言二描述己经是足够的,但是三维模型和匹配经常应用于摄影测量中,例如建筑物形状提取。最后,什么属性对于特征提取或识别有用呢?属性要能表达不同的特征和图像不同的部分之间的区别。第二,属性要能反映外部世界的规律和结构。这样,属性的选择就是与应用无关的了.在遥感中,通过辐射校正、地物的光谱特征和地面的真实情况,所得到的多光谱影像的特征是众所周知的。一些属性的规律将可以从这些特征知识中提取:例如,不同类型的地面覆盖的光谱特性,如不同类型的植被、土壤、矿物质、水和一些人工建筑物经过多年广泛的实验和地面事实已经被确定了。在计算机视觉中,另外一些属性是基于形状和外形的;例如.道路是窄的条带,建筑物是封闭的多边型等。另外一些属性是基于上下文的,例如,建筑物通常位于道路旁,桥一般是跨越在河上的。特征可以一定的结构进行组织。一种方法是用层次的方法组织它们的部分或全部关系,例如基于系统的语义网络。第二种方法根据邻接关系来组织它们。后者对应于空间临近或上下文关系。二者都可以用图形表达。32特征识别计算机视觉中的目标识别与摄影测量中的特征提取相对应。为了从一幅图像上识别单个目标,自下至上的数据驱动控制通常是足够的,其中属性第一次被检测和表达成符号.通过聚集比较原始的属性来确定新的特征.利用这些属性从模型库中选择合适的模型,也称为索引。然后找到与影像属性最匹配的模型属性。最后,利用一些决策程序来校正模型属性.查找过程本质上包括归类、建立索引和匹配等步骤。然而,在包含多个目标,并且有遮挡和重叠的比较复杂的遥感影像中自下至上控制是不适用的,另外,在质量比较差的图像中噪声会产生假属性。对于遥感图像,这是一个非常合适的方案.在这种情况下,自上而下或者混和控制策略是比较有用的.在自上而下的方法中,假设阶段需要利用属性检索模型的组织,使得基于观测的属性和一小部分合适的目标可以被选择.在校正阶段应用选用的模型来识别目标.在混合方法上,两个阶段的联合提高了处理效率。当结果属性比单个属性更丰富时,就可以对属性进行组合.这个过程称为知觉组织.Lowe提出了目标识别中组合问题和属性组合标准。他寻找边缘分割的结构,它应该是在一定的投影方式下具有普遍性。例如同线性和平行边缘。Zerroug和Nevatia应用均匀投影方法把圆柱投影到二维空间。许多研究者己经研制了专业组合方法,例如:steger等的用于路道提取的方案,Hewricsson和Baltsavias等的用于建筑物的提取方案。显然局部上下文信息在属性组合中发挥着重要的作用,因为,为了定义局部上下文信息,人们希望把描述局部属性与其他属性之间的关系作一些特定安排。有关遮挡、透视、几何、物理方面的一般知识对识别来说是必要的.Brooks(1981)建立了一个名为^eRoNYM的目标识别几何推理系统.Matsuyama和H、ang(一985)研制的s一oMA系统,其中包括了几何推理专家模块。Mc引one和Shufelt(1994)在他们的系统中考虑了投影几何,以用于建筑物提取,而Lang和Forstner(1996)在建筑物提取中应用了多态特性.上下文信息在图像理解起着重要的作用。特别在松弛标记方法中,该方法用局部和全局上下文信息来进行图像区域或目标标记。经过分割阶段,场景标记应该与场景知识相对应,并且标记应该是一致的.这个问题用约束传播的方法来解决.局部约束导致局部一致,并且通过迭代的方法,局部一致性与整幅图像的一致性相协调。关于松弛标记方法的详细论述可以参考Hancock和Kittle:的文章。离散的松弛方法很简单,只能处理完整和精确的分割.概率松弛方法是建立在局部不一致性很可能全局解译比一致很有价值但不易于解释的基础上的,可参见早期Rosenfeld等人(1976)关于这种方法的一个例子.为了处理匹配阶段的不确定性,人们应用了多种基于证据的技术,例如:Dompstershafer理论,可靠性估计,模糊逻辑,最小错误原理,可信度估计,随机封闭集,贝叶斯网络等.
4建模和表达方法应用的一些例子
在计算机视觉和摄影测量与遥感领域中的知识表达和建模方法的应用就是前述一些方法的具体化。这些应用的领导者在理论上是机器械视觉的研究者。在摄影测量与遥感领域,所采用的方法紧随计算机视觉领域之后,这些方法己经改进成信息提取的方法了.这些应用表明摄影测量与遥感领域的研究者在人工智能技术上达到了专业水平。这些方法己经从基于规则的系统发展到语义网络,从框架发展到逻辑描述。在这一部分,计算机视觉和摄影测量与遥感领域中的一些应用的回顾就表明了这个趋势.4.1逻辑Reiter和Mackworth是第一批在计算机视觉系统中,应用逻辑作为一种表达方式的研究者.在他们的著作中,他们提议用一个逻辑框架结构来描述和解译图像和场景知识,并且提出二者之间的形式映射关系。他们陈述了影像原理,场景原理和描述原则,这些原理的逻辑模型形成了影像的解译。他们应用一个称为Mapse的简单地图理解系统来说明他们的方法。虽然这种应用具有相对的局限性,但是还没有新的系统被报道。一个原因是计算方法的复杂性。当逻辑提供一个一致的形式来说明约束,特定的研究使用逻辑的效率并不高。另外,FOL本身善长描述数据的不确定性和不完整性,这些存在于图像属性之中。影像元素与影像对象之间的对应并不是一对一的关系,另外的逻辑关系对这些模型是必要的。Matsuyama和Hwang采用了一个逻辑框架结构,在这种结构中,动态产生新的逻辑一致性和规则。4.2基于规则的产品系统Brooks研制了基于模型的影像理解系统一一ACRONYM系统用来检测三维目标,并用它进行了从航空影像上提取人工地物的实验。三维模型使用一个基于框架的表述来储存。对提供的影像进行了分析,ACRONYM系统提取了线段并获得二维圆柱。几何知识和图像条件经过编码,形成规则被用来产生场景的三维模型,然后这些与框架相匹配以便识别人工地物。sIGMA是一种用框架来描述知识,并且使用从上而下和从下而上两种控制方案来提取特征的航空影像理解系统。它包括三个子系统:几何推理专家系统(GRE)、模型选择专家系统(MSE)、低水平视觉专家系统(LIVE)。信息从GRE传至MSE,然后同LIVE进行通讯。SIGMA中的框架使用槽储存一个对象的属性和它与其他对象之间的关系。以框架中空间知识为基础,产生目标的假设并用于影像特征相匹配。与目标外形有关的推理,由MSE子系统来处理,并转换成图像术语传递给LIVE子系统。这种自上而下的影像属性的选择有利于检测到一些小属性,通过从航空影像中提取房屋和路段信息的实验对这个系统进行了测试。Mckeown等提出一个基于规则的系统,用来从航空图像上解译飞机场.这个系统以大约450条规则为基础,分为6组:初始化、用于原始图像片段解译的区域解译、一致性检查、组合图像片段对功能区域的规则和用于建立机场模型的目标生成规则.Mckeown和Harvey研制了称为•schemata一个航空影像解译系统,该系统中包括一个从标准知识集编汇的一些规则。它们从较高的层次模式中自动生成规则,这有利于更好地进行错误处理和更有效的操作。他们的系统包括大约100schemeta,其中每一个都会产生大约5个规则。start和Fischler提出了一个基于知识的系统,用上下文信息进行地形识别。在不同的层次上用规则对上下文进行定义。上下文信息并不一定可靠,结果导致很多冗余.这个解译系统是以三种规则为基础的:候选结果,候选结果评价,一致性确定。在评价过程中,候选结果的比较是基于可靠的候选结果评价的基础上的,在这个过程中评价相关相似性,候选结果是这类结果中的一个.作者认为这样划分知识是为了使其成为便于操作的大小单元。Stilla等描述了一个基于模型的系统,用来从航空影像中自动提取建筑物信息,目标既具有特殊性又具有一般性。该系统中用产品规则和产品描述集来对要识别的目标进行建模.特殊的模型用不变的拓扑逻辑结构来描述目标,而一般的模型更具有普通性.这些系统说明基于规则的系统不能保证知识的添加性和推理的一致性。如果打破单一规则基础而采用多尺度的多规则那么就会使程序模块化程度降低,而且不易于更改。Draper等人建议用黑板系统和基于schema的结构来处理之。4.3黑板系统Nagao和Matsuyama首先陈述了用黑板模型的影像理解的问题,并把它应用到郊区的航空影像中,用于识别汽车、房屋、道路等。他们的系统包括全局的数据库和一组知识源.黑板用层次方法记录由:基本区域、典型区域和目标等组成的数据.黑板还存储一个标记图,它连接原始影像的象素和数据库中的相应区域。基本区域是影像段分割的结果,并用灰度、尺寸、影像中的位置来标记。然后区域中的独特的特征被提取,识别的结果是具有下面的基本属性的区域。1.依据区域尺寸,大的、同类的区域;2.依据区域形状,长的区域:3.依据区域光照,有阴影的区域;4.依据临近区域的定位和太阳的定位,有阴影的区域;5.有植物和水的区域;6.根据纹理信息,高反差纹理区域。这些属性以单独的模式储存在黑板上,然后根据不同区域的特殊特征存在或不存在,知识源会识别出一个特殊的目标.每种知识源都是一个规则,这些规则是在目标识别的图像处理操作过程中的一个条件或是复杂操作的一部分。例如,利用知识源检洲庄稼地就是这样:“如果”是大的同类的区域、植被区域、没有水的区域、没有光照源的区域,“那么”可以证明这片区域是庄稼地。每种知识源单独识别一个目标,且这个可以导致同一个区域识别相互冲突(如庄稼地和草地)。为了解决这个问题,系统自动地计算一个可靠值.然后,取可靠值最高的识别结果奋舍弃其他的识别结果。Fuger等描述了一个基于黑板的数据驱动系统来分析航空影像中人工的目标.一般的目标模型在黑板中用符号表达,单个对象用几个属性描述.模型被许多参数所限制,这种参数被一个用“发展阶段”的封闭的循环系统所决定。stilla提出一个基于黑板影像理解的系统,这种系统适合于航空影像中复杂场景的结构分析。从一个原始对象开始,反复使用中间结果,目标对象就可以一步一步地组成。对象的组成用一个派生的图表来表达和记录.通过二维图像的分割和直线的近似计算来进行图像的分析识别。黑板系统一般趋向于具有一个集中控制的结构,所以效率就成了问题。另外,黑板系统假设所需要的知识源是有效的,所以在计算机视觉应用中应用该方法前提是图像已经被分析过了。4.4框架Hanson和Rieman把框架作为假设的产生的机器。关于目标分类的知识表达为框架。槽描述了目标类别之间二进制几何关系。槽还包括例示其他的对象描述的产品规则,这样,框架可用于控制又可用于表达.Ikeuchi和kanade用来表达三维对象.当明确了目标模型是有用的,处理过程是自上而下的。然后,如果模型比较弱并且有较准确的数据,那么处理过程是自下而上的。其他使用框架的系统包括^eRONYM、sxGMA、Nagao和Matsuyama等人的系统,这些己经在上面介绍过了。4.5语义网络Nicolin和Gabler描述了一个分析航空影像的系统,该系统用语义网络来表达和解译图像。系统由一个短期存储器(STM)、一个方法库(MB)、一个长期存储器(LTM)组成.5丁M的概念地等同于黑板,储存影像解译的部分结果.LTM存储场景的先验知识和特殊领域知识。系统匹配STM的内容和LTM的内容来产生解译结果.这个过程由MB中的推理机模块来完成.STM最墓本的内容是用一种自上而下的方式建立起来的,并且在一种模型驱动阶段状态产生,校验LTM中存储的目标属性的已有部分和缺少的部分。为了基于知识从数字地图中提取目标,Ma}’er已经发展了一个基于语义网络的系统。该系统是建立在语义网络和框架描述相结合的基础上的,在控制上采用模型驱动和数据驱动相结合。模型是由三个层次组成的,一般与自上而下的影像处理过程的各自的层相一致:(l)影像层,如数字地图;(2)影像图表和文本层:(3)语义对象语义网络以图形层的部分元素为基础构建语义对象,这些对象构成了图形对象和地形对象之间的一般或特殊的关系.例如,一个图表对象层中延长的区域特征化为“路的两边”、“人行道”、“道路网”等.虽然其他对象的描述没有给出,但是测试己证明了道路网的提取.用框架被设计来分析不同的概念和他们的属性.对象的提取以模型驱动和数据驱动实例为基础,初始的研究以用户确定的特定目标为基础的。虽然方法是以地图上明确定义的信息提取为基础,但是M叮er认为这个过程对影像信息的提取也是很有用的。Tonjes己使用语义网络从重叠的航空影像来建立影像模型。输出是具有适当植被表示的三维景观。Tonjes认为语义网络适用于表达结构化目标的知识.它的语义网络是用框架描述的,其中包括关系、属性和方法。语义网络有三个层:(l)传感器图层,该层从纹理,条带和图像细节为基础描述分割层。(2)几何和材料层,该层利用传感和地形解译结果来描述三维表面层。(3)影像层,它是要提取的对象。语义网络建立在三层之间。目标描述通过每层来重建,重建是基于数据驱动和模型驱动的。Lang和Forstner把他们的建筑物的提取方法建立在多态的中间层特征的基础上。该方法中应用了部分分层描述的语义模型。各部分之间的关系没有包括在其中。结合应用于顶点原始层的数据驱动模型和用于目标解译、验证假设层的模型驱动方法的基础上,建立了建筑物假设层,应用了四种建筑物类型:平屋顶、非直角平屋顶、人字形屋顶、曲线屋顶.sch川ing和vogtle开发了一个利用已知地图库辅助解译的数字地图史新系统。影像与地图相比较,检测出地图自编辑以来的变化。接着,语义网络分析新的特征。产生了两个网络,一个用场景,另一个用于图像,在其中网络中的典型关系建立在不同的层次上.DoGunst提出了一个数据驱动和模型驱动相结合的方法,用来识别数字地图更新所需的目标,这个方法是建立在用于道路描述的目标导向模型和用于特征识别的基于框架的语义网络基础上的。框架详细定义了目标之间的关系,目标的定义,可选的目标定义和预处理关系。道路的细节包括复杂道路的结合点,这些在知识库中己被描述。这是一个包括几个不同类型的道路特征的非常细节的研究。研究效果很明显,但同时也表明解译如此多细节存在着困难。Quint和sties在一996年,quint在1997年提出了一个叫MOSES的航空影像分析系统,该系统用语义网络作为建模工具,利用从地形图和GIS数据中获取的知识来自动精练。地图和图像中的一般模型的概念是相应的生成的模型概念的特例。对应于特定的场景的特定模型由系统自动产生:它是通过结合用图像的一般模型进行地图分析而产生场景的描述而产生的。一开始,数字化的有用的线段用来作为地图的结构分析,从而获取地图的结构分析结果。这样,结果图像一般模型来产生特殊模型,以用于图像分析,对于结构分析,原始影像用作输入部分。分析是模型驱动的,进行目标识别。在图像分析处理中用价值函数指导研究。总结之,己发现语义网络有很广泛的应用,并且己经应用于航空影像和数字地图的解译中.4.6描述逻辑逻辑描述的方法在摄影测量方面的应用微乎其微.其中一个是Lang和schroder(1994)研制的基于描述逻辑的方法,利用该方法结合从地图上提取的参考信息来解译航空影像的变化。用KL一one相似描述逻辑来描述不同类型的目标知识和可能的变化类型,它在必要和充足的条件下对概念进行描述。用描述逻辑的描述模块对有关场景和解译的实际信息进行描述。用目标概念和变化概念在逻辑上描述空间地物的几何关系和拓扑关系。目标被认为是经过图像处理和属性提取后的目标概念的一个实例。变化概念的概念被定义为识别变化.利用目标导向和许多启发式方法实现快速搜索。然而,这篇文章的例子似乎都以人工影像为基础的。
一、数据融合
1.1概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。
7年代末,在公开的技术文献中开始出现基于多系统的整合意义的融合技术。1984年美国国防部数据融合小组(dfs)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,buchroithner和wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。
1.2基本内容
信息融合是系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器id/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先
每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。
1.3处理模型
美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
二、多传感器在林业中的应用
2.1在森林防火中的应用
在用modis(moderateresolutionimagingspectroradiometer)数据测定森林火点时的2、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1m的热辐射通道的数据外加入空间分辨率为25m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得gps接收机输出的有关信息通过与rs实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2森林蓄积特征的估计
hampusholmstrom等在瑞典南部的试验区将spot-4×s卫星数据和carabas-iivhfsar传感器的雷达数据进行了融合,采用knn(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。
knn方法就是采用目标样地邻近k个(k=1)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3用非垂直航空摄像数据融合gis信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森
林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。 trevorjdavis等22年提出采用非垂直的航空摄影数据融合对应的gis数据信息实现森林调查数据
的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用gps对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的gis数据进行融合,做出资源变化的估计或影像的修正。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
三、数据融合在林业中的应用展望
3.1在木材检测中的应用
3.1.1木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。
在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。
x射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,
造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和x射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。
基于多传感器(机器视觉及x射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;auburn大学的生物系统工程系和usda南方林业实验站与有关公司合作开展用gps和其他传感器研究林业机器系统的性能和生产效率。
关键词:计算机视觉;背景差法;图像处理;车流量检测;二值化
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)19-4493-03
随着现代交通的快速发展,车辆的日益增多,合理利用道路资源成为目前一项重要课题。为了实现快速准确地检测道路中的车流量,该文提出了一种基于计算机视觉的车流量检测方法。
1 车辆前景图像的提取
对车辆进行检测的前提是提取车辆的前景图像,即在视频序列中实时地发现并提取运动目标,为之后运动目标的处理、识别、分析等算法提供数据[1]。一般情况下视频监控中背景与摄像头之间相对位置保持不变,则背景图像的大小和位置在不同帧中将保持不变,于是可以直接利用帧间同一位置像素的亮度或颜色的差别来进行变化检测,并提取目标。对于运动目标检测和提取算法,常用的有帧间差法、背景差法这两种方法。
帧间差法是利用相邻帧的图像相减得到车辆的前景图像,而背景差法是利用当前的图像减去背景图像得到车辆的前景图像。后者更加直接有效,通常能够提供最完备的特征数据,是当前静止背景下进行运动目标检测的最常用的方法[2]。具体做法:
[Dt(x,y)=ft(x,y)-f(x,y)] (1)
其中[Dt(x,y)]为提取出来的车辆前景图像;[ft(x,y)]为当前视频图像;[f(x,y)]为视频的背景图像。摄像头的位置是不变的,所以当前视频图像的背景与背景图片相同,相减后相同点的灰度值都变为零。而车辆包含的点在两幅图中的灰度值不一样,相减后不为零 [3]。实验结果如图1-图3所示。
如图所示:实时路况图像与背景图像相减后可以得到车辆前景图像。这种方法得到的车辆前景图像很完整,能够很清楚的分辨出前景车辆。但这种方法最大的缺陷就是阴影问题比较严重,与此同时,背景图像的选取也很重要。
2 车辆前景图像的处理
2.1图像二值化
摄像头拍摄到的图像一般为彩色图像,包含了丰富的信息,比如光照信息,物体表面的颜色信息等。但这些信息对运动车辆的检测作用不大,并且占用了大量的内存空间,严重影响到图像处理的速度和效率。因此,我们需要对图像进行二值化处理 [4]。
在数字图像处理中,二值图像占有非常重要的地位。二值化后的图像不再涉及像素的多级值,使处理变得简单,而且数据的处理量较小。此外,二值化后的图像能够用几何学中的概念进行分析和特征描述,具有很大的优势。为了得到理想的二值图,我们一般用值域分割的方法,即该点的灰度值大于某个值时,就将该点的灰度值置为1,而小于该值的话就将该点的灰度值置为0。
[g(x,y)=1f(x,y)≥T0f(x,y)≥T] (2)
通过设定阈值T,可以将图像进行二值化。二值化后可以很清晰地分辨出车辆信息。便于图像的后期处理。图4为二值化后的图像,该图像可以很清楚地分辨出车辆信息,但会出现有些车辆的前景图像不完整或区域不连通,这样对车辆计数有很大影响,这就需要对车辆前景图像进行完善处理。
2.2图像膨胀和填充
经过二值化后的图片,由于车辆本身各点的像素灰度值不同,其有些点的灰度值与背景图像上相应点的灰度值很接近,再经过一定阈值的二值化后,这些点的灰度值就完全为“0”[5]。这样一辆车得到得前景图像就会不完整或者区域不连通,会导致图像中目标计数的不准确。针对这个问题可以通过图像的膨胀和填充将图片变得更完整。
如图5可知,车辆的二值图像已经是一个完整的块,但图像仍然含有噪声及小物体(如青色框框出部分),计算机同样也会将其默认为车辆信息。因此我们需要将这些噪声和小物体去除掉。
2.3图像去噪
在车辆的前景图像中由于噪声的存在以及二值化阈值取得不合理会导致二值化图像中小目标的出现,从而影响计算机对车辆的识别。因此,我们需要将图像中这样的小物体去除。首先我们要区分开车辆的前景图像和小物体,我们可以从面积来识别车辆。一般小目标二值化后的面积要比车辆的面积小得多,通过设定合适的阈值,可以将小目标去除,这样就可以得到仅为车辆前景图像的二值化图[6]。如图6。
2.4车辆计数
车辆前景图像经过二值化,膨胀,填充等一系列处理之后,图像中每个车辆都有自己独立的区域,计算机就可以对图像中目标进行计数。由于每个区域的图像像素是连续的,在二值图像中表现为连通性,因此可以利用计算连通图的数量来求出目标数量。在MATLAB中利用bwlabel函数[7]可求出连通图的数量,对于图6中的车辆计数结果如图7。
虽然摄像头置高可以解决部分车辆重叠问题,但由于车辆阴影的影响还会有部分车辆会粘连在一起。由图8可知:目标块2,3,4,5这四个都是一辆车得二值化图像块,但目标块1却不是一辆车的二值化图像块。目标块1是几辆车粘连在一块了,这样就导致计算机对车辆的计数有误差。
但是从各个块得外接矩形可以明显比较出图像块1的外接矩形形状和其他四个有明显差别。根据这个差别我们可以通过外接矩形的长宽比来赋予计算机识别车辆粘连问题的能力。通过给车辆块的外接矩形的长宽比定义设定阈值,在设定的阈值范围内就表示有辆车。从而计算出粘连在一块的车的数量。下面是车辆计数结果:
图像中目标块数为5块,真实车辆块数为7辆(2辆汽车,1辆电瓶车)。
3 结束语
实验结果表明,该文方法鲁棒性好,实用价值高,能够准确地对车辆进行计数,得到实时路况信息,在只能交通领域有着广泛的应用前景。
参考文献:
[1] 章毓晋.图像理解和计算机视觉[M].北京:清华大学出版社,2000.
[2] 卢强,陈泉林,林康红,奉玲,等.智能交通监控系统中路况图像背景去除算法研究[J].电子技术应用,2001(11):35-36.
[3] 董长虹,赖志国,余啸海. Matlab图像处理与应用[M].北京:国防工业出版社,2004.
[4] 夏良正.数字图像处理[M].南京:东南大学出版社,2001.
[5] 容观澳.计算机图像处理[M].清华大学出版社,2000.
(2)p码和高效能c/a码gps接收机在飞行中模糊度解方面的比较 lacha.,g 郑国忠
(9)现代三维大地控制网的精度标准 leick,a 刘守邦
(14)四等导线测边的额定精度 г.,рн 严伯铎
(16)用小像幅航空摄影测量方法进行滑坡变形监测 nakay.,t 严晖
(18)空间数据库中的位置精度 caspa.,w 李小鹏
(23)面向地球环境的全球gis—测绘技术与地球环境问题结合之关键 张祖勋 廖明生
(26)gps与地形图 colv.,ap 于冬梅
(28)darpa的战略计算计算机视觉计划 陶闯
(30)面向对象的概念在gis和测量软件开发中的应用 hesse,w 周月琴
在1998年第三次高校本科专业目录修订调整前,测绘学科本科有4个专业:摄影测量与遥感、工程测量、大地测量、地图制图,虽然都要学习摄影测量学,但是各个专业间差异较大,如原武汉测绘科技大学(武测)对摄影测量与遥感专业学生有关摄影测量方面的教学内容包括:基础摄影测量、解析摄影测量、数字摄影测量、摄影技术、航空与航天摄影技术、非地形摄影测量;实践环节包括:航测实验、航测外业实习、航测内业实习。而原测绘学院摄影测量与遥感专业有关摄影测量方面的教学内容包括:摄影与空中摄影、航空摄影测量、航天摄影测量、解析摄影测量、航测自动化、像片判绘(包括实习)、像片转绘,实践环节还包括航测外业实习。由于当时摄影测量教学中实验或实习内容涉及很多价格昂贵的专业摄影测量仪器,一些院校受限于办学条件,当时只开设有工程测量专业。原武测工程测量专业在摄影测量学方面主要的课程有:摄影技术(一学期)、摄影测量学(一学期),但没有相关实习;而同济大学工程测量专业,在20世纪90年代中期开设的摄影测量学相关课程有:摄影测量与遥感(上、下两个学期)、工程摄影测量,实践环节包括:摄影测量实验、遥感实习;相较一些院校的工程测量专业,其摄影测量方面的学时数已经偏多。1998年第三次高校本科专业目录修订后,以一级学科设置本科教学专业,现在本科阶段只有测绘工程专业,摄影测量学作为测绘工程专业的主干课程及方向之一,与原来工程测量专业比,摄影测量学在教学中所占的比重增加,但是该比重远低于在摄影测量与遥感专业中的比重,并且由于总课时呈压缩态势,因此实际授课时间实际是在减少。随着空间技术、传感器技术和计算机技术的发展,近20年来摄影测量学内容发生了很大变化;在经历模拟、解析、数字3个阶段发展后,摄影测量快速进入了航空摄影测量与航天摄影测量并存的发展阶段;航空摄影发展到了模拟航空摄影和数码航空成像并存阶段,航天摄影(测绘卫星)完全实现了数字成像;摄影测量数据处理则实现了全数字化。为了适应摄影测量快速发展的情况,同济大学测量系在2005—2006学年开设了摄影测量学的双语教学[9],其他院校也对摄影测量学教学进行了有益的改革与尝试[10-11]。摄影测量的快速发展使得一方面涌现大量新知识点,现在本科教学中摄影测量方面涉及的很多内容实际上是20世纪90年代以来人们的研究结果,因此需要教授的内容大量增加;另一方面,以一级学科设置本科专业,测绘学科的各个二级学科的内容都要涉及,而通识教育本身又需要挪出相当的学时进行通识类课程学习,造成的结果是在摄影测量方面,现在同济本科教学中相关的课程只有:摄影测量基础、数字摄影测量及实践环节———摄影测量实习,并且其中作为专业主干课的“摄影测量基础”课时缩减为一周4课时(将来还将缩减为3课时),在这种背景下,摄影测量方面的教学应如何开展,特别是主干课摄影测量基础教学如何开展,教学中应该包括哪些内容?过去的模拟摄影测量内容是否要涉及?怎样涉及?这些都须考虑。
二、通识教育下同济大学测绘专业“摄影测量基础”教学探索
作为一门主干专业基础课,摄影测量学在数学上具有完整的理论基础,与其他测绘基础课程如测量学、大地测量学有较大的差异,也是一门非大众化的学科课程;但作为测绘技术中的一个分支,其具有广泛的应用,是后续学习数字摄影测量、近景摄影测量及遥感等专业课程的基础。随着近、现代摄影测量理论研究和技术的发展,相关内容更新非常快,而且与计算机视觉的结合日趋紧密,因此现阶段摄影测量学的教学内容也有较大的变化,一是内容增多,二是内容改变多特别是涉及应用方面。而通识教育背景下,造成课时数紧缩,因此在摄影测量基础教学中须兼顾两者,在教学内容安排中尤其要注意基础部分、拓展部分的比例安排,统筹考虑一般学生的需求和感兴趣且学有余力同学进一步深入的要求。结合摄影测量方面课程的教学经验,确定了“摄影测量基础”课程教学的指导思想。
1.“摄影测量基础”课程教学的指导思想
摄影测量学基础作为一门基础性专业课程,在现在学时大大压缩的情况下,整个教学内容应强调基础性,为学生将来可能的进一步学习打好基础。测绘工程专业的学生将来会从事各种不同的行业应用,同济大学测绘工程专业的学生毕业后单纯从事摄影测量与遥感方面研究与实际工作的并不多,比较多的从事工程测量,但现在工程测量这方面的仪器不少涉及近景摄影测量原理的应用,如工业场景监测等;另一方面还有不少学生从事GIS数据处理的工作,其中会涉及不少航空、航天影像的处理。针对这些不同的学生,项目组成员认为“摄影测量基础”课教学的目的是在有限的学时下,传授摄影测量最基本的概念方法,建立摄影测量学基本框架;为将来进一步学习相关后续课程及将来工作中有关知识学习作准备。考虑到同济大学测绘工程专业摄影测量学方面课程分为摄影测量基础和数字摄影测量学两部分,而卫星影像几何处理集中在后续的遥感课程中讲授,且课时数有限,因此现在“摄影测量学基础”课的教学,其指导思想应是:对摄影测量学的讲授内容侧重于摄影测量基本原理、基本过程,使学生建立起摄影测量的基本思想,保证学生对摄影测量整体过程的理解;在此基础上适当加强摄影测量实际应用部分的教学,提升学生的学习兴趣,同时通过双语教学实践来提高学生的专业外语能力,为今后进一步学习做准备。
2.构建科学的“摄影测量基础”课程教学的目标体系
从上述“摄影测量基础”教学指导思想出发,构建了通识教育下“摄影测量基础”课程教学的目标体系。总体上,“摄影测量基础”教学目的是为满足宽口径人才的培养,满足不同部门对于摄影测量和影像空间信息获取人才的要求,为学生将来的对摄影测量学相关内容的进一步学习、自主学习打好基础,为这一目标,将教学中涉及的内容分成4类:需熟练掌握的、需掌握的、需了解的及兴趣拓展部分。有关数字影像匹配方法的基本计算过程,数字高程模型的建立及其应用,数字微分纠正的原理及正射影像图的制作;全部放到数字摄影测量课中讲授,不在摄影测量基础课上做要求。这样通过本课程教学,使学生系统地学习摄影测量学的基本理论与方法,着重使学生掌握摄影测量学的基本知识(包括空间解析定位和图像解译)及利用摄影测量方法获取空间几何位置信息的基本操作过程;了解摄影测量学与遥感、GIS的密切关系,空间定位技术(GPS)的关系,在摄影测量影像信息处理中的应用及摄影测量学的最新发展及其在国民经济建设中的主要应用。一些感兴趣的学生可以进一步拓展了解其历史发展知识及与计算机视觉的关系。
3.优化教学内容,为学生进一步的学习打好基础
合理选择、组织的教学内容是满足在课时较少情况下学生仍能够较好掌握摄影测量基本知识的重要保证。摄影测量学教学中既包括有大量的摄影几何原理,又涉及很多数据处理的方法及相关应用方面的知识,在现有的教学中各门相关课程的讲授内容各有侧重。而传统的教学方法中沿着摄影测量的发展脉络,从模拟—解析—数字来介绍,其最大的好处是:对摄影测量的发展历史、相关概念演变的关系学生能比较清晰的掌握,但这是建立在过去专业细分的基础上的、需要大量课时,并且最好有一定模拟仪器的支持,这在现有情况下无法满足,而且其中部分知识内容已属于比较陈旧过时的内容,也没有必要讲授,而其中历史部分,虽应涉及,但不同学生对各部分内容的兴趣并不一样。由于将“摄影测量基础”课程的教学内容分成了4部分,因此,摄影测量历史部分知识属于学生只需了解的内容,而模拟摄影测量部分的绝大多数内容则属于兴趣拓展部分的内容。在教学中重点放在学生需要掌握或熟练掌握的内容;同时考虑到计算机视觉研究对摄影测量的冲击与促进,在教学内容中增加了相关内容的介绍,其中部分如计算机视觉方向如何表示像点、物点的关系,它与摄影测量表示方法的关系,是学生应了解或兴趣拓展的内容。目前对摄影测量基础的教学内容及教学顺序作了较大调整:①考虑到学生在先前阶段并没有课程专门讲授摄影测量中的影像获取及其要求,在内容中增加影像获取部分,介绍过去胶面影像的获取(简要介绍)和数字影像的获取,并对相机检校简要介绍;②由于将数字摄影测量部分内容独立在专门的课程介绍,在摄影测量基础部分重点介绍像片解析基础、强化解析空中三角测量部分内容,特别是光束法平差、增加直接线性变换内容;③讲授内容去掉了模拟测图部分内容的介绍,这些内容只作为学生兴趣阅读的材料;④考虑到整个航测成图的整体性,在内容中增加了航测外业部分介绍,包括坐标框架选取、像控点获取,以及影像的调绘。现有的一些摄影测量教材中模拟摄影测量的内容已经完全去掉,只在绪论的历史回顾中出现。由于现在摄影测量中一些名词、概念、处理方法中还留有模拟测图的痕迹,将模拟部分完全去掉是否会影响学生对这些问题理解?一些摄影测量还留有不少模拟的痕迹,完全去掉对学生理解是否有利?从这一角度出发,在讲授过程中仍然将模拟测图内容作适当介绍,作为学生拓展了解的内容。而对于影像解析及解析空三的内容,因其是摄影测量的基础,对进一步学习很重要,因此在授课中强化了这方面的内容。
4.加强与创新项目的结合、与实践的结合
摄影测量是一门应用性很强的学科,为调动学生的学习兴趣,在教学过程中,增加了一些摄影测量知识应用的小实验。如利用规则格网板进行控制,利用普通相机(如手机自带相机)进行面状物体的摄影和基于影像的面状物体形状测量;结合网上大量的影像信息(特别是卫星影像信息,如百度地图、GoogleEarth上的影像信息),与实地相对照,引导学生理解影像调绘、外业控制、像片控制点的概念,并结合学生自己的日常生活进行有针对性的调绘。现在大学本科教育中,非常重视学生创新能力的培养,有各种学校和国家的创新项目。有些学生提出的一些项目申请想法就涉及影像的几何处理、摄影测量的相关知识,因为是学生自己提出的想法,所以学生的兴趣高、学习主动性强,并且很多想法更为新颖、有趣,为此在摄影测量基础教学过程中加强了和创新项目的结合。现在测绘工程三、四年级学生正在进行的创新项目中,有2~3个项目是与摄影测量学相关的。通过加强课程教学与实践和创新项目的结合,原本抽象的概念内容变得具体、实在,与日常生活中应用相结合,调动了学生的学习兴趣,同时为完成这些项目和实践活动,还会涉及一些教学中未授内容,这样可以进一步促进学生深入、主动地学习,能激发学生去思考该学科的更广泛应用,而不是仅局限于测图方面,这也与现在通识教育背景下进行通才培养的理念相一致。
三、结束语
在过去的几年里,高质量的显示技术发展越发迅猛,目前双目视差信息、人类视觉系统的三维深度感知越来越引起学者的研究兴趣。双眼视差的呈现方法有多种,主要包括三大类:立体显示、全息显示和立体面显示。而立体显示技术比基于全息或容积的方法更为成熟和广泛应用。创造立体显示的方法有多种,包括立体空间复用和时分复用技术,而且在显示时,还有不可忽视的人的因素。本书针对立体显示技术中人的因素提供一份详细分析,使其在设计和使用三维显示时能够被充分考虑。
本书分为3部分,共8章:1.3D立体显示中人的因素简介:主要是对相关背景信息与知识的简单概述,以及对全书结构的说明。第1部分 背景信息,包括第2-3章:2.人类双目视觉基础:包括双目视察、视觉竞争、双目视察梯度、视觉通路等术语和概念的介绍;3.创建立体显示:包括空间复用和时间复用的概念。第2部分 立体显示中影响立体深度知觉的因素:包括第4-9章:4.低级因素:包括双目串扰、时空复用、调节辐辏冲突等因素的介绍;5.低级因素(续):包括瞳孔亮度的差异、两眼间的差异对比与简单总结;6.语境因素:包括时空频率的影响、真实环境中的视觉与距离变化、立体显示环境中视觉的差异等内容;7.语境因素(续):包括知觉的恒常性,分别是大小、远近、速度、深度的恒定,以及环境的因素;8.高级因素:包括运动视差和航向控制、运动视差和双目视察的冲突、直观推理等内容;9.高级因素(续):包括手/手臂跟踪和本体、空间心理模型和工作记忆、交互式立体显示和空间推理,最后进行了总结。第3部分 立体显示设计的建议,含第10章:10.对全书进行了简单总结,并提出若干立体显示设计的建议。
本书通过对立体显示相关文献及应用进行总结,分析了从人类视觉角度对立体显示的影响,并指导读者如何从人的视觉/人的角度进行立体显示的设计。全书条理清晰,逻辑性很强,由浅入深,易于初学者迅速了解主要概念。本书适合计算机视觉、模式识别、生物视觉等领域的学者、硕士生及以上水平的读者阅读。
李亚宁,硕士研究生
(中国科学院自动化研究所)
关键词:智能 传感器
传感器象人的五官一样,是获取信息的重要工具。它在工业生产、国防建设和科学技术领域发挥着巨大的作用。但与飞速发展的计算机相比较,作为“五官”的传感器远远赶不上作为“大脑”的计算机的发展速度。
随着测控系统自动化、智能化的发展,要求传感器准确度高、可靠性高、稳定性好,而且具备一定的数据处理能力,并能够自检、自校、自补偿。传统的传感器已不能满足这样的要求。国外有的文章称传统的传感器为Dumb sensor(愚蠢的、笨哑的传感器)。另外,为制造高性能的传感器,光靠改进材料工艺也很困难,需要利用计算机技术与传感器技术相结合,弥补其性能的不足,计算机技术使传感器技术发生了巨大的变革,微处理器(或微计算机)和传感器相结合,产生功能强大的智能传感器。国外称为Intelligent sensor(智能传感器)或Smart-sensor(灵巧的、机敏的、智能传感器)。另外,传统的传感器一般只能测量一个参数,有些场合需要同时测量多个参数的体积小的多功能传感器。现在多国科学家已重视这一方向的开拓,并已研制出一些多功能传感器。
1 传感器的智能化
目前国内外学者普遍认为.智能传感器是由传统的传感器和微处理器(或微计算机)相结合而构成的,它充分利用微处理器的计算和存储能力,对传感器的数据进行处理,并能对它的内部行为进行调节,使采集的数据最佳。
传统的传感器只能作为敏感元件,检测物理量的变化,而智能传感器则包括测量信号调理(如滤波、放大、A/D转换等)、数据处理、数据显示以及自校自检自补偿等功能,图1是智能传感器的原理框图。
图1 智能传感器原理框图
微处理器是智能传感器的核心,它不但可以对传感器的测量数据进行计算、存储、数据处理,还可以通过反馈回路对传感器进行调节。由于微处理器充分发挥各种软件的功能,可以完成硬件难以完成的任务,从而大大降低了传感器制造的难度,提高传感器的性能,降低成本。需要指出的是,除微处理器以外,智能传感器相对于传统传感器的另一显著特征是其信号调理电路。被测的物理量转换成相应的电信号后,送到信号调理电路中,进行滤波、放大、转换,再送入计算机(微处理器)中进行处理。与计算机技术的结合,使智能传感器相对于传统传感器具有如下功能:
①自补偿能力:通过软件对传感器的非线性、温度漂移、时间漂移、响应时间等进行自动补偿。
②操作者输入零值或某一标准量值后,自校准软件可以自动地对传感器进行在线校准。
③自诊断功能:接通电源后,可对传感器进行自检,检查传感器各部分是否正常,并可诊断发生故障的不见。
④数值处理功能:可以根据智能传感器内部程序,自动处理数据,,如进行统计处理,剔除异常值等。
⑤双向通信功能:微处理器和基本传感器之间构成闭环,微处理器不但接收、处理传感器的数据,还可将信息反馈至传感器,对测量过程进行调节和控制。
⑥信息存储和记忆功能。
⑦数字量输出功能:输出数字信号,可方便地和计算机或接口总线相连。
日前,世界各国都在研制和开发各类智能传感器,随着科学技术的不断发展,智能传感器的功能将逐步增强,它将利用人工神纤网络、人工智能、信息处理技术(如信息融合技术、模糊理论等),使传感器具有更加高级的功能,具有分析、判断、自适应、自学习的功能,并可以完成图像识别、特征检测、多维检测等复杂任务。
随着计算机技术的飞速发展,智能传感器技术必将大放异彩。
2 智能传感器的发展状况
2.1 物理转化机理
由于集成智能传感器可以很容易对非线性的传递函数进行校正,得到一个线性度非常好的输出结果,从而消除了非线性传递对传感器应用的制约。该机理具有稳定性好、精确度高、灵敏度高的特点。利用同一硅片上集成的智能检测电路,可以迅速提取频率信号,使得谐振式微机械传感器成为国际上传感器领域的一个研究热点。
2.2 数据融合理论
数据融合是集成智能传感器理论的重要领域,也是各国研究的热点,对于多个传感器组成的阵列,数据融合技术能够充分发挥各个传感器的特点,利用其互补性、冗余性,提高测量信息的精度和可靠性,延长系统的使用寿命。
2.3 CMOS工艺兼容
目前,国外在研究二次集成技术的同时,集成智能传感器在工艺上的研究热点集中在研制与CMOS工艺兼容的各种传感器结构及制造工艺流程,探求在制造工艺和微机械加工技术上有所突破。
2.4 传感器的微型化
集成智能传感器的微型化决不仅是尺寸上的缩微与减少,而且是一种具有新机理、新结构、新作用和新功能的高科技微型系统,并在智能程度上与先进科技融合。其微型化主要基于以下发展趋势:尺寸上的缩微和性质上的增强性;各要素的集成化和用途上的多样化;功能上的系统化、智能化和结构上的复合性。
3 智能传感器的应用
3.1 立信眼球
由爱立信微波技术公司研制的ERIEYE(爱立信眼球)采用了智能传感器技术和一个用户界面友好的指挥和控制系统,可以快速获取准确和综合的信息。它是一种出色的雷达系统,可以在陆地和水面上分辨和跟踪海上及空中目标,通过仪器观测到的距离远远超过了地平线之外。
3.2 计算机视觉系统
在计算机视觉系统中,智能传感器不仅直接确定数据集的范围,还通过测量确保系统的安全。获得需要到达的地点信息,安置系统以得到高质量的信息。适应实践和环境的变化,甚至获得特殊的指令,控制器件的动作。
4 现状与发展
目前,世界各国都在研制与开发各种智能传感器和多功能传感器。其中最成功的是美国Honeywell公司研制的DSTJ-3000智能压差压力传感器在同一块半导体基片上用离子注入法配置扩散了压差、静压和温度三个敏感元件,整个传感器还包括变换器、多路转换器、脉冲调制、微处理器和数字量输出接口等。
智能传感器是测量技术、半导体技术、计算技术、信息处理技术、微电子学、材料科学互相结合的综合密集型技术。目前各国科学家正在按下列技术途径开发研究:
(1)利用新型材料研制基本传感器。基本传感器是智能传感器的基础,它的制作及其性能对整个智能传感器影响甚大。除硅材料具有优良的物理特性,能够方便地制成各种集成传感器。此外还有功能陶瓷、石英、记忆合金等都是制作传感器的优质材料。
(2)利用新的加工技术。近年来利用微加工技术日趋成熟,可以加工高性能的微结构传感器、ASIC制作技术,也可用于制造智能传感器。
(3)采用新的测量原理和方法。谐振式传感器输出数字量,可以直接和微机及接口总线连接,不用A/D转换器。另外,光纤传感器、化学传感器、生物传感器新型传感器,为智能传感器提供新的信息来源。■
参考文献
1.Clarkson M. Smart Sensors. Sensors, 1997, 14:14
2.White N. Intelligent Sensors. Sensor Review 1997,17(2);9
3.ィンテリヅェントセンサシステムの现状と展望。日本电气学会,电气学会技术报告(Ⅱ)部第272号,昭和63年6月,P4~5