前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的自动识别技术论文主题范文,仅供参考,欢迎阅读并收藏。
关键词:车牌定位 字符分割 字符识别
1.引言
随着汽车数量的不断递增,摆在面前的是巨大的交通压力,现代交通的发展迫切要求实现交通管理的自动化。因为车牌号码是车辆的唯一“身份”标识,所以车牌识别系统可以作为车辆自动识别的一种重要形式, 对于交通管理、治安处罚等工作的智能化起着十分重要的作用。它可广泛应用于交通流量检测,交通控制于诱导,机场,港口,小区的车辆管理,停车自动收费,闯红灯等违章车辆监控以及车辆安全防盗等领域。因此对基于特征的车牌识别算法的研究在大型停车场的管理系统和交通事故的破案方面具有特别重要的实际应用意义。
2.车牌识别原理及流程
车牌自动识别是利用车辆的动态视频或静态图像进行车牌号码、车牌颜色自动识别的模式识别技术。包括车牌定位算法、车牌字符分割算法和车牌字符识别算法等。
本文设计的车牌识别系统总结了车牌识别技术的历史,分析了车牌识别的研究现状,对存在问题和意义提出了本设计的新方案。本设计的流程包括车牌图像采集,图像预处理,车牌定位,车牌字符分割,车牌字符的识别等几个部分。
3.各模块的实现
3.1 图像采集。考虑图像对后续操作的影响,图像在拍摄时采用人工拍摄选取车牌最佳拍摄环境。
3.2 图像预处理。本算法中预处理是对图像进行图像转换、图像增强、边缘检测和二值化,。目的是突出车牌的主要特征,以便更好地提取车牌。
3.3 车牌定位。从预处理后的汽车图像中分割出车牌图像。即在一幅车辆图像中找到车牌的位置。本文采用基于数学形态学和边缘特征的车牌定位方法。即先对车牌图像进行预处理,然后再对预处理后的图像进行大范围搜索, 再用开闭合运算来填补车牌区域内细小孔洞和去除噪声, 进而增强车牌区, 使车牌区成为一个连通区域, 找到符合汽车牌照特征的若干区域作为候选区,然后对这些侯选区域做进一步分析、评判,最后选定一个最佳的区域作为牌照区域,并将其从图象中分割出来。该方法有效改进了传统的车牌定位方法, 提高了车牌定位的速度和准确度。
3.4 字符分割及归一化。即对获得的车牌分离出单个字符以便字符识别。本文采用改进的投影法。即将垂直投影法和固定边界法相结合,达到了更好的分割效果。计算出列方向像素值之和。选取一较小的像素和阈值,找到车牌上汉字的左端,在用该阈值继续寻找汉字右端的同时,根据车牌标准,利用高与宽的比例关系找到汉字的右端。重复该方法找到其他字符的左右端,然后将字符逐一分割。归一化则是将分割出来的字符大小归一化。
3.5 字符识别。将字符转换为文本形式直接显示出来。 本文采用的识别方法是基于模板匹配的车牌识别方案。首先取字符模板,接着依次取待识别字符与模板进行匹配,将其与模板字符相减,得到的0越多那么就越匹配。把每一幅相减后的图的0值个数保存,然后找数值最大的,即为识别出来的结果。
4.识别结果
5.结论
本文主要解决了以下问题:⑴在背景的图象中如何定位分割牌照区域;⑵对分割下来的牌照字符如何提取具有分类能力的特征;⑶如何识别字符。在车牌字符识别系统的研究领域,近几年出现了许多可行的识别技术和方法,从这些技术和方法中可以看到两个明显的趋势:⑴单一的识别技术无法达到理想的结果,多种方法的有机结合才能提高系统有效识别能力。本文的设计,也汲取了以上一些算法的思想,反复比较,综合分析;⑵在有效性和实用的原则下。通过多次实验,表明该车牌识别系统可有效地识别多幅车牌,但对于识别倾斜、污损比较严重的车牌方面的技术还有待解决。
参考文献:
[1]刘屹松.基于模板匹配车牌识别系统的研究实现[硕士学位论文].北方工业大学,2009
[2]刘智勇.基于MATLAB的车牌定位.中国科学院,2000
关键词:射频识别 物流 RFID
一、射频识别技术综述
射频识别技术(Radio Frequency Identification Technology,简称RFID)是一种非接触式的自动识别技术,它主要依靠射频信号来自动定位目标对象并获取相关的数据,整个识别过程不需要人工参与,实现自动识别。
从八十年代开始这项技术走向了成熟,它比同期或早期的接触式识别技术更灵活,RFID系统的射频卡和读写器不用接触就可以完成识别的工作,因此它可以应用在更广泛的场合。它的产品形状和大小各异,如:卡片型、硬币型和有印刷天线的纸张等,但它们的基本的功能是一样的,只要配合专用读写器,就能够从外部写入或读取信息。
虽然RFID的功能比较单一,却在服饰业、食品业和物流业等许多行业起到了革命性的影响,主要体现在传统的条形码系统已经逐渐被RFID系统代替。在诸如美国的WalMart、英国的特易购Tesco和德国的Metro等大型世界级连锁零售企业,都为了提升企业内部物流系统的效率,采用RFID系统。由此可见,这项技术已经在全世界的零售业产生了巨大的影响,而零售业又与现代物流业关系密切,应当考虑基于射频识别技术来建立智能化的物流管理体系。
二、射频识别技术的优势分析
射频识别具有技术方面的优势。以前的条形码技术已经使用了很长时间,但现在这种技术在许多情况下已经不能满足使用者的需要了,条形码虽然成本便宜,但它的存储量很小,而且使用时不能改写,这些缺点都限制了它在物流领域的应用前景。在信息时代的背景底下,用户对大存储量信息载体和无线信息交流方式有了强烈的需求,并且要在现代物流管理中实现自动识别,提高物流管理的效率,RFID技术在技术上的优势就有了更加广阔的应用空间。
射频识别具有应用方面的优势。在物流领域,无论是传统的管理方式,还是在更强调智能化管理的今天,物流管理最终的目标都是要通过向商品流通过程中的对象提品或服务,用来换取更多的利润。而将RFID技术应用到商品从生产、仓储、运送以及商品流通的完整物流管理流程里,能在很大程度上帮助物流企业提高业务的效率。
三、基于射频识别技术的智能化物流管理
将射频识别技术RFID与现代的物流管理相结合,将会极大地提升物流管理的智能化水平,其必将成为现代物流发展的趋势。
1、货物运输
RFID系统可以在货物运输过程中,实时跟踪货物运输的地点,自动收集货物的信息,减少了货物运输过程中人为参与的环节,以此获取更准确的货物信息,实现货物的在途控制。这样,就可以随时地监控全局,更好地调整资源和劳动力的配置,合理调度和分配运输工具,有效利用了工作时间,降低了物流成本,提高生产效率。
2、入库发货
在仓库的进货口处,贴有电子标签的货物通过阅读器自动采集信息,完成盘点并将信息输入主机系统数据库。入库时,RFID系统可以根据货物标签中所记录的相关数量和体积等信息,给出最合适的仓储位置,以达到仓储空间的最优化利用。入库后,则通过阅读器自动完成清点作业,并更新库存信息;发货时,由另一读写器识别并将信息输入中央管理器,告知它被放在哪个位置。尤其在危险品货物的入库和发货时,有更大的优势,避免的工作人员直接接触货物所可能造成的伤害。
3、商品库存
将RFID系统应用于商品的库存管理,可以通过无线射频自动收集信息,完成商品入库的记录工作,管理中心可以实时地了解仓库储存了多少商品,能够精确地监控货物的流动情况,实现库存情况的实时控制,这样可以增加处理货物的速度,还可以监视货物的其他信息,极大地增加了清点工作的透明度,提高了管理效率。
4、仓库安全
电子物品监视系统(EAS)是一种设置在需要控制物品出入的门口的RFID技术,这个系统用来保证仓储安全,防止商品被盗,主要应用在商店、图书馆和数据中心等地方,当未被授权的人从这些地方取走物品时,EAS系统会及时发出警告。首先在将EAS标签粘在物品上,当物品被正常购买或者合法移出时,在出口通过一定的设备使EAS标签失活,就可以顺利取走。非法物品经过门口时,EAS装置能自动检测标签的活性,立刻发出警告。
5、搬运装卸
在火车运输中,将射频卡安装在车厢顶部,读写器安装在铁路运输沿线上,通过读取的数据,能获取火车的身份和监控火车的完整性,以防止遗漏在铁轨上的车厢发生撞车事故。目前,射频自动识别系统已经遍布全国14个铁路局。
6、流通加工
用RFID技术在生产流水线上实现自动控制、监视,提高生产率,改进了传统的生产方式,降低了生产成本。将RFID设备装配在加工流水线上,应用智能标签有助于大量地生产用户特殊定制的产品。用户可以从上万种零部件中,选择自己需要的特殊颜色、型号和样式等,而且这种射频卡可重复使用,每个射频卡上保存有描述产品的详细要求,流水线的每个工作点都有读写器,这样可以保证产品在流水线上能顺利的完成装配和加工的任务。
7、事故监控
当事故发生,即使司机不知自己所在位置,也可以通过在沿途设置的RFID监测点得到反馈的信息,管理中心可以迅速准确地了解事故发生的位置与运送货物的安全情况,保证在最快是时间内紧急救援,减少货物的损失,降低物流风险和成本,提高物流效率。
四、射频识别技术在应用上的局限性
射频识别技术可以广泛应用到物流的很多方面,但是也存在了一些制约其发展的因素:
1、价格是RFID走向大面积市场应用的最大障碍
RFID标签的成本比较高,如果应用在集装箱或者汽车、电器冰箱之类的大宗商品上,成本不算什么;但如果商品本身价格比较低,这一技术的成本就显得比较高了。
2、RFID技术存在安全隐患
RFID标签无法对阅读器进行身份验证,当RFID标签接近阅读器时,就会无条件的发出信号,无法辨别阅读器是否合法,这会带来比较大的安全隐患,可能造成货品信息的泄露。
3、RFID技术缺少统一的行业标准
目前RFID技术存在两个基础技术协议,分别是MIT Auto-ID Center与日本的Ubiquitous ID Center提出的,两种标准都有不同厂商支持,采用何种协议会影响对应厂商的市场份额,进而影响整个射频识别产业的发展。
参考文献:
1 张敏;现代物流与可持续发展[D];山东农业大学;2004年
2 包建荣;基于以太网传输射频识别应用系统的研究与设计[D];浙江工业大学;2004年
关键词:RFID;系统;数据采集;资产全生命周期;智能识别;动态管理
中图分类号:TP315 文献标识码:A 文章编号:1009-3044(2013)10-2438-04
1 项目背景
随着企业的不断发展,信息化设备、检测仪器、计量设备、生产设备、办公设备等固定资产种类繁、数量多,这给资产管理部门带来了很多的工作量,仅每年两次的资产盘点就占用了资产管理部门大部分精力。在国家对资产管理越来越重视的大环境下,为了进一步完善目前的资产管理系统,加大资产管理的力度,保证资产的安全和数据的可靠,尤其加强对一些贵重资产和调拨频率高的设备管理成为资产管理部门的重点工作。
射频识别技术RFID(Radio Frequency Identification Technology)是从八十年代起走向成熟的一种非接触式的自动识别技术,它通过射频信号自动识别目标对象并获取相关数据。相对于条形码技术有非接触式、非视线识别、可擦写信息、更大的读写距离、大容量(相对条形码)、可多个识别等突出优势,因此,将RFID技术引入资产管理的应用中,充分发挥RFID优点,构建一个适应性更强、安全性更高、数据信息更可靠的RFID资产管理系统,可以加大和加快对企业资产管理系统的改造。
2 管理现状
目前,资产管理部门采用传统的手工记录方式加Excel表格方式来实现资产管理中资产数据的录入和统计,随着资产不断增多,目前的管理方法已开始跟不上管理要求,表现如下:
1) 资产的盘点、清查时,管理人员需一一手工确认资产上信息登记卡,工作量巨大。
2) 资产台帐分级多,统计、查询麻烦。归口实物台帐、财务资产台帐、各使用部门资产台帐,台帐众多,容易造成数据管理的混乱。
3)无法将采购合同、项目合同与资产管理相关联。
4) 数据保存在单台PC里,无法实现数据共享。
5) 无法追踪资产状态信息,实现包括在库、已入账(验收后)、报损、待报损、未入账(已签合同采购,但未入账)等资产全生命周期管理。
6) 设备出入时无法自动、快速、准确审核确认,资产的安全性低。
3 建设目标
本系统的目标是依托RFID的技术优势,通过安放在资产上的标签,利用先进的RFID设备对数据自动采集,经后台应用软件的智能决策,提高资产管理的信息化、自动化、网络化、智能化,通过查询系统可以明确地查到每项资产的状态、去向、使用人、使用年限等信息,在资产盘点时能有效降低员工劳动强度,最大限度的提高效率、准确率;实现资产管理部门的合同管理,方便查找合同与资产的对应关系,从管理上加大对资产的管理针对性。
4 系统构架和组成
4.1 基于RFID技术的企业资产管理系统结构
如图1所示。
4.2 系统组成
系统组成分为三个部分:RFID设备,网络及服务器,资产管理应用软件。
4.2.1 RFID设备
包含了RFID固定设备、智能手持终端、标签等设备,主要用于收集原始数据。同时把采集到的信息传送给资产管理软件。
4.2.2 网络及服务器设备
资产管理RFID系统所需要的网络及服务器设备。
4.2.3 资产管理应用系统
接收、处理来自RFID设备采集到的数据,根据具体要求完成数据处理,实现数据统计、查询、存储或共享等,包括手持终端应用软件。
5 系统功能模块
根据工作流程中需求,资产管理软件系统需包括合同管理模块、资产管理模块、查询统计模块、系统管理模块、提示管理模块、手持机模块、接口扩展预留模块等。
5.1 模块设计图
5.2 合同管理
将购买资产的合同按合同管理的要求录入系统,同时按合同中的设备清单录入资产管理系统,完成资产和合同的对应关系。
5.2.1 合同信息录入
将合同中体现的所有信息录入到资产系统中,包括合同中发生的资产类型、数量、单价等。
5.2.2 合同信息修改功能
当合同中输入的信息保存后,发现有错误数据时,可将此合同从系统中调出,对错误信息进行修改。
5.2.3 合同信息查询功能
可根据合同编号、合同发生日期、合同输入日期、合同状态等条件对合同内容进行查询。
5.3 资产管理
5.3.1 资产验收管理
验收合同中采购的资产,验收无误后在资产管理系统中录入资产信息。
5.3.2 资产盘点管理
资产盘点管理是在资产管理系统中按使用部门或资产类别等多种方式自动生成资产盘点任务,并可将盘点任务下载到手持PDA中。盘点人员使用PDA对指定资产进行盘点操作,盘点完成后盘点数据回传到系统中,对比后形成盘盈、盘亏报表。
5.3.3 资产领用管理
资产领用人首先填写申请,通过相关审批环节后领取资产,资产管理员录入资产领用信息后,使用PDA到仓库读取领用资产的标签和资产领用人员员工卡,实现资产与使用人员的关联绑定。
5.3.4 资产退还管理
资产用完后需要退还仓库的,由资产当前使用人将资产送到资产管理办,资产办人员使用PDA读取退还资产信息,修改资产状态、使用人、存放地点等信息,并打印退还单据。
5.3.5 资产调拨管理
由资产的使用人办理调拨手续,通过相关负责人审批后送资产管理办,资产办人员使用PDA读取调拨资产信息,修改资产使用部门、使用人、存放地点等信息,并打印调拨单据。
5.3.6 资产报损管理
资产报损时,修改资产的状态,快速实现资产报损管理。
5.4 查询统计
可按资产分类、品牌、入库时间、盘点、领用、退还情况及合同信息进行查询;并可按按照管理要求,统计相关数据,如年度资产购入数量、资产总额等,生成报表。
5.5 外出资产验证查询
由于资产在外出时是通过外出审批过程的,所在保安处根据资产标签进行自动检测资产的放行情况是否为可放行。示意图如图3所示。
当设备外出审批通过后,管理人员在本模块内设置设备外出权限。当设备外出时,安置在门口的识别设备自动采集到设备上的标签信息,同时把信息回传给系统验证,系统验证通过后,在门卫处的屏幕上显示允许外出,提示门卫放行。
当未经许可的设备外出时,验证不通过系统能以声音的方式提示告警。
5.6 信息提醒
系统提醒功能是根据借用资产应退还的日期,提醒资产管理人员,当日是否有资产需要退还。
5.7 系统维护
5.7.1 员工信息维护
包括员工信息数据导入和权限设置。
员工信息数据可从现有办公的0A系统中导入,本模块中提供数据导入接口。对员工的访问资产管理系统的权限进行相关设置。
5.7.2 资产类别信息维护
资产类别信息可从现有的财务EAS系统中导入,本模块中提供数据导入接口。
5.8 手持机系统管理
类似与计算机系统可实现资产验收、盘点、领用、退还等功能。
6 系统效能
整个系统管理系统采用先进的RFID 技术,可以实时监控每个资产的状态及流向,真正实现资产信息化动态管理,系统同管理手段的结合,可以实现资产管理的信息化、自动化、智能化和柔性化,在提高效率的同时,加大管理的力度。
1) 提高效率。系统自动采集资产信息,在整个环节中大大的提高工作效率、提高信息透明化。
2) 提高资产盘点的确认率。系统采集信息准确,大大提高了将来资产易维护和安全性,最大限度的减少人工记录和统计的失误率。
3) 实时记录资产的状态信息。
4) 智能决策支持。
系统高效的、快捷、准确的统计功能(比如资产总量、资产分布、使用情况、资产状态等相关数据的快速统计)能给管理层决策提供数据依据。
5) 智能提示
对资产归还时间、设备维护时间可提供条件式的预警提示功能,方便管理部门进一步了解资产使用情况。
6) 出入口信息智能确认
出入口的审核确认,自动、快速、识别距离远识别,大大提高资产的安全性。
7) 采用高新技术,能大大提高管理力度,树立企业新形象。
7 结论与展望
RFID技术在资产管理的应用有着广泛的应用,而本资产管理RFID系统在中心的使用,让实现管理变为可能。
近年来,作为国家政府部门,在资产管理环节下大力度来加强管理,其出发点就是让资源为社会提供高效优质的产品和服务。基于RFID技术的企业资产管理系统的使用为企业不同部门、不同性质的资产分类管理提供了客观基础,资产管理变得信息化、透明化、科学化,对资产实行分类、分级管理,明确不同的管理目标,有助于增强管理的针对性,形成资产管理的合力,改变当前的资产管理不善的局面。同时,本系统的实施,不仅实现了资产管理的有据可查,提高了管理的权威性,也能给企业资产的分配提供合理规划依据,使资产的运行具有稳定性。
参考文献:
[1] 高峰.基于RFID 的零售业仓储管理信息系统应用设计[D].杭州:浙江大学硕士学位论文,2008.
[2] 张文丰.RFID技术在企业资产管理的应用[J].商场现代化,2008(21).
[3] 杨智明.保山学院固定资产管理系统分析与设计[D].昆明:云南大学硕士论文,2010.
[4] 褚方鸿.英特尔基于 RFID 技术的仓储管理解决方案[J].权威论坛,2006(8).
[5] 张晖,王东辉.RFID 技术及其应用的研究[J].微计算机信息,2007(11).
[6] 张于芝.无线射频识别技术及其在图书馆的应用[J].现代情报,2007(2).
【关键词】小波包分解特征融合;PCA
1.引言
人脸识别是人类视觉中最杰出的能力之一,但由于受技术条件的限制发展缓慢,因而在最初的二三十年里关于这个课题只有少量的论文出现。二十世纪六十年代,Bledsoe提出了人脸识别的半自动系统模型与特征提取方法。二十世纪七十年代,美、英等发达国家开始重视人脸识别的研究工作并取得进展。1972年Harmon用交互式人脸识别方法在理论上与实践上进行了详细的论述。就在这一年,Skai设计了人脸图像自动识别系统。八十年代初T.minami研究出了优于Sakai的人脸图像自动识别系统。进入九十年代后,由于微电子、计算机等技术的发展,加上人们对人脸图像自动识别的迫切需求,利用人脸图像进行自动的人脸识别和身份验证的研究变得非常热门,应用上取得了长足的进步。
人脸识别(Face Recognition)一般可以描述为:给定一静止或动态图像,利用己有的人脸数据库来确认图像中的一个或多个人。从广义上讲,其研究内容包括以下五个方面:(1)人脸检测(Face Detection):即从各种不同的场景中检测出人脸的存在并确定位置。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影口向。(2)人脸表征(Face Representation):即确定表示检测出的人脸和数据库中的己知人脸的描述方式。通常的表示方法包括几何特征(如欧氏距离、曲率、角度筹)、代数特征(如矩阵特征矢量)、固定特征模板、特征脸、云纹图等。(3)人脸鉴别(Face工dent1facation):即通常所说的人脸识别,就是将待识别的人脸与数据库中的己知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式与匹配策略。(4)表情分析(Facial Expression Analysis):即对待识别人脸的表情进行分析,并对其加以分类。(5)物理分类(Physical Classification):即对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息。本课题的研究内容属干狭义的人脸识别方法,不涉及表情识别和物理分类方面。一个人脸自动识别系统包括三个主要技术环节,如图1所示:
图1 人脸识别系统
2.PCA变换的人脸识别原理
2.1 对低频分量进行PCA特征提取
对人脸图像训练样本依次进行一级小波分解,用低频分量做训练样本集。总体散布矩阵Cx按公式(1)建立:
(1)
其中:x――低频训练样本向量;mx――低频训练样本集的均值向量。总体散布矩阵,Cx是一个实对称矩阵,可以找到它的一组N个正交特征值,令ei和(i=1,2,3,…,N)分别为Cx的特征向量和特征值,将特征值按降序排列。对应特征值选取d个特征向量排列组成低频变换矩阵A.通过公式(2)求出特征向量个数d:
(2)
其中为按降序排列的头k个特征值,为按要求设定的阈值.将低频训练样本集中的低频分量向变换矩阵投影,得到一组低频训练样本投影系数:
i=1,2,3,…,N (3)
2.2 对高频分量进行PCA特征提取
对原始图像训练样本依次进行一级小波分解,对两个高频分量加权求和,并以此高频分量作为训练样本集。得到一组高频训练样本投影系数:
(4)
i=1,2,3,...,N (5)
L1,L2表示LH,HL两个高频区域分量,,表示分配给两个高频区域分量的权重系数。
1)对所有训练样本A进行二层小波包分解得A1与Ah=2,…,16;
2)采用式(6)求2至5号高频子图的加权平均图像;
(6)
3)分别对A1、Ah继续PCA变换,得高频子图与低频子图的主分量Y1与Yh;
4)对Y1与Yh采用式进行融合处理,融合公式如式(7)所示,得最终的鉴别向量Y;
(7)
识别阶段:
1)对所有测试样本B进行二层小波包分解得与q=2,…,16;
2)用式(8)求后2至5号高频子图的平均图像;
3)分别对B1、Bh进行PCA变换,得高频子图与低频子图的主分量Z1与Zh;
4)利用式(9)对Z1与Zh采用式进行融合处理,得最终的鉴别向量Z;
5)采用三阶邻近对测试样本进行分类。
由于该算法是先对图像进行小波包分解,先对低频图像进PCA变换,然后对图像高低频图像分别是PCA变换,因此称其为WP2PCA,相应的把对小波包分解,只对低频图像进行PCA变换,用于识别的方法称为WPPCA。
3.仿真实验与分析
在Pentium(R)4CPU2.4GHz,256M内存,windows XP操作系统,Matlab7.0环境下进行了仿真实验。
其中选取参数,,分类器采用3阶邻近作为准则,距离为欧式距离。分别在ORL与YaleA人脸库上对PCA、WPPCA、WP2PCA进行了识别率的测试。试验1 ORL数据库
ORL数据库包含了40个不同人脸,我们取其中的30个人的数据,每人10幅图像,共300幅图像,每幅图像的大小为112*92,该库包含了不同时间,不同视角,不同表情(闭眼、睁眼、微笑、吃惊、生气、愤怒、高兴)和不同的脸部细节(戴眼镜、没戴眼镜、有胡子、没胡子、不同发型)的条件下拍摄的。表1所示为Kq的计算结果。
在ORL每类训练样本取5,对应的测试样本分别取5,抽取和特征维数(即对应的投影空间向量数)分别为10、20、30、40、50、0、70、80、90、100、110、120,试验结果如表2所示。
YaleA库由15个不同的人,每个人11幅图像组成,包含了较大的光照和表情的变化,对该库通过双眼定位,提取人脸部分,并把每一幅图像归一化到46*58在YaleA每类训练样本取6,对应的测试样本分别取5,抽取和特征维数(即对应的投影空间向量数)分别为5、10、15、20、25、30、35、40、45、50,采用PCA,WPPCA,WP2PCA识别率如表3所示。从实验结果可以看出,WPPC与WP2PCA的最高识别率都搞CPA近2%,从实验结果看出,尽管WP2PCA与WPPCA的最高识别率都是90.7%,但WP2PCA比WPPCA的优势是当特征维数为15时就达到最高识别率90.7%,而WPPCA当特征维数为20时,才达到最高识别率90.7%。随着特征维数的增加,三种方法的识别率都呈下降趋势,这也说明随着特征维数的增加,一些冗余信息也随之增加,从而使识别率下降。
4.结论
文中提出基于小波包与PCA分解相结合的特征级融合人脸识别方法,该方法既利用包含人脸大部分信息的低频分量;又根据人脸特点,对高频分量进行了加权处理,充分利用高频分量中有用的细节信号,提取出有助于提高识别率的高频分量。利用高频分量的有效信息与低频分量的进行融合,从而达到提高识别率的目的。实验证明此种方法可以明显提高识别率,训练时间大幅减少。
参考文献
[1]王昆翔,李衍达,周杰.关于人脸图像自动识别研究中的几个问题[J].公安大学学报,2001(1).
[2]李刚,高政.人脸识别理论研究进展[J].计算机与现代化,2003(3).
[3]廖国琼,刘云生.嵌入式实时数据库ARTs-EDB事务调度实现技术[J].计算机工程,2005,31(16):37-39.
[4]陈传波,王桦.实时数据库的事务调度研究[J].计算机应用,2005,25(9):2004-2006.
关键词:仓库管理系统;条形码;纺织企业;计算机
中图分类号:TP31 文献标识码:A文章编号:1007-9599 (2010) 05-0000-02
Textile Warehouse Management System Application of BarCode
Gao Demei
(Shandong Silk Textile Vocational College,Zibo255300,China)
Abstract:From bar-code technology in the textile industry's need for storage management,benefits and the bar code is generated,printing, textile and other aspects of literacy Warehouse Management System application of bar code.
Keywords:Warehouse management system;Barcode;Textile enterprises; computer
一、纺织企业仓库管理系统中条形码应用的必要性
纺织行业属于劳动密集型行业,原料以及产品的出、入库非常频繁。采用传统的手工方法已不能适应企业的发展,具体表现在:库存物资积压多,资金周转慢,原始单据繁多,信息利用率低,数据处理单调,手工处理易出差错以及管理手段落后等,这些都给进一步提高企业仓库管理工作的质量和水平带来很大的不便。
使用存库管理系统,可以及时了解生产动态和库存积压,加速资金周转,同时可极大地减轻仓库管理人员的工作强度,提高劳动效率,从而提高企业科学管理水平。然而,根据纺织企业的特点,人员文化素质较低,产品比较繁杂,如果使用一般的库存管理系统,可能会带来以下问题:
(一)数据实时输入困难。仓库管理人员进行货物的入库记帐工作,必须使用键盘输入品名、单价、规格、数量等信息,速度缓慢且容易出差错,特别是当进出仓库的产品多且操作人员不够熟练时,远远不能满足需求。
(二)工作量巨大的仓库盘点工作仍需先手工登记,再输入计算机完成,仓库管理人员的劳动强度仍然很大。
(三)操作较为繁琐。使用键盘操作仓库管理系统,就必须根据屏幕提示一步步地进行工作,操作过程较复杂,一部分仓库管理人员缺乏对计算机的了解,不习惯使用键盘操作计算机,完成其工作。
基于上面的考虑,在研制仓库管理系统时,有必要融合条形码自动识别技术,提高管理系统的自动化程度。
与键盘输入相比,条形码输入的速度是键盘输入的几倍,而且采用条形码技术误码率低于百万分之一,这样的特点保证了清点库存产品时的效率和正确率。出入库时使用条形码识读器扫描条形码,简单迅速,不易出错。给每一包产品生成一个条形码,若出现质量问题,便可根据条形码找到数据库中对应的记录,从而找到相应的责任人。
另外,条形码标签易于制作,对设备和材料没有特殊要求,识别设备操作容易,不需要特殊培训,且设备也相对便宜。条形码技术目前已比较成熟,在纺织企业使用条形码技术,能充分发挥条形码技术的优势,提高企业的管理水平。
二、条形码简介
条形码技术是以计算机技术、光电传感技术和通信技术为基础而发展起来的一项自动识别技术。现在已经成为信息数据自动输入、识别的重要方法和手段。
条形码是一种可印制的机器语言,它采用二进制的概念,以“0”和“l”表示编码的特定组合单元,以规则排列的图形符号来表示数据。
在使用中,条形码符号由一个红外线或可见光源照射,深色的模块吸收光,浅色或空的模块则将光反射回扫描器。扫描器将光的情况转换成电子脉冲,译码器使用数学算法将电子脉冲转换成一种二进制码,然后将译码后的信息传送给一部手持式终端机、个人电脑、控制器或计算机主机。译码器可以内嵌到扫描器中或外接。常见的扫描器使用可见光和红外线发光二级管(LED),氮氖激光或固态激光二级管(可见光和红外线)等光源来识读条形码符号。一些扫描器要求接触符号,另一些则可以从远至几英尺以外的距离来识读符号。
随着现代化技术的应用,条形码技术因能为信息管理系统提供高效、快速、价格低廉的数据输入途径,而被广泛地应用于各个领域的信息管理系统中。
条形码技术是在计算机的应用实践中产生和发展起来的一种实现快速、准确进行数据采集和自动识别的技术。条形码技术的应用解决了数据采集和数据录入的“瓶颈”问题,为制造业物料管理提供了有力的技术支持。
条形码编码又是一个网络技术。条形码编码信息能够在分布广泛的各种设备形成的网络中传递。
三、纺织企业应用条形码技术的优点
条形码本身不是一套系统,而是一种十分有效的识别工具,它提供准确及时的信息来支持成熟的管理系统。条形码技术是迄今为止最经济、实用的一种自动识别技术。
把条形码技术应用与库存管理系统中,主要利用条形码技术以下几个方面的优点:
第一, 输入速度快,与键盘输入相比,条形码输入的速度是键盘输入的几倍。
第二,可靠性高,键盘输入数据出错率为三百分之一,利用光学字符识别技术出错率为万分之一,而采用条形码技术误码率低于百万分之一。
第三,采集信息量大,利用传统的一维条形码一次可采集几十位字符的信息。二维条形码更可以携带数千个字符的信息,可以包含图形或汉字,并有一定的自动纠错能力。
第四,经济性好,比起其它的自动识别技术,条形码印刷和识读设备的价格便宜,并且,随着电子技术的发展,相关设备还在不断地降低价格。
第五,灵活实用,条形码标识既可以作为一种识别手段单独使用,也可以和有关识别设备组成一个系统,实现自动化识别,还可以和其他控制设备联接起来实现自动化管理。另外,条形码标签易于制作,对设备和材料没有特殊要求,识别设备操作容易,不需要特殊培训,且设备也相对便宜。
条形码技术目前已比较成熟,在纺织企业使用条形码技术,能充分发挥条形码技术的优势,提高企业的管理水平。
四、条形码符号的生成与条形码的印制
当项目代码确定以后,需将这个代码的数据信息转化成为图形化的条形码符号。目前主要采用的是软件生成方式,一般的条形码打印设备和条形码胶片生成设备均安装了相应的条形码生成软件。
条形码是由一组按一定编码规则排列的条、空符号,而条形码生成软件则需根据条形码的图形表示规则,将数据化信息转化为相应的条空信息,并且生成对应的位图。对于专用的条形码打印机,由于内置了条形码生成软件,所以只要给打印机传递相应的命令,打印机就会自动生成条形码符号。而普通的打印机则需要专门的条形码软件来生成条形码符号。需要生成条形码的厂商可以自行编制条形码的生成软件,也可选购商业化的编码软件,以便更加迅速、准确地完成条形码的图形化编辑。
自行编制条形码生成软件:设计条形码打印软件的关键在于要了解条形码的编码规则和技术特性。条形码是以条、空的宽度与组合方式来表达信息的,因此其条与空的尺寸精确与否直接关系到条形码能否被正常地读取。因为目前打印设备都是以点为基本打印单位,如果条形码条、空的宽度不是点数的整数倍,则可能产生打印误差,直接影响到条形码的可识读性。这也是为什么条形码图像经过缩放后经常不能被读取的原因。另外,条形码的条、空组合方式也因码制不同而不同,因此编制软件时需认真查阅相应的国家标准。
选用商业化的编码软件:选用商业化的编码软件往往是最经济、最快捷的方法。目前市场上有许多种商业化的编码软件,这些软件功能强大,可以生成各种码制的条形码符号,能够实现图形压缩、双面排版、数据加密、数据库管理、打印预览和单个/批量制卡等功能。同时,可以向应用程序提供条形码生成、条形码设置、识读接收、图形压缩和信息加密等二次开发接口(用户可以自己替换),还可以向高级用户提供内层加密接口等,而且价格也不高。
目前较为先进的条形码生成软件有法国生产的CODESOFT,美国生产的Barcode等。最新版本的CODESOFT7软件功能十分强大,支持所有主要的一维条形码和二维码,有通用版、专业版和企业版三种版本可供选择,通用版仅用于条形码的生成,价格比较便宜,而专业版和企业版则可以支持多种数据库,可以方便地连到企业的内部信息系统,但是价格要高于通用版。企业可以根据具体情况选用不同的版本。
对于一些纺织企业而言,有两种实现方案,一是可以找专门的人开发,以方便以后的库存管理系统设计人员的调用;也可以把这任务一起承包给库存管理系统设计团队,如果能实现,在兼容方面会减少很多矛盾,也节约不少财力和精力。
由于企业规模比较大,产品较多,因此打印任务是比较繁重的,因此,可以考虑采用专用的条形码打印机。由于标签纸有些是贴在编织袋上,有的编织袋表面比较粗糙,用普通的标签纸在搬运过程中很容易脱落,纺织企业可以与提供标签纸的厂家联系,在纸上涂一层特殊的强力胶,很好的解决这个问题,并且可以在编织袋的两边都贴上标签,将条形码脱落的问题降到最小。
五、条形码硬件的选择
条形码识读器也称条形码扫描器,利用光点与条形码之间的相对运动来对条形码数据进行采集。当光点从左到右扫描完一个符号时,因组成条形码符号的元素对入光有不同的反射率,反射光的强度就会发生大小交替的变化,这种反射光强度的变化经过精心设计的光电接受系统,会转化成电压信号的变化,经整形,可输出一系列与条形码符号相对应的方波信号。
条形码识读器根据用途不同,大体可以分为两类:在线式条形码识读器和便携式条形码识读器。在线式条形码识读器一般是非独立使用的,在采集器与计算机之间由电缆连接传输数据,不能脱机使用。便携式条形码识读器是为适应一些现场数据采集和扫描笨重物品的条形码符号而设计的。便携式条形码识读器中的基本数据必须通过PC的数据库获得,而存储的操作结果也必须及时地导入到数据库中。目前由于无线电网络技术的应用,便携式条形码识读器可以通过无线电波和PC、服务器进行实时数据通信和远程控制。操作员能将所有操作后的数据在第一时间存入数据库,即将数据库系统延伸到每一个操作员的手中。
根据纺织企业仓库的具体情况,考虑到产品的体积比较大而且使用电缆易在纺织品仓库中引起火灾,可以选择使用便携式条形码识读器。
总之,纺织企业的仓库管理采用的数据库管理系统中引用条形码技术是十分必要的,是解决现存问题的有力手段。
参考文献:
[1]张艳.条形码在图书馆的应用及打印生成方法.科技情报开发与经济,2004,14(8):41
[2]张成,袁冰,王杰等.条码技术在立体仓库物料管理中的应用.中国制造业信息化,2003,32(10):76
[3]张成.条码技术在电气制造企业库存和生产过程管理中的应用研究[D].〔硕士学位论文〕.成都:四川大学,机械制造及其自动化,2004
[4]蓝伟坤,陈东.条码技术在仓库管理系统中的应用[J].湖北工学院学报
关键词: 人脸识别; 数据采集; Adaboos算法; 考勤
中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2017)04-53-03
Abstract: There are two kinds of traditional enterprise time and attendance system, the manual system and the timecard system. The manual system is of great workload and low efficiency, while the timecard system has the phenomenon of fake registration and loss of the card, resulting in a higher cost. Therefore the use of enterprise camera to develop a face-recognition based enterprise time and attendance system can greatly improve the efficiency of enterprise check work attendance and reduce the cost of attendance management. This paper introduces the research and development process and the research results of an enterprise's face-recognition based time and attendance system.
Key words: face recognition; data collection; Adaboos algorithm; check work attendance
0 引言
人脸图像具有惟一性和稳定性,因此人脸识别广泛应用于刑侦破案、视频监控、表情分析、日常考勤等场合,逐渐成为人们工作和生活中的常用身份验证手段。人脸识别技术应用于考勤系统,可以充分利用已经建好的人脸数据库资源,更直观、方便地核查身份。本文对应用于考勤系统的人脸识别技术进行了研究。
1 系统设计概述
本系统包含采集模块和管理模块两大模块。采集模块主要包括视频图像的采集、处理、人脸检测、人脸定位以及跟踪;管理模块主要包括人脸识别管理和考勤管理。系统架构和工作流程如图1所示。
系统分为服务器端、办公室端和工厂端三部分。服务器端负责数据的存储和读写;办公室端负责软件系统设置、考勤人员录入、人员人脸特征采集、考勤情况统计等等;工厂端为人员考勤点[1]。
人脸识别考勤系统的程序流程:管理员通过摄像头将企业员工头像录入数据库,员工每次考勤时将脸部对准摄像头,系统提取头像,经视频识别模块与数据库中照片比对,配对成功后记一次考勤,并将考勤数据发送到考勤数据处理模块。考勤数据模块与企业财务系统对接,将考勤与员工的工资、奖金挂钩。图2为识别程序流程图。
2 数据库整体框架
本系统首先通过登录模块来确保登录用户具有合法性,保障了系统的安全。本文将用户分为管理员和普通用户,普通用户可以查看员工的考勤记录和修改自己的密码,而管理员可以对所有窗口进行各种管理操作,如添加、删除、修改员工基本信息,设置权限,添加员工请假信息等。其中本系统中还有一个人脸库,它存储每一个员工人脸照片,这些照片经过图像预处理,分别存放在以员工名字命名的文件夹中,为人脸库的训练提供数据[2]。
用户登录窗口是整个系统的入口,在用户成功登录后就可以按照权限进行相应的操作。管理员权限登录成功后可以进行人脸检测、人脸自动识别、保存视频图像等功能,而普通用户就没有这个权限。普通用户的权限是可以查询员工的出勤信息、修改自己的密码等功能。
用到数据库的窗体主要有以下三个。
⑴ 员工注册信息窗口,它用于管理员工的基本信息,包括员工信息的添加、删除、修改和浏览等操作。
⑵ 员工出勤窗口,它用来记录员工的出勤状况如是否请假、迟到等,也包括对请假员工信息的录入等。
⑶ 查询窗口,它主要用来查询员工的出勤信息,可以按多种条件进行查询,比如按具体的日期、是否迟到、是否请假、正常出勤等条件进行查询[3]。
3 人脸识别算法的实现
AdaBoost 算法以根弱学习的反馈信息自适应性的调整错误率下限,这就使得该算法更容易被应用于实际问题。同时,由于AdaBoost算法在效率上几乎和原有的Boosting算法相差无几,这就使得 Adaboost算法得到了极大的发展[4]。
Adaboost算法的具体实现步骤如下。
⑴ 设输入M个训练样本:{(x1,y1,…,(xm,ym))},其中Xi∈X,Yi=(+1,-1),初始化样本权重D1(i)=1/m,i=1,…,m。
⑵ 对每次训练都要进行一次操作:对弱分类器空间的每个弱分类器h进行操作为:将样本空间X划分为:X1,X2,…,Xn,计算每个划分j=1,…,N及b={+1,-1}之间的区域标识权重。得到每个弱分类器h 在各个划分上的输出值为:
,计算归一化因子:。
⑶ 从弱分类器空间中选择出使归一化因子Z 最小化的弱分类器h并加入到强分类器中,则:Zmin(Z)。
模块的输入为所有训练样本的特征集,经过用户指定的迭代次数T次后,共可得到T个分类能力比较强的弱分类器。在每次迭代时,根据训练样本的权重来训练弱分类器,然后根据弱分类器的判断结果和样本的权重分布来选择出一个错误率最小的弱分类器以作为本次迭代选出的分类能力较强的弱分类器 h,最后通过增大h所错分的样本权重值来更新每个训练样本的权值,以便在下次迭代中,使这些被错分的样本得到更多的重视,经过迭代最后共可产生T个弱分类器,将这些弱分类器组合后便可得到分类能力较强的强分类器[5]。
4 结论与展望
本文针对镭射卡考勤存在的问题,运用软件工程的方法,设计实现了人脸识别考勤系统,并将其用于广东顺德科晟电子有限公司。
本文主要是做了以下几方面的内容:
⑴ 介绍了人脸识别的方法原理和比较有特色的人脸识别及其算法。
⑵ 根据顺德科晟电子有限公司原有考勤管理系统存在的问题,以及当前认人事考勤管理现状,论证了对进行人脸识别考勤系统的必要性和紧迫性。
⑶ 针对广东顺德科晟电子有限公司的考勤管理系统的现状,按照软件工程的思想完成了对人脸识别考勤系统的需求分析和系统设计。
⑷ 设计了人脸识别考勤系统数据库和数据字典。
⑸ 完成了人脸识别考勤系统的开发。
由于本人水平有限,本系统的设计和开发还存在许多不周全之处,在下一步研究中还需要改进。
参考文献(References):
[1] 齐礼成.基于人脸识别考勤系统的设计与实现[D].西安电子科技大学硕士学位论文,2012.
[2] 郭磊.人脸检测技术研究及实现[D].哈尔滨理工大学硕士学位论文,2009.
[3] 刘明宝,姚鸿勋,高文.彩色图像的时人脸跟踪方法[J].计算机学报,1998.21(6).
1 引言
伴随着计算机技术的日益发展,会更加迫切要求应用目视解译经和知识知指导遥感图像计算机解译。遥感数字图像计算机解译是以遥感图像为研究对象,在计算机系统支持下,综合运用地学分析,遥感图像处理,地理信息系统以及模式识别与人工智能技术,实现地学专题信息的智能化获取[1]。基于遥感图像可以客观真实和快速获取地球表层信息的优势,遥感数据被广泛应用于自然灾害评估,自然资源调查与评价,环境监测与军事侦察上等。因此,利用计算机进行遥感图像解译,快速获取地表不同专题信息,利用这些专题信息能够迅速更新地理数据库。这不仅是实现遥感图像自动理解的基础之一,而且也是地理信息系统中数据采集自动化研究的一个方向。本次论文是在充分了解绵阳地域概况的情况下,并获取绵阳区域的TM影像图,利用遥感软件对该遥感影像进行预处理后,建立解译标志,对遥感影像进行人机交互解译,完成矢量化地图的制作,在GIS软件中进行属性和拓扑关系的添加;矢量地图和遥感影像叠加处理,最终得到功能齐全的遥感影像地图。
2 遥感图像预处理
遥感信息是对地表状况的反映,但是卫星姿态、搭载扫描系统引起的遥感图像畸变大。所以空间分布特征被部分地歪曲了,因此要对遥感图像进行预处理。本次论文处理所用的遥感图像为Landsat-5卫星获取绵阳区域的TM影像图,该遥感图像是在中国科学院数据共享平台下载获得。采用的是WGS-84坐标。陆地卫星提供的TM影像,其覆盖范围较大,宏观综合性强。TM图像具有8个波段,信息量丰富。由于TM影像图具有宏观性强,信息量丰富的特点通过对其解译和制图,可获得绵阳地区丰富及具体的信息,绘制成详细的区域地图。
2.1 组合多波段数据
Landsat-5的TM影像共有7个波段,不同的波段组合可以增强不同的地表信息[2]。其中第3、第2、第1波段组合形成的真假彩色图像虽然有理于各种地类识别。但是图像平淡、色彩不饱和、信息量比较少。考虑到研究区域地表信息丰富,采用第4、第5,第3波段组合而成的非标准假彩色图像。将上述转换的单波段IMG文件组合为一个多波段图像文件。组合波段结果如图1所示。
由图1可知水体边界、以及和水体有关的地物在图像中比较清楚。河流、道路、桥梁边界和轮廓清晰。房屋的布局清楚。街区内部结果特征较为明显。植被有较高的辨识度。
2.2 图象几何校正
由于容易受到卫星姿态、搭载扫描系统引起的遥感图像畸变大以及地表起伏等影响[2]。图像必须经过几何校正。在图像几何校正过程中,采集控制点是一项非常重要工作。控制点一般选择图像上特征较为明显的点位。对于图像使用选择控制点的方法进行几何精纠正,在一幅遥感图像上和对应的地形图上选择至少9个分布均匀、特征明显的典型地物目标作为控制点,建立影像坐标和地图坐标之间的变换关系,按照这个变换关系进行控制点纠正。本文特征点采集与校正后结果如图2,图3所示。
2.3 纹理分析
遥感图像的光谱信息是目视判读的基本依据[3]。但是随着图像解译与分析工作的深入开展,光谱信息已经不能快速有效地进行计算机分析和自动识别。纹理特征作为遥感图像中重要的信息,通过灰度值得变化和重复性来反映地表物体的粗糙度,能充分反映影像特征。因此,对纹理信息的提取对遥感图像的识别起着重要作用。纹理分析通过在一定的窗口内进行二次变异分析或三次对称分析,使图像的纹理结构得到增强,通过几何校正以及纹理分析可以明显看到绵阳市区河流和主要街道以及房屋的轮廓信息。几何特征尤为明显。结果如图4所示。
3 遥感图像解译
遥感影像的解译标志,是一种在遥感图像上能反映和判别地物信息的影像特征。利用解译标志能直接在图像上判别出相应的地物,或者通过已识别出的地物或现象作进一步的推理分析,判别出其它不易在遥感影像上直接解译的目标[4]。
3.1 非监督分类
数字图像计算机解译的基础工作是数字图像的分类。其方法包括:非监督分类和监督分类,目的是实现遥感图像信息提取。非监督分类是在没有训练场地作为样本的前提下,根据像元间相似度的大小进行归类并且合并的方法。常用的方法是:分级集群法,动态聚类法。动态聚类法给出图像粗糙的分类,然后在一定的原则下在不同的类别间重新组合样本,一直到分类比较合理为止[7]。本文以动态聚类法进行非监督分类ISODATA(迭代自组织数据分析技术)方法在动态聚类法中具有代表性。结合研究区实际情况确定初始分类数,设置循环收敛阈值。执行非监督分类,获得分类结果。图5所示。
3.2 监督分类
监督分类与非监督分类的不同点是在遥感图像上采样区中图像地物的类别属性已有了先验的知识。这些先验知识通过实地的抽样调查,配合人工目视判读技术来获取。采样区已被选定,按照已知类别的特征去训练判别函数,先验的采样区为训练区,其用途是训练判决函数。训练区是图像上已知类别属性的图像地物构成训练区。一旦训练区被选定后,相应对象类别的纹理特征便可以用训练区中的样本数据进行估计。
由非监督分类结果和监督分类结果可知研究区的河流、植被、街区、房屋等均能从遥感影像图上快速提取出来。这为接下来的制图工作奠定了坚实的基础。
4 遥感制图
4.1 遥感影像地图
遥感影像地圖是以遥感影像并结合一定的地图符号来体现制图对影像地理空间和环境状况的地图[7]。在遥感影像地图中,图面内容要素主要由影像构成,辅助以一定的地图符号来表现或说明制图对象。
4.2 矢量化地图的制作
本文在遥感图像预处理和解译的基础上进行矢量化工作,在矢量化后还需在现场做进一步的确认,对错误之处进行及时修改。在修改后的矢量图的基础上使用ArcGIS软件中先对矢量图与遥感影像图进行配准,结果见图7。接着对矢量图进行属性和拓扑关系的添加,最后经矢量图和遥感影像叠加处理完成遥感影像图的制作。结果见图8。
5 结论
利用计算机进行遥感图像解译,快速获取地表不同信息,利用获取的信息迅速地更新地理数据库,这是实现遥感图像自动完善的基础之一,也是地理信息系统中数据采集自动化研究的一个方向,具有重要的理论意义和应用前景。
遥感影像地图具不仅具有原遥感图像的影像内容,还具有线划要素,数学基础等,拥有直观易读的特点,与普通地图相比,影像地图具有丰富的地面信息,内容层次分明,图面清晰易读,充分表现出影像与地图的双重优势。从而提高了地理信息为人们的视觉直接感知的可视化表达程度及辅助决策的准确度,在国民经济建设中起重要的应用价值。
关键词:档案库系统;Modbus/TCP;自动识别;COM
中图分类号:TP31
随着信息化建设的不断深入,各单位已经全面的使用电子档案系统,电子档案具有传递便捷、资源共享、查阅方便等多种好处,不过由于纸质档案的形成必须要经过人工操作,对原文件的任何篡改都会留下痕迹,所以纸质档案在法律上的可信度很高,能够起到原始凭证的作用。因此在实际工作中电子档案并不能完全替代纸质档案,很多情况下还是需要用到纸质档案。如何将电子档案利用与纸质档案管理结合起来,大幅度降低档案维护成本,提搞档案管理效率,成为目前迫切需要解决的问题。
本文针对以上问题,提出了自动档案库系统的解决方案。自动档案库由多层档案柜、通信模块和计算机控制系统等组成,能够实现档案的自动借阅和归还,是综合了信息自动化、存储和自动识别技术于一身的立体集成化系统。设计该系统的目标是为了减少档案管理人员的工作量,对档案管理的业务流程进行调整和优化,进而规范档案业务操作,提升档案管理的自动化水平,大大提高工作效率。
1 系统总体设计
本文所设计的控制系统分为三层:应用管理层、档案柜管理层和档案柜控制层。应用管理层与档案柜管理层通过TCP协议进行通信,档案柜管理层与档案柜控制层通过Modbus/TCP进行通信,如图1所示。
应用管理层为档案管理系统,它构件了完整的档案资源信息共享服务平台,支持档案管理全过程的信息化处理,主要包括以下功能:档案接收、档案移交、档案查询、档案统计、档案借阅、档案归还、档案数据维护、档案借阅记录管理、档案发送记录管理、报表打印输出、数据库管理等。
档案柜管理层对档案柜控制层的集中管理,包括两个方面的内容:把应用管理层发来的指令转化为对档案柜控制层的指令,定时读取档案柜控制层的消息,并转为系统事件通知应用管理层进行相应。
档案柜控制层根据档案柜管理的指令,控制档案柜的走层、档案的存取、档案盘库等操作,实时根据传感器改变状态寄存器的内容。
图1 系统总体框架图
2 基于Modbus/TCP的传输控制协议
Modbus是一种应用层报文传输协议,用于实现不同类型的网络连接的设备之间的客户机服务器之间的通信。Modbus/TCP协议一种的开放的通信协议,用户可以根据需要灵活进行扩展。[1]它支持C/S模式,将应用层的Modbus消息封装成IP包在网络上传输。[2]
Modbus/TCP是采用C/S模式来进行报文传输,此模式基于4种类型报文,即请求(Modbus Request)、指示(Modbus Confirmation)、响应(Modbus Indication)和证实(Modbus Response),如图2所示。请求是客户端发送给服务器用来启动报文,指示是服务端接收的请求报文对客户端的反馈,响应是服务器针对客户端的请求发送的具体响应,证实是在客户端接收的响应信息时给服务器的反馈。[3]
图2 Modbus/TCP报文传输
协议档案柜管理层由运行在PC机上档案柜管理程序构成,档案柜控制层由触摸屏(TPC)和控制电机和传感器的可编程逻辑器件(PLC)构成。协议档案柜管理层通过网络的Modbus/TCP协议,对各个触摸屏(TPC)和可编程逻辑器件PLC的位变量、整型变量等的读写实现对档案柜的远程测控,如图3所示。
图3 协议档案柜管理层构成图
3 档案自动识别
目前成熟的档案识别方法有条码识别法[4]、RF识别法[5]。条码识别法是在把打印好的条形码粘贴到档案盒上,把条形码作为识别档案的唯一标示;RF识别法则是通过粘贴在档案盒上的电子标签来识别档案的。两种识别方法特点不一,接下来对这两种方法进行具体讨论。
使用条码管理档案,做法是为每个档案盒编配唯一的条码,条码中包含特定规则的位置信息,然后将条码贴到档案盒外面的背脊上。一旦档案盒中有档案存入时,条码、档案盒和档案就建立起了唯一的映射关系。将这种对应关系信息录入到计算机上的档案管理系统中,为每一份档案建立一条记录,保存这份档案对应的条码、在档案柜中的位置、是否在柜等信息,这样就打好了档案识别的基础。档案首次入库时,条码与档案的映射关系建立,数据库中产生相关记录。当需要借阅或者归还档案时,档案识别系统就可以通过条码定位档案盒,找到了档案盒就相当于找到了目标档案。
射频识别系统由电子标签和阅读器两部分组成。在档案识别系统中通常的做法是把阅读器安装在档案柜中,把电子标签粘贴到档案盒上。电子标签中保存的数据通过特定的编码存储在电子标签中,阅读器可以非接触的读取电子数据。系统工作过程分为能力供给和信号识别两个部分。其中能力供给指的是电子标签对电子标签阅读器发出的微波查询信号进行转换,把微波信号转换为电流;信号识别指的是微波查询信号经过电子标签内部的电路处理之后,携带了电子标签内部存储的数据信息,利用电子标签自带的微型天线返回到阅读器中。经过能力供给和信号识别两个过程,阅读器就可以拿到电子标签存储的数据信息,实现档案识别。以下针对条码识别法、RF识别法分别比较两者优缺点,如表1所示。
表1 条码识别法、RF识别法优缺点比较
条码识别法 RF识别法
扫描速度 扫描枪一次只能扫描一个条码 RFID阅读器可同时辨识读取多个RFID标签
抗污染能力和耐久性 条形码采用纸张打印,抗污染能力和耐久性差 RFID一般采用塑料材质封装,具有很强的耐污性和耐久性
穿透性和无屏障阅读 在没有阻挡和近距离的情况下,条码才能被识别 RFID通信具有一定的穿透性,除金属材质外一般材质都能穿透
成本 条码和条码扫描枪成本很低 RFID标签和RFID阅读器成本较高
针对条码识别法、RF识别法的特点,各单位可以根据需求选用不同的方案。条码识别法和RF识别法在系统中识别和传输过程中,由于条码被污染和斜放等情况,RF识别法信道中有噪声干扰和标示有重叠的情况,引起数字信号波形的失真导致错误,针对错码的问题,通过两种策略来处理。一种方法是在档案标识上设置冗余的信息位,在一定错误率的情况下可以通过算法推算出错误的信息,常用算法有循环冗余CRC校验;另外一种是设置校验位,通过校验位来验证发送的信息,验证不通过的情况下让接收方请求重传,常用算法有奇偶校验、汉明校验。因为档案柜在扫描枪扫描过程中一般都是一次扫描,所以我们一般采用纠错码的策略来解决误码的问题。
5 档案自动盘库
为了解决人工归还和借阅档案时放错位置的问题,设计档案自动盘库功能,通过该功能可以对整个档案柜的档案进行批量整理并与档案信息系统中存放的档案存放信息进行核对修改。
自动盘库操作流程如下所示:(1)执行档案柜走层操作,准确走到确定层;(2)启动盘库扫描枪从左到右运动扫描整个层中的档案,一层扫描完成后,盘库扫描枪从右到左运动回到起始点再执行走层动作,直到扫描完毕,经过扫描得到的柜号、层号、档案标识通过Modbus/TCP协议传给档案柜控制层,档案柜控制层通知应用层程序,对扫描的数据进行处理;(3)档案柜向上走一层,继续流程2,直到完成所有层的扫描,自动盘库完成。
在进行盘库操作时,档案柜控制层把盘库扫描枪扫描到一个档案标识就会将柜号、层号、档案标识发送给档案柜管理层,档案柜管理层触发应用层程序的事件,应用程序处理相应事件显示差异信息,用户根据差异信息选择进行更新档案存取信息和借阅情况。
5 档案管理层接口规范
不同厂商采用的硬件类型一般是不同的,同一厂商的不同型号的设备通常也有所区别,传统的档案管理软件基本都是针对某一款特定的档案柜设计的,所以不具有通用性。硬件上一些小改动或升级就会导致整个应用程序的大范围改动甚至重写。传统的档案管理程序与设备是一一对应的,每一种设备都需要开发专用的管理程序和相应驱动。传统档案管理层的开发示意图如图4所示。
图4 传统档案管理层的开发示意图
在实际的大型档案管理系统中,档案柜类型往往不止一种,同种类型的档案柜每隔一段时间也会进行硬件升级,在这种情况下,档案管理层的接口如果仍然按照传统的结构进行设计,必然会带来很多问题,在很大程度上增加系统开发和维护的成本。在本文的档案柜系统设计中,档案柜管理层为了实现与底层硬件设备的无关性,需要硬件设备已经统一的基于COM组件,不同硬件设备指需要按照统一COM编写自己组件,就可以实现协议档案柜管理层对档案柜控制层的操作,如图5所示。
图5 基于COM组件的档案层接口规范
6 结束语
通过对自动档案库系统合理设计,将系统分为应用管理层、档案柜管理层和档案柜控制层。应用管理层与档案柜管理层通过TCP/IP协议进行通信,档案柜管理层与档案柜控制层通过Modbus/TCP协议进行通信,针对人工归还和借阅档案时放错位置的问题,专门设计档案自动盘库功能,同时为了实现档案柜管理层与底层硬件设备的无关性,制定了档案管理层接口规范。实际使用表明:基于Modbus/TCP协议自动档案库系统可以方便快捷的实现电子档案系统与纸载档案管理的无缝结合,在大幅度提高档案的管理效率和档案管理自动化水平的同时,降低了档案管理费用和档案管理人员的工作量,充分提高工作效率。
参考文献:
[1]乔永卫,程帅.基于Modbus协议的自动控制系统的通信研究[J].自动化与仪表,2012(08):34-37.
[2]白焰,钟艳辉,秦宇飞.基于VC的Modbus协议通信测试软件的实现―Modbus串口通信与Modbus/TCP通信[J].现代电力,2008(06):76-81.
[3]翁建年,张浩,彭道刚.基于嵌入式ARM的Modbus_TCP协议的研究与实现[J].计算机应用与软件,2009(10):36-39.
[4]张应福.物联网技术与应用[J].通信与信息技术,2010(01):50-54.
[5]杜晓明,葛世伦.基于RFID和条形码的中小企业仓库管理系统研究[J].组合机床与自动化加工技术,2010(02):106-110.
[6]郎为民.射频识别(RFID)技术原理与应用[M].北京:机械工业出版社,2006.
[7]康东,石喜勤,李勇鹏.射频识别RFID核心技术与典型应用开发案例[M].北京:人民邮电出版社,2008.
[8]Don 本质论[M].潘爱民,译.北京:中国电力出版社,2001.
[9](美)WilliamA.Shay.高传善等译.数据通信与网络教程[M].北京:机械工业出版社,2005.
[10]胡啸,陈星,吴志刚.无线射频识别安全初探[J].信息安全与通信保密,2005(06).
[11]柴先明,黄知涛.信道编码盲识别问题研究[J].通信对抗,2008(02):1-4.
[12]Vaidya N,Das S R.RFID based networks exploiting diversity and redundancy[J].ACM SIGMOBILE Mobile Computing and Communications Review,2008(01):2-14.
[13]叶佳帆.基于modbus/tcp以太网技术的静电除尘器的研究[D].硕博学位论文,2009.
关键词:博客;Blog;Web;数据挖掘;算法;热点话题挖掘;现状
中图分类号:TP392 文献标识码:A 文章编号:1009-3044(2013)12-2771-03
1 博客简介
因特网(Internet)和万维网(WWW)的出现,改变了人们的工作方式和生活方式。个人网站、论坛(BBS)等给了人们自由发表信息的途径,而博客(Blog)的出现,使人们更加方便的展示自我。由于具有开放、简便易用的特点,使博客具有独特的魅力,使用博客的用户越来越多。
1.1 博客的定义
博客的英文名字Blog,来源于Web Log这个名称。博客源于RSS技术,作者以日志风格信息,读者以评论方式与作者互动,是一种自由、简单易用的信息传播和互动方式。
一个博客文章就是一个网页,博客作者可以对文章分类。这些文章都按照发表日期的倒序排列,最新的文章在网页最上面显示。博客的内容和题材,在合乎法律的要求下相当广泛,可以是新闻、时事评论、个人生活体验、购物信息、专业技术技巧、学术知识、照片、小说、产品等,有个人博客、公司博客、组织博客等。
1.2 博客的现状
据估计,目前全球的博客运营网站有数十万个,有数亿人使用博客。博客已经成为个人、企业、组织、团队之间常用的沟通工具。2002年,中国大陆开始有了博客服务网站。现在中国大陆已经有大量的博客服务网站,发展迅速。截止到2013年4月,新浪博客服务网站点击数最高的个人博客已经超过了21亿次点击,排在第二、第三的个人博客的点击数均超过10亿次,排在第100名的博客的点击数也高达6千5百万(来自新浪博客总流量排行)。中国互联网信息中心(CNNIC)统计显示,截止到2012年底,我国拥有博客(个人空间)的网民有3.73亿,占网民总数的66.1%[1]。从市场份额看,典型的博客网站有:QQ空间、新浪博客、博客大巴、搜狐博客、和讯博客、博客园、CSDN博客、博客网、网易博客、凤凰博客、中国博客、天涯博客、百度空间等。
2 博客资源挖掘
近几年来,由于博客的快速发展,国内外很多科研人员开始对博客进行研究,获得了丰富的研究成果。目前的研究主要集中在对博客内容进行挖掘、检索等方面。
2.1 国外对博客资源挖掘的研究
IBM的D.Gruhl、R.Guha、D.Liben-Nowell和A. Tomkins从宏观、微观两个层次上研究了博客网站里的主题传播特征和博客用户之间的交互特征,通过数学模型抽取出博客网站里可以表示新主题的关键词,并对不同时期的关键词进行分析,得出一些传播特征[2]。日本的I.Ohmukai、H.Takeda、K.Numa等人利用语义网搜索技术建立一个更加方便发表博客的“语义博客系统”,并对信息的收集和发表的不同层次做了详尽的分析[3]。HP实验室的E.Adar、L.Zhang对博客网站里的信息传播进行分类,设计出可视化的工具软件来动态显示不同博客之间的互相链接,并提出了一种新的Rank搜索算法[4]。
博客上的信息是网络信息的一种,但它又有自己的特点,对博客进行研究,首先需要能够识别博客信息。东京工业大学的T. Nanno、T. Fujiki、Y. Suzuki、M. Okumura等学者提出了基于对日期表示和对HTML文档的分析来自动收集、监控、挖掘博客(Blog)的方法[5]。马里兰大学的Kolari P、Finin T、Joshi A等学者提出了基于向量空间模型(SVM)的博客识别和发现的方法,去掉了较好的效果[6]。博客与传统的个人网页或网络日记不完全相同,T. Fujiki、T. Nanno、M. Okumura等学者通过对自动提取的热点关键词的分类、比较,区别出了博客和个人网站、网络日记的差异[7]。
2.2 国内对博客资源的研究
在博客识别方面的研究,国内已经出现比较可靠的方法或算法。哈尔滨工业大学的张迪通过比较博客网页和普通的Web网页,提取出博客网页的特征,从网络爬虫下载得到的网页中识别出博客网页来,并且作者还对博客网页相关内容进行了抽取[8]。重庆大学的张程、陈自郁等人针对当前因特网上大量出现的博客网页,通过分析博客网页的结构特点、技术特征,结合网页DOM节点特性,提出了基于DOM树分析和模式匹配的博客网页自动识别算法,并通过实验对该算法进行了验证[9]。河南大学的李旻提出了博客综合特征空间的概念,并且详细论述了该空间中三大类共五种博客特征的概念、定义和抽取方法。研究了网页的形式化表示方法,分析了特征项的提取、选择及权重计算的整个过程,在这基础上设计出了基于标签信息的TF-IDF算法及标签权重调整方案。最后提出一种基于综合特征空间的博客网页识别算法,并将该算法运用到基于页面布局特征的博客网页识别阶段和基于文本内容特征的博客网页识别阶段[10]。哈尔滨工业大学的杨宇航、赵铁军、郑德权、于浩提出了一种基于链接分析的对博客信息源进行量化评估的方法,在这个基础上发现重要的博客信息源,既体现了博客信息的特点,又减少了作弊链接对结果的影响。作者用设计的博客信息源重要性评价指标进行评估,证明了该评估方法的有效性[11-12]。
对博客作者的个人信息进行挖掘是博客数据挖掘的一个方面。上海交通大学的倪晓川通过挖掘博客网页的内容来获得博客作者的个人信息,构建博客作者的兴趣集合,为此,他提出了一种采用文本分类技术的自动挖掘博客作者兴趣的方法。该方法使用多分类器连合的技术来提高分类的精度和挖掘结果的可靠性,并且使用自上而下的层次分类方法,挖掘出更具体的博客作者的兴趣,而且兴趣可以用层次结构的形式展现。在此基础上作者还提出了对博客作者、博客文章进行情感型和信息型判定的问题,作者将该问题看作是一个文本分类问题,可以采用文本分类技术解决这个问题[13]。
博客球是包含所有博客的虚拟社区或社交网络的集合名词,可以把它看成是一个超大型的原始数据库。西南石油大学的季文韬通过搭建博客球数据库集群环境,建立了一个大型的博客球矩阵,通过分析博客网页中的各个指标在矩阵中的权重从而确定矩阵元素。由于博客文章往往是个人所发,缺乏规范、约束,导致博客信息中存在不少噪音数据。于是作者采用奇异值分解(SVD)技术来对文本向量矩阵进行降噪,除去噪音数据,并利用k-Means聚类算法对降噪后的数据信息进行聚类分析,从中发现有价值的信息[14]。在论文中,作者通过分析、对比实验结果,找出有效的博客球聚类方法。
哈尔滨工业大学的轩文烽针对现有的博客关键词抽取算法依赖于外部资源和具体的文本格式这个问题,提出了一种基于主题模型LDA(Latent Dirichlet Allocation)的博客文章关键词抽取算法,并通过与TF-IDF(Term Frequency–Inverse Document Frequency)和层次隐马尔科夫模型(Hierarchical Hidden Markov Model,HHMM)的对比实验,对该算法的有效性进行了检验,最后运用皮尔逊相关系数从关键词权重与其词频之间的线性相关程度这一角度分析了该算法优越性的原因。另外,作者通过比较、分析四种典型聚类算法K-means、K-means++、Markov Cluster、和Affinity Propagation,筛选出更适合博客关键词抽取的算法Markov Cluster;以此为基础,设计了一个用于对博客文章进行主题聚类的算法,该算法能自动对聚类结果进行描述。作者还在传统链接分析的基础上,结合博客网页的关键特征,提出一种融合了用户评论和正文相似性信息的博客文章排序算法[15]。
3 博客领域热点话题挖掘
作为互联网的一种应用,博客已经出现了较长时间,但是对博客领域的热点话题挖掘并不是很多。
通常我们所理解的新闻热点话题,一般都是通过该话题新闻报道的数量来表示。比如一个事件发生以后,很多媒体都对该事件进行了报道,那么这个事件可以被认为是热点事件,关于这个事件的所有媒体的相关报道组成了一个热点话题。但是对于博客上的热点话题,则与新闻报道的热点话题不同。因为博客文章是个人所发,一般情况下,不会出现象新闻热点话题那样有大量媒体进行报道的情况,所以,我们判断博客网站上的热点话题,主要是依据博客文章的阅读数量、评论数量、收藏或转载数量及时间等[16]。
运用热点话题检测与跟踪技术,将大量的博客信息按照话题进行归类和分组,对用户感兴趣的某些特定话题进行跟踪,实现个性化的服务,取代人工以简明、概要的方式呈现给用户[17]。这种技术可以使用户在动态变化的互联网环境下找到自己需要的信息,使博客信息更有价值,更加准确、有效地为用户使用。
传统的博客热点话题发现主要是根据阅读数量、评论数量等来得到的,并没有考虑话题内容和评论内容[16]。为此,大连理工大学的时达明、林鸿飞提出了一种基于内容相关度和语义分析的博客热点话题检测方法。该方法在考虑了评论数量的同时,还通过分析评论内容与话题内容的相关度并分析评论中的语义来计算话题在该博客中的热度,最终完成该博客的热点话题发现[18]。实验表明,他们使用的方法是有效的。
华南理工大学的胡方涛在对网络爬虫进行了一定的分析研究之后,通过已有的聚类算法将采集下来的博客数据聚类,形成话题。然后根据博客数据的特有属性,提取出博客话题排序特征,最后通过热点话题计算公式算出每个话题的热度值,发现其中的热点话题。对于热度较高的话题,通过计算评论的情感来进行话题支持度的分析[19]。热点话题支持度的分析能够使得网民在了解该热点话题的同时,还能了解民众对该热点话题所持的一种情感态度。
4 结束语
本文探讨了博客资源数据挖掘、面向博客的热点话题挖掘的研究现状。博客数据挖掘是Web数据挖掘的一种具体应用。虽然有不少研究者对博客数据挖掘进行了研究,但从整体上看,与Web数据挖掘比较,对面向博客的数据挖掘的研究还是很少。笔者以博客(或Blog)加挖掘作为篇名关键词在知网上搜索,截止到2013年4月,只搜索到28篇文献,而以Web(或网络)加挖掘作为篇名关键词进行搜索,搜索到了4057篇文献。关于博客挖掘的文献只占Web挖掘文献的0.69%。这与我国3.73亿网民拥有博客、个人博客网站有21亿的点击数这样的博客使用现状显然不符。对博客数据挖掘,还有很大的研究空间。
参考文献:
[1] 中国互联网络信息中心(CNNIC).第31次中国互联网络发展状况统计报告[EB/OL]. http://.cn/hlwfzyj/hlwxzbg/hlwtjbg/201301/P020130122600399530412.pdf.
[2] Gruhl D, Guha R, Liben-Nowell D,Tomkins A.Information Diffusion through Blogspace[C].ACM WWW, 2004.
[3] Ohmukai I, Takeda H, Numa K.Personal Knowledge Publishing Suite with Weblog, Workshop on the Weblogging Ecosystem[C].Aggregation,Analysis and Dynamics,2004.
[4] Adar E,Zhang L.Implicit Structure and the Dynamics of Blogspace, Workshop on the Weblogging Ecosystem at the 13th International World Wide Web Conference[C].New York,2004.
[5] Nanno T, Fujiki TSuzuki,YOkumura M.Automatically Collection, Monitoring, and Mining Japanese Weblogs[C].WWW,2004.
[6] Kolari P, Finin T, Joshi A. SVMs for the blogosphere: Blog identification and splog detection. In: Proc. of the AAAI Spring Symp. on Computational Approaches to Analyzing Weblogs[C].California: AAAI Press,2006:92-99.
[7] T. Fujiki, T. Nanno, M. Okumura. Differences between Blogs and Web Diaries[C]. WWW2005, Chiba, Japan, 2005,5: 10-14.
[8] 张迪.中文Blog网页识别与内容抽取研究[D].哈尔滨:哈尔滨工业大学,2007.
[9] 张程,陈自郁,古平, 等.基于DOM树结构的Blog网页自动识别[J].计算机应用研究,2008(5):1489-1491.
[10] 李旻.基于综合特征空间的Blog网页识别方法研究[D].开封:河南大学,2009.
[11] 杨宇航,赵铁军,郑德权,等.基于链接分析的重要Blog信息源发现[J].中文信息学报,2007,21(5):68-72.
[12] 杨宇航,赵铁军,郑德权,等.基于链接分析的重要Blog信息源发现[A].孙茂松,陈群秀.内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C].北京:清华大学出版社,2007.
[13] 倪晓川.博客作者兴趣挖掘与博客信息、情感分析的研究[D].上海:上海交通大学,2008.
[14] 季文韬.基于数据挖掘的博客球聚类研究[D].成都:西南石油大学,2011.
[15] 轩文烽.面向主题的博客资源挖掘关键技术研究[D].哈尔滨:哈尔滨工业大学,2011.
[16] 刘旭.博客热点话题挖掘方法[D].哈尔滨:哈尔滨工业大学,2010.
[17] 丁伟莉.中文Blog热门话题检测与跟踪技术研究[D].哈尔滨:哈尔滨工业大学,2007.