前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的日常运维管理主题范文,仅供参考,欢迎阅读并收藏。
[关键词]数字航道;监控系统;航道维护
中图分类号:TP215.3 文献标识码:A 文章编号:1009-914X(2017)05-0053-01
0.引言
随着经济的快速发展,水路运输的地位日益凸显。当前,国家从战略层面上划定了长江经济带、打造长江黄金水道的总体规划,力争把长江建设成为贯通东西的高等级航道,利用长江天然的地理优势,进一步开发开放沿江地域经济建设,实现了长江航运跨越式发展。十二五以来,长江航运发展日益繁荣,长江水道内航行船舶逐渐增多,这一定程度上增加了长江航道维护管理的工作量。为有效促进长江航运的良性发展,实现长江航道维护管理由劳动密集型向科技管理型转变,数字航道监控系统在经过反复研究和实践后应运而生,数字化航道监控系统被广泛应用到长江航道维护管理之中,在长江航道改革转型的同时,大大提高了长江航道的安全性及时效性。
1.数字化航道监控系统概述
1.1 系统简介
数字航道是长江航道管辖区域、管理对象以及管理活动的数字化体现,综合运用了卫星遥感、计算机联动、地理信息系统、宽带网络等多种技术,在信息的呈现上实现了虚拟化、可视化、智能化、可控化的特点,最大程度的释放自然资源的潜能,提升长江航运的经济作用,优化长江航道公共管理水平,在长江航道规划、长江航道维护以及长江航道管理等方面发挥着重要作用[1]。
1.2 系统组成及功能
数字航道系统组成见图1,各系统之间紧密相连。其中,电子航道图系统主要提供长江航道水深、沿岸建筑物等信息;信息管理系统则为监控系统提供标位设置、标位查询、标位异动等相关内容;综合监控系统则为系统支撑平台提供航标船舶的动态信息;系统支撑平台则主要收集三个系统的信息。
数字航道应用的核心是综合监控系统,通过展示电子航道图来获得长江航道的详细信息和实时情况。该系统主要由航标遥测遥控平台、船舶监控平台以及水位监控平台组成,其中航标遥测遥控平台主要通过安装航标上的数字航道智能终端来获取航标的实时地理位置、航标灯的工作状况等技术信息;船舶监控平台主要监控船舶的位置以及船速的基本动态;水位监测平台主要是反应水位信息相关情况。
2.数字航道监控系统在航道维护中的应用
2.1 航标技术信息动态监控
数字航道正式运行过程中,成立监控指挥中心与调度中心,采取24小时全天值班的方式,对系统辖区内的航标技术状态进行动态监控。在航标上安装智能终端设备,以便将航标信息通过网络或者短信方式上传到数据库服务器中[2]。监控人员只需在调度中心刷新监控系统就可以获得航标的具体地理信息以及航标工作状态等内容。
当辖区内的航标出现异常情况后,监控系统会自动报警,操作平台上以“闪烁”、“声音”报警的显示方式提醒工作人员注意相关动向。动态信息窗口中,“航标信息状态”栏中显示不同的报警级别,系统进行处理操作时,通过监控系统来查看航标灯的历史信息,并根据天气、水位等数据确认报警情况,并有针对性的进行处理。整个监控工程采用远程化与信息化控制,降低维护及管理人员的劳动强度,提高科技运用含量,节约资源与成本,确保水上船舶的航行安全。
2.2 工作船舶动态监控
传统航道管理中,航道技术人员要想了解工作船舶的具置以及工作船舶的具体情况,需要使用电话进行沟通,此种沟通方式实效性较低,且获取的动态信息有时会出现偏差,进而导致船舶调度出现一些技术和实际上的问题。通过数字航道监控系统,只需将船舶监控系统开启就能够实时的跟踪工作船舶所传送的GPS定位以及相关数据。当航标出现异常需要恢复时,工作人员可以根据该系统提供的数据合理调度工作船舶进行作业,在提高航道维护工作效率同时,加强对工作船舶的有效管理。
2.3 水位动态监测
数字航道监控系统转变了水位观测的工作方式,实现了传统人工观测到自动观测的飞跃。系统中的水位自动观测仪会不间断收集水位数据,通过GPRS将水位数据进行实时发送,使工作人员能够获得水位站传输的实时水位信息[3]。此外,水位监测平台中,监控人员还能够对水位数据进行图表分析,研究水位的变化趋势,为航道维护提供数据来源,以此来制定某个时段、某个区段的航道维护计划。
2.4 航标碰损事件或船舶交通事故的调查取证
长江航道内船舶航行数量较多,航标被航行船舶碰损事件时有发生,航标往往只能在碰损一段时间后才能被发现,且当时无法获取被碰损的具体时间、以及碰撞船舶的名称、原因等,这对后期碰损事件的调查与取证带来了难度,对航道保护造成了一定的制约。运用数字航道监控系统后,通过监控平台能够准确获取航标碰损的时间,并能对航标的动向、方位进行监控,及时通知工作船舶前往对航标进行恢复作业,有效保护航标资源;同时,系统中的“区域船舶轨迹查询”可以监测到航标碰损时附近船舶的行驶轨迹,通过数据可以对肇事船舶进行甄别,对碰损事件后续的处理提供有力的技术保障。
此外,数字航道监控系统还为船舶交通事故的调查及取证提供了巨大帮助。在以往的航道维护及管理中,辖区内发生船舶事故后,工作船舶往往需要一定的时间赶赴事故现场,即便在第一时间到达现场,也通常只能了解事故后的状况,并不能对事故发生时的具体情况作出准确的判断。通过数字航道监控系统,使用“轨迹查询与回放”功能来查证事故船舶的历史轨迹,将事故船舶的全过程进行动态回放,分析事故原因,判断事故发生时航标是否处于正常的工作状态,对事故的调查取证提供了严谨的证据支撑。
3.讨论
长江航道维护及管理水平的不断提升,离不开数字航道系统的运用,目前该系统已经广泛的应用到了我国各河流航道管理之中。在数字航道系统中,数字航道监控系统是核心,佐以航标遥感遥测、船舶监控以及水位监测三大平台,通过监控系统的实际应用,解决了以往日常航道维护管理中耗时、耗力的状况,保障了航标、船舶、水位等动态信息的真实性和及时性,弥补了航标失常、船舶事故调查取证难度大的薄弱环节,极大的提升了航道维护的效率,确保了船舶航行安全和航道公共资源安全。
参考文献
[1] 李邵喜,王德强,柏遥李瑞斌.内河航道三维动态监控系统架构[J].大连海事大学学报,2011(02):12-16.
[2] 曹波,付桂.长江口数字化信息建设初步构想[J].水运工程,2013(11):33-37.
[3] 万芳.数字化集中监控在交通运输指挥中心的应用[J].中国交通信息化,2013(06):91-93.
关键词:西门子3AT2-EI型;500kv开关;维护;重要性
1 3AT2-EI型500kv开关在日常运维中的注意事项
通过多年运行经验汇总以及厂家相关说明介绍,在日常运行中该类型开关需要注意的事项包括:检查该开关的标志牌,名称、编号齐全、完好;检查该开关套管瓷瓶无断裂、裂纹、损伤、放电现象;检查该开关的分、合闸位置指示器与实际运行方式相符;检查该开关软连接及各导流压接点压接良好,无过热变色、断股现象;检查该开关的控制、信号电源正常,无异常信号发出;检查该开关的SF6气体压力表或密度表在正常范围内,并记录压力值;检查该开关的端子箱电源开关完好、名称标志齐全、封堵良好、箱门关闭严密;检查该开关的各连杆、传动机构无弯曲、变形、锈蚀,轴销齐全,以及检查该开关的接地螺栓压接良好,无锈蚀。
3AT2-EI型500kv开关的液压操动机构在日常巡视检查维护中也要特别注意,液压操动机构箱应开启灵活无变形、密封良好,无锈迹、无异味、无凝露等。箱内的计数器应动作正确并记录动作次数,储能电源开关位置正确,机构压力正常,油箱油位在上下限之间,油箱油管及接头无渗漏油迹象,油泵运作正常,无渗油并且无空转现象,行程开关无卡涩变形,活塞杆、工作缸均无渗漏,加热器(除潮器)正常完好,并正确投入。
3AT2-EI型500kv开关操动机构箱内的各个继电器无损坏或异常。除了日常运维事项,在以下特殊情况下,还应对该类型开关进行特巡:高峰负荷期间:增加巡视次数,监视设备温度,触头、引线接头,特别是限流元件接头有无过热现象,设备有无异常声音;短路故障跳闸后:检查开关的位置是否正确,各附件有无变形,触头、引线接头有无过热、松动现象;设备重合闸后:检查设备位置是否正确,动作是否到位,有无不正常的音响或气味;严重污秽地区:瓷质绝缘的积污程度,有无放电、爬电、电晕等异常现象。
2 3AT2-EI型500kv开关常见异常及处理
2.1 开关不能正常分、合操作处理
2.1.1 检查同期装置与操作方式是否对应。
2.1.2 检查开关直流控制电源是否正常,空开是否跳开。
2.1.3 检查开关就地-远方切换开关位置是否正确(切换开关在开关控制柜内、继保小室监控屏上各有一个)。
2.1.4 防跳继电器动作时,必须查明原因处理后,方可再行操作。
2.1.5 检查SF6气压、操作液压、弹簧是否正常。
2.1.6 开关经检查处理后仍不能分闸时,应对故障开关进行隔离:
A.本所开关出现此种异常情况时,由于我所闸刀监控闭锁逻辑回路前串入电气闭锁无法采用用两侧闸刀隔离开关的方法。
B.500kv开关只能采用停役相邻开关进行隔离(具体根据网调要求)。
C.220kv线路(主变)开关出现此种异常情况时,将该母线上的其它线路倒母后,利用母联开关切除故障开关。
D.35kv开关不能分闸时,只能断开上一级开关来隔离故障开关。
2.2 开关SF6压力低告警信号(压力降到第一报警值)的处理
2.2.1 检查开关SF6压力表计读数及开关控制柜内对应继电器动作情况,核实原因。
2.2.2 SF6泄漏,压力低至第一报警值时,发“SF6泄漏”信号,此时开关还可以分、合闸操作,向调度汇报情况,建议停役开关,要求补气。
2.2.3 不停役开关对开关进行补气时,在未补气前应密切监视压力变化,及时汇报。对开关检漏时应停开关后再进行处理。
2.3 开关SF6压力低至闭锁分闸时的处理
2.3.1 开关发“SF6总闭锁”信号时,此时说明SF6已严重漏气,开关已不能作分合闸操作,严禁再行操作开关,要求将开关改为非自动,并隔离本开关。
2.3.2 本所开关出现此种异常情况时,由于我所闸刀监控闭锁逻辑回路前串入电气闭锁无法采用两侧闸刀隔离开关的方法。
2.3.3 500kv开关只能采用停役相邻开关进行隔离(具体根据总调要求)。
2.3.4 220kv线路(主变)开关出现此种异常情况时,将该母线上的其它线路倒母后,利用母联开关切除故障开关。
2.3.5 35kv开关不能分闸时,只能断开上一级开关来隔离故障开关。
2.4 开关油压闭锁自动重合闸时处理
液压机构开关液压降至闭锁重合闸压力时,开关尚有分、合闸功能。检查压力表读数,现场核实情况。若设备无渗漏油,则控制回路可能有故障,查找原因恢复操作机构打压;若无法恢复,应密切监视机构压力,及时汇报调度,并建议开关停役处理。开关合闸前,出现压力低于闭锁重合闸值并告警时,则不能投入运行。
2.5 开关油压总闭锁时处理
液压机构开关液压降至闭锁分闸压力时断路器失去所有操作功能,严禁操作开关,开关改非自动,据调度命令隔离该开关。采用开关不能分闸时的方法隔离开关。
2.6 开关油泵电动机故障的处理
检查开关汇控柜内打压马达电源小开关或加热器电源小开关是否跳开,若跳开,可以试合一次,不成功,不能再合,应检查各回路是否有短路,并消除。打压马达电源开关跳开,进行处理时,应注意开关操作油压情况,并按开关油压异常情况进行处理。
2.7 开关“N2泄漏”动作信号处理
检查现场开关压力表计指示情况,漏N2时油压将达355bar及以上,若压力正常系信号回路异常,检查信号回路。漏N2时开关汇控柜内对应继电器将动作。此时已闭锁开关合闸功能,在3小时内开关还可以分闸一次,应在复归无效的情况下及时通知变检工区前往处理,并明确汇报相应调度:该开关已闭锁重合闸功能(对开关分闸无影响),但可以在不停电情况下进行处理。
开关漏N2经处理后,信号保持回路由开关汇控柜内漏氮复归开关S4进行手动复归。
尤其强调的一点是:该类型SF6开关发生意外严重漏气或爆炸等事故,值班人员接近设备要谨慎,尽量选择从“上风”接近设备,必要时要戴防毒面具、穿防护服。
总之,3AT2-EI型500kv开关经过长期运行,经验事实证明了其运行稳定安全可靠,作为电力调度运行人员,应对该类型开关了解透彻,掌握其运行规律和特点,本文对3AT2-EI型500kv开关的一些特点和运维注意事项略作了初步探讨,权且当做抛砖引玉了。
关键词:IT运维管理 自动化技术 电力系统
中图分类号:TP302 文献标识码:A 文章编号:1007-9416(2012)11-0105-01
1、IT运维管理
IT运维管理是指IT部门通过制度的制定、流程的管理和先进的技术等手段对系统运行的软硬件环境、系统依托的网络环境、程序和进程的综合化管理。其主要管理内容包含:监控系统网络终端、网关、服务器、OS等基础设施和系统软件;监控Database、DNS等应用支持软件和服务管理;监控业务系统的CSF(Critical Success Factors)和KPI(Key Performance Indicators)并对相应数据进行统一管理(存储、备份及恢复);监控系统内部逻辑资源和物理资源的运行情况,并将统计数据与财务部门等。
2、IT运维管理现状
随着IT企业和企业内IT部门在社会经济效益中的作用愈加明显,其建设和运行维护过程中出现的问题也成为制约企业和社会发展的重要阻力。其集中表现在以下几方面:
2.1 运维高成本
近年来,我国科技型企业蓬勃发展,硬件产能和技术水平取得了重大的进步和长远的发展,但是,在IT运维成本中,硬件或技术支出仅占全部运维成本的两成,其余的近八成的成本支出包含了IT人员的管理培训和系统流程管理及系统测试,而系统流程管理及系统测试基本依靠人力手工管理,在降低了运维效率的同时还增加了人力成本的支出,因此,建设好的IT运维环境首先应加深自动化程度。
2.2 运维过程被动
由于IT运维的预警机制建设不完善,运维人员只有在系统报警后才会被动性的处理故障,而平日运维人员的工作基本是手工进行简单、低效率、重复性的问题处理,其运维服务质量很难提升,因此也造成了业务部门对运维服务的长期不满。
2.3 运维低自动化
运维的低自动化导致在信息运维管理部门获取大量杂乱信息及警报时,运维人员无法明确寻找发现并解决问题的根源,只能手工的逐一对设备进行检查,占用了大量的运维资源,并降低了运维服务速度、服务质量,增加了运维人员工作强度和运维人力支出成本。
2.4 运维集中度低
对于国内大型企业的IT部门,首先其硬件结构采用了大集中模式,其次其拥有的多家子公司均有独立的运维中心,配备相应的开发和维护人员。在运维管理过程中,对故障的解决,不能由呼叫中心或运维客服统一解决调度,只能由该地的运维工程师现场处理,这就造成了事故处理时间上的滞后,水平不同专业不同的运维工程师处理问题上的速度不同。
2.5 缺乏运维机制
现今大多数企业和IT部门没有规定明确的运维机制,没有明确的责任划分和管理模式,这就造成了出现故障时,很难及时找到故障原因、找到责任归属人,导致无法及时处理问题。即使发现问题解决故障,也只是针对单次事件,缺乏规范化的解决机制和数据记录。
3、IT运维自动化
随着IT运维管理的硬件结构采用了大集中模式,其管理难度和工作量大幅增加,企业和IT部门通过运用专业化技术及工具、标准化的突发应对机制和流程化的管理模式手段,减少事故反应时间,降低运维成本支出,提升服务质量,逐步实现IT运维的全面自动化。
3.1 IT运维自动化优势
(1)提升流程可控性: IT运维自动化将改造和优化基于业务需求的个性化流程,提升流程可控性。(2)提升流程透明度:IT运维的信息自动化管理将改变手工流程管理造成的流程定制和优化所带来的难度,通过可视化界面,用户可监测整个流程的运行状态,提升了基于业务需求的个性化流程的保障能力。(3)降低运维成本:IT运维自动化的实现,是将打造出“全局域流程监管、全天候业务监测、事故自动化修复”的保障平台,摆脱日常、大量、简单、重复的手工作业带来的运维人力高支出,平衡水平不同专业不同的运维工程师对问题处理的波动性带来的风险。
3.2 IT运维自动化内容
IT运维自动化是指将手工操作的日常任务及流程组织变更等工作转化为信息化自动化操作,以基于事件为框架的流程化管理。预警和事故处理方面,通过知识库的建立,主动性的监控核心IT设备,预测事故的发生,提前预警将损失降到最低,而突发事故发生时,集中监控系统将激发相关事件并启动故障响应和数据备份恢复机制;日常设置变更方面,通过自动检测机制,触发变更申请流程传送至管理员进行确认,协助完成配置的维护及变更;日常设备检测方面,定期及不定期的对系统内的硬件设备、应用软件和依托的网络进行自检,完成日常对系统安全的检测和监控,同时生成日常维护报告,将报告收集、整理、分析、总结并发送到知识库,由知识库定期提供IT运维的性能参数和资源分配的分析报告。
4、IT运维自动化在电力系统内的应用
为了更好的解决自国网SG186工程实施以来,带来的电力系统内部运维管理机制不规范、运维管理技术不成熟和运维管理人员成本支出增加等问题,有必要建立建设一个信息化自动化运维平台,简化工作流程、提高工作效率、提升服务质量。
目前江苏电力系统已经建立了多个IT设备监控平台,包括国网公司桌面管理系统、可信网络接入系统、北塔网络设备监控平台。其中,国网公司的桌面管理系统可以查看桌面终端的所有软件、硬件信息,可以监控违规外联行为、系统弱口令、设备变化,可以下发安装补丁、软件。可信网络接入系统,可以监控内网上网络设备的可信接入,需进行snmp认证,如未经过认证,认定为可疑或者非法设备。北塔网络监控平台可以监控系统内网所有网络设备的连接方式、状态。
总之,整合各电力企业内部的运维部门资源,建立统一规范的突发事件解决和跟踪流程,引入优先处理关键流程决策,建立运维日志,增加知识库自检和辨识处理问题的能力,提高运维事故响应效率和执行力度,减少操作的随意性,其目的不仅是单纯实现运维自动化,而是运维管理能力的提升,是运维管理服务的最终目标。
参考文献
[1]熊志全,数字化电网模型[J].电力信息化,2005年05期.
[2]唐琳,李云峰.电力信息系统的安全性初探[J].信息安全与通信保密,2006年10期.
[3]王金泉,林荣惠,陈荣平.基于信息系统接地引入点的方法[J].中国科技信息,2007年19期.
关键词:电力系统;IT运维自动化;应用
中图分类号:TM76文献标识码:A文章编号:1673-1131(2015)12-0262-02
21世纪电力信息化迅猛发展,电力公司越来越得到营销管理、物资管理等业务系统的认可。随着支撑电力系统的硬件资源逐渐增加,IT运维系统面临巨大的挑战,传统单一的IT运维管理工具不能跟上信息部门发展的脚步;电力系统中IT运维自动化必须完善,构建统一的发展平台,实现数据库和信息库相互统一。
1IT运维管理存在的问题
(1)运维成本较高。随着IT企业和IT部门的普及,硬件产能在信息技术发展中做出了突出贡献。电力系统中IT运维成本在硬件或技术支出两方面占有20%;另外80%主要是由维护成本构成;主要包括IT运行中进行人员管理,以及对系统进行测试;运用人力手工管理对系统进行流程管理,在此基础上对系统进行测试[1]。采用人力手工管理不仅增加了人力成本费用,而且限制了运维效率。所以应该加深自动化程度,进一步提高IT运维环境。
(2)运维过程处于被动状态。据调查,我国的电力系统中IT运维在预警机制方面不完善,运维人员只能通过系统报警才可以被动的处理故障。日常工作中,运维人员都是采用手工进行简单、重复性的处理形式完成基本工作,导致难以提升运维服务质量,运维服务没有满足业务部门的需要。
(3)运维低自动化。运维人员没有办法明确杂乱信息的根源,由于电力系统IT运维自动化特征比较明显,导致在获取到诸多杂乱信息以及警报期间,运维人员很难找到杂乱信息的根源甚至没有办法去解决问题。运用手工方式对设备进行检查,不仅会占用大量的运维资源,影响运维服务质量,限制运维服务速度;而且运维人员的工作强度、人力支出成本也会随之增加。
(4)运维集中度低。现阶段,我国大型企业采用的IT部门硬件结构上运用大规模集中模式。据统计,我国部分子公司已经设立了独立的运维中心,而且已经相应的配备了开发人员和维护人员,在运维管理期间,由于呼叫中心或者运维客服不能进行统一协调调度,只能通过当地的运维工程师现场处理,致使隐患处理时间推迟[2]。
2电力系统中IT运维自动化的解决对策
2.1降低运维成本
对于电力化系统中IT运维自动化的发展,主要包括IT运维自动化的运行、维护、服务、优化、变更。应该从管理和技术两方面降低运维成本。电力系统中IT运维自动化建设覆盖全局的流程监管系统,实行全天候制业务检测;对于系统隐患采用自动化修复功能。改善IT运维自动化系统,实现IT运维自动化基础上建设全局域流程监管系统,采用全天候业务监测系统,降低IT运维自动化成本,进一步避免日常手工方式下出现的重复工作;不仅可以降低运维工作中人力支出,对于不同技能的运维人员进行技能评估,而且可以减少波动性问题带来的隐患[3]。
2.2提升流程可控制性
电力系统下IT运维自动化将日常的工作流程变换为信息自动化操作流程,主要包括手工操作为框架的流程化管理模式,采用预警和处理两个方面建立知识库;IT设备运用主动性监控,对于突发事故具有预测功能,通过预警功能降低损失,对于突发事故没有事先警示时,采用集中监控系统启动故障响应和备份恢复系统找回丢失的数据,将电力系统下IT运维自动化工作转化为信息自动化操作,提高自动检测功能。对电力化系统中IT运维自动化应该明确IT资源监管范围,落实电力系统下IT资源管理的维度,统一制定IT运维自动化编码规则,制定出电力化系统IT运维自动化关系。
2.3提高IT运维工作质量
建立电力系统中IT运维自动化的发展,应该和电力信息运维的特点相互结合,制定统一的电力IT建模方式。电力系统中IT运维自动化的发展应该具有材料采购、产品入库、投入运营并顺利运用、产品维修、借与调转和产品报废六个基本情况。在IT资源的生命周期理论中引入电力IT资源建模,进一步扩展模型的使用范围。电力系统下IT运维自动化建设呼叫中心过程中,呼叫中心和数据库要具有面对面交流功能,及时解决用户提出的问题并且满足用户提出的要求;不仅可以在用户沟通期间降低门槛,而且可以密切用户关系。比如通过远程协助、语音在线交流等方式不但能够加强运维效率,而且可以加强运维效果。运维效果在运行期间,利用积累的宝贵经验,提高运维工作质量具有重大意义。
2.4制定元数据的数据集成方案
对IT运维系统采用集中式管理,通过设立IT运维集中团队,实现集中式管理模式,建立集中管理IT运维平台,为数据专业化提供保障。电力化系统性中IT运维自动化应该制定元数据的年数据转换组件,信息运维综合监管系统,实现统一数据模型,集成监管子系统的局部。集中系统数据,主要通过以下几个方面,IT运维自动化设立统一的信息库,信息库应该具有合理性、通用性等特征,支撑电力系统IT运维自动化管理模型。信息库接口应该丰富,方便使用,对系统性能具有调优功能。考虑信息库的安全性,对IT运维自动化,设计安全审美模块,增强IT数据库的安全性。就目前而言,我国的电力化系统下IT运维自动化主要在江苏以及山东等个别区域实施了试点运行;应该加强运维团队支撑作用,统一运维工作规范。制定运维工作制度,实现运维工作向标准化管理转变。
2.5提高IT运维机制
企业应该根据IT资源管理系统的模型,制定统一IT运维自动化的信息系统,为信息运维综合监管系统提供服务功能,主要包括对提供的数据进行维护,对数据同步的同时进行数据归档。构建持久化的中间件,把外界对数据库的直接访问进行封装。增添直接增加删除以及修改等功能,通过对象之间的关系不仅可以把数据库表的复杂联系进行屏蔽,而且可以提高资源对象的搜索效率。通过电力系统下IT运维知识库的搭建,完善呼叫中心功能,扩大运维用户的使用范围,实现IT运维系统的操作指导功能,进一步实现资源共享功能。逐渐增加知识库的设备,促进IT运维功能逐步增加。对运维工作人员进行定期培训,提高运维工作人员的整体素质。
3结语
随着我国科学技术的不断发展,电力信息自动化在电力信息网络方面做出了突出贡献;不仅提高了网络运营能力,而且提高了电力系统的服务质量与服务效率。现阶段,应该优化运维工作平台,实现由点到面的IT运维工作平台,促进电力企业的发展。
参考文献:
[1]李蒋.解析电力系统中IT运维自动化的应用[J].科技与创新,2014(21):24-24
[2]胡海霞,卓兰霞,刘丽,等.IT运维自动化在电力系统的应用[J].中国电子商务,2013(4):45
【关键字】烟草业 信息安全体系运维管理体系
一、IT运维的概念与重要性
IT运维管理就是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(如硬软件环境、网络环境等)、IT业务系统和IT运维人员进行综合管理。其运维管理主要包括八个方面的管理内容:设备管理;应用/服务管理;数据/存储/容灾管理;业务管理;目录/内容管理;资源资产管理;信息安全管理;日常工作管理。
运维工作能有效延长应用系统的生命周期,并因此成为软件工程的重要阶段。信息系统运行维护质量的优劣直接关系到应用系统的运行效果,乃至生命周期。从软件工程的角度来看,整个运维期从应用系统投入使用开始,直至系统的自然消亡,是信息系统生命周期中最长、最重要的一个阶段。良好的运维机制和运维措施不但能够确保系统长期稳定地运行,有时还能缓解或解决设计时遗留的某些缺陷,并且延长信息系统的生命周期。科学的运维工作能针对不同的运维要求确立灵活的运维原则。运维工作应是讲求科学性和策略性的。由于各种信息应用系统在职能上有着截然不同的分工,在处理方式上有着各自的特性和规律,因此应用系统间普遍存在着较多差异,这种差异不但体现在软硬件设备上,而且还体现在日常的运行方式,乃至安全性要求上。针对这些参差不齐的差异,运维部门需要制定差异化的运维原则。
二、烟草商业基层运维队伍的建设的基本方式
建立安全运维管理平台,作为体系的应用支撑系统。一方面通过集中授权访问,实现统一的认证授权和全网日志审计。另一方面依托集中授权,保障网络服务质量,提高网络的可用性和利用率。第三从业务视角提供对业务服务的管理,并以预先定义的事件管理流程完成事件的处理。第四将信息化队伍建设、资产资料管理、工作计划、考核和项目管理工作电子化,实现信息中心的信息化。
一体化保障体系建设原理是“以整体规划为引领、以标准规范为主线、以集中管控为模式、以应用系统为支撑”。即在整体信息化规划的指导下,制定标准规范,指明一体化保障体系建设工作依据和管控要求;通过集中管控,明确一体化保障体系的管控模式和具体措施;通过应用支撑,保证一体化保障体系能够按标准规范建设、按管控措施执行。
通过明确管控模式和措施,落实人员职责,确定行为规范,保证技术措施真正发挥效用,保障标准规范的有效贯彻和落实。具体措施包括在基层单位建立起"一站式"的运行维护窗口、优化岗位设置、提升人员素质、实行集中安全管理、整合技术监控及防范措施,逐步实现在线绩效评估及考核。
三、运维队伍建设过程中的若干问题
当前,宜昌市烟草公司信息化建设正在稳步推进,各类面向不同业务形态的应用系统不断产生。随着现代社会信息化程度的提高,企业对应用系统使用的网络及计算机软硬件设施的依赖程度也相应增强,然而,现实环境中的许多意外故障或蓄意事件(如病毒攻击)却无法完全避免。作为组织机构关键性和战略性的资产,信息化系统与组织机构的生产、经营、管理的关联越来越紧密,信息系统能否安全、可靠地运行,将直接影响到企业发展的各个方面。信息系统运维管理平台的建设和实施,对维护好规模越来越大、技术越来越新、复杂度越来越高的应用环境,确保各个系统能够长期、健康地运行将起到非常积极的作用。
经过近半年的运行,在烟草基层单位的队伍中安全运维管理系统应用方面存在以下两点问题:
1.重视不够,认识不足。
(1)安全运维管理系统尚未得到充分应用,没有及时通过安全运维管理系统了解本单位系统运行情况,多次发生系统预警2小时后仍未进行处理的情况。
(2)日常工作记录不及时,全年共有1517起机房日志和备份日志未及时进行记录,占总日常工作的80%。
2.落实不到位。
(1)人员未落实,一些基层单位的服务台、技术支持、日常工作记录填报人员未明确具体责任人。
(2)流程执行不到位,预警发生后,应首先由基层单位所在的服务台接受预警信息并转入事件处理流程,目前,有68%的预警信息未转入事件处理流程,只是由技术人员自行进行解决。
3.已转入事件处理流程的事件处理不及时,有50%的事件超过2小时后才开始处理。
四、基层运维队伍建设工作的改进
建设安全运维管理系统,使烟草基层单位实现信息化的公共安全管理、系统运维监管和信息安全防控为当务之急。
(一)进行“6A”公共安全管理。“6A”是指账号、授权、认证、审计、接入和流量预警。
集中账号管理:集中帐号管理的管理对象是用户和帐号,通过LDAP,将用户与其拥有的所有信息系统帐号关联,进行集中管理维护,为集中访问控制、授权、审计提供原始数据基础。
集中认证授权:集中认证授权的管理对象是用户和他的系统访问权限,通过设置在单位内的CA认证授权平台,实现所有应用系统、网络设备、操作系统、数据库等的统一认证授权和单点登录。
集中安全审计:集中安全审计的管理对象是所有基层单位的网络、主机、应用系统和用户行为,通过架设在各单位的网络探针,收集相关数据并集中的进行审计分析。
集中安全接入:集中安全接入的管理对象是用户、网络设备和服务器,通过架设在各单位的安全网关,实现对用户终端的登录安全评估检查,并为每个用户划分基于被访业务系统的专用虚拟安全域。
集中流量预警:集中流量预警的管理对象是骨干网链路,通过部署在各单位的流量探针,对网络出口流量、业务系统访问流量、终端节点流量进行综合分析、监测、预警和清洗。
(二)进行系统运行监控和运维服务监管。安全运维平台是以业务为视角,将业务系统相关网络设备、链路、主机、数据库、中间件等软硬件设备进行集中管控,对关键指标进行实时监视,出现异常情况后立即预警,通知运维人员进行处理。同时,集成部分操作命令,实现自动化处理的操作控制活动。如:监控发现业务带宽的空闲和紧张状况,通过配置针对网络的优先带宽、保证带宽和预留带宽策略,保证业务带宽需要。
烟草基层单位下一阶段将要开发的业务应用管控部分,是以全程业务流程作为监测视角,通过业务流程建模、确定监测的关键点、设置关键点的监控指标,进行以全流程业务为中心的监测处理,实时提供业务全流程运行状态和质量情况监测;并可通过模拟客户端运行全流程业务的过程以及模拟外部系统调用服务的过程,对全流程进行探测,从而主动发现业务流程的潜在问题。
(三)提升信息安全防控能力。一方面进行机房标准化改造,各单位机房标准化改造应按照B级机房标准进行,避免贪大求洋。主机房面积按照每机柜占地3.5-5.5平方米计算,机房采用双电源双回路配电,消防采用S型气溶胶自动灭火装置,机房专用空调、防雷、电磁屏蔽、环境控制等其他设施设备应符合GB50174-2008《电子信息系统机房设计规范》要求。另一方面,通过划分网络安全域、进行安全域之间的隔离和访问控制、进行应用访问流量和互联网访问流量的有效管控,来保证网络性能和带宽能够充分满足信息化需求。第三方面通过安全配置、补丁修复、漏洞扫描、防病毒、主机入侵防御等技术手段实现所有操作系统、数据库、中间件、应用的全方位安全加固与防护。第四方面通过进行终端安全修复、安全接入控制、终端桌面安全和网络行为监控,提高全省对于分散终端的安全管理能力,规范终端用户的行为,降低来自终端的安全威胁。
(四)设立基层单位运维服务窗口,统一受理、处理和记录信息化安全服务事件。
烟草基层单位运行的维护窗口设置在单位内的运维服务中心,实行74小时运维保障,做到一站式受理、一站式服务。运维服务中心设置服务台、信息服务管理、IT维护和技术支持岗位,由信息系统规划、建设和运行维护的技术人员组成。一般来说,基层的韵味服务中心是最基础的服务中心,主要是解决基层单位自身的问题,如果遇到自己解决不了的问题,则可请求上级单位层次更高的运维服务中心帮助解决。
运维服务中心的工作主要是基层单位内信息化实现安全服务统一调度、信息资源的集中管控和统计分析。信息化安全服务统一调度依据ITIL最佳实践进行,目前已实现了事件、问题、配置和变更流程的电子化处理,下一阶段将逐步实现IT服务规划、日常需求管理、服务级别管理、服务可用性管理等其他18项服务流程的电子化工作。运维服务中心通过对信息资源的集中管控和统计分析,定期向各级领导提交运维报告,为领导决策提供必要的数据依据。
去年,湖北省烟草基层单位实现一体化的保障体系主要进行了两个方面的建设工作。一是编制了一体化保障体系建设规划、标准规范和规章制度,共编制了12项标准规范,修订完善了16项规章制度和21项管理流程。相应的征求意见稿已下发给各市州公司,下一步,市局将结合各单位提出的修订意见,对标准规范和制度流程进行修改,力争在年内。二是在基层单位内推广了安全运维管理系统,系统建立的安全准入帐号7396个,发放加密与签名证书16156张,目前全省共有7000多人在使用。安全运维管理系统集中管理IT基础设施842个、信息化项目70个、信息化从业人员172名, 实现了21项信息化指标的自动考核,从2010年10月至今,系统预警73877起,已全部处理完毕,未发生因故障导致业务中断的事故。
五、宜昌运维的发展
一体化保障体系建设遵循“统一规划、适度超前、小步快跑、分步实施”原则,分阶段开展。2011年为体系巩固年,在2010年一体化保障体系初步建成的基础上,继续巩固应用效果。2012~2013年为体系优化年,优化完善一体化保障体系。2014~2015年为体系提升年,持续改进一体化保障体系。
2011年,全省将通过“抓管理、抓落实、抓实效”三项工作来进一步深化一体化保障体系应用,巩固完善全省一体化保障体系。
参考文献
关键词:计算机;信息系统;运维服务;模式
中图分类号:TP182 文献标识码:A文章编号:1007-9599(2011)07-0000-02
Operation and Maintenance Service Mode Research of Computer Information System
Sun Liang
(Yixing Power Supply Company,Yixing241255,China)
Abstract:The information revolution to people's daily life has brought great change,this transformation not only in equipment,innovation and management,is reflected in the use of the computer system on the increasingly large and complex.Operation and maintenance services,computer information systems,computer information systems in the face of market on the basis of further progress and development,computer information systems development in China may have been more mature,but it does not sound operation and maintenance services.The main content is the mode of operation and maintenance services for computer analysis and discussion.
Keywords:Computer;Information system;Operation and maintenance services;Mode
一、计算机信息系统的功用分析
随着计算机的日益普及,网络基础设施的不断建设与完善,计算机作为一台单独的文字处理机的日子已经一去不复返了。现在的计算机与网络密不可分,计算机已经成为制造信息、收发信息、处理信息的信息处理机。现在的各企、事业单位和政府机关都已告别了孤立的单机时代,而是由服务器、文件服务器 、确飞服务器 、打印服务器、邮件服务器等、局域网、个人计算机或叫工作站和外设打印机、扫描仪、数码照相、数码摄像机、投影机等及软件网络操作系统、单机操作系统、各类应用软件构成一个工作或办公系统,由于这个系统主要是利用计算机来进行信息采集、信息共享、信息收发、信息处理,因此,我们称之为计算机信息系统。
计算机信息系统是由服务器、局域网与外设组成,其功用十分广泛。目前在各企、事业单位,主要有如下作用:
第一,应用信息共享。因为每个人的电脑,通过局域网连接,因而,各类信息都能通过网络发送、传递,计算机与计算机之间、计算机与服务器之间都能通过网络相互访问,实现信息共享、设备资源共享。计算机信息系统内的所有人员都能通过网络共享系统内的打印机等硬件资源共享服务器中的数据库的数据等软件资源。
第二,网上办公。由于计算机信息系统内的所有人员通过网络都能互连互通,因此只要加装网上办公软件,就能实现网上办公,无纸化办公。大大节约办公成本,提高办公效率。
第三,集中计算或网格计算。计算机信息系统内的所有人员,如果处理大数据,本人的计算机运算能力不够时,可通过集中计算或网络计算软件,把计算任务,发送到系统内的所有空闲计算机上计算,达到充分利用设备,提高计算速度之目的。
第四,共享因特网。如果每台计算机单独上因特网,费用将十分昂贵,而计算机信息系统内部通过局域网互连。
二、计算机信息系统运行维护
(一)设备管理。设备管理包括对网络设备、服务器、计算机、打印机的管理,并使这些设备处于最佳运行状态。 通过定期检查各设备的运行日志,并及时解决潜在故障的隐患,从而保证各设备的性能、 安全、 稳定性都处于最佳状态。
(二)应用软件系统的管理。应用软件系统的管理要根据软件的特点进行有针对性的管理:对网络版的防病毒软件,需要定期检查病毒库的更新情况;对本单位已建成的业务软件,则要求软件系统最大限度的满足业务办理的需求,并按软件工程的要求,加强对软件生命周期的管理,如在系统功能修改过程,要有软件需求更改申请流程,以确保需求的稳定性。
(三)系统容灾管理。确保在异常情况下,快速恢复系统的正常使用。因此需制定各应用软件系统的应急处理措施,并根据各系统的使用特点、重要程度、使用范围制定相应的数据备份策略。需要经常对备用系统的程序文件是否与系统一致进行检测,并对数据备份情况进行跟踪。
(四)日常工作管理。对计算机信息系统的管理是一种日常的常规性维护工作,对于运维工作人员来说,应该将对信息系统的维护作为一种日常性的工作习惯,不要等到出了故障和问题以后才开始意识到应该对相关问题进行解决。在日常管理中,明确运维工作人员各自的职责与工作内容,制定一定的考核标准和考核依据,以体制来规范工作人员的日常行为,并且来调动他们的工作积极性。
三、计算机信息系统运维服务分析
关键词:通信系统;配电网自动化;管理模式
引言
随着我国经济建设高速发展和人民生活水平的不断提高,对供电可靠性、电能质量以及优质服务水平等提出了更高的要求,打造坚强智能电网迫在眉睫[1-2]。而配电网通信系统作为智能电网建设的基础部分和关键环节,一旦失去通信系统的支撑作用,配网自动化在调度运行中的“遥测”“遥信”等信息将无法实时上传[3-4],从而导致电网调度运行人员无法及时准确掌握电网运行情况。随着电力通信系统的发展,电力主网通信系统日益成熟。然后作为终端接入的配电通信网由于接入站点众多、覆盖分散、建设模式不统一、日常维护不到位,已经严重制约了智能配用电业务的发展[5]。为了打造坚强智能电网,必须加强配电网自动化通信网络精益化管理,提高优质服务水平。本文从配电网通信系统的规划、建设以及日常维护三个方面探讨了配电网通信管理模式,并提出了相应的改进措施。
1配电网通信系统管理现状及存在的问题
1.1配电网自动化系统简介
配电网自动化系统[6-8]是服务于城乡配电网改造建设的重要系统,可以将配电网络中的各种运行信息、电网结构、地图信息以及用户信息等进行集成,实现运行状态实时监控和配电网自动化管理。当前,我国配网自动化进行了众多试点运行,主要由配电主站层(配调中心)、子站层(变电站)和终端层组成,此外还包括外部应用系统以及通信接入层,其中光纤通信已逐渐发展成主干网的主要通信方式。馈线自动化的实现也完全能够建立在光纤通信的基础上,这使得终端能够快速地彼此通信,共同实现具有更高性能的馈线自动化功能。图1给出了配电网自动化系统的结构示意图。
1.2配电网自动化通信系统简
介配电网自动化通信系统[6-8]是连接主站、子站和终端的通信系统,他将现场终端采集到的实时信息传送至配网主站,同时将主站下发的各种遥控命令传送至现场终端,进而实现配电网自动化管理。配电网通信系统可以分成三层结构,具体包括配网自动化主站与各子站的通信主网即骨干层,各子站与配电终端通信设备之间的通信子网即汇聚层,终端通信设备和配电设备信息采集器之间的通信即接入层。图2给出了配电网自动化通信系统结构示意图。
1.3配电网通信系统中存在的问题
目前,配电网通信与主网通信在工程实施上差异性较大,表1给出了二者在规划、建设和日常运维上存在的诸多不同点。本小节将围绕这三方面作详细介绍,并指出配电通信网存在的不足之处。1.3.1规划阶段主网通信在规划时,通信设备和光缆随主网规划,严格按照相关标准规范化设计,新增站点通信网的可靠性较高。配电网通信规划涉及到公司运维检修部门、配电运维室、信通公司等多个部门。配网自动化通信骨干层和汇聚层由骨干传输网或数据通信网组网,可靠性较高。但是配电网接入层新增的开闭所、配电房和环网柜等光缆路由是通过级联的方式,经邻近的开闭所接入配电网通信系统,接入方案可选择性较多。因此,新增站点在接入配电通信网前需要综合考虑各种因素,包括光缆长度、OLT(OpticalLineTerminal,光线路终端)光口资源冗余情况、EPON(EthernetPassiveOpticalNetwork,以太网无源光网络)多级分光衰耗情况以及日常运维的便捷性等。然而目前新增站点接入时,为了节省光缆的接入成本,通信光缆敷设一般采用就近接入的原则,光缆路由规划比较粗放,并没有系统地考虑OLT光口资源情况、EPON多级分光衰耗情况以及日常运维便捷性的要求。1.3.2建设阶段主网通信设备和光缆随主网一次性投资建设完成,待新增站点启动送电后,配置相应的业务,之后便进入正常运维阶段,整个建设过程比较规范。配电网通信在建设过程中,往往只关注配电网通信的完成率,对配电网自动化通信系统相关双路由保护重视不够,有时会出现两条进站光缆建设时间不同步的情况,从而无法满足手拉手保护配置的要求,这必然给配网自动化相关业务的正常运行带来安全隐患。此外,建设单位往往在单路由并由蓄电池应急供电的情况下催促供电单位配合完成通信设备相关调试工作;调试完成后,建设单位在未征求供电单位许可的情况下随意关闭电源,导致站点相关通信设备无故掉电离线,并产生告警,直接影响通信设备上线率等考核指标,给日常维护工作带来不必要的麻烦。1.3.3日常运维本小节将从以下四个方面详细探讨配网通信在日常维护中所面临的问题。(1)配网通信检修面临的安全问题。配网设备所处的配电房与变电站内的环境差异大,变电站内通信设备一般在保护室内或设有独立的通信机房,与室外强电电缆及变压设备明显隔离。而配网通信设备与强电设备大多处在同一配电房内,强弱电没有明显的分离。此外,通信运维人员在配电房内操作通信设备时存在不规范情况,大多无专责监护人监护,安全措施亟待加强。(2)配电网站点众多,位置难寻,站点坏境恶劣。随着城市规模的不断扩大,新建小区的开闭所、配电房和环网柜数量也在急剧的增长,以某市市区为例,截至2016年底,配网接入端站点数量已高达876座。此外,小区站点位置分布不统一,常分布在地下车库、地面独立配电室等,给维护人员寻找具置带来了一定的难度。需要特别强调的是,某些站点设备运行环境比较恶劣,曾经出现封堵不规范造成的鼠害(老鼠咬断光纤造成通信故障)、阴暗潮湿及夏季高温下设备运行不良的现象。(3)配电网通信故障率高,维护效率低下。虽然配网通信故障的发现及消除简单,但处理起来比较繁琐。在光缆方面,配网自动化通信光缆不同于主网光缆,绝大部分为管道普通光缆,小区分布越密集,配网光缆分布越集中,经常发生光缆外破事件;在设备方面,恶劣的环境直接影响设备的正常运行,导致站点ONU(OpticalNetworkUnit,光网络单元)设备损坏,因此故障率较高。经统计后发现,某市配电网通信故障中,光缆中断故障占比达70%,设备故障占比20%。绝大多数故障消缺难度并不大,但是故障率比主网通信网高,耗费大量人力物力。需要指出的是,运维人员虽然可以在网管上实时监控站端ONU的工作状态,对于出现的告警及时处理,但故障处理一半以上时间浪费在路途中。此外,目前配电网通信系统没有专人负责,相关维护人员往往需要中断其他工作临时参与到配网通信的抢修中,影响事故处理效率。(4)配电网通信设备资料繁琐,入档不规范。配网通信设备资料包括配网自动化和用电信息采集相关通信设备及其对应屏柜的光纤配线架资料,光缆路由,设备台账等资料。由于开闭所等在投运阶段由不同厂家承包建设,资料登记不统一,现场的光纤配线架标签不齐全,档案整理不规范,为后期的维护管理带来了巨大的挑战。此外,运维人员在日常工作中,往往不及时更新台账资料,管理混乱,日常运维效率极端低下。
2配电网自动化通信管理模式探讨
2.1配电网通信系统管理模式解决方案
上一节从规划阶段、建设阶段和日常维护三个方面详细探讨了配网自动化通信系统与主网通信系统的差异性,并指出当前配网通信系统中存在的诸多问题。本节将继续从规划阶段、建设阶段以及日常维护这三个方面一一探讨配网通信系统中存在的问题,并提出一种有别于主干通信网的管理模式,以期望能够加强配电通信网的管理水平。由上文可以看出,虽然配网通信与主干网通信在规划、建设和日常运维等方面存在诸多差异,且面临一系列问题,但归根究底,主要是因为公司对配电网通信的管理尚且停留在主干通信网管理模式下,并没有制定一套针对性且规范化的管理模式。鉴于配电通信网涉及站点众多,覆盖密度大,日常运维繁琐,需要我们更加注重日常工作中的沟通和协调作用,并贯穿于配电网通信系统的整个规划、建设和日常运维等阶段。在规划阶段,工程人员除了应掌握新建站点附近的光缆路由情况、施工难易程度之外,还需要考虑相邻站点光功率大小,上联变电站OLT的PON口使用情况,后续有可能接入的信息通信王其明等:现代配电网通信系统管理模式探讨站点等,做到统筹分析,合理规划光缆路由。在建设阶段,需要安排专门人员与建设单位沟通,及时掌握新增站点的建设进度,严格审核新增站点是否具备双路由、双电源等接入条件,满足要求后方可入网。设备一旦上线后,严禁随意断电,若确有需要,应向相关供电部门提交断电申请,待审批通过后应在供电部门相关人员陪同下进行断电操作。在日常运维时,可以从以下三个方面加强管理,逐渐形成一套完整的规范化配电网通信管理模式。(1)建立有效的工作监护制度。涉及配网通信现场工作应至少由两人进行且不少于一名工作负责人,工作中需要加强监护并做好相应的安全措施,工作流程严格执行通信检修标准。(2)建立联合巡视机制。目前配电侧站点的通信设备相对简单,软件侧故障可以从网管的日常巡视中发现,而站点环境情况、设备硬件工作状态及光缆异常情况,不需要很高的专业知识即可判断,所以可以将配网通信设备的日常巡视纳入到配电运维的巡视中去,建立联合的巡视机制减少巡视人力的开销,并且能及早发现问题杜绝故障发生。(3)设置专人负责配网通信设备资料的记录备案。配网通信设备验收过程中,严格执行相关标准,把关质量,检查各种资料是否齐全,现场光纤配线架标签是否完整、通信设备是否做到可靠接地、电源走线、机柜穿线以及孔洞的封堵是否规范以及光缆衰耗是否符合标准等,对位置隐蔽的站点应做好记录整理。发现缺陷后,积极协助配合施工单位进行消缺整改,做到小问题当场解决,大问题提早处理,确保配网通信系统验收合格。验收后要设置专人及时做好相关档案的录入工作,保证后续有新设备新站点接入时,可以持续更新资料,确保设备的运行有案可查。
2.2配电网通信系统管理流程
为了进一步规范配电网自动化通信系统的管理,本文特地制定了一套详细的配电网自动化通信系统管理流程,如图3所示。该流程图涵盖了配网通信系统的规划、建设和运维三个阶段,主要涉及到公司管理部门以及其他相关的设计单位、建设单位和用户。根据上文的分析可以看出,配电网通信系统的日常运维是管理中的一大难点,鉴于此,本文制定了详细的管理流程,如图4所示。该流程图主要涉及到信通公司领导、配网自动化业务部门、网管调度员、巡检人员以及台账管理员。
3结语
随着智能电网技术的不断发展,如何为配网自动化业务提供可靠的通信通道是智能电网建设的一个关键点。本文从规划、建设和日常运维三个方面探讨了配电网通信与主干网通信管理模式的差异性,并提出了一种有别于主干网通信系统的管理模式,以期待能够提高配网通信的管理水平,从而更好地服务于配网自动化,服务于坚强智能电网建设。
参考文献:
[1]康恩婷,侯思祖,高宇.配网自动化无线通信方案的探讨[J].电力系统通信,2005,26(2):29-32.
[2]张岚.配电网自动化通信方式综述[J].电力系统通信,2008,29(4):42-46.
[3]杨力帆,吴飞龙.E1PON在配网自动化通信系统中的应用[J].电力系统通信,2010,31(12):16-20.
[4]陈晖.GPRS通信技术在配电网自动化监控系统中的应用[D].济南:山东大学,2006.
[5]刘广友.县级配网自动化系统的研究[D].济南:山东大学,2005.
[6]刘健,倪建立.配网自动化新技术[M].北京:中国水利水电出版社,2003.
[7]梁晓红.基于EPON的店里配电网通信方案设计[J].光通信技术,2013,37(9):38-41.
在ITIL 3.0和ISO 20000相继,ITIL、ITSM、BSM逐渐升温的势头中,IT运维管理是否已经成为昨日黄花?它将如何继续保守在市场上的一席之地?
随着ITIL 3.0和ISO 20000的,IT服务管理(ITSM)、业务服务管理(BSM)升温的势头有增无减。然而,对于大多数还处于IT运维管理阶段的中国企业来说,CIO更关注的还是那些运维管理系统能使企业自身的业务和应用系统安全稳定地运行。
赛迪顾问数据显示,2006年,中国运维管理市场规模达到2.1亿美元,年复合增长率为25%。那么,面对新形势,IT运维管理该如何站稳自己的脚跟?
运维管理的拿来主义
一般来说,完整的运维管理解决方案包括网络管理解决方案、安全管理解决方案、运维流程管理解决方案以及数据管理解决方案等几部分。同时,从另一个角度看,完整的运维管理系统解决方案还应该包括运维管理流程的梳理和规划,运维系统的实施管理(方法论),运维系统建设的回顾和检查以及运维流程的优化。
当然,同样作为IT服务的一种管理方式,运维管理与ITSM、ITIL有着密切的联系。北京神州泰岳软件股份有限公司运维管理专家谭立蓉分析认为,ITIL 3.0和ISO 20000标准的,对IT运维管理具有积极的意义。ITIL 3.0更加强调IT服务与企业业务目标的一致性,强调服务的生命周期管理,这一点对企业IT服务管理的发展是有指导意义的,同时也使得IT管理更加受到企业的重视,最终使ITSM得到更加迅速的发展。当然,这一点目前还不是很明显。而ISO 20000标准的,对运维管理的影响则更加明显。从国内的企业来看,特别是对于准备走向国际化的发展较快的大型企业,ISO 20000标准的,使得企业更加重视服务的管理,从而加快了IT服务管理的步伐。
ITSM主要关注企业IT服务管理,而BSM更加专注于企业的业务管理。随着计算机技术、网络技术的不断发展,企业的业务发展已经与IT系统的发展密不可分,而IT管理的目标也一定是跟企业的业务发展目标所吻合,才可能给企业带来最大的价值。可以看到,目前很多管理软件企业多年来在ITSM领域摸索后,已经从IT管理向业务服务管理转变。例如,神州泰岳9月推出的新产品中,包括投诉管理和电子运维管理,这两个部分都已经涉及用户的业务管理。运维管理是神州泰岳利用IT服务管理的理念向整个运维领域推广和延伸的一种具体体现。运维管理已经不仅仅局限于IT设备的服务管理,例如在电信运维领域,所管理的对象已经延伸到对通信设备和业务,而管理所涉及的人员也已经不仅仅是IT设备的管理人员。从这个角度看,运维管理也是BSM。
实践中完善运维管理
运维管理本身包括设备管理、应用/服务管理、数据/存储/容灾管理、业务管理、目录/内容管理、资源资产管理、信息安全管理和日常工作管理等子系统。IT系统运行维护业务也是围绕着技术、人和业务流程三个基本元素展开的,这三个要素互相关联、互相制约,共同决定业务运作的成效。对于IT运行维护业务来说,业务目标保证IT系统正常、可靠、高效、安全运行,为业务部门提供优质服务;技术指各种管理监控系统,人员指IT支持部门各级员工,流程指IT运行维护的各种业务过程,如报警故障处理流程、设备配置修改流程等。
运维工作本身比较繁杂和琐碎,因此,在产品的设计中,技术提供商首先要充分考虑作为运维人员的工具和助手,系统一定要好用、实用,能够减轻运维人员的日常工作压力。这就要求企业将这种设计原则体现在产品线中,系统的功能日趋满足用户的个性化需求。
通过系统管理,用户可以定制自己日常使用的派发组、派发对象,可以自定义短信提醒功能,如在工单到达或下班前作业计划没有完成时提醒等。在值班中集成了值班平台,值班人员可以在同一页面进行作业计划、工单等方面的处理,为运维人员提供一个集中处理的平台而不需要到各个功能模块中去分别处理。
作业计划是整个运维体系中非常重要的一环,维护人员需要通过作业计划的执行对现有系统运行情况进行了解,以便为网络优化和问题处理提供更好的分析数据。因此作业计划内容是非常烦琐、庞杂的,通过模板定制功能规范整个作业计划的制定,使之规范化和简洁化,同时通过细粒度的设定(cell级别),使今后的分析更为方便。同时系统提供自动巡检功能,能够使作业计划中日常的工作能够自动执行,减轻运维人员的日常工作量。
值班工作是保证整个IT系统持续性运行的必要手段,首先,从值班用户角度出发,为值班的用户建立一个完整的值班平台,值班人员可以通过该平台顺利完成故障处理、任务处理、公告,执行相关的作业计划等,并将重要内容记录于值班日志。
而对于运维系统一般都会出现的延迟问题,较好的办法是采用事前预警和事后督促两种方式来解决。运维系统提供了多种事前预警机制,如工单到达短信提醒、审批提醒、作业计划未完成提醒、排班提醒等,同时给运维人员提供客户化定制提醒功能,以最大限度地保证运维工作能够准确及时地完成。
在出现延迟后,系统提供服务等级协议(SLA)管理规则,通过该规则可以定期不间断地提醒运维人员要及时完成工作,同时可以定义相关规则,当出现延误后系统可以升级问题级别或者通知相关人员。
以中国联通运维管理系统为例,中国联通增值业务部为了适应在增值领域中市场竞争的变化,必须不断加强对增值系统运行情况的监控和管理,并加强总部对各省分业务运行情况的统计和考核。中国联通全国增值业务网络管理系统的建设正是为了解决以上问题,同时增值网管系统不能只监控系统硬件和系统软件,还要对短信中心、短信网关、语音平台、炫铃、WAP等业务子系统进行监控。通过对各业务子系统的整个处理流程进行监控,全面掌握各业务子系统的运行状况。
因此,整个运维管理系统包括工单管理、总部内部管理、知识库、值班管理、资料管理、局数据制作管理、作业计划管理、系统管理等。
链接:运维管理的发展趋势
在前期,IT运维管理侧重于网络、硬件等设备,随着市场竞争的加剧,越来越多的人意识到,提高用户满意度、降低运行成本、保证系统遇到突发事件能够快速地解决等软课题的重要性,即更看重服务质量和效率。因此目前看运维系统更加突出流程化、规范化。
提高运维精细化管理水平交通设施管理和故障处理一般都有一定的流程和制度,但没有配套的技术手段的支持,流程和制度往往难以真正地得到高效贯彻执行。系统将规范交通设备的管理,实现交通设施设备从购买、入库、使用、维修、报废的全生命周期管理,降低设施的养护成本;规范交通设备运维工作中故障处理流程,规范交通设施故障发生、故障恢复、故障维修、修复确认、维修完成后故障单信息完善、故障延期修复报备等环节;落实养护相关的制度,并可针对各个环节进行考核,从而提高交通设施的运维管理水平和效率。提高运维效果评价科学性怎样评价运维系统使用后的效益?需要看它给正在运行中的系统和设备带来哪些改变,这些改变是积极的还是糟糕的。系统从不同用户所关注的问题入手,依据需求结合实际数据设计相关的考核指标。考核指标从三个角度来进行评价分析:从系统设备健康水平,从运营方和养护方的管理服务水平,从系统产生的经济效益角度。通过运维管理系统自动记录的过程数据来多角度统计分析,量化表达各种考核指标,能够提高运维效果评价的科学性。智能交通设施管理系统集成了中间件、GIS、FLEX和视频识别等先进技术,实现了三个层次共32项主体功能,下一章节将会对系统设计和实现进行简要阐述说明。
设施运维系统及评价体系的设计和实现
1系统架构设计
智能交通设施综合管理系统分为状态信息采集层、智能分析报警层和人机交互界面三层,对应的系统软件架构分三层设计:信息采集、智能报警分析、平台系统。如图(1)所示。信息采集层负责设施运行信息的自动化采集,向智能报警分析和平台系统提供基础数据。它直接或间接通过设施提供的标准接口或系统接口采集相关状态、性能、配置等运行数据,数据内容包括:服务器告警信息、服务器性能、应用软件状态、网络设备运行信息、网络拓扑信息、机房动力环境监控信息、外场设备状态和采集信息等。信息采集方式可集中和相结合,使采集软件灵活部署。智能报警分析层负责分类汇总信息采集层采集到的数据,通过报警阀值和报警规则预处理后生成基础事件,不同来源的事件经过过滤,同类事件经过压缩,相关联的事件经过根源分析,获得用户所需的根源报警,根据报警事件重要程度进行分级,整个过程实现了向平台系统提供设施的智能报警。平台系统层围绕设施运维应用,实现各种业务功能,具体业务功能包括:资源管理、日常养护、日常监控、应急保障、业务报表、系统评价。系统的用户角色分为养护公司、运维管理人员、运行管理人员和部门领导四类。各角色主要业务职责如下:(1)养护公司:综合报警监控的确认巡检;故障报修登记、设备报修签收、设备维修结果登记等;(2)运维管理人员:设备报修签发、设备维修结果审核、设备报修搁置列表管理、设备停用管理,设备生命周期管理;设备基础信息采集入库及维护、机房设备位置、端口、接线、IP、VLAN等资源信息采集入库及维护;(3)运行管理:内外场设备报警查看处置;(4)部门领导:对各岗位操作情况进行统计考核。
2设施信息采集
状态信息采集层主要实现外场设备状态信息采集、内场设备状态信息采集、机房环境监控信息采集,所有采集的信息会接入消息总线中间件并存入历史数据库,为进一步智能报警分析提供数据支持。(1)外场设备状态信息采集:系统通过接口协议,实现对信号机、电子警察、监控摄像机、卡口、情报板、车检器等外场智能交通设备运行状态信息采集;(2)内场设备状态信息采集:通过IBMTIVOLI智能基础设施管理软件实现对服务器、交换机、数据库、应用软件等内场设备运行状态信息采集;(3)机房环境监控信息采集:通过接口协议采集机房温湿度计、UPS、配电柜、空调、消防、门禁和地漏报警信息。
3智能报警分析
智能报警分析层根据采集的状态信息,经过压缩过滤和算法分析,可以综合判断故障根源,为快速处置和问题诊断提供参考。(1)报警事件压缩过滤:根据采集到的状态数据和维护人员指定的报警规则,生成基础事件。对于同一种设备的同一种事件,由于事件产生的渠道不同,会生成多条重复的报警信息,比如通过交换机主动上传的trap事件,和根据交换机的状态数据生成的事件可能会出现重复报警的情况,对这种事件进行过滤。对于某种瞬间发生或者处在报警边界值的事件,可能会频繁的生成和消失,这样就会产生很多重复无用的事件。为了避免这种情况,通过设置平滑周期,对这种事件的生成进行压缩。(2)事件根源分析:通常情况下,在生成的众多单点事件中,往往是由其中的某几个根源事件导致的,根据单点事件之间的逻辑关系和被管对象之间的物理拓扑关系,依次递归查找,根节点对应的事件,即为根源事件。(3)事件分级:报警事件级别分四级普通事件:需要养护人员关注,事件作用一般为预防提醒非关键设备某些指标工作异常,但设备还能工作,不影响其他设备。警告事件:需要设备管理员和养护人员关注,事件作用一般为提醒非关键设备工作异常或不能工作,但不影响其他设备。严重事件:需要值班员关注,告知设备管理员。事件作用一般为关键设备工作异常或不能工作,影响分系统内局部设备。致命事件:需要值班员关注,及时电话通知设备管理员和养护人员。事件作用一般为关键设备工作异常或不能工作,影响全局设备或全系统正常运行。智能报警分析应用场景示例,如图(4)所示。
4运维管理应用
运维管理应用主要实现日常监控、日常养护、应急保障、资源管理、生命周期管理和业务报表分析统计等功能。(1)日常监控:通过机房模拟图、二维或三维地图监控外场设备,以列表和图表的形式展示设备运行的实时信息,报警事件产生,自动定位故障设备,按照报警级别,启动关联预案,监控人员按照预案处置。如图(5)所示。(2)日常养护:日常养护工作通常有设备定期巡检、临时故障维修、抢修,养护中要遵循养护制度,养护过程需要规范,设计了养护流程管理。它支持多岗位跨网络协同工作流程化管理,包括故障报修登记、故障签发管理、任务签收管理、维修结果登记、维修结果审核、搁置列表管理和归档列表管理等。如图(6)所示。为养护更加便捷和使用系统更方便,引入了手持终端。如图(7)所示。图(7)(3)应急保障:在突发重大事故或灾害的情况下,保障各系统正常运行,需要应急保障手段,系统提供一些辅助,主要有各类灾害事故预案模型演练、培训,应急设施资源的查询,预案相关人员组织。如图(8)所示。(4)资源管理:基于自主开发的GIS支撑管理平台和Flex机房管理功能对内外场设备位置、端口、接线等空间和属性信息进行协同维护管理。(5)生命周期管理:对设备安装、建设交付使用、每次维护、到最终报废进行全生命周期过程记录和管理。(6)业务报表:对系统资源情况、设备资产保值、监控设备性能、设备故障、养护记录数据、各职责岗位绩效考核、等多方面进行综合统计分析。
5系统评价分析
系统相关的用户大致分为三类:投资方、运营管理方、养护公司。三者都有对使用该系统期望和诉求。投资方的诉求:建设这套系统后,今后的运维养护能否更省钱,能否为运维养护提供长久支持;运营管理方的诉求:养护效率、质量、养护水平得到提高,人均台班费用得到控制,自身的管理改进和提高,运营管理取得的成绩可以量化,能更好的为业务部门提供系统保障;养护公司的诉求:能更省时省力的完成工作,能更好的响应运营方的要求。针对这些诉求,结合运维的信息,制定了对应的评价指标,指标从三个方面回答用户的诉求:资金成本、运维服务水平、系统健康水平。(1)资金成本=节省的养护人工成本+节省的设备成本,节省的养护人工成本核心指标是人均的费效比和设备养护率。设备养护率随着养护的年限逐年增长,可以根据实际设备使用环境,同行业水平,结合系统记录的养护记录制定,一般第一年0.4,保修期内,每年增长0.1,过保修期每年增长0.2,以3年保修期计算,到第5年设备养护率达到1,这意味着过保的设备5年后的养护频率要大于1。人均的费效比=人工总花费/(人均出工时间×养护团队人数)。节省的养护人工成本=(今年的人均费效比-上年人均费效比)×(今年设备养护率/上年设备养护率)×上年人工总花费。节省的设备成本的核心指标是过保设备每年的折旧价值和当年设备过保的备件花费。过保设备每年的折旧价值根据设备的使用环境和it设备折旧值制定,it设备一年质保,5年报废,一般过保设备每年的折旧价值为:设备采购价格×0.2。设备过保的备件花费是指设备过保后,维修的备件花费。节省的设备成本的公式:Σ(单个过保设备每年的折旧价值-当年单个设备过保的备件花费)。(2)运维服务水平=运维管理绩效×50%+养护服务水平×50%,运维管理绩效的核心指标是养护任务的完成率;养护服务水平的核心指标是养护任务质量平均得分、养护任务规定时间完成率和养护培训成绩。养护任务质量得分最高不超过100分,每次养护任务由审核人员根据养护制度要求和养护结果综合评分。养护培训成绩由运营公司组织养护人员学习和考试评分。运维管理绩效=养护任务的完成率×100。养护服务水平=养护任务质量平均得分×40%+养护任务规定时间完成率×100×40%+养护培训成绩×20%。(3)系统健康水平=设备总完好率×100,设备总完好率是指所有设备完好工作时间的比率。设备总完好率=Σ(单个设备实际完好工作时间/单个设备理论要求完好工作时间)。评价的指标结果通过图表的方式直观表现,如图(9)所示。
系统项目实施效果
(1)使用这套系统后,可量化从养护资金使用效率、养护成本、养护运营绩效、系统运行稳定等多方面带来的改变。(2)通过设定指标,从管理绩效、成本核算等方面量化考核运营公司。(3)设施全生命周期的管理,对设施质量评估提供了数据支持,对设施资产进行了优化配置。(4)以规范的方式管理养护数据,在管理过程中能方便的统计分析系统的不稳定点,排查系统隐患,保障系统运行稳定。(5)综合的智能报警,提高了故障排查效率;报警预案、报警联动,加快了故障的响应速度。(6)强化了养护制度的管理,对养护安全、养护纪律起到规范、督导作用。(7)应急抢修的管理、手持设备应用、各种应急养护预案的培训和演练,为应急保障提供了技术支持。(8)手持终端设备的应用,使得养护全过程信息直达、高效、迅速,系统提供更有力信息支持。(9)规范的管理养护数据、落实养护制度、养护应急预案的培训等,使得养护知识、养护经验共享,提高养护服务水平。