前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的消防运维管理主题范文,仅供参考,欢迎阅读并收藏。
【关键词】 高职机房 维护管理 云计算模式
研究项目:陕西省高等职业教育教学改革研究项目,编号:11Z55。
随着高职院校理实一体、项目化教学等教学模式的进一步推广,高职院校计算机机房成为学校重要的实习实训教学场所。建立一个规范的、行之有效的机房管理体制,不仅可以保证机房的正常高效运行,同时还对学校的网络安全、校园稳定起着重要的作用。
高职院校机房日常维护的常见问题
随着招生规模的逐年增大和生源质量的变化,高职院校计算机机房管理表现出如下常见问题:计算机数量多,但配置不统一;校内实训课程多、实训学生多等对机器系统的要求不统一;机房承担多项校内外无纸化考试对系统的更新要求不统一;教师上课形式多(如软件需求、是否需要互联网等等)对管理人员的要求不统一;机房开放产生的网络安全、病毒危害等安全要求不统一;在不同机房上课造成作业等数据的移动存储和机房禁止使用U盘等存储器的要求不统一等等,使高职院校计算机机房管理难度增加,对机房管理人员提出了更高的要求。
机房的维护与管理方法
1.完善管理制度:健全的制度使机房管理有了标准和依据,但要把严格管理的指导思想落到实处,提高机房管理水平,还要加强广大师生的责任心与过程的动态管理。教师上课前要明确要求学生对号入座,要爱护自己的机器;要规范引导学生有序进入机房;上机过程中,教师要负责学生课堂纪律并填好上机实验记录表,并加强巡查指导;课后,教师要规范引导学生将电脑关机,凳子摆放整齐;机房电脑有老化、更新、修复等问题,除进行日常的检修外,还应对机房建设时存在的缺陷、机件的磨损、老化、固件的松动、装修变形等问题定期检修、更改或完善。坚持每月定期对机房整修一次;调整活动地板、检测安全防火设备等。
2.加强硬件管理:管理员在做好机房保洁的同时,还要注意做好防火、防水、防盗等安全防护,确保机房设备的安全。并按机房管理要求做好常规检查工作,发现问题,及时解决。
3.合理使用多媒体电子教室实现文件收发、学生监控、教学辅导、远程开关机、远程启动程序等。例如我们在机房使用的极域电子教室能很好地完成这些功能。
4.利用网络克隆软件实现系统的备份与快速恢复。日常管理中我们经过分析比较,使用诚龙网维全自动PXE网刻工具快速安装系统,一般50台左右的机房5分钟左右就可克隆完成。该系统无须架设DHCP和TFTP服务器,也无须进行GHSOT服务端设置,真正全自动的网刻。用户只需要将客户机设置从网卡启动,管理员不必到每台客户机上设置网卡类型,只需在服务器上轻点鼠标就可对机房所有电脑轻松网刻,十分方便。
5.为了保证学生用机系统安全,我们使用冰点网络还原软件对数据进行保护,不必购买还原卡等设备就能实现数据的安全使用。冰点还原能够很好地抵御病毒的入侵以及人为对系统有意或无意的破坏,它的安装不会影响硬盘分区和操作系统,轻松安装、动态保护,其网络功能很好地实现了机房所有电脑的瞬间恢复,操作简单。用户在设置CMOS密码的同时,再设置只允许从硬盘启动,加上屏蔽U盘等,在冰点还原的保护下打造的系统可谓安全可靠。
6.在机房安装路由器,分层次解决上网问题。教师根据教学需要若需互联网支持,管理员打开该机房路由器,避免整栋楼上网,影响其他机房上课,有效控制某些学生上课上网、打游戏的行为发生。
7.在网关控制机安装“网路岗”解决上网安全问题。“网路岗”作为一款专业的上网行为监控管理软件,在同类局域网管理软件产品中市场占有率国内第一;经过多年的升级换代,目前已经更新到第八代,利用网路岗可以监控常见的上网记录、聊天内容,还可以监控到QQ外发的文件,收发邮件(含附件)、FTP传文件、网页发邮件及附件、网上发贴、发微博记录、网上发文章等。这些功能很好地实现机房上网环境的监控,杜绝上网违法行为的发生,也为校园稳定起着重要作用。
8.安装虚拟机解决有关破坏性实验问题。通过Vmware虚拟机软件,用户可以在一台物理计算机上模拟出二台或多台虚拟的计算机,这些虚拟机完全就像真正的计算机那样进行工作,可以提供一个真实的,不受任何限制的系统给学生,学生完成如格式化、分区、软件测试、服务器设置等实验操作,不会影响机房物理计算机,保证机房机器正常运转。
云计算在高校机房的应用模式
云计算是近年来一个热门的技术名词,很多专家认为,云计算会改变互联网的技术基础,甚至会影响整个产业的格局。正因为如此,很多大型企业都在研究云计算技术和基于云计算的服务,亚马逊、谷歌、微软、IBM、SUN 等IT 巨头都在其中。几年之内,云计算已从新兴技术发展成为当今的热点技术。在云计算服务模式下,高校机房用户端只需要一台能连上互联网并安装了“云操作系统”的浏览器的电脑即可,用户要应用的软件及硬件均是以云服务的形式提供。
云计算降低了高校计算机机房建设中巨大的软硬件成本,计算机基础投入成本将降低。高职院校计算机机房大部分机器是面对学校老师实验实训教学所用,随着软件的不断升级,有些老机器根本没办法适应现在软件的最低配置要求。如果高校机房采用云计算所提供的服务,管理员不需要再费时费力地为所有计算机安装所有高校教师需要使用的软件,软件的升级、维护可由厂商直接在互联网上进行,机房管理彻底摆脱了软件系统维护的烦恼。
云计算给机房管理提供安全的保障。教师在机房教学过程中,只需要给学生提供账号和密码就可以登录教学软件系统,学生无须下载或者用U盘拷贝课件,这样可以大大提高机房的安全保障。
云计算可以帮助机房管理工作人员省时省力。一旦云计算模式在机房内运行,机房管理人员只要维护好服务器的工作状况,就可以维护好整个机房的运行,无须每台机器都要进行维护和整理,大大节省了机房管理人员的时间和精力。
机房之间利用云存储实现数据管理,其数据备份和容灾技术保证了云存储中的数据不会丢失,数据加密技术保证了云存储中的数据不会被未授权的用户访问,为教学资源的安全性和可靠性提供了保障。
结束语
教高[2006]16号文件指出:高等职业院校人才培养模式改革的重点是教学过程的实践性、开放性和职业性,实验、实训、实习是三个关键环节。计算机机房作为重要的校内实验实训实习基地,其管理与维护是保证学校正常教学活动的基础工作。科学的管理,会使机房维护工作事半功倍。
日趋成熟的云计算技术在高校机房中的应用能为高等教育提供更好的机房实训条件和实训基地,可保证高职院校计算机实践教学的质量,强化学生的实践动手能力,能为培养高素质的技能应用型人才提供保障,更有效地服务区域经济的发展。
参考文献:
[1]石志国.计算机网络安全教程[M].北京:清华大学出版社,2007,2
[2]张书峰.计算机机房管理的实践与总结[J].中国教育技术装备,2010(2).
关键词:运维站模式;变电站;运行;维护
当前社会经济发展形势下,社会群体的电力需求呈现出多元化特点,为进一步提高电力服务质量,应当在运维站模式下,充分做好变电站的运行维护工作,加强变电站设备的日常维护管理,细化设备巡视与维护、事故处理、消防等方面工作,切实保证变电站的稳定运行,为电力事业的发展提供可靠的基础。
1 变电站运行维护工作现状
近年来,随着电力系统的不断发展,运维站模式下,变电站新建、改建、扩建工程不断增多,给变电运行维护管理工作带来更大的难度一方面所辖受控变电站数量越来越多,特别是智能变电站得到不断发展,同时,站内设备型号过多,其原理、性能、工作方式也不尽相同,易发生异常或故障,受控站分布过于分散、相距较远等设备、环境因素导致变电站运行维护的工作任务大量增加另一方面,从电运维的人员仍基本保持原有数量甚至减少,且运维人员的工作技能水平不一,容易造成误操作、设备损坏及人身伤害等事故,也直接影响到运行维护工作的质量。
2 运维模式下变电站运行维护的具体管理措施
2.1 加强运维站模式下的变电站管理
在运维站模式下,为保证变电站的安全稳定运行,应当充分做好变电站交接班和值班管理,严格按照变电站相关制度和规定开展各项管理工作。在交接班管理过程中,应当充分做好交接班的准备工作,在准确把握运维站模式下变电站运行方式的基础上,规范两票执行情况,规范现场操作行为,对安全器具、车辆使用情况进行仔细检查,并及时准确做好记录,为运维站模式下变电站高效管理奠定坚实的基础。交接班管理过程中,应当加强资料、图纸管理,交接班人员应当在交接现场向接班人员详细交代相关工作情况,做好变电站下一步运行维护的注意事项,对变电站运行情况进行确认后,交接班双方负责人应当在记录上签名,以保证变电站交接班工作的顺利进行。
在值班管理过程中,变电站运维人员应当时刻保持通讯畅通,关注辖区变电站的各项信息,包括异常信息和警告信息等,对于变电站中的操作行为进行准确记录,并将变电站与调度部门的业务联系具体内容进行准确记录和录音,为变电站运行异常及故障诊断等提供可靠的数据资料支持。在值班过程中,变电站运维人员应当制定科学合理的巡视计划,加强对变电站的巡视,一旦发现变电站运行异常或设备出现故障,应当进行准确的分析和判断,分析变电站设备异常原因,对变电站设备的具体情况进行准确记录,及时向上级部门回报,做好值班巡视总结,对巡视质量进行全面且科学的评价,切实提高变电站值班管理的有效性。
2.2 建立全面的模拟演习机制
在运维站模式下,变电站运行维护工作中,应当结合辖区内变电站的实际运行情况加以深入分析,从事故、消防以及防汛等方面入手,制定切实可行的模拟演习机制,维护变电站的安全稳定运行。因此在变电站运行维护工作中,应当确保各类型安全器具齐全,尤其是消防设备、防汛设备及其相配套器材等,应当妥善保管,固定存放位置后,在设备和器材上做好标签,以便运维人员在实际应用中能够快速且准确的找到所需器具。与此同时,应当安排专门人员定期对相关器具和设备进行清理、检查和试验,确保各项器具和设备保持优良的待使用状态,若发现设备或器具超出使用期限,应当及时进行更换,以免影响变电站运行维护工作的顺利开展。在运维站模式下,应当对变电站运维人员进行培训和再教育,确保运维人员了解设备及器具的具体性能和使用方法,并做到熟练操作设备,明确变电站事故处理、消防及防汛工作的注意事项,切实提高变电站运行及维护效率。应当结合变电站的实际运行情况,建立全面的模拟演习机制,定期组织开展模拟演习活动,强化变电站运维人员的责任意识,锻炼运维人员的应对突发状况的能力,切实保障变电站的安全稳定运行。
2.3 完善变电站各项运行记录,规范运维程序
在运维站模式下,开展变电站运行维护工作的过程中,应当对变电站的运行情况进行准确记录和完善,为后期变电站各项工作的顺利开展提供可靠的数据基础,并为变电站运行情况的参照查询提供重要依据。变电站运行记录中主要包括辖区变电站运维工作日志、值班及交接班记录、操作记录、巡视记录等,与此同时,应当对变电站设备的异常缺陷情况进行准确记录,对设备的运维分析进行记录,并对设备的维护情况进行准确记录,为后期变电站运行维护分析提供可靠的数据资料,从而对运维站模式下变电站运行维护效率进行客观且准确的评价。
在这一工作环节中,变电站运维人员应当对生产管理系统进行合理运用,与此同时做好纸质记录,确保生产管理系统内的各项数据信息记录与纸质记录内容保持高度一致,具有真实性和准确性。变电站运维人员应当基于运行记录建立科学化的审核评价制度,以班组和工区为主要审核级别,对变电站运行记录进行规范审核,明确记录中存在的不足,规范变电站运行记录。进而通过变电站运行记录,及时发现变电站设备运行过程中的隐患问题,及时采取高效的改进措施,降低变电站运行风险,维护运维站模式下变电站的安全稳定运行,进而推进电力行业的发展。
运维程序主要包括维修和运行两个环节,只有不断加强两者之间的联系,统筹其工作程序,落实每个环节的检修,才能更好地促进电力行业发展。巡视过程是运维程序中的重要组成部分,主要包括熄灯、正常、全面、特殊等方面的巡视,智能化中还有远程巡视。供电企业可以组织工作人员编写《智能变电站远程巡视标准化作业指导书》,借助摄像机等设备,对智能化产品进行拍照,并对其进行合理的编制,为巡视提供更全面的保障。
2.4 提升运维人员责任心
提升工作人员责任心,通过定期培训等方式,强调运维模式的重要性,检查工作人员的操作技能,带领工作人员优化运维模式操作系统,提高运维工作的效率和质量。工作人员也必须不断加强自身职业道德修养,练习自身智能设备的操作技能,仔细检查变电站各类设备,并充分发挥运维系统的其他设备辅助作用,保障整个程序的合理性和科学性。加大对智能变电站的重视程度,利用一体化运维模式,促进电力行业的整体发展。
3 运维站模式下智能变电站运行维护要点
在运维站模式下,智能变电站运行维护工作中,应当对GPS对时系统进行合理运用,实现变电站站域、区域内的全面实时控制,通过对现代信息技术的有效运用,将变电站传统保护屏上的保护功能硬压板转变为后台监控截面上的软压板形式,以提高智能变电站运行维护的可靠性。相关运维人员应当对压板进行及时检修,最大程度上避免设备检修过程中出现误跳或合闸等情况,保障变电站的稳定运行。应当注意的是,在设备验收过程中,应当对厂内设备联调环节进行合理运用,对变电站二次回路SCDM相关配置文件的合法性进行检查,并确保变电站数据模型的一致性及设备的互联性满足运维站模式下变电站运行的相关标准。
结束语
总而言之,运维站模式下变电站运行维护工作具有一定复杂性和特殊性,为保障变电站的安全稳定运行,提高电力服务质量,应当加强运维管理,针对变电站运行过程中出现的问题,及时采取有效措施进行管理,切实提高变电站运维管理水平和运维管理效率,保障电力系统的稳定运行。
参考文献
[1]冯平.变电站运行维护风险分析与控制措施[J].中国高新技术企业,2014(27).
[2]曾福至.提高变电站运行效率的安全措施探讨[J].中国高新技术企业,2016(2).
分公司领导:
××××年运维部在分公司直接领导下、省公司相关专业部门指挥调度下及全体员工的勤奋努力下,顺利完成网络维护、通信生产建设任务,有力的保证了版纳辖区移动业务发展,全年来的工作总结如下:版权所有
一、网建设
在省公司的正确领导及相关部门的大力支持下,通过分公司全体工程技术人员的勤奋工作,现已全面完成。截止月份,共新建基站座(宏站个、边际网个),搬迁基站个,扩容基站个(扩容宏站个、扩容边际网),减容基站座(宏站个、边际网个),修改基站配置、改站型座(即由二代站改为四代站一个,三代站改为四代站个,边际网改为三代站一个,微蜂窝改边际网个)。建设进度全省超前,圆满完成省网工程建设计划,提高了网络覆盖质量,更有力的提升了市场竞争力,促进了业务发展和业务收入的增加。
四月份完成的接口扩容,完成扩容为,新增,该支持,对交换进行了扩容,容量由万门增至万门,、扩容工程于×月×日已割接完毕,设备投入正常运行。
月份建设完成电视电话会议系统工程。
×月×日生产楼正式动工,今年预计完成%的进度。
二、本地传输网建设
.及时完成城域网工程项目施工,建设个节点,个环,建设光缆公里,管道公里,并初验割接入网。及时完成网配套个基站的接入段光缆建设,光缆总长公里。
.积极配合协调省管工程版纳本地网线路工程施工,现今已完成工程量的百分之九十。
⒊根据版纳分公司本地网传输光缆现状,及时委托线路代维,促使传输处于良好运行状态,并消除了存在的故障隐患。
三、网络优化
节日期间运维部在分公司领导的直接指导下,经过节日前针对城区及乡镇集会活动地点进行网优大规模的网优工作,仅仅景洪城区我们就将近增加个,省公司节日前发下四代站载波块,使用块,用于新开通基站个,替换站个,增加站个,扩容站个,拆下的三代站载波块,其中利旧块用于新开通基站个,增加站个,扩容站个。
调整天线个,分别为天马,移动新大楼,微波宾馆。
节日前组织网优人员和交换机房人员,提取××××年度的话务量数据进行分析,根据话务模型提出本年度的话务量预测(主要是节日话务量预测),按话务量预测结果提出了网的扩容改造计划。在后面的工程实施中证明,话务预测在扩容工程中起到了直接的指导性作用。同时要求机房在节日期间实时观测网络话务,对于拥塞高的扇区马上进行参数的调整,功率控制,使话务分流到相邻小区,应急通信车对话务分流取到了非常好的效果。因节日前网优工作准备的较充分,可以看到在今年节日话务量高于往年的情况下,节日期间的网络质量保持较好,基站拥塞率较去年已大大下降,去年多个扇区的话务拥塞率高达-%,而今年最高拥塞只达到-%。
经过全年大家的刻苦努力,版纳网络的考核指标不断提升,特别是拥塞小区的消除情况走在全省的前列,在全省网络分析会议上受到表扬。版纳在全省网络排名逐步处于前列,特别是月达到了第二名的可喜成绩。但是我们需要努力改进的地方仍很多,特别是掉话率方面。
四、基站维护工作
全年更换个基站组存在问题的蓄电池,更换了电池的基站有等基站。
在近期结合全州空调的整治维护工作展开了基站的固定资产清查、地阻测试、铁塔防盗检查、机房防水、基站卫生检查等工作。版权所有
省公司新配备增加了台油机,保证基站停电时发电油机的需要。
公司领导组织人员进行了全州基站的三次季度巡检,发现了许多问题,督促相关人员解决。
五、动力环境
完成全州个基站的电池放电测试(全州共有个基站,只有个基站有动力环境监控)整理出个基站的电池放电时长资料。对今后的电池维护提供了准确的数据。
八月在全州进行了空调的全面清洗检修维护工作,对部分存在故障的空调进行了全面的维护,使设备在可靠的环境下正常工作。
六、加强技术培训,提高队伍素质
分公司承担网工程建设的是一支年青的队伍,面对大规模工程建设任务,要在短时间内保质保量完成,无论是组织工作,还是技术工作都存在较多的难题。为此,分公司把开展技术培训作为一项确保工程质量、进度的重要措施来抓,采取走出去请进来的方式,不但相方设法派员工出去学习,还利用工程期间厂家工程技术人员比较集中的特点,组织运维人员进行现场交流或集中培训,由厂家工程技术人员进行讲解,并做现场解答。
全年单在本地就组织维护人员进行了多达人次的集中培训,学习边际网、空调、电源的相关知识,提高了维护人员的技能。
积极学习最新移动通信技术,二月份运维部四个技术人员到昆明进行长达一周的学习,回来后积极宣贯学习,平时注重技术交流,互相学习。
在×月×日至日,请中兴公司工程师在我公司对电源进行了一次级用户培训。
×月×日至日,请艾默生公司对其产品的使用维护进行了详细的讲解。
在月,请公司高级工程师就边际网进行了为期天的一次现场培训,使员工的基站维护技能又上了一个台阶。
七、交换维护工作
交换设备通信故障为零。及时有效的处理交换设备出现的故障,保障了交换网络的安全。配合省公司完成了项数据传真要求的工作内容并及时反馈。
日常维护工作:为分公司领导、运维部及县公司提供每天的日报,及时反映出网络运行的情况,为领导的决策提供真实可靠的数据。完成了个基站的扩容,开通,减容,传输割接的数据制作工作。
配合市场部每月开通新入网用户的国内漫游功能,完成神州行大众卡的后台数据制作,配合计费中心在后成批量的用户数据处理,以及新营业厅的计费电路的调度。
八、安全及消防
注重安全生产,全年人员无伤亡事故发生。多次召开安全学习。
在-月,运维部组织了全州的基站防盗检查,并在基站变压器挂警示牌。还对基站、机房的消防进行了检查,就一些存在的问题进行了及时整改。
在月,运维部全体人员参加了公司组织的消防培训,提高消防安全意识。
在月,主动联系厂家对二楼机房的气体消防系统进行了移交终验,使消防设施终于投入使用。
九、存在问题及不足
发生基站阻断次,其中广电光缆故障造成次、租用电信电路传输造成次、微波故障造成次、停电造成次、故障次。
今年新建站未安装动力环境监控,给维护带来很多不便,也造成不必要的损失。
有部分基站仍为单台空调工作,时间长后,影响空调寿命,
随着基站逐步增多,维护量越来越大,应急发电频繁,致使维护力量不足以及维护人才缺乏的现象更加突出。引进人才、建立新的用工制度是当前加强维护力量迫在眉睫重中之事。
部门管理不畅,有待磨合调整和适应后加以改进。
十、××××年工作计划
⒈继续抓好网络维护质量管理和科技维护水平,提高网络运行质量。
⒉完成××××年边际网站、宏站的勘站选址及前期土建电力协调工作。
⒊积极配合做好城域网、本地传输网、城区管道等工作建设准备开工建设等工作任务。
⒋按计划完成勐海生产楼建设工作。
[关键词] 数字化管理;公司主干网;信息网络机房;标准化;精细化;流程化
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2013 . 01. 022
[中图分类号] TN915.07 [文献标识码] A [文章编号] 1673 - 0194(2013)01- 0037- 01
1 引 言
近年来,随着国家信息化的大力推进,各行各业在信息领域快速发展,信息网络机房的建设管理也成为当前的一个热点。2009年,国家了《电子信息系统机房设计规范》。与此同时,中国石油编制信息技术基础设施层系列企业标准,其中《数据中心机房建设规范》用于指导中国石油总部及各企业单位数据中心机房建设工作。如何在遵循国家及企业标准的基础上,做好信息网络机房的建设、运维和管理,是中国石油乃至整个大型企业信息化中面临的重要课题。长庆油田正是在这种背景下,在网络核心机房的建设和运维中,进行了有效的尝试。
2 高效运维思路
笔者通过总结10多年10多个信息网络机房的运维经验,对国内外的最新技术的跟踪学习吸收,并进一步调研了解了若干行业信息网络机房运维管理的现状,认为,网络机房建设起初的规划十分重要,后期的运维管理也极大地决定着网络运维的效率和服务能力的持续提升,应重点关注以下几个方面:
2.1 坚持集中化管理运维的原则
大型企业大量存在信息网络机房规模小、配套设施不完善、重复建设等问题。应坚持集中统一的原则,限制小机房建设。
2.2 采用可扩展模块化的理念
据Gartner 统计,数据中心的生命周期失调,只有78%的数据中心大于7岁。如何使信息网络机房具备灵活的扩展能力,应对多变的业务需求及未来的不确定因素,是信息运维人员需要重点考虑的问题。
2.3 遵循高可用性和高效安全运行的原则
国家规范GB50174把机房分成3个等级。我们在进行信息系统的运维中,不管现在的要求是单机、冗余还是容错,都要本着发展的观念,充分考虑系统的高可用性、高效、安全运行,统筹考虑,预留扩展空间。
3 信息网络机房的建设实践与探索
“标准化设计、模块化建设、数字化管理”的理念在长庆油田的油气生产领域、管理层面都广泛地进行试点及推广,在信息网络机房的运维方面,我们进行了尝试。
3.1 在设计、标准规范方面
当信息网络机房的规模大到一定程度的时候,不论是维护的难度、人力的紧缺,还是在维护的时效性上,都面临较大的挑战。所以,要在早期就做这些方面的考虑,做到标准先行。
统一资源标识。编制信息网络机房标识规范,涉及机柜、设备、线缆(电源、光纤、网线、PCM)等方面。
统一机柜功能。一是对机柜的选型进行统一。二是对机柜的链接加固、接地、强电及弱电走线方式、PDU及配线架的安装位置及规格数量进行规范。三是对设备的安装进行统一。
按照模块化的思路进行平面布局。按照模块化的设计理念,从机房、区块、机柜3个层面进行功能划分。在机柜分配上考虑设备的冗余配置、不可预见的扩充等因素。在区域的划分上,考虑功能的类同以及连接的最小化。
3.2 在建设方面
前边谈到机房的分级,主要看由于基础设施造成的网络中断,在社会和经济上造成的损失程度进行分级。所以,信息网络机房这个基础设施的建设,要早筹划谋,为以后的发展做预见性考虑,以下几个方面就是我们在摸索中所进行的一点具体做法:
3.2.1 严格遵照国标进行专业化的装修装饰
国标GB50174-2008对机房的环境等做了详细的要求,还有其他一些相关标准化也做了要求。
3.2.2 全线考虑电源系统的冗余,确保电力供应
为做到全线电源冗余,要从市电、交流配电、UPS系统、UPS配电、列头柜、PDU、设备全面考虑冗余。
3.2.3 弱电配线坚持分级集中的原则
弱电与强电分别布线,强电采用下走线,弱电采用上走线,为避免水患等,地下电源系统不做街头转接等。弱电配线采用分级集中方式。
3.2.4 环境管理自动化
使用自动化的动力环境管理平台,从视频监测、温湿度监测、水患监测报警、门禁控制、消防报警、电源监测、电源空调监测等方面,提高机房的安防和管理水平。
近些年来,随着我国电网企业规模的不断扩大,其业务类型与日常活动也越来越复杂。为了提升电网企业的工作效率与运行稳定性,就需要对企业的运行提供必要的技术支持。因此,对电子智能数据中心的设计与运维进行一定的研究,对于企业的发展而言具有不可忽视的作用。
1 电子智能数据中心的设计原则
1.1 实用性
实用性是电子智能数据中心相关功能设计的最主要特性,电子智能数据中心的相关设备设计,包括存储设备、主机以及服务器等众多设备的设计,都应该满足实用性的基本要求,并适应企业的使用需求。同时,还应该考虑最新技术的稳定性与实用性,保证系统在应用过程中不仅要实现性能的提升与功能的拓展,还要实现稳定的运行。
1.2 安全性
对于电子智能数据中心安全性的实现主要包括三大方面,分别为硬件设施的安装、数据信息的安全以及系统应用性能的安全。数据中心要严格遵守安全性的相关原则,在最大程度上降低设备故障而造成的系统停机现象,降低企业为此付出的经济损失。与此同时,在数据中心的设计过程中,还应该增强信息安全制度的建立,提升企业内部数据信息的安全性。
1.3 可靠性
电子智能数据中心相关设备的运行应该是稳定、可靠的,其不仅需要满足企业运行过程中对于数据中心的工作要求,还要实现自身运行的可靠性。对于电子智能数据中心业务处理功能的设计不应该具有独立性,而是要保证系统整体功能的可靠性,例如:系统能否支持大容量的数据输入、能否处理复杂的业务工作以及在特殊环境下能够实现自身的运维与风险规避等,这是数据中心可靠性的具体表现。
1.4 可拓展性
电子智能数据中心的建设应该顺应时展的潮流与方向,在设计工作中,应该保证功能的可拓展性以满足业务变化的需求。例如在数据中心需要处理更多业务的时候,其可以在原有的基础上增加必要的内存与CPU等,还可以通过增加处理节点以提升数据中心的性能,而不需要对系统的整体结构进行调整,保证系统的稳定运行。
2 电子智能数据中心的设备运维措施
2.1 实现设备运维的精细化管理
要想实现对设备运维的精细化管理,就需要通过必要的先进技术对数据中心的全部环境、设备以及软件的运行情况有一个清楚的了解,即实时掌握电子智能数据中心运行的全部参数,实现企业日常业务处理的自动化与智能化,尽可能做到在危机发生前具有一定的预报,在危机发生时能够具有必要的预案,在危机发生后能够进行相关的记录与分析。而要想做到这些,就需要做到对数据中心的全面、集中控制,实现对数据中心全体设备的精细化管理。电子智能数据中心的精细化管理需要的运营数据包括环境参数、设备数据以及安全指数等。环境参数的种类数量不多,包括大气温度、空气湿度、风速以及风向等环境数据。而设备参数则是指中央空调系统、冷风机以及水塔等电网企业基本设备的相关数据,这些数据具有很大的复杂性,就以中央空调系统来说,其包括的空调设备数量就高达几十个,因此设备参数的管理数量是十分巨大的。安全参数则主要包括外来入侵监测、消防控制以及视频监视等。对于电子智能数据中心设备的精细化管理,就要实现对这些参数的全面掌握。
2.2 构建数据中心全寿命周期的管理模式
在一般情况下,电子智能数据中心的使用时间都较长,在不同周期数据中心的管理内容与管理要求也大不相同。因此,对数据中心管理阶段的划分与管理模式的确定,是管理工作开展的前提与基础。在对数据中心寿命周期进行分析时,可以适当参考国外具有丰富管理经验国家的数据中心管理模式,然后根据我国数据中心的实际发展情况,进行合理的调整与修改,以满足我国数据中心的管理需求,达到更好的设计效果。目前,我国的数据中心寿命周期的管理模式主要是从工程的设计阶段开始,到运营维护阶段结束。该种类型的管理模式相较于传统的管理模式而言具有很大的进步,传统的管理模式并未对项目使用期间的设备运维进行必要的管理,因此不具备对于设备运维的全面性。而新型的管理模式囊括了工程的全部阶段,实现了对于设备运维工作的全面管理。因此,构建数据中心全寿命周期的管理模式对于企业发展而言具有不可忽视的重要作用。
2.3 增强对于设备运维工作的整体统筹规划
电子智能数据中心是企业运行的基础,是企业日常工作的支持,能够满足企业发展的实际需求。近些年来,企业的相关部门只重视对于电子智能数据中心功能的拓展与实际问题的解决,却从未从整体角度对数据中心运维工作的质量进行必要的研究。而在日常的设备运维工作中,不仅可以利用成熟的技术、智能化的监控设备实现对电子智能数据中心的全面管理,并且对于数据中心的容量管理也可以进行一定的监控。对于容量的管理,需要对设备的数量、使用情况以及性能等数据进行全面的掌握,只有掌握了这些基础的设备数据,才能为设备运维工作的整体统筹规划奠定一定的基础。除此之外,长期的设备监控与数据搜集能够为后期的数据中心管理以及运行情况评估提供必要的数据,保证运维工作筹划的可靠性与科学性。总而言之,增强对于设备运维工作的整体统筹规划对于设备运维工作质量的提升具有不可忽视的重要作用。
3 结束语
随着电网业务的复杂化,对电子智能数据中心的设计和设备运维工作提出了更高的要求,其已经引起了电网企业相关部门与社会各界的密切关注。我们应当加大对其的研究力度,做到科学设计,保证设计的实用性、安全性、可靠性及可拓展性,并在日常的设备运维工作中,加大管理力度,做好电子智能数据中心的设备运维工作,使电子智能数据中心更好的发挥其应有的作用。
【 关键词 】 ITIL; IT服务管理;运维管理
Research and Design of an ITIL Based IT Service Management Framework
Zhou Min Chen Zhi-Hua
(China Tobacco Guangdong Industrial Co.,Ltd. GuangdongGuangzhou 510610)
【 Abstract 】 With the increasing popularity and depth of information application, information systems play an essential role in supporting business operations, while the operation and maintenance of information systems have become more and more important in enterprises. Based on ITIL best practice, along with the current situation of IT operation and maintenance management, a feasible IT service management framework is proposed in this paper, helping enterprises enhance IT operation and maintenance capability, improve the efficiency and quality of IT service, support and promote our core business.
【 Keywords 】 ITIL;IT service management;operation and maintenance management
1 引言
随着信息化应用的不断普及和深入,信息系统已成为支撑企业运作不可缺少的一部分,为了提升自身竞争力,各大企业都投入了大量资金在IT建设上,建立了各种信息系统和各种必要的硬件设备和网络设施,这些软硬件设施成为了支撑企业运作不可缺少的部分。随着企业越来越依赖信息系统,信息系统发生故障所带来的负面影响也越来越大,传统粗放式的IT运维管理已不能满足企业全面管理信息系统的要求,缺乏有效的运维管理已成为影响信息系统应用效果的一个主要瓶颈。
对于如何进行有效的IT运维管理,世界上许多政府部门和企业进行了长期的探索和实践,逐渐形成了一种新的IT运维管理方法论:ITIL(IT Infrastructure Library,IT基础架构库),ITIL是从大量企业的IT运维服务管理经验中总结出来的最佳实践,它以流程为导向、以客户为中心,通过整合IT服务与企业业务,提高企业的IT服务能力和水平。ITIL可引导组织高效和有效地使用技术,让既有的信息化资源发挥更大的效能。
2 IT运维服务管理现状
目前,很多企业都投入了大量资金进行信息化建设,但是长期持续建设的惯性使企业普遍存在“重建设、轻运维”的现象,缺乏规范化的运维管理流程。其实无论是硬件还是软件,从整个生命周期来看,系统的运行维护阶段占整个时间和成本的约70%至80%,所以运维阶段是IT生命周期中的关键阶段,如果IT的运维管理做的不好,那么这些花费大笔投资建立起来的系统将无法带来预期的效益。
因为缺乏规范、高效的运维管理体系,导致企业普通存在诸多问题。
(1) 被动的运维工作模式。运维人员就像“消防队”一样,处于被动的服务状态,不知道什么时候、什么地方会出现“火情”,只有当问题已经发生后,才进行紧急处理,导致服务质量不高,甚至影响正常的业务运作。
(2) 缺乏对运维工作的统一管理和监督。在处理问题时,没有对问题进行记录和分类,无法跟踪和监控问题的处理情况,难以对已发生的问题进行分析,从而采取措施避免同类问题的再次发生。
(3) 没有知识和经验的共享和积累。由于缺乏对运维过程的记录,使得问题的处理方法只有当时的维护人员掌握,相关经验难以积累和共享。
(4) 缺少量化的绩效考核指标。在运维工作中没有建立量化的考核指标,运维人员的工作绩效很大程度上依赖于负责人对他的主观印象,无法准确考核运维人员的绩效,使得工作的积极性得不到提高。
因此实现运维管理从被动式服务转变为主动预防服务,以流程贯穿整个运维管理过程,切实保障系统可靠、稳定、高效地运行是目前企业信息化建设急需解决的问题。
3 ITIL发展及技术概述
在20 世纪80 年代中期,英国政府为了提高政府部门IT服务的质量,启动了一个项目来开发一套规范化的、可进行财务计量的IT资源使用方法,该项目的最终成果就是ITIL V1.0版本。在2000年至2003年,英国商务部(OGC)总结了IT服务管理的最佳实践经验,推出了ITIL V2,它主要包含六个模块:服务管理、业务管理、IT服务管理实施规划、应用管理、安全管理和ICT基础架构管理。在2007年,ITIL V3正式,它整合了V1.0和V2.0的精华,并融入了IT服务管理领域当前的最佳实践,并首次引入了生命周期的概念,通过PDCA模型(Plan-Do-Check-Act),持续不断地循环改进IT服务,从而保证ITIL持续的生命活力,ITIL V3框架如图1所示。
ITIL V3通过引入“生命周期模型”,将各模块有机地贯穿在了一起,以服务战略为指导,通过服务设计、服务转换和服务运营的实施,并借助持续服务改进不断完善整个过程,使IT服务管理过程整合为一个良性循环的整体。
4 运维服务管理体系框架设计
根据目前IT运维工作情况及存在的问题,本文在ITIL理论的指导之下,设计了IT运维服务管理体系,体系的总体框架如图2所示。
IT运维服务管理体系主要分为四个部分,分别是运维管理平台、数据管理平台、运维支撑平台和监控管理平台。
4.1 运维管理平台
运维管理平台实现了运维管理的主要流程和管理职能,通过对运维过程的记录和处理,及时跟踪运维处理情况,实现运维的闭环管理。该平台最核心的功能主要包括事件管理、问题管理、变更管理、管理、配置管理和服务台等。
(1) 事件管理。事件是指可能引起或已经引起IT服务中断或服务质量下降的活动,如软硬件故障、网络中断等。事件管理就是当事件发生时,对事件进行记录和归类,并指派适当的IT人员处理事件,同时对事件处理的全过程进行跟踪和监督,尽可能在最短时间内解决故障,恢复系统的正常运作,从而减少事件对业务运作的影响。
(2) 问题管理。与事件管理关注快速解决故障不同,问题管理主要关注的是找出并消除引起事件的根本原因,从而避免事件再次发生。在问题管理中首先将之前重复发生过的或者非常严重的事件升级为问题,然后通过对该问题的调查与分析,找到问题产生的根源,从而制定适当的解决方案防止该问题的再次发生。
(3) 变更管理。为了适应业务的变化或者解决当前系统问题,需要进行必要的系统变更。但是在错综复杂的IT环境中,系统变更可能会产生新的问题,从而影响整个IT系统运行。变更管理就是通过对所有变更请求的记录、分类、评审和筛选,在充分考虑变更风险的基础上制定变更实施计划,从而确保变更的有序进行,降低或消除因变更所造成的影响。
(4) 管理。与变更管理关注变更风险不同,管理主要关注变更的实施。管理通过项目规划的方式来实施IT系统的变更,确保只有经过测试的、正确无误的软硬件版本才能到运行环境中,保证运行环境的安全可靠。
(5) 配置管理。配置管理将IT环境中所有配置项(硬件、软件等)的信息以及配置项之间的关系记录到配置管理数据库中,为事件管理、问题管理、变更管理和管理提供了软硬件的详细配置信息,从而为快速解决事件和问题、评估变更风险、制定策略提供了依据。
(6) 服务台。服务台是用户和IT部门沟通的桥梁,它将事件管理、问题管理、变更管理、配置管理和管理都整合到以服务台为核心的交互平台上,通过该平台来集中处理所有的服务请求,使用户和IT运维人员能通过该平台对服务请求的整个生命周期进行监控和沟通,同时也为衡量运维绩效提供了数据支撑。
4.2 数据管理平台
该平台主要是存储和管理IT运维的相关数据,包括运维知识库、配置管理库、事件问题库和监控数据库。
(1) 运维知识库。IT人员将运维工作中遇到的问题进行归纳整理,把经过实践证明正确的、成熟的解决方案录入到知识库中,当再次处理同样问题时,系统将自动从知识库里搜寻出历史解决方案和建议。通过知识库,能够不断积累运维工作的实践经验,从而达到经验共享和快速解决问题的目的。
(2) 配置管理库。详细记录了系统软硬件的配置信息以及相互的关联关系,通过配置管理库,真实的反应了IT基础架构的配置情况,为事件管理、问题管理、变更管理和管理的运作提供支持。
(3) 事件问题库。记录事件和问题的详细信息,包括处理的交互过程、详细的解决方案以及相应的附件等,从而实现对事件和问题的跟踪和监督,并出具相关的统计报表,使用户可以按照不同的维度,对事件和问题进行统计分析。
(4) 监控数据库。将监控管理平台中采集到的软硬件性能数据统一记录到监控数据库中,并设置相应的报警阈值,当性能超过阈值时,通过短信方式通知相关的IT人员。
4.3 运维支撑平台
运维支撑平台用于支撑运维管理活动,如通过工作流来实现运维流程的自动化处理;通过报表引擎来设计各种主题报表;通过日志管理来记录系统中所发生的所有行为;通过权限管理来为用户分配不同的权限;通过接口管理来管理与外部系统的接口。
4.4 监控管理平台
监控管理平台通过集成各种监控工具对机房环境、服务器、网络、数据库和应用系统的运行状况进行实时监控,如服务器的CPU、内存和磁盘空间使用情况;机房的温度、湿度和UPS情况;网络设备的接口利用率、数据流量和丢包率等。
通过监控管理平台的建立,用电子巡检方式代替了人工巡检,大大缩短巡检周期,提高了工作效率。同时为性能指标设定不同级别的报警阈值,当性能超过阈值时,系统将自动在运维管理平台中创建一个事件,详细记录报警信息,并通过短信形式通知相应的IT人员,改变以往被动服务的局面,提高系统无故障运行时间。
5 总结
本文首先对目前企业运维工作状况进行了分析,归纳出目前存在的主要问题。
然后在深入研究ITIL最佳实践的基础上,设计了一套基于ITIL的运维服务管理体系,使运维管理从传统的单一、被动和低效的管理方式逐步转变为统一、主动和高效的管理模式,全面提升运维管理水平。希望本文可以对ITIL在企业的推广起到一个抛砖引玉的作用。
参考文献
[1] 胡佳.基于ITIL的ERP运维管理模式的研究[D].上海:复旦大学,2008.
[2] Jan Van Bon(荷兰)著,章斌译. IT服务管理—基于ITIL的全球最佳实践[M].北京:清华大学出版社,2006:25-26.
[3] 孙强,左天祖,刘伟.IT服务管理:概念、理解与实施[M].北京:机械工业出版社,2004:13-14.
[4] 陈宏峰,张亮,黄新峰,黄爽.翰纬ITIL V3 白皮书[M].上海:翰纬 IT 管理研究咨询中心,2007:14-15.
[5] Jan Van Bon(荷兰)著,章斌译.基于ITIL的IT服务管理基础篇[M].北京:清华大学出版社,2007:37-38.
[6] 陆康明.基于生命周期的IT服务管理研究[D].上海:同济大学,2008.
作者简介:
[关键词]信息技术;商业银行;信息系统;一体化管理
中图分类号:TP308;TP309 文献标识码:A 文章编号:1009-914X(2015)45-0068-01
前言
2014年7月22日网上报道了一则关于重庆农商行数据中心发生火灾,直接损失高达亿元的新闻,新闻中称重庆农商行的数据中心发生重大火灾,导致直接损失上亿元,并称该事故主要是因为机房电气系统着火导致数据中心被毁。后根据通报,重庆农商行总行扩展机房突发线路电气故障,银行在当地消防部门的帮助下快速的解决了问题,切换到灾备中心运行,没有造成巨大损失。当作者偶然听到这则新闻时,便意识到问题的严重性,我们不妨假设确实存在着这样一种情况,火灾导致机房设备烧毁,导致银行的数据中心被毁,那么带来的问题将极其严重,直接的关系到每个银行用户的利益,数亿元的经济数据将会丢失也会给银行带来致命的打击,所以银行数据中心的安全性成为了银行的重中之重,为此我们需要分析银行数据中心基础设施的运维管理,对其中的内容和完善措施进行详细的讨论。
一、银行数据中心标准化管理大致内容
2014年8月19日,中国数据中心工作组《数据中心运维管理技术白皮书》正式在第二届内蒙古“草原英才节”上,白皮书的填补了行业数据空白,使得数据中心运维管理技术正是走向标准化和制度化,从的《数据中心运维管理技术白皮书》中我们不难看出数据中心运维管理内容大致有数据中心ITIL运维框架、运维组织架构、基础设施运维之监控系统、基础设施运维之日常工作、基础设施运维之应急处理、网络运维、客户服务、现场运维之基础工作、基础及应用平台运维、运维管理工具、运维质量保障体系、数据中心运维相关认证、运维之行业实例、能耗测评、运维之能效管理、验证测试、运维之供应商管理等,这些内容的让人们更加深入的认识了数据中心运维管理的流程、运维管理所需要的工具、运维管理所需要的技术、运维管理应急处理等知识。根据《数据中心运维管理技术白皮书》中提到的内容,银行数据中心采用这种管理模式和上述提到的内容大致相同。
二、银行数字中心一体化运维管理完善的措施
(一)建设规划的架构
架构设置主要是指“一部两中心”管理架构和“两地三中心”灾备架构建设,针对前者,银行内部要形成一个相互配合、相互制约、责任明确职能部门体系,如银行统筹规划部门的职责是负责银行的中长期技术方面的规划,制定出银行信息系统项目建设计划、资源分配计划、信息化体系建设等,并负责银行所有信息系统项目的安全监督和质量监督;针对后者,银行必须要按照监管部门的要求建立起“两地三中心”灾备架构,即同城和异地数据灾备中心,即便是某地出现如火灾、地震类的灾害导致一个地方的数据中心破坏,那么备份的数据中线也可能在短时间中替代被损坏的数据中线继续为社会大众提供服务,确保银行用户的经济数据的安全性。
(二)建设规范的制度
银行内部要想实现数据中心标准化运维管理首先得有一个科学规范的制度支持,所以建立规范的制度是极为重点的基础和前提。运维管理规范主要包括规范制度、规范流程和规范操作,规范的制度体系主要有日常数据中心管理工作制度、日常数据中心维护制度、数据中心应急制度、数据中心岗位规范职责等。规范的流程可以借鉴ISO20000等国际性的管理标准,从而在银行内部全面的实现技术、人员、流程标准化的统一协调管理,建立起主动的数据防范安全生产体系。操作规范根据数据中心的特点制定出一个科学完善的操作规范,并制定成册,定期的对人员进行基础操作培训和考核,尤其是关乎数据安全性的操作要重点提醒,以最大化的减少人为误操作。
(三)建立起应急管理体系
随着科学技术的发展,信息技术的普及,加上网络环境日益复杂,网络安定度不断下降,处于网络中的银行数据中心不仅面临着网络方面的风险,再加上银行业务日趋复杂,银行规模不断扩大,外部环境日趋复杂也使数据中心的安全运行产生不良的影响,这些影响很容易导致数据中心出现或多或少的问题,因此建立起常见的问题应急处理措施能够极大的减少系统故障时间,可以具体从三个方面实现快速处理:首先是快速响应,其次是快速定位,再次是快速处置,一旦出现问题,银行所有的技术部门应当快速的达到规定岗位,及时的对问题进行定位,根据问题制定针对性的处理方案,以确保在最短时间中处理问题,最短时间中恢复数据中心正常运作。
(四)加强日常维护
为了确保银行数据中心能够安全稳定的运营,实现运维管理高效化,加强数据中心日常维护是必然的措施,主要重点关注四个方面的内容:首先是需要加强计划统筹工作,将银行内部的例行维护以及变革都纳入到窗口内实行,统筹计划部门也需要制定出完善的日常维护技术,维护部门严格按照维护计划实施维护;其次加强投产和变革风险控制,对银行中的新产品、新业务等容易出现风险的部分进行严格控制,并建立起一套完善的控制制度;再者是突出重点维护,针对重要活动、节假日、交易高峰期等一些较为特殊的时期进行重点维护,做到重点保障和控制;最后是银行内部推广运维自动化,在银行内部针对运维特点建立起预自动化机制,如故障问题进行实时监控,对出现的问题及时报警,维护系统自动化维护信息等。
(五)加强一体化建设
银行内部加强一体化建设主要从以下五个方面来进行:一是需要根据银行的业务特点建立起一体化流程规范,明确方法、步骤、要求和流程,提高效率,二是建立起一体化调度体系,统一银行所有生产调度,切实建设银行经营风险,三是建立一体化应急机制,对银行信息系统出现的问题及时的进行反馈,高效的调度人力和物力及时处理问题,四是建立一体化平台,对运维管理中的问题及时的反馈到统一平台,再统一制定处理措施,并保持相关信息作为未来的参考,五是建立一体化质量控制,确保银行各环节的生产质量。
三、结束语
总体来说,银行的数据中心是银行的命脉,一旦数据中心出现故障或问题,那么不仅会给银行带来严重的损失,还给用户带来严重的损失,为了切实的减少数据中心运行的风险,实施一体化运维管理能够做到提高管理效率,做到及时响应,处理各类银行日常经营过程中产生的问题,有利于银行健康发展。
参考文献:
[1] 肖力.数据挖掘技术在大型商业银行数据中心的应用[D].复旦大学,2009.
[2] 奚力铭,彭克坚.关于商业银行云计算数据中心的探讨[J].中国金融电脑,2014,(7):26-30.
[3] 毛宇星.商业银行云计算数据中心实施路径及策略[J].中国金融电脑,2014,(7):11-14.
[4] 沈烨F.商业银行数据中心的无线网络安全解决方案[J].中国金融电脑,2006,(1):23-25.
关键词:安全播出 供电系统 发射系统 运维与技术管理 规范
安全播出是每个发射台站的生命线,根据《广播电视安全播出管理规定》,县级发射台应达到三级保障的基本要求,本文探讨县级发射台站在安全播出保障工作中规范做法。
供电系统安全播出要求
《广播电视安全播出管理规定细则》规定,县以下转播台应该达到三级保障要求,即应该接入两路外电,如只有一路外电,必须配置自备电源;三级播出负荷供电应设两个以上独立低压回路,并具备自动或手动互投功能;调频、电视发射台的发射控制设备和信号源设备应采用不间断电源UPS供电,UPS电池组后备时间必须满足实际负荷。三级保障应配置信号切换、分配等设备,并在相应节点配置应急跳线端口。
发射系统要求
县级发射台站应根据省级以上广播影视行政部门批准的频率、功率等参数配置发射机和天馈线系统。电视发射机应按1+1方式配置,调频发射机应按1+1或N+1方式配置。电视和调频天馈线系统的配置应符合《电视和调频广播发射(转播)台(站)设计规范》(GY 5062)的规定,应该采用双馈结构,并配备相应的倒换装置。天线塔桅杆的配置应符合《钢塔桅结构设计规范》(GY 5001)的规定。机房温度、湿度、防尘、静电防护、接地、布线及外部环境等应符合《中、短波广播发射台设计规范》(GYJ 34)、《电视和调频广播发射(转播)台(站)设计规范》(GY 5062)的有关规定,满足设备安全运行要求。机房应采取必要的防鼠、防虫等措施。防护围墙、通风采暖或空调系统、防雷接地系统应符合《电视和调频广播发射(转播)台(站)设计规范》(GY 5062)的有关规定。
运维与技术管理
县级发射台站应遵循《广播电视发射台运行维护规程》(GY/T179以下简称《运维规程》)相关规定,按照广播影视行政部门批准的节目、频率(频道)、功率及其他技术参数满时间、满功率、满调制地发射广播电视节目。
无线发射台安全播出年度运行指标应满足三级,停播率≤180秒/百小时,即可用度≥99.95%。
机房管理制度应包括机房出入人员管理、机房禁止性规定等;值班及交接班制度应包括交接班要求、值班内容、纪律要求、监听监看要求等。安全制度应包括技术安全、信息安全、施工安全、消防安全规定等;供配电管理制度应包括用电规范、操作规范、安全规范、主要运行参数和关键设备运行情况巡查规定等;播出变更管理制度应包括播出变更的启动条件,播出变更前的各项准备措施,播出变更的检查确认规定等;事故报告制度应包括不同等级事故的报告原则、报告内容(事故原因、事故时长、影响情况、处理过程等)、报告要求等;维护检修制度应包括维护检修的项目和周期、检修规范、责任分工、重要数据的存储与备份规范、维护记录规范等;设备管理制度应包括设备管理责任分工、日常管理要求等;技术档案管理制度应包括技术档案的范围、分类明细、存档要求、出入库管理规定、销存时限规定等。
执行安全播出规范
县级发射台站应遵循《运维规程》的规定,建立“计划科学、分界明确、操作范、管理严格”的维护机制,做好各技术系统日常维护以及大修、更新改造等工作。应参照《运维规程》的相关要求,针对不同系统和设备分类制定周检、月检、季检、年检等周期性的维护计划,并按计划组织实施;维护工作应做好记录并存档。
预案流程:检查应急预案和操作流程的制定和演练情况,考核值班人员的掌握程度,评估各项应急预案和关键操作流程的合理性和可操作性。
文件资料:检查值班日志、运行记录、播出运行文件、维护计划、维护记录、安全播出报表、安全播出事故调查分析报告、设备器材档案等资料,评估技术资料的管理水平。
关键词: 云计算;数据中心;虚拟化;系统迁移
0 引言
云计算是基于互联网、通过虚拟化方式共享资源的计算模式,通过互联网上异构、自治的服务为个人和企业用户提供按需即取的计算。通过引入云计算平台,可以极大降低企业IT建设和运营维护成本,同时降低能源消耗。
全球及国内云计算产业正在蓬勃发展,石油行业云计算产业发展也很迅速。中石油将云计算列为十二五重点项目,云技术平台建设项目于2011年3月启动,新疆油田、燕山石化、长庆油田等企业均建设了云计算平台,极大地提高了本单位的应用系统效率和数据安全性,大幅降低了运维工作量。
1 大庆油田信息化现状及存在的问题
经过多年发展和建设,大庆油田的信息化获得了长足发展,支撑了油田各项业务的正常运转,助力大庆油田的稳步发展,但仍存在很多问题。随着大庆油田的快速发展,现有信息化基础设施将不能很好地满足将来的业务需求,表现为以下几点。
大庆油田勘探开发系统需要部署高性能计算环境,这些软硬件系统分散地部署在研究院、采油厂和各服务公司,各单位只凭借自身条件无法满足地震处理和解释、油藏研究等业务需求,急需将软硬件资源进行整合,实现高效协同。
目前,各二级单位自建的应用系统的建设模式采用应用系统与硬件一对一的部署,通常按照应用系统最高负载配置硬件,硬件利用率低于30%,大部分时间处于闲置状态,这些价格不菲的硬件,消耗了大量的电力资源。另外,由于各采油厂重复建设了部分功能相同、业务类型相近的应用系统。
目前,若要建设应用系统需要经过立项、审批、招标、采购、安装等诸多环节,往往需要半年甚至更长时间才能完成部署。这种建设模式显然已不能适应当前需求变化频繁、随需即用的业务系统。
大庆油田各应用系统分布广、数量大、类型多,有些系统故障率较高,运行不稳定,这导致了运维管理的困难,运维成本居高不下,应用系统的稳定度降低,应用系统经常中断。
2 云计算中心建设方案
2.1 总体思路
根据大庆油田的信息系统现状,云计算中心首先要完成云计算平台的建设,实现各种软硬件资源的集中部署,网络环境及备份中心的搭建,然后完成应用系统的迁移和整合升级,建设统一的运维队伍,实现专业化运维服务。
云计算中心建设是一项极其复杂的系统工程,要按照先试点后推广、边研究边应用滚动发展的模式。先期在试点单位进行云计算建设,进行试点验证,后期在全油田范围内推广,最终建设的云计算中心。
2.2 系统架构设计
大庆油田云计算系统架构由五个重要部分构成,分别为基础设施层、平台层、应用层、管理层、用户访问层。
基础设施层包括机房、数据库一体机、应用服务器、网络系统、存储系统等物理基础设施。平台层为用户提供对资源层服务的封装,包括数据库和中间件服务。应用层为勘探开发研究人员、生产操作人员、管理决策人员、信息专业人员提供的应用软件。管理层提供对基础设施层、平台层、应用层的管理功能。用户访问层提供用户使用云计算服务所需的远程桌面或Web的访问接口。
2.3 物理部署方案
2.3.1 机房部署方案。将云计算中心划分生产区、管理区、测试区、备份区。同时要保证机房的空间面积,提供冗余的电力系统,配置全面的监控系统,提供良好的空调系统,严格的安保系统和灵敏的消防系统。
生产区:放置生产所需的服务器、存储、网络等设备。通过部署高性能计算服务器及GPU的图形服务器,满足研究人员对于地震资料处理、地震反演、油藏数值模拟、地震体解释、地质建模等计算密集型专业研究类系统的需要;部署应用服务器,通过服务器虚拟化技术承载大庆油田地质综合研究、办公应用、生产管理、油田企业信息门户、GPS车辆管理系统等应用系统;部署数据库一体机承载勘探开发核心应用数据库。
管理区:实现对服务器、存储、网络的系统监控、资源调配、报表提供等服务。
应用测试区:完成应用上线前的应用系统生产环境测试。
备份区:实现核心业务及数据的备份。
2.3.2 骨干网络技术方案。按照云计算部署模式,各应用系统和数据集中部署到大庆油田云计算中心,小队用户通过骨干网络访问应用系统。云计算中心的骨干网络设计要满足高带宽、无拥塞、高可靠性等要求,骨干网络采用双归属方式建设,网络拓扑如图1所示。
云计算中心网络采用扁平化、双核心结构,核心节点之间采用高端路由器以40G带宽链路互联,核心交换机要有大量的数据交换能力和万兆端口的接入能力。汇聚节点部署在各通信分公司,为采油厂、矿、小队提供数据的网络汇聚。汇聚节点以双归属上联核心节点路由器。
2.3.3 容灾备份方案。考虑到大庆油田云计算中心的数据及应用的安全性,需对云计算中心建设备份中心对重要的生产数据和关键应用进行异地备份,通过云计算中心与备份中心之间的万兆光纤实现数据和应用的快速备份。
3 总结及展望
大庆油田云计算中心建成后将对保障大庆油田的持续稳产起到重要作用,获得较为显著的效益。包括以下几个方面:可以提高大庆油田软硬件资源的利用率,大幅减少硬件数量,降低电力总能耗,使系统运维人员大大减少,节省设备采购、部署、运维成本;通过集中部署高性能计算资源,更好地支持了油田的专业研究的发展;通过部署云桌面,实现移动办公、在线工作,提高工作效率;通过建立统一开发平台,降低软件开发难度,缩短系统建设周期;建立统一运维管理流程,实现油田信息资源的集成化、可视化、透明化、自动化管理,提高运维管理水平,提高应用系统可靠性及用户满意率。
参考文献:
[1]纪荣艺、周英操、樊洪海等,石油集团企业的云计算战略[J].信息技术,2011,3:18-21.
[2]雷万云,云计算战略企业信息化建设策略与实践[M].清华大学出版社,2010,12.
[3]吴吉义、平玲娣等,云计算:从概念到平台[J].电信科学,2009(12):23-30.