机房断电突发事件应急方案

为确保机房安全与稳定,有效处置突发事件,建立统一指挥,职责明确,运转有序,反应迅速,处置有力的应急处置体系,最大限度降低突发事件的危害,保障机房工作正常运作,特制定本预案.应急处置工作原则:统一领导,统一指挥各司其职,整体作战,发挥优势,保障安全.对所发生的突发性事件,机房值班人员了解详细情况后,应马上向领导汇报.为保证网络机房的安全,在发生影响安全的情况时得到及时处置,特制定本预案。

总述

1)、保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产安全为前提,然后进行故障的解决;

2)、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备尽快诊断和维修;

3)、故障应急人员高度负责的原则,当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理故障,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时,及时向领导汇报。应急人员不可互相推卸责任,如因特殊情况,确实无法处理故障,部门领导必须安排好其他人员处理。

4)、尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。

1、停电

立即到机房查看电路情况,设备运行情况并及时询问所在机房停电原因,什么时候可以恢复;过程中应及时通知上级和网管中心,以便上级在关键时刻做些指导性的指示,让网管着重监控该机房信息。如果断电时间过长,联系当地发电厂家来发电。

比如一路电突然断电后,首先要先查看有接到一路电的设备有没有转换到二路电,运行有没异常,如果因设备加电重启后导致业务中断,要马上找出哪条业务中断并通知上级和数据组,配合他们恢复业务。

市电恢复,第一时间通知网管中心,询问设备运行有无异常;然后,通知区域经理,告知停电相关信息(停电时间、恢复时间、停电原因),写故障报告,上报给相关领导

附录:

1、杭州物业电话:徐×××:1373227XXXX

2、杭州电工电话:阮先生:1381914XXXX

3、宁波电信局电话:孙先生:1300736XXXX

4、嘉兴电工电话:暂无

2、UPS故障处理应急预案

UPS出问题会影响接在UPS上的设备的供电,由于有些服务器是单电,只接UPS,会导致通过服务器的链路直接中断,应马上通知上级,联系数据组,想办法先把断电的设备加上电,和数据组配合把业务恢复。查看UPS情况,初步判断是什么问题,根据情况看机房能不能解决。不能解决就告知上级。

(比如UPS坏了,首先找出哪些设备与UPS连接,把它转移到一路电或二路电市电上,过程中通知上级,联系数据组,转移好电源后配合数据组把业务恢复,再查看UPS情况,初步判断是什么问题,根据情况看机房能不能解决。不能解决就告知上级)

当UPS故障发出告警声时该如何处理?

A、过温 : 请确认UPS现场环境是否温度过高;UPS的进风口是否被其他杂物挡住。

B、输出电压异常 :请确认接在UPS 输出端的负载是否有短路,可卸掉负载,重新开机。

C、电池电压或充电电压异常 :请确认UPS电池是否有故障或是外接电池故障,以及充电压是否过高。

D、超载 :请减少UPS 输出端的负载,再重新开机。

如何还是不能解决,联系技术支持和跟领导汇报通知。

技术支持:陈先生 1803733XXXX

3、发生火情情况时的处置

1)、定期检查灭火器,有无过期,如果过期要及时跟领导反应,做相关处理;

2)、机房人员要时刻保持警惕,熟练掌握灭火器的使用方法,密切关注机房设备的运行情况;

3)、发现机房内有异常气味时,要认真仔细地检查机房内的设备设施的各个部位,直到查明原因,确信无危险情况时为止。事后要将处理情况报告上级领导;

4)、发现机房有烟雾时,对烟雾产生处进行检查,尤其要注意检查活动地板下面电缆是否有起火冒烟的情况。事后要将处理情况报告上级领导;

5)、发现机房出现火焰时,首先要切断电源,根据火焰的大小通知消防部门,同时使用灭火器,采取一切措施控制和扑灭火焰。

4、空调发生故障应急方案

发生机房空调故障,会使机房的温度升高,危害设备正常运行。所以,发生此类故障后,要积极维修,如果一时之间无法修复,必须采取应急措施,保障机房环境符合要求。

1)、机房局部设备温度升高过快或过热的处理方法

首先,将此设备的机柜门打开,让热空气充分散出,也可以用电风扇对此设备吹风,加快散热速度,购买比冰块,放在大盆里,置于局部散热部位,利用冰块融化吸收热量;

2、联系空调售后,技术支持,相关联系方式暂无。

5、链路中断

发现链路中断,应立即告知上级,要了解整条链路所走的通道和与设备相连的端口,切记在解决问题链路时不能影响正常链路。联系数据组配合他们做一些分析:链路可能出问题的地方,找到问题后应准备解决问题所需的物品。

6、短路

如果电短路首先关闭短路设备的电源,查看短路原因,通知电工过来并报告上级(如果短路起火首先要使用二氧化碳、干粉灭火器灭火)检查线路和设备是否因短路受到影响,消除隐患。查看机房设备是否运行正常。

时间:2013年11月15日星期五