数据中心基础设施管理运行维护流程

数据中心基础设施管理运行维护流程。设备是数据中心基础设施的组成子集,对设备的维护是保障基础设施稳定运行的重要措施。设备维护的工作主要包括维护流程的制定、预防性维护工作的执行、维护档案的管理和故障的处理几方面内容。

DCIM(数据中心基础设施监控管理)系统是对数据中心资产设备,资源设备运行状况的进行全面监控和管理,包含基础设施监控和基础设施管理两大功能模块。通过采集设备、传输设备和管理设备等,DCIM提供一个全面的管理平台,对数据中心资产设备和场地基础设施进行统一监控、科学管理、全方位展示。

数据中心基础设施管理运行维护流程。设备是数据中心基础设施的组成子集,对设备的维护是保障基础设施稳定运行的重要措施。设备维护的工作主要包括维护流程的制定、预防性维护工作的执行、维护档案的管理和故障的处理几方面内容。

运行维护流程是设备维护工作的指导和依据,数据中心管理者首先要保证各维护流程的正确性、完整性和全面性,同时通过反复的培训和演练使运维人员对流程充分熟悉和理解,并在实际工作中严格执行。

运行维护流程通常包括三个主要类别:标准操作流程(SOP)、维护操作流程(MOP)、应急操作流程(EOP)。

1、标准操作流程通俗地说就是设备的开机、关机操作步骤,对于数据中心的任何一个型号的设备都必须有SOP。这里值得一提的是,同类型的设备可能有不同的型号,比如空调可能包括制冷量60KW和80KW两种,对于不同型号的设备开机、关机的操作步骤可能不同,所以SOP应该按照型号的不同分别编写。

2、维护操作流程包括了设备的维护、保养、预防性巡检等流程内容,一般情况下MOP会包含SOP的条目,因为不论是维护、保养还是巡检,常常需要进行开机、关机的操作。对于主设备,每个型号都要有SOP和MOP;辅助设备(阀门等)可以分类定义,每类有单独的SOP和MOP。

3、每个数据中心都至少应该有7~10个应急操作流程(EOP),主要呈现在断电、空调失效、火灾、防汛、安防、信息安全等方面。当数据中心有异常情况发生时,往往是多系统、多专业联动反应,所以在平时的培训和演练中,需要多个应急预案交叉启动,为应对实际中可能出现的场景做充足准备。

本文来自信息化观察者网,转载请注明出处。

 

欢迎加入东西智库微信群,专注制造业资料分享及交流(微信扫码添加东西智库小助手)。