又一机房失火,数据中心为应对火灾如何做好防范?

前几天,电影《烈火英雄》上映。烈火无情,英雄无畏,跟这部电影相关的话题当天迅速上了热搜。这部影片不光让我们意识到火灾的无情,更警醒我们应该注意防范火灾。数据中心也不例外。

前几天,电影《烈火英雄》上映。烈火无情,英雄无畏,跟这部电影相关的话题当天迅速上了热搜。这部影片不光让我们意识到火灾的无情,更警醒我们应该注意防范火灾。数据中心也不例外,在大多数人的印象里一定会认为数据中心和火灾没有太大关系,因为数据中心里除了电子设备外,并没有太多易燃物品,再加上数据中心具有完善的消防监控系统,认为就算有些火灾隐患也可以及时处理。实际恰恰相反,数据中心却成了火灾的高发行业。机房的设备密度越大,散热量越低,一旦发生火灾就可能是一场毁灭性的灾难。

又一机房失火,数据中心为应对火灾如何做好防范?

一、盘点数据中心火灾案例

2018年11月25日,韩国三大电信运营商之一KT位于首尔市中心的大楼发生火灾,事故原因为地下电缆隧道起火。火灾烧毁16.8万股电话线和220套光缆。由于通信设备受损,此次事故导致韩国的警局、医院、金融等社会基础设施被迫停转。直到次日普通电话与报警系统依然处于瘫痪状态。

又一机房失火,数据中心为应对火灾如何做好防范?

2018年8月,东京某建筑发生火灾。据悉该建筑为建设中的亚马逊AWS东京数据中心。警方表示起火是由于聚氨酯保温材料被乙炔气火炬上落下的火花引起。大火燃烧了八个小时,导致五人死亡,五十人受伤,烧毁了大约三分之一建筑物。

2017年4月4日,北京邮电大学网络数据中心突发火灾。起火原因系UPS蓄电池组故障引起,UPS电池中部西侧位置烧坏,接报后学校迅速切断了电源。由于北邮的网络信息中心机房是北京多所高校的校园网上游节点机房,此次起火导致包括中国政法、北京理工、北航等多所北京高校网络崩溃,至6日6点网络接通,教育节点恢复。

又一机房失火,数据中心为应对火灾如何做好防范?

2015年10月13日,微软Azure上海数据中心发生故障,据悉故障由服务器所在机房着火断电引起,导致12日晚间21起至13日下午5点期间Azure基础设施离线无法提供正常服务,东部Azure服务处于瘫痪状态,受影响的用户包括金融、互联网、房地产、教育等多个行业。

2014年7月20日,重庆农商行数据中心发生火灾,起因为该行总行扩展机房突发线路电气故障,导致电气系统着火。该行公告称起火并未对机房设备造成大影响,但网传直接损失达一个亿。

二、数据中心起火常见原因

数据中心设备众多,功率大、耗电量大;机房线缆多、布线复杂,这些都是数据中心容发生火灾隐患的原因。数据中心常见引发火灾的故障有以下几种:

1、UPS系统及后备蓄电池组引发火灾

电池着火后,烟雾迅速蔓延整个机房(严格意义来说UPS电池不能和机房的设备在一起,但是很多单位因经费和空间限制而放在了一起),即使是不在一个机房,因通道连通,烟雾也会迅速占领机房。

2、负载过大

机房内设备部能满足用户需求,在机房加设备轻而易举,但是线缆的负载不是轻易改造的,这样就造成线缆负载大,过热引起火灾。

3、空调设备引起的火灾

空调设备是机房不可缺少的设备,而空调的电加热量、电加湿器又常常会引起火灾。如电加热器在风机损坏或风机关掉后,电加热器的热量没及时散发出去,使周围温度剧烈上升而造成火灾。电加湿器在水蒸发完后得不到及时补充,也会造成火灾。

4、老旧设备不及时更换

特别是线缆长时间高负载运行,再不及时更换线缆,很容易使线缆绝缘层高温熔化,短路引起火灾。

5、高温、多雷雨天气

除了常见的电气火灾之外,在高温、多雷雨天气等情况下也可能引起机房起火。雷电放电时所产生的电磁效应,能产生高达数十万伏,甚至数十万伏的冲击电压,足以烧毁电力线路和设备,引发绝缘击穿,发生短路引发火灾。雷电放电时所产生的热效应、静电感应及电磁感应都可能引发火灾。

6、火灾蔓延至机房

数据中心其他位置起火蔓延至机房。另外还要注意的是,火灾不一定只是在机房里引发的,它可能来自数据中心的其他区域。由于机房与其他建筑之间的距离较近,或与其他用途房间同在一幢建筑中,在其他建筑或其他用途房间起火时,火势通过机房外部的围护结构、门窗及通风管道蔓延至机房引起机房内火灾。

三、如何防范数据中心火灾

1、选用冷通道系统,提升数据中心散热能力

为了解决企业数据中心机房设备发热密度高,电力能耗大,机房和机柜空间不足,存在局部热岛冷热空气直接混合等问题,满足数据中心的散热需求,减少冷量的浪费,数据中心使用冷通道系统不仅能在很大程度上提升数据中心的散热能力,而且可以充分利用机房与机柜空间。

2、防火材料的使用能减小、延缓火灾的危害

针对机房外火源引起火灾的情况,在设计数据中心时,要考虑墙壁和天花板的隔热性能,使用防火材料。当火灾从其他地方产生时,在一定程度上有助于减小或延缓火灾的危害。

3、可靠的电力保障与高效节能的冷却系统

电力成本占数据中心整个支出成本的50%-70%,其中一半是机器设备散热需要的空调费。数据中心设备运行时的最佳温度为22℃,上下浮动不能超2℃。在基准温度情况下,温度每升高10℃计算机的可靠性就下降25%,这就需要在选址和冷却系统上下功夫。

4、火灾侦测和预警系统

一套有效的火灾侦测和预警系统也是非常必要的,所以需要在数据中心里面使用高敏感度的侦测设备。当机房出现冒第一缕烟的时候就能够侦测到,而不是等到整个机柜都燃烧起来之后才发现。

5、建立火灾应急预案

对值班人员进行火灾事故演练,一旦发生火灾值班人员不会慌了手脚,可以按此前演练进行操作,将损失降到最低。

6、及时配备环境监控系统

要能够对消防信号干接点、消防主机、空调机、电路负载等进行实时监控,一有异常及时告警。及时处置,防患于未然。

7、提高对机房可靠性、可用性、安全性等方面的认识

既要重视信息系统安全,又要重视机房的运行维护管理,重视对计算机硬件、软件及网络设备的维护。要树立大局意识和忧患意识,对机房设施安全的重要性给予足够的重视。

本文来自信息化观察者网,转载请注明出处。

 

欢迎加入东西智库微信群,专注制造业资料分享及交流(微信扫码添加东西智库小助手)。