数据中心工作人员可以采用什么措施来避免和缓和系统宕机呢? Schuknecht建议建立良好的设施,计算出每件设备的维修计划,建立员工培训计划,介绍员工该如何及何时回应宕机事件,提供足够的资金用于营运以确保一切正常运作,还要建立一个良好的治理计划,其中站点基础设施要依照生产商规定运行。
数据中心经理Chuck Goolsbee:硬件故障导致宕机
最常看到的两个因素是不可恢复的部分故障和操作设备差错。就不可恢复的部分故障而言,通常的罪魁祸首是基于网络协议和不会导致彻底故障的网络硬件问题。网络硬件和协议正如所料在彻底故障的情况下通常是工作的,如线卡坏掉,失去电力到失去冗余等。但是,真正有问题的是在发生故障过程中,部件如何继续工作。虽然网络硬件常常发生这种问题,但是在电气开关设备和不间断电源设备造成的停机中也有类似的故障,比如在三相配电系统中损坏了一个单相。
...