本期微课我们接着讲数据中心运营安全的话题,在第5期时候我们讲了《安全法》中对安全管理的要求,包括安全方针、安全的组级架构以及安全的职责。今天接着聊这些要求在数据中心基础设施运营中的落地。感谢张永萍老师不辞辛苦为我们整理了这些知识点。
一旦数据中心发生了安全事故,会产生什么样的后果:
1. 安全事故本身可能造成基础设施设备系统的损坏,严重影响到业务的连续性,产生重大的经济损失;
2. 安全事故可能会被有关机构通报,成为反面教材,对数据中心的信誉造成损害,影响数据中心在客户心中的形象,并进而影响到业务;
3. 数据中心的有关领导可能会受到追责,运维人员的薪资必然会受到影响甚至失业;
4. 对事故当事人及其家庭带来极大的痛苦,甚至根本性改变其今后的生活;
5. 安全事故善后处理工作,数据中心运营团队需付出高昂的经济成本。
以上几条足可以看出数据中心场地基础设施运营中的安全问题不是小事,必须得到各级领导的重视。那么,既然数据中心的安全至关重要,那在我们数据中心当中存在哪些不安全的因素呢?
数据中心运行过程中除了我们所熟知的火灾、配电、空调、油机、电容、承重、水浸、人为原因等安全因素外,还有电力、机械、危险品、高空作业、动火、有限空间活动、吊装等等。我们运维过程中通过编写SOP、MOP、EOP等过程文件来控制和减少因设备引起的安全事故,但SOP、MOP、EOP主要是针对设施设备系统的,编写它们时也应该要考虑安全的因素。
既然SOP、MOP、EOP都只针对设施设备的,在数据中心运营中如何减少风险因素对人身安全和职业健康的影响呢?
应该要有正确的识别、预防和消除这些隐患的措施,才能减少导致人身伤害、疾病、或者甚至死亡的安全事故。一个全面的“数据中心基础设施场地安全计划”和完善的“安全保证体系”就是任何数据中心运行和维护计划中的一个关键组成部分。
接下来咱对安全体系和计划逐个展开讲解!
1、安全体系的内容
A)制定明确的数据中心基础设施运维的安全方针来指导安全管理的方向;
B)确立基础设施运维团队的安全原则;
C)确立数据中心基础设施运营团队的安全责任和组织架构;
D)建立严格的安全生产的规范和流程;
E)安全作业的最佳实践;
F)定期进行安全培训;
G)定期召开的安全会议。
2、安全计划的目的
A)所有员工都得到针对其岗位所需要的合适的安全程序及培训;
B)所有和工作相关的伤害和疾病都得到准确的报告;
C)在安全和无危险的情况下对他们的职责范围内的设备和资产进行运行和维护;
D)一旦观察到了不安全的做法或者情况,要立即进行纠正,并报告给管理层。
1.什么是安全方针?
安全方针正如质量方针一样,必须是能朗朗上口,每个员工都能背诵出来的。ISO 9001第三方审核的时候,通常会抽查一些员工,要他们背诵他们的质量方针。如果背诵不出来,就会有不合格项。所以,在南方的一些工厂,为了保证大家都能背诵出质量方针来,是有奖金激励机制的。
2.什么是安全原则?
确立安全原则,比如一旦发生事故,是以人为重,还是以资产和业务为重?
再比如能不能带电作业?这些都要在文件化的安全体系中表述出来。确实会有些地方可能会以保业务为重。所以,我们运维人员为了自身的免责,也需要去建立安全体系。并且要把安全的原则明确定义下来。
1.安全方针和安全原则
安全体系的第一部分是安全方针和安全原则,已经在上面叙述过,不再赘述。
2.安全防护用品
安全体系的第二部分就是关于个人防护装备,或者称为“劳动卫生用品”、因为更容易在中国的法规或者标准中找到的专用名词。
设施管理团队应该确定存在哪些危害需要使用个人防护装备,并且为所有员工采买合身的、适当的个人防护装备,同时培训员工正确使用这些个人防护装备。所有个人防护装备都应该正确地保存在合格人员容易取用的地方并得到正确的维护和保养。个人防护装备还应该按照相关的规定和装备制造厂家的建议进行定期的测试和更换。所以,可以看出来,光是一个个人防护装备,就需要控制需要什么、哪里需要、规格、数量、维护、保养、测试、更换等等多个控制点需要控制。
3.电气安全
有人提到了电气危险是数据中心的最主要的危险,因此,在安全体系中必须要有一部分专门针对电气安全的,这就是安全体系的第三部分。
目前,中国的数据中心场地基础设施运维中,鲜有专门的安全体系的。把安全这个概念引入到数据中心基础设施运营中来,并且作为一个重要的要素进行控制。
与电相关的工作存在固有的危险。设施管理团队必须制定一份正式的电气安全计划,以最小化所有在设施内工作的人员暴露在电气伤害中的风险,并确保符合适用于现场电气系统的相关法规的要求,除非停电带来的危险更严重或者无法实现,否则,要求所有在电气设备上开展工作都应该在断电的情况下进行。
这个在数据中心也要看具体的配置以及数据中心的业务的重要性来确定的,确实不好实施。但看上面提到的两个因素以外,还要看领导的决心了。数据中心的很多操作都是要在线完成的。电气安全计划中应该包含有关的条款来确保所有的电气工作都是由有资质的员工来实施的。应该为这些有资质的员工提供相应的安全工作程序、个人防护装备和诸如上锁挂牌装置等等其它的控制手段,并接受了对以上程序、装备和手段的培训。
4.危害分析:
创建安全工作程序应该从危害分析入手。所有的操作程序应该包含一份正式的危害分析,记录在每份程序中。这份危害分析应该识别所有的作业安全风险,并应该针对每一个安全风险确定相应的安全措施,来达到一个可以接受的风险等级,以便安全地执行该程序。
每份危害分析应该识别如下的内容:
☞ 是否会暴露在危害中;
☞ 暴露的程度;
☞ 是否需要特殊的授权或者其他的控制过程;
☞ 是否需要个人防护装备;
☞ 如果需要个人防护装备,哪些类型的个人防护装备会提供所需要的保护。
5.危害沟通:
设施管理团队应该维持有一个符合主管部门制定的法规的危害沟通计划。该计划应该应用到在正常或者紧急情况下,员工可能接触到有害物质的所有作业操作。
该计划应该包括以下的要件:
☞ 场地有害化学品清单;
☞ 安全数据表的使用;
☞ 所有有害物质容器的正确标识。
对员工就其工作所接触的危险品的位置、安全处置程序、不受到这些化学品伤害的自我保护措施的进行培训。
我在国内走了几十个数据中心了,没有发现那个数据中心有洗眼设备的。我在美国也走了十来个数据中心,每个数据中心都配置了洗眼设备。并且洗眼设备的运行和维护也是基础设施运行和维护团队的一项工作。洗眼设备主要就是接触到化学品的时候能够及时清洗。这是一种安全设备,其实,数据中心还应该配备很多的安全设备。
例如谁的数据中心配备有心肺复苏仪的?我们自己的工厂、办公室都配有心肺复苏仪。我们在现场的所有人员都要接受急救培训,并且持证上岗。
6.危险品的控制。
所有的危险品,如爆炸物、可燃物、有毒物品、放射性物质、腐蚀性或者氧化物质,应该按照生产厂家的建议和适用的法律和条例进行正确的识别、标识、储存、维护、使用、运输和处理。
安全保证和质量控制是一样的,表面上都是花钱的,看不到收益。就和买保险一样,一旦发生了,就知道它的重要性了。
7.符合国家、行业、地方的法规。
遵纪守法是每个公民的义务,要确保对保证数据中心基础设施运行和维护工作使用的法规的获得、维护、宣贯和执行。
这些法规的例子包括但不限于:
☞ 中华人民共和国安全生产法 - 2014年12月修订实施;
☞ 中华人民共和国劳动保护法 - 2008年1月1日修订实施;
☞ 中华人名共和国国务院《危险化学品管理条例》- 2012年12月1日修订实施;
☞ 国家安全生产监督管理局令第66号《有限空间安全作业五条规定》- 2014年9月29日。
群里有很多非常有经验的运营管理人员,每个人都贡献一点。我希望我们能借助这个平台,把数据中心的设计、规划、运维所适用的国家、地方、行业的法规做出一个详细的清单来。这份清单及其要求就是各位向领导要资源的最好的理由。
小编
本期微课感谢张老师!终于讲完了数据中心的安全运营。安全意识应该深入人心,才能力保数据中心平稳运行。本期微课到此结束,期待下一期的知识分享!