全国数据中心专业人才网
全国数据中心专业人才网详情页背景图
全国数据中心专业人才网详情页icon最新动态 全国数据中心专业人才网所在位置icon 您所在的位置:首页 > 最新动态
微课016期 云机房供配电系统UPS发展趋势

\

 

 

 

微课这个名字的确起得好,既简单明了又有技术含量。它表明三言两语解决实际问题,既节省了时间又获得真知。真希望这个栏目做成知识交流的平台。少谈些家长里短风花雪月之类的话题,多说些知识性的东西,总之要珍惜时间,多作有益的贡献才符合这个创意新颖的名字。

王其英

微课016期  UPS发展趋势  王其英著

 
 
 

1、从单机向冗余结构变化

由于数据网络中心的重要性越来越显著,供电电压的任何中断都会造成重大损失。任何单机供电都存在着断电的危险,为了实现供电的高可靠性,多机冗余连接已经成了数据中心用电的必要手段。

2、从注重系统的可靠性向注重系统的可用性变化

任何系统的可靠性都不是绝对的,数据中心设备所关心的不仅是供电会不会中断,更需要知道断电时间有多长。换言之需要知道在指定时间内能有效工作的时间比例,这就是前面所提到的可用性概念。

从可用性公式中可以看出,提高可用性的途径有两条:①提高设备的可靠性,即延长MTBF,但是这样做的效果不太显著,并且提高了造价;②缩短MTTR,这一条容易做到,UPS的冗余连接就可达到缩短平均修复时间的目的。比如两台UPS冗余连接,其中一台出现故障时另一台可继续供电,待这一台故障机器修复后再行接入,从供电未曾中断的角度看MTTR=0最好,所以冗余连接是实现高可用性的必要手段。图1-32示出了降低单机故障率与采用冗余措施的可用性比较情况。

\

从图1-32中可以看出,尽管将单机系统的故障率提高到0.0025,但是其可用性值仅为0.998;在双机冗余连接的情况下,即使单机的故障率为0.010(是前者的4倍),但其可用性值却几乎为1

但是不要产生另一个误会,即为了提高可用性,只要降低MTTR就行,可不去考虑MTBF值的大小,这当然也是一种误解。为了提高可用性,只要求降低MTTR而可不去考虑机器的质量(即MTBF)无异于拔苗助长,可用下面的例子说明。

例1-2当要求可用性A=0.99999时,每年允许停机的时间t

T=365*24h*(1-0.99999=8760h*0.00001=0.0876h=5.256min

在N+1冗余的系统中,假如MTTR=10min,根据式可用性公式可算出硬件应具有的MTBF

MTBF=MTTR/(1-A=1/6/1-0.99999=0.16667/0.00001=16667h

当MTTR=20min时,硬件系统的可靠性R就要求MTBF=33333h,见表1-1

\

从表1-1可以看出,MTTR越长,就要求MTBF越长,对设备质量要求就越高。其原因有两个:①一台UPS因故障进行修理时,尽管另一台在继续正常供电,万一在这个修理期间内它也出现故障,就会造成停电事故,故障UPS的修理时间越长,出现停电事故的概率就越高;②UPS的质量越差,出现停电事故的概率也越高。

第二个原因可用下面的例子来说明。

假如两台并联的UPS有着同一个量级的可靠性(但绝不是一模一样),比如它们各自的MTBF分别为50h51h,那么两台UPS同时出现故障的时间就是它们的最小公倍数50*51=2550h),即每隔2550h就出现一次两台UPS同时出现故障的现象。这时两台UPS同时需要维修,由于整个供电系统已经瘫痪,从不间断的意义上讲,尽管维修时间再短也不行了。另外,在2550h8个月)之内,由于UPS的质量低劣,也可能会故障频发,带来了许多麻烦,也造成很多损失。但如果将两台UPS的质量提高一步,即将MTBF提高到500h510h,那么它们的最小公倍数就是25500h3年),于是两台UPS同时出故障的时间由8个月延后到3年;如果再将两台UPS的质量提高一步,即分别为5000h5100h,它们的最小公倍数就是255000h29年),这时就将两台UPS同时出故障的时间推迟到29年以后。这时,两台UPS互为备用的条件才能被满足,所以减小MTTR也才真正有了实际意义。

因此只有在保证了UPS质量(MTBF)的前提下减小MTTR才具有真正的意义。

3、从单纯供电系统向保证整个IT运行环境变化

当前网络数据中心过关心的是整体运行效果。如图1-33所示就是一个木桶结构式的机房结构原理图,数据中心机房的各设备就想组成木桶的木板。木桶盛水的容量取决于两个因素:①取决于构成木桶所用木板中最矮的那一个;②取决于木板之间连接的密封情况。木桶的寿命则取决于所有木板中质量最差的那一个。所以在这个要求综合效果的木桶中,作为UPS的这一块木板,长度再高也不能增加木桶的容量,质量再好也不能延长木桶的寿命。比如空调机故障,高温情况可导致系统停机;在机房中,由于机架布线太密而堵塞了风路,形成热点也可导致停机;监控系统失效,可使盲目运行的机器故障等。因此只一味地提高电源的指标和质量已不能保证整个系统的质量,必须要提高整个运行环境的指标。美国有关机构为这个运行环境命名为网络关键物理基础设施,用NVPINetwork Critical Physical Infrastructure)表示。

\

4、提高UPS供电系统的适应性

数据中心的建立遍地开花,其发展很不平衡,中心规模和用电容量差距也很大,要求UPS具有应变的功能,这就是“适应性”。

 
 
文章摘自《云机房供配电系统规划、设计与运维》,王其英著