全国数据中心专业人才网
全国数据中心专业人才网详情页背景图
全国数据中心专业人才网详情页icon最新动态 全国数据中心专业人才网所在位置icon 您所在的位置:首页 > 最新动态
对可靠性和可用性的理解(1)
数据中心规划设计者必须清楚的可靠性指标:可用性
(1)绝大部分数据中心对业务连续性提出了非常高的要求;
(2)任何设备和系统都是要发生故障的,这是不争的事实;
(3)连续性要求意味着,希望把故障影响的时间缩到最短,也就是说系统要有可修复能力,修复时间越短越好;
(4)于是就出现了衡量修复能力和修复时间的指标:平均修复时间MTTR(Mean Time Repair)
(5)可靠性指标之一是平均无故障时间MTBF(Mean Time Between Failures)
(6)有了MTBF和MTTR,就可以表达系统可用性(可用度)A(t) 
 \
(7)可用性A(t)的定义:电子系统在使用过程中,可以正常使用的时间与总时间之比。
越来越多的厂商和用户已经形成这样一个共识:真正能为用户带来价值的是其可用性,在概念上它包含了系统中设备的可靠性、可管理性和可维护性。可用性高意味着给用户更多的正常使用时间。可用性成为数据中心规划设计的第一功能指标,对可用性的研究促进了数据中心技术的全面发展,成为数据中心规划设计、建造、设备研发制造的最重要的思维方法和企业哲学。
 
可靠性与可用性之间的关系
(1)可靠性表达式之一:
故障率λ(t):将单位时间内损坏的元件数据与在该时间断间内工作元件总数之比作为表示在该时间段内元件可靠性程度的数据。也可以说成是在单位时间内的故障数相对于依然正常工作的元件数的比值,在值称为“故障强度”或失效率。
(2)可靠性表达式之二:
可靠度R(t):设备或系统在一段时间内不发生故障的概率
\(当λ(t)是一个常数时)
(3)可靠性表达式三:
平均无故障间隔时间MTBF:
\(假定t<<MTBF时)

(4)可用性表达式:

\
可靠性与可用性之间的关系
(5)从“不停电”观念的变化看可靠性与可用性的区别:

\
可靠性与可用性之间的关系
(6)R(t)、A(t)、MTBF、MTTR都是概率指标
MTBF与产品生命周期无关
举例:
以50万个25岁的人作为抽样;
在一年的时间内,收集这些人口的“故障”(死亡)数据;
这些人口的生活时间是500000×1年=50万人年;
在这一年当中,有625个人“出现故障”(去世);
故障率为625个故障/50万人年=0.125%/年;
MTBF是故障率的倒数,即1/0.00125=800年;
设备的MTBF是以产品稳定运行阶段(举例中的25岁)的失效率计算的,所以与产品生命周期无关。
\