3

这里有两个系统,A 和 B。如何计算每个系统的停机时间。

对于 A,应该是:0.01 * 10 * 6 * 12 = 7.2 小时/年?

一个系统有 10 个物理节点,如果其中任何一个节点发生故障,整个系统就会崩溃。单个节点的故障概率为每月 1%,修复停机时间为 6 小时。那么每年整个系统的停机时间是多少。

B 系统有 10 个物理节点,如果 10 个节点中有 9 个在运行,则整个系统可以正常运行。单个节点的故障概率为每月 1%,修复停机时间为 6 小时。那么每年整个系统的停机时间是多少。

4

2 回答 2

4

我们在这里讨论的是预期的停机时间,因此我们必须采用概率方法。

我们可以对这个问题采取泊松方法。单个节点的预期故障率为每月 1%,或 12 个月内 10 个节点的预期故障率为 120% (1.2)。因此,对于 A 的预期值,1.2 故障/年 * 6 小时/故障 = 7.2 小时/年是正确的。

您可以通过使用 7.2 作为泊松分布的 lambda 值来计算给定停机时间的可能性有多大。

使用 R:ppois(6, lambda=7.2) = 0.42,这意味着您有 42% 的机会一年内的停机时间少于 6 小时。

对于 B,它也是一个泊松,但重要的是第二个节点在第一次故障后的六个小时内发生故障的概率。

故障率(假设每月 30 天,有 120 个 6 小时周期)为每个节点每 6 小时周期 0.0083%。

因此,我们查看六小时内发生两次故障的可能性,乘以一年中的六小时周期数。

使用 R:dpois(2.0, lambda=(0.01/120)) * 365 * 4 = 0.000005069

0.000005069 * 3 预期小时/故障 = 每年 54.75 毫秒预期停机时间。(每次故障预计需要 3 小时,因为第二次故障应该平均发生在第一次故障的中间。)

于 2015-10-14T19:51:20.150 回答
0

1% 的故障率/月/节点在任何给定时间发生故障的概率为 0,00138889%。当有 8760 h/y * 10 个节点 = 87600 个“试验”时,我在 Excel 中使用二项分布来模拟 N 个节点故障的概率。我得到了这些结果:

0 failure:   29.62134067 %
1 failure:   36.03979837 %
2 failure:   21.92426490 %
3 failure:    8.89142792 %
4 failure:    2.70442094 %
5 failure:    0.65805485 %
6 failure:    0.13343314 %
...and so forth

N 次故障将导致 6N 小时的停机时间(假设它们是独立的)。那么对于每 6N 小时的单节点停机时间,其他 9 个节点都没有发生故障(100% - 0,00138889%) ^ (9 * 6N)概率为.

因此预期的两节点停机时间是P(1 node down) * (1 - P(no other node down)) * 6 hours / 2(除以二,因为平均第二次故障发生在正在修复的其他节点的中点)。将所有N失败次数相加后,我得到预期的 9.8 秒 / 年的两节点停机时间,现在知道这是多么正确的估计,但应该给出一个粗略的想法。相当蛮力的解决方案:/

Excel 计算

于 2015-10-21T13:15:39.013 回答