Oded、Catcall 和 Gilbert 的评论很到位。
我学习 IT 行业的那家银行在单个 MVS(后来的 Z/OS)大型机上运行其整个核心业务,该大型机运行单个 DBMS 和单个事务处理器(除非您将 TSO 算作事务处理器)。
事务处理器定期停机(例如,每天一次)。它从未导致银行破产,因为它总是在不到一分钟的时间内重新启动并运行。里程可能会有所不同,但在整个工作日(480 分钟,或 < 0.25%)中损失一分钟的工作时间确实不会造成危险的破坏。
有时,单个 DBMS 也会下降(例如,每月两次)。我仍然可以听到 sysprogs 隔着栅栏对服务台人员大喊“DBMS 已关闭”,意思是“预计会接到用户电话”。它从未导致银行破产,因为它总是在几分钟内重新启动并运行。里程可能会有所不同,但每个月失去几分钟的工作时间确实不应该造成危险的破坏。
我记得有一次银行真的濒临破产是当开发团队把银行绝对核心业务的一个新项目弄得一团糟,银行完全倒闭了(它的真正业务) 连续三四天。这不是 0.25% 的业务时间损失,而是几乎 100 倍以上。
我的故事的道德?他们两个人。(a) 这完全是关于风险评估(=概率评估)和风险加权(=概率加权)成本估算。(b) 如果您提出关于 SO 的问题(这意味着一种认可/期望回答者在该主题上比您拥有更多专业知识),并且像 Oded 和 Catcall 这样的人会为您提供准确且准确的答案重点,然后不要要求论文或案例研究来支持他们的答案。如果您不想接受专家的专业知识,那为什么还要一开始就问什么?