您多久通过重新启动计算机、路由器、程序、浏览器来解决问题?或者甚至通过重新安装操作系统或软件组件?
当怀疑软件组件没有以正确的方式保持其状态时,这似乎是一种常见的模式,然后您只需通过重新启动组件来获得初始状态。
我听说 Amazon/Google 有一个由许多节点组成的集群。每个节点的一个重要属性是它可以在几秒钟内重新启动。因此,如果其中一个失败,那么将其恢复到初始状态只是重新启动它的问题。
是否有任何语言/框架/设计模式可以利用这种技术作为一等公民?
编辑描述亚马逊背后的一些原则以及可用性和一致性的总体原则的链接:http: //www.infoq.com/presentations/availability-consistency