我知道异步系统中的故障检测器基本上被归类为(最终)完美/(最终)强大以及这些类是如何定义的,但我很难理解它背后的直觉。
假设我有一个故障检测器的具体实现,它定期监听来自每个进程的心跳消息。如果某个进程有一段时间没有发送其心跳消息,则该进程将被添加到可疑列表中,直到收到来自该进程的消息。
现在,我怎么知道这个 FD 的实现是哪个类?这是否需要正式证明 FD 的完整性/准确性属性?如果可以实现完美的 FD,为什么还要研究其他(较弱的)FD?还是在设计容错分布式算法时仅“假定”这些类?
我对此有点困惑(如何对给定的(具体)FD进行实际分类)。我将不胜感激任何答案。