2

我有一个工作角色,4 个实例,带有外部 TCP/IP 端点。经过几天没有问题的运行,实例一个接一个地开始死亡。

在 24 小时内,它们都处于状态:“等待状态(角色报告自己不健康。)”。

他们都在发送“正在工作”的详细日志(来自 Run 方法),但不接受任何传入连接。这怎么可能发生?来自某个线程的未处理异常?

为什么几个小时后它们都没有重新启动,而它们都只是“等待状态”?

4

1 回答 1

0

如果他们无休止地重复启动-关闭-重新启动循环,那么一种可能性是您有一个启动任务,它在第一次运行时工作但在后续运行时失败(即,它不是幂等的)。

否则,可能是您的启动过程中的某些问题导致了问题,但如果没有更多信息,很难说。尝试 RDP 进入机器并查看 Windows 事件日志以及您能想到的任何其他内容以获取线索。

您也可以尝试重新映像一两个实例,看看是否能解决问题。这至少可以告诉您问题是否出在基本代码中,或者虚拟机是否进入了某种不可恢复的状态。

于 2013-05-03T14:37:07.507 回答