0

我部署了一个工人角色,可以在一段时间内正常工作(几天......),但在某些时候它会停止或崩溃,然后它根本无法重新启动并保持“循环......”。唯一的解决方案是重新映像角色。

如何设置自动警报,以便在角色无响应(和骑自行车...)时收到电子邮件?

谢谢

4

2 回答 2

0

像这样的警报或通知今天不可用,但正在处理中。如果这导致服务中断,您可以随时注册外部监控服务,该服务会在您的站点关闭时向您发送警报。

但是,我建议解决问题的根本原因,而不仅仅是重新映像以解决症状。这是我将如何开始:

  1. 您很可能遇到了http://blogs.msdn.com/b/kwill/archive/2012/09/19/role-instance-restarts-due-to-os-upgrades.aspx中描述的问题。特别是,请参阅常见问题下的 #1,其中讨论了角色在重新启动后由于操作系统更新而无法正确重新启动的常见原因。请注意,#1 还讨论了如何模拟这些类型的 Azure 环境问题(即从门户手动重新启动),以便您可以重现故障并对其进行调试。
  2. 要解决此问题,我建议阅读http://blogs.msdn.com/b/kwill/archive/2013/08/09/windows-azure-paas-compute-diagnostics-data.aspx上的故障排除系列。您特别感兴趣的可能是“故障排除场景 2 – 运行良好 2 周后的角色回收”
于 2013-09-06T19:46:51.777 回答
0

Azure 无法通知您此类情况。考虑在 WorkerRole 中的循环周围放置一个 try/catch,并在出现问题时发送电子邮件给您。

或者,如果您愿意使用第三方服务,请考虑使用AzureWatch(我隶属于该产品)。它可以在您的实例变为无响应、忙碌或其他非就绪状态时提醒您

于 2013-09-06T20:41:26.433 回答