我正在使用 AWS Lambda(每小时由 Cloudwatch 规则触发)来触发 EMR 集群的创建以执行作业。EMR 集群完成其步骤后,将结果文件写入 S3 存储桶。关键路径是一天中的小时
/bucket/2017/04/28/00/result.txt
/bucket/2017/04/28/01/result.txt
..
/bucket/2017/04/28/23/result.txt
我想发出一些警报,以防 EMR 作业由于某种原因未能在该小时内创建 result.txt。
我已经在 Lambda 调用计数和 lambda 错误计数上发出了一些警报,但我没有找到合适的警报来测试 EMR 是否确实正确地完成了它的工作。
请注意,Lambda 每小时每 3 分钟触发一次,大约需要 15 分钟才能完成。一个好的解决方案是创建一个其他 Lambda,每 30 分钟触发一次,并检查存储桶中是否存在正确的密钥?如果没有,那么将一些日志写入 cloudwatch,我可以监控并使用它们来创建警报?
我还有什么其他方法可以实现这种警报?