对于我的 python/django 站点,我需要构建一个“仪表板”,它将向我更新数十个错误/心跳/意外事件的状态。
我目前正在通过让 Django 站点向管理员帐户发送电子邮件来跟踪几种类型的“事件”:
1)通常应该发生的事情出错了。我们每隔几个小时将文件同步到不同的服务和其他机器,当出现问题时我会发送错误电子邮件。
2)当应该发生的事情实际发生时。有时,第 1 项中的事件失败得如此可怕,以至于他们甚至不发送电子邮件(尝试:除了:围绕一个事件应该始终有效,但可以从 crontab 中删除内容,系统配置可能会在不发生的地方被撞歪运行等,我什至不会收到错误电子邮件,并且缺少成功/心跳电子邮件会让我知道应该发生的事情没有发生。)
3) 当任何意外发生时。我们对后端操作的运行方式做了很多假设,如果违反了这些假设中的任何一个(例如,我们发现两个具有相同电子邮件地址的用户),我们想知道它。这些事件不一定是错误,更像是要调查的警告。
所以我想建立一个仪表板,我可以很容易地从 python/django 更新,让我鸟瞰所有这些类型的活动,这样我就可以停止每周发送数百封电子邮件(这已经无法管理了。)