2

我正在寻求任何有在 AWS 中监控 Oracle RDS 数据库经验的人的一般建议。我正在使用的系统将涉及 AWS 中的多个企业 Oracle RDS 数据库(大约几十个)。我的组织正在考虑两种监控选项:

  1. 通过在 EC2 实例上容纳 OMS 和存储库数据库并在我们的 RDS 实例上启用 OEM_AGENT,在 AWS 中设置云控制。
  2. 完全依赖 EM Express/CloudWatch 以及我们可以使用的任何其他第三方软件,而无需 Cloud Control 的开销。

选项 1 的担忧在于它破坏了我们迁移到 RDS 的原因,即消除了维护传统本地 Oracle 数据库的一些管理开销。OEM 存储库数据库不能存放在 RDS 中,因为 OMS 需要对存储库进行 SYS 级访问,而 RDS 不允许这样做。因此,拥有云控制将需要我们希望摆脱的大量维护。

选项 2 的问题主要是缺乏度量警报。CloudWatch/Enhanced Monitoring 为警报提供了一些基本指标,但缺乏更具体的指标和警报,例如警报日志错误、表空间、长时间运行的查询、使用的存档区域等。我们不介意缺乏集中化,因为我们将简单地创建一个内部页面,其中包含指向所有不同数据库的链接,而 EM Express 从性能监控的角度为我们提供了我们所需要的东西。唯一值得担心的是缺乏指标警报。如果没有其他方法可以做到这一点,我们也可以简单地编写自己的 PL/SQL 脚本来触发警报。

但是,我很想知道其他人是如何解决这个问题的,甚至只是一般地,已经建立了哪些基于 AWS 的 Oracle 监控系统以及它们是如何工作的。

4

1 回答 1

0

今天几乎所有迁移到云的企业都面临的问题。迁移到云的公司摆脱了一些管理任务,然后他们发现他们无法完成他们在本地进行的所有定制。

因此,以下是如何使选项 2 变得更好。特别是为了解决您的问题

唯一担心的是缺乏指标警报

  1. RDS 事件是一种很好的监控方式。您可以订阅事件并通过多种方式获得通知,例如群组电子邮件、松弛频道或第三方监控工具(如 pagerduty)。

  2. 使用 RDS Events 与 Lambda 集成。我强烈建议看看 Lambda。正如我上面提到的,除了订阅事件之外,您还可以调用/触发 lambda 函数来对某些事件执行操作。我们使用 Lambda 来克服 mysql 中的从属跳过错误。

  3. Lambda 的另一个用例是 cron 作业的替代方案。比如每天检查磁盘空间,以确保在夜间进行增量备份。

如果您对“如何实施”这些选项有具体问题,请告诉我。我很乐意添加更多信息。

于 2017-05-08T21:41:40.523 回答