1

我所处的环境支持大约 100 个数据库、Web 和杂项。其他服务器(99% Windows)。基础设施(硬件+网络)由顾问管理,而我的团队负责系统开发。基础设施人员已经安装了一个 SCOM 环境,用于跟踪一般系统健康状况等,我也有兴趣使用它来跟踪应用程序健康状况。

谁能提供有关 SCOM 是否适合使用自定义规则监视自定义开发应用程序的见解?我的团队中没有人有使用 SCOM 的经验,我正在尝试权衡学习 SCOM 与仅按预定时间间隔运行一些 Powershell 脚本以查找警告条件的好处。

我们想要监控的一些事情:

  • 扫描日志文件以查找表明特殊情况的症状,例如“挂起”服务
  • 调用 URL 并监控响应时间
  • 调用 URL 以扫描错误消息
  • 监控数据库查询活动等。

没有使用 SCOM 的经验(并且从开发的角度来看),这些类型的任务是否适合 SCOM 的工作?与使用 Powershell、bat 或 cygwin 脚本或像Gibraltar这样的工具相比,学习 SCOM 来实现这种监控是否有意义?

4

1 回答 1

0

是的,你问的有点可能。我花了一天中最好的时间试图弄清楚这一点,所以我想我会在这里发布我为你找到的东西。

可以为任何机器上的任何日志设置监控。只要您可以使用事件日志查看器看到该登录窗口(实际上还有更多,但如果您可以在这里看到它。假设它可以被我监控。

将您正在监视的任何内容放入 SCOM 中它自己的组中,并设置它自己的管理包。如果您想收到有关这些警报的邮件,您甚至可以使用与“由特定组中的任何实例引发”匹配的订阅条件设置邮件警报。

如果您只想监视远程服务器上的“应用程序”日志,这是一个示例:

  1. 以 Operations Manager 作者或管理员角色的成员身份启动操作控制台。

  2. 在操作控制台中。单击创作按钮。

  3. 在导航窗格中:

    1. 展开创作,然后展开管理包对象。
    2. 右键单击规则,然后单击创建新规则... 以启动创建规则向导。
  4. 在选择规则类型页面上:

    1. 展开警报生成规则,展开基于事件,然后单击 NT 事件日志(警报)。
    2. 从列表中选择目标管理(Windows 核心库 - 自定义)或单击新建...以创建管理包。
    3. 点击下一步。
  5. 在规则名称和说明页面上:

    1. 在规则名称框中,键入应用程序事件日志错误。
    2. (可选)键入规则的描述。
    3. 单击选择以选择要定位的项目。
    4. 在“选择要定位的项目”对话框中,选择“Windows 计算机”,然后单击“确定”。
    5. 确保选中规则已启用选项,然后单击下一步。
  6. 在事件日志名称页面上,确保日志名称设置为应用程序,然后单击下一步。

  7. 在构建事件表达式页面上:

    1. 指定以下表达式:

      参数名称 运算符值 事件级别等于错误

    2. 点击下一步。
  8. 在配置警报页面上:

    1. 在警报描述框中,指定以下内容:

来源:$Data/EventSourceName$ 事件 ID:$Data/EventDisplayNumber$ 事件类别:$Data/EventCategory$ 用户:$Data/UserName$ 计算机:$Data/LoggingComputer$ 事件描述:$Data/EventDescription$

2.  In the Severity option, click Warning.
3.  Click Alert suppression... to define the handling of duplicate alerts. In the 

警报抑制对话框: 1. 单击以下字段: 事件 ID 事件源记录计算机 事件类别 用户描述 2. 单击确定。

  1. 单击创建。重复该过程以针对任何其他事件日志中的错误创建类似的警报。

可能看起来有点混乱(糟糕的格式无济于事,抱歉)但是一旦它出现在你面前,它就会变得有意义。

希望这对无论如何都有帮助,伙计,

李杰

于 2013-09-23T16:31:25.197 回答