2

这个问题有点宽泛,但我觉得没有一个地方可以帮助系统地诊断弹性搜索问题。广泛的类别可能是:

  • 客户

    1. 查询错误
    2. 查询结果不正确
    3. 无法解释的行为
  • 服务器

    1. 设置问题
    2. 性能问题
    3. 严重错误
    4. 无法解释的行为

1)a) 的示例是,在服务器上记录查询字符串(参考如何启用日志记录会很好),安装 inquistor 插件(链接到 github)并自己运行查询字符串。等等

4

1 回答 1

4

您的问题非常广泛,老实说,我不确定我是否可以完全回答,但是我会告诉您我们如何监控和管理我们的集群。

1 - 我们将查询日志和慢查询日志记录graylog2(它在后台使用 es),​​因此我们可以轻松查看、报告和警告来自集群的所有日志记录。我们还可以查看已经发生的慢查询。

2 - 我们将es 统计信息发送到statsd,然后在石墨中绘制该信息。这样我们可以看到集群状态、查询计数、索引计数、jvm stats、磁盘 i/o 等。所有这些都从es stats api解析并发送到 statsd

3 - 我们使用结构脚本来部署/升级集群并管理插件安装

4 - 我们使用jenkinsjmeter对集群进行偶尔的性能测试(随着时间的推移我们变得越来越慢,集群部署是否有效?)

5 - 我们使用bigdeskhead插件来关注集群并探索它的运行情况。

于 2013-11-14T03:12:05.927 回答