这个问题有点宽泛,但我觉得没有一个地方可以帮助系统地诊断弹性搜索问题。广泛的类别可能是:
客户
- 查询错误
- 查询结果不正确
- 无法解释的行为
服务器
- 设置问题
- 性能问题
- 严重错误
- 无法解释的行为
1)a) 的示例是,在服务器上记录查询字符串(参考如何启用日志记录会很好),安装 inquistor 插件(链接到 github)并自己运行查询字符串。等等
这个问题有点宽泛,但我觉得没有一个地方可以帮助系统地诊断弹性搜索问题。广泛的类别可能是:
客户
服务器
1)a) 的示例是,在服务器上记录查询字符串(参考如何启用日志记录会很好),安装 inquistor 插件(链接到 github)并自己运行查询字符串。等等
您的问题非常广泛,老实说,我不确定我是否可以完全回答,但是我会告诉您我们如何监控和管理我们的集群。
1 - 我们将查询日志和慢查询日志记录到graylog2(它在后台使用 es),因此我们可以轻松查看、报告和警告来自集群的所有日志记录。我们还可以查看已经发生的慢查询。
2 - 我们将es 统计信息发送到statsd,然后在石墨中绘制该信息。这样我们可以看到集群状态、查询计数、索引计数、jvm stats、磁盘 i/o 等。所有这些都从es stats api解析并发送到 statsd
3 - 我们使用结构脚本来部署/升级集群并管理插件安装
4 - 我们使用jenkins和jmeter对集群进行偶尔的性能测试(随着时间的推移我们变得越来越慢,集群部署是否有效?)