问题标签 [netdata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
syntax - Ansible 通知语法问题 - 名称 ^ 任务中未检测到操作
我不确定我在这里缺少什么。
Ansible 2.1.2.0
Python 2.7.5
CentOS Linux 版本 7.2.1511(核心)
剧本文件如下所示:
角色的(netdata)main.yml 看起来像:
处理程序通知通知程序,它的主文件如下所示:
那么,为什么 Ansible 会给我以下错误?
node.js - 如何将子域重定向到特殊端口?
就我而言,主机是我在 Digital Ocean 的实例之一,但我使用 Cloudflare 作为我的 DNS 服务器。
我试图将我的域和子域重定向到特殊端口,但不起作用。
域 RSV 设置(不起作用):
Type: RSV
Name: _http._tcp.mydomain.life
Value: SRV 0 0 8080 mydomain.life <- ip is 128.99.12.34
TTL: Auto
子域 RSV 设置(不起作用):
Type: RSV
Name: _http._tcp.mysub.
Value: SRV 0 0 8080 othersubdomain.mydomain.life <- ip is 128.99.12.34
TTL: Auto
我为 mydomain.life 和 mysub.mydomain.life 创建了 A 记录。
结果是,它们都没有重定向到 128.99.12.34:8080(netdata),
但只需连接到 128.99.12.34(ghost)
我错过了什么吗?
或者任何其他解决方案可以帮助我将域/子域重定向到特殊端口?
mysql - 如何记录mysql读取下一个查询?
我的 MySQL 数据库负载很大。
使用 NetData(https://github.com/firehol/netdata),我看到处理程序“Read Next”有时会从 30-50 跳到 4M!
如何记录相关查询(由 read-next 跳转关注),或以任何方式检测可能导致此问题的原因?
提前谢谢
monitoring - 在 netdata 监控中添加挂载点警报
我有一些来自已安装到我的 netdata 服务器的 4 个远程服务器的共享。由于停电和其他问题,远程服务器并不总是在线,如果任何挂载点可用或不可用,远程服务器将是对我的 netdata 监控的非常有价值的补充,并相应地发送警报
阅读 netdata 网站上的文档和健康监测部分,但无济于事。磁盘监控不是我需要的,而是挂载点缺席/存在
那可能吗?
linux - 我应该修改 docker 或主机中的内核以更正“netdata 警告”吗?
我在 docker 容器中安装 netdata,它告诉我:
“内存重复数据删除指令,您有可用的内核内存重复数据删除程序,但当前未启用。要启用它,请运行:”
它还说“如果启用它,您将节省40-60%的网络数据内存。”
我应该在主机中还是在 docker 容器中运行此命令?
编辑
我正在使用以下命令运行我的 docker 容器:
influxdb - netdata > influxdb > icinga2
我在所有服务器上都安装了 netdata 监控。我使用 InfluxDB 作为后端,我也有 Icinga2。是否可以将一些指标推送到 IcingaWeb2 以获取警报并为来自 InfluxDB 的阈值配置警报?
load - 在 Docker 环境中安装 netdata 时经常出现高 cpu 负载
我们在大型机器(64GB,10 个 CPU)上的 docker 环境中运行 netdata,许多机器(>40)运行相同的设置,包括 postgres、mongo、tomcat、httpd、solr。
在每台机器内部,我们都有一个 netdata 服务,它收集详细数据并将其发送到中央 netdata 实例。我们在两个不同的数据中心运行 6 台这样的大型机器。
一切正常:我们只面临一个奇怪的问题:- 由于我们在所有机器中集成了 netdata,CPU 负载每 90 分钟增加一次,负载达到 120(对于 10 个 CPU 系统来说,这非常高,其中 20短时间内会没事的)。
负载仅保持高位几分钟,然后又回到 2-4 的水平(这意味着大多数机器大部分时间都处于空闲状态,这是真的)。
我们检查了进程,发现没有一个进程会产生高负载。唯一的问题是,不同机器的所有 netdata python 脚本似乎同时运行并一起产生高负载)。
我们已经做了什么: - 大多数 netdata 插件都关闭了:我们只使用监控 cpu、网络、磁盘、tomcat、apache - netdata 插件每 5 秒运行一次(任何更高的频率都会产生更多的负载,并且服务器没有恢复正常负载) - 关闭插件来测量 postgres 和 mongodb (我想监控这个,但它们完全破坏了服务器导致大量负载)
我的问题是:
我们如何才能更改 netdata 配置,以防止 CPU 负载出现经常性的高峰值。我们有 40 个相同的配置,40 个 tomcats/apache/sql 等。它是 docker 环境与机器内部的 netdata 结合吗?
我们只能猜测为什么它每 90 分钟才会发生一次。可能是一些关于 netdata 如何调用插件的时间模式,我不知道......
任何提示或建议如何在这样的系统中管理监控?
prometheus - Prometheus 与 Central/Master Netdata 服务器的集成
我有一个主/中央网络数据服务器,它聚合来自从网络数据代理的指标。
我想设置 Prometheus 服务器以从主/中央 Netdata 服务器而不是单个 Netdata 代理中查询数据。
让我知道我是否正确设置它,或者我应该让各个 Netdata 代理将数据提取到 Prometheus。
我正在使用这种方法来确保 Netdata 代理的安全,因为从 Netdata 主机到 Netdata 代理的通信是使用令牌进行的。
prometheus - 设置 Netdata -> Consul -> Prometheus Stack
根据文档: https ://github.com/firehol/netdata/wiki/Netdata,-Prometheus,-and-Grafana-Stack
我们可以使用 Consul 作为所有 Netdata 代理都将注册的注册表,稍后 Prometheus 将抓取 Consul 注册表以获取注册的端点并删除数据。
我试图寻找文件来设置它,但我找不到它,是否有任何关于设置堆栈的文件。