问题标签 [datadog]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1980 浏览

windows - 在 Windows 上安装 Datadog 代理

我正在尝试仅使用 powershell 而不是手动在 Windows 上安装 Datadog 代理但是,没有设置 APIKEY。安装后有没有办法更新/设置 APIKEY?

0 投票
2 回答
3269 浏览

datadog - 如果我想发出查询结果的数量,作为 datadog 指标,正确的指标类型是什么?

我的守护进程不断地查询数据库。在每次迭代中,(a) 守护进程进行 DB 查询 (b) 从 db 接收一些文档 (c) 处理这些结果。我想发出为Datadog 上的查询返回的文档数。什么是正确的度量类型?

0 投票
1 回答
209 浏览

apache-kafka - Datadog:kafka.messages_in.rate kafka metirc 含义

kafka.messages_in.rate是否表示从生产者到代理的事件数,或者它还包括来自其他代理的复制事件。官方文档没用,只是用简单的英语呈现相同的指标,没有可能的解释

0 投票
1 回答
58 浏览

powershell - Powershell if/else 基于 repadmin 结果?

我试图弄清楚如何获取“repadmin /syncall /d /e”的结果并将结果放入 if else 语句中。我曾考虑尝试仅查找它为 if 和输出的成功字符串,但我想知道是否有更正式的方式来提取状态码?因此,如果成功使用一些内置的 PowerShell 功能来了解状态是否成功。我这样做是为了向 DataDog 发布一个指标,为跨站点 AD 复制提供通过或失败计数。有任何想法吗?

0 投票
1 回答
245 浏览

apache-kafka - 调试不平衡的kafka message_in rate

我的生产中有一个 4 节点 kafka 集群,我们使用自定义分区器,它执行 id 的 mod 64 来确定分区。自上周以来,我们的 1 个节点上的 kafka messages_in 速率一直不平衡,如附图所示在此处输入图像描述。粉色线显示 kafka01 节点上的消息速率,蓝黄色线显示所有其他 3 个框上的速率消息。我正在使用 datadog 来监控和使用指标 kafka.messages_in.rate 。假设 id 分布没有变化,那么在 rate 中消息的分布应该没有变化。我为调试问题所采取的步骤是

  1. 集群在 4 个节点中的每个节点上有 16 个领导者进行平衡。
  2. ISR 在 4 个盒子中也是平衡的,每个盒子有 32 个 ISR [复制因子为 2]
  3. 所有 4 个盒子上的网络进出几乎相等。

请求任何帮助或领域/指标,以调试此异常。

对于将来正在搜索此内容的人 https://mail-archives.apache.org/mod_mbox/kafka-users/201710.mbox/%3CCALaekbwkSKapqPwsyuAoHGiSnc1+3jF2wF+2FDZbAVx61E+c2w@mail.gmail.com%3E

0 投票
4 回答
7291 浏览

datadog - 在数据狗图中用零替换任何数据

在 datadog 中使用公式时,似乎没有办法用零替换任何数据。我试过填充零,但它似乎不起作用我只是希望我的 dd 代理监视器在它关闭时显示 0 而不是没有数据

0 投票
1 回答
123 浏览

java - 用于警报的 Datadog Java API

我是 Datadog 的新手,我正在尝试在我的 AWS 云堆栈上实现 Datadog 的静音/取消静音功能。我想使用 AWS Lambda 函数来做到这一点。我正在寻找基于 java 的解决方案。是否提供了任何基于 Java 的 sdk?

我发现 Datadog在这里提供 API 来安排停机时间

但我能看到的支持是 Python、Ruby 或 Curl。如何为它构建基于 Java 的解决方案?

0 投票
1 回答
3703 浏览

python - Datadog: ERROR:ddtrace.writer:cannot send services to localhost:8126: [Errno 111] Connection denied

我的应用程序在 docker 容器中运行,它无法与运行在 ec2 主机上的 dd-trace 代理通信

我已经完成了所有的配置,仍然面临着ERROR:ddtrace.writer:cannot send spans to localhost:8126: [Errno 111] Connection refused

知道如何解决这个问题吗?

0 投票
0 回答
452 浏览

ruby-on-rails - 什么可能导致 redis 命令/秒和延迟的随机峰值?

我正在使用 Datadog 和 NewRelic 来尝试追踪似乎在随机时间发生的奇怪行为。最近我注意到我在 NewRelic 中的应用程序的 REDIS 延迟出现了巨大的峰值。我将 Datadog 添加到 Redis 服务器并看到这些命令峰值/秒从约 0.5-2k 到超过 40-60k!随之而来的是带宽和负载的峰值,但只有非常重要的 CPU 变化。

当这些发生时,GoogleAnalytics (GA) 相比之下实际上表现出相当缓慢的一天。事实上,今天的整体应用程序负载比下图显示的那一天高出大约 2-3 倍,但今天的 REDIS 性能非常完美,没有任何延迟/命令峰值。

会不会是机器人/爬虫碰到了导致大量数据被一次插入的陈旧缓存?我的应用程序严重依赖外部 API,它偶尔也会导致响应时间激增,但为什么缓慢的 API 调用会导致 redis 调用速度变慢或 redis 命令出现大量峰值?

显示非常轻微的 CPU 峰值,但较大的命令/秒和带宽峰值

NewRelic 显示 Redis 延迟峰值

0 投票
0 回答
2127 浏览

debian - 启动失败(结果:启动限制)[debian - datadog 代理]

我做了什么?

通过我的 debian 8.x 主机上的命令行。

预期行为:

实际行为:

问题:

由于结果状态:启动限制,我无法启动服务。我等了大约9个小时。我的想法是服务状态将从多次重启尝试中恢复。它没。有任何想法吗?