在我的情况下,Flink 将指标发送到 Datadog。Datadog 主机图如下所示{我不知道为什么在这里显示延迟}
Flink 指标被发送到 localhost。这里的问题是,当
flink-conf.yaml
文件配置如下
# adding metrics
metrics.reporters: stsd , dghttp
metrics.reporter.stsd.class: org.apache.flink.metrics.statsd.StatsDReporter
metrics.reporter.stsd.host: localhost
metrics.reporter.stsd.port: 8125
# for datadog
metrics.reporter.dghttp.class: org.apache.flink.metrics.datadog.DatadogHttpReporter
metrics.reporter.dghttp.apikey: xxx
metrics.reporter.dghttp.tags: host:localhost, job_id : jobA , tm_id : task1 , operator_name : operator1
metrics.scope.operator: numRecordsIn
metrics.scope.operator : numRecordsInPerSecond
metrics.scope.operator : numRecordsOut
metrics.scope.operator : numRecordsOutPerSecond
metrics.scope.operator : latency
问题是 Datadog 显示了 163 个我不理解的指标,我稍后会解释
我不理解 datadog 中的指标格式,因为它向我显示了类似这样的指标
现在如上图所示
- 延迟以时间表示
- 每秒事件数是事件/秒
- 计数是一些值
所以我的问题是这是哪个指标?
另外,我工作的执行计划是这样的
如何将 Datadog 中的指标与 Flink 中的执行计划算子联系起来?
我在 Flink API 1.3.2中读到我可以使用标签,我尝试在 flink-conf.yaml 文件中使用它们,但我不知道它们在这里有什么意义。
在这种情况下,我的最终目标是在每个操作员处找到操作员延迟、输出和输入/秒的记录数