apache-flink - Flink 网络缓冲区使用率高，导致 Kafka 滞后

Question

我们的 Flink Jobs 包含一个过滤器，按会话 id 键，然后是间隔 30 分钟的会话窗口。会话窗口将需要累积会话的所有事件，并使用ProcessWindowFunction.

我们正在使用 Flink 1.9，总共 20G 内存的 128 个容器来运行我们的工作，截止比率为 0.3。我们正在做增量检查点。

当会话窗口开始触发process功能时，网络缓冲区使用率开始变得相当高，然后我们开始让 Kafka 输入滞后。我们的设置：

state.backend: rocksdb
state.checkpoints.dir: hdfs://nameservice0/service
state.backend.rocksdb.memory.managed: true
state.backend.incremental: true
#https://github.com/facebook/rocksdb/wiki/Memory-usage-in-RocksDB
state.backend.rocksdb.memory.write-buffer-ratio: 0.6
state.backend.rocksdb.memory.high-prio-pool-ratio: 0.1
state.backend.rocksdb.block.blocksize: 16mb
state.backend.rocksdb.writebuffer.count: 8
state.backend.rocksdb.writebuffer.size: 256mb
state.backend.rocksdb.timer-service.factory: heap

containerized.heap-cutoff-ratio: 0.25
taskmanager.network.memory.fraction: 0.85
taskmanager.network.memory.min: 512mb
taskmanager.network.memory.max: 7168mb
taskmanager.network.memory.buffers-per-channel: 8
taskmanager.memory.segment-size: 4mb
taskmanager.network.memory.floating-buffers-per-gate: 16
taskmanager.network.netty.transport: poll

部分图表：

任何建议将不胜感激！

score 1 · Accepted Answer

如果我可以访问详细信息，以下是我将尝试提高此应用程序性能的内容：

(1) 是否可以重新实现窗口以进行增量聚合？目前，这些窗口正在构建可能相当长的事件列表，并且它们仅在会话结束时通过这些列表工作。这显然需要足够长的时间才能对 Kafka 造成背压。如果您可以预先聚合会话结果，这将平衡处理，并且问题应该会消失。

不，我并没有与我在这里所说的相矛盾。如果我不清楚，请告诉我。

(2) 你已经放置了很多额外的网络缓冲。这通常会适得其反；您希望背压快速反弹并限制源，而不是将更多数据推入 Flink 的网络缓冲区。

您最好减少网络缓冲，如果可能，请使用可用资源来提供更多插槽。当一个插槽忙于处理刚刚结束的长会话的内容时，拥有更多插槽将减少影响。为 RocksDB 提供更多内存可能也会有所帮助。

（3）看能不能优化序列化。最好和最差的串行器之间的吞吐量可能相差 10 倍。请参阅Flink 序列化调优。如果记录中有您实际上不需要的任何字段，请将它们删除。

(4) 看调优 RocksDB。确保为 RocksDB 使用最快的可用本地磁盘，例如本地 SSD。避免将网络附加存储（例如 EBS）用于state.backend.rocksdb.localdir.

score 0 · Accepted Answer

我不知道 flink 的内部结构，但原因可能与会话窗口有关。我的意思是，如果您有如此多的会话操作具有相同的间隔（30 分钟），那么所有会话操作将同时执行，这可能会产生延迟。

apache-flink - Flink 网络缓冲区使用率高，导致 Kafka 滞后

2 回答 2

Related

Reference