java - NIFI：限制 NIFI 集群中 NIFI 处理器的并发任务数

Question

这个问题说明了一切。我该如何做以下事情之一：

我有一个 NIFI 集群和一个自写的专用处理器，它通过 JDBC 将大量数据加载到数据库中（每秒最多 20Mio 行）。它使用了一些数据库供应商特定的调优技巧，在我的特定情况下非常快。其中一个技巧需要为每个连接加载一个独占的空表。

目前，我的处理器在 NIFI-Cluster 中为每个节点打开一个连接（它从DBCPConnectionPool. 集群中有大约 90-100 个节点，我将获得 90-100 个连接——所有这些连接都同时批量加载数据。

我正在使用 NIFI 1.3.0.0

非常感谢任何帮助或评论。抱歉没有显示任何代码。大约 700 行并没有真正帮助解决这个问题。但我打算把它放在 Git 上，并作为开源项目 Kylo 的一部分。

score 4 · Accepted Answer

NiFi 中拆分任务的一种常见方法是将流文件拆分为主节点上的多个文件。然后其他节点将提取其中一个流文件并对其进行处理。

在您的情况下，每个文件都将包含一系列要从表中提取的值。假设您有 100 行，并且只想要 3 个节点来提取数据。因此，您将创建 3 个流文件，每个文件都有单独的属性值：

然后节点会从远程进程组或队列（例如 JMS 或 SQS）中获取流文件。只有 3 个流文件，因此从连接加载数据的节点不超过 3 个。

1 回答 1