“hortonworks-dataflow”的相关标签问题

0 投票

1 回答

1186 浏览

hadoop - Apache Nifi 无法写入 HDFS

当我尝试使用 PutHDFS 处理器将文件放在 HDFS 上时，出现以下错误：

我使用 HortonWorks 沙箱 HDP 和 HDF（Windows 上的 docker 容器）。好像是Nifi的问题，HDFS没问题，可以放/写/读。

我正在尝试解决此问题，但没有结果，我删除了 docker 的 HDP 图像并获得了一个新图像，但也没有结果。

2018-05-31T14:47:14.117

0 投票

1 回答

1201 浏览

apache-nifi - Apache Nifi - 使用 Kafka + 合并内容 + 放置 HDFS 以避免小文件

我在 Kafka 主题中有大约 2000000 条消息，我想使用 NiFi 将这些记录放入 HDFS，所以我PutHDFS同时使用处理器，ConsumeKafka_0_10但它在 HDFS 中生成小文件，所以我使用合并内容处理器来合并记录在推送文件之前。如果配置需要更改，请提供帮助这适用于少量消息，但在涉及大量数据的主题时为每条记录写入一个文件。

谢谢！！

apache-nifi hortonworks-dataflow

2018-07-18T13:39:06.730

0 投票

1 回答

102 浏览

apache-nifi - Ambari 自动重定向到 NiFi

我在我的 Hortonworks 中安装了 NiFi，每当我在 Ambari 中开始我的会话时，我都会被重定向到 NiFi。有谁知道如何更改它，以便我的 localhost:8080 不会自动重定向到 NiFi？我附上了下面的图片。

提前致谢：）

apache-nifi hortonworks-data-platform ambari hortonworks-dataflow

2018-07-25T10:10:04.670

0 投票

2 回答

629 浏览

apache-nifi - NiFi中触发了FetchFolder？

我正在使用 NiFi 使用专有处理工具（在 NiFi外部运行）来编排大型二进制文件的处理。

NiFi 将源文件放在磁盘上，我调用外部工具（使用 ExecuteScript 处理器），该工具加载二进制文件并继续生成许多较小的文件。

当外部工具完全完成后，我需要“拾取”较小（生成）文件的目录并继续通过 NiFi 处理。我需要等待，因为 [输出目录]、[文件数] 和 [处理所需时间] 是动态的。

问题：

GetFile（获取目录）没有上游连接，所以我无法在处理完成后触发它。
ListFile + FetchFile 组合不起作用 b/c ListFile 没有上游连接，所以 - 再次 - 我无法在处理完成后触发它。

...那么，在完成二进制处理后，我可以使用什么处理器来获取新文件的目录并将它们带入 NiFi 领域？

apache-nifi hortonworks-dataflow

2018-08-16T15:53:45.810

0 投票

1 回答

621 浏览

apache - NiFi GenerateTableFetch 不存储每个 database.name 的状态

我正在测试 NiFi 以替换我们当前的摄取设置，该设置从表的多个 MySQL 分片导入数据并将其存储在 HDFS 中。

我正在使用GenerateTableFetch并ExecuteSQL实现这一目标。

每个传入的流文件都有一个database.name属性，用于DBCPConnectionPoolLookup选择相关的分片。

问题是，假设我有 2 个分片要从中提取数据，shard_1对于shard_2表帐户，我也有updated_atas Maximum Value Columns，它没有为table@updated_at每个分片存储状态。状态中的每个表只有 1 个条目。

当我检查 Data Provenance 时，我看到 shard_2 流文件文件在没有传递给 ExecuteSQL 的情况下被删除。我的猜测是，这是因为 shard_1 查询首先执行，然后当 shard_2 查询到来时，它的记录会与 shard_1 的 updated_at 进行检查，并且由于它返回空，它会删除文件。

有没有人遇到过这个问题？还是我错过了什么？

apache apache-nifi hortonworks-data-platform hortonworks-dataflow

2018-09-08T21:37:58.177

0 投票

2 回答

2374 浏览