问题标签 [apache-minifi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-nifi - 边缘 NiFi 处理器内集群节点之间的内容分布
我正在探索 NiFi 文档。我必须同意它是有据可查的开源项目之一。
我的理解是处理器在集群的所有节点上运行。但是,我想知道当我们使用 FetchS3Object、FetchHDFS 等内容拉取处理器时,内容是如何在集群节点之间分布的。在 FetchHDFS 或 FetchSFTP 等处理器中,所有节点都会连接到源吗?它是拆分内容并从多个节点获取,还是一个节点获取内容并在下游队列中对其进行负载平衡?
apache-nifi - minifi:listfile 处理器未从该位置获取文件
我刚刚开始使用 nifi 探索 minifi,两者都安装在我的本地计算机上。
在我启动 minifi 后,它在日志文件中抛出以下错误:
请帮忙。提前致谢
apache-nifi - Nifi中的预处理和后处理
我有一个要求,我想为每个处理器做一些预处理和后处理。基本上我想在每个流文件上添加开始时间结束时间和一些额外的细节那么什么是最好的方法。
- 创建自定义控制器服务
- 在每个处理器之后添加执行脚本
还是有什么其他方式?
apache-nifi - Kafka 处理器不保留流文件的属性状态
我更新了流文件的一些属性并将其放入 kafka 中,但是当我从 consumekafka_2.0 处理器使用相同的属性时,属性丢失了。这不支持吗?我需要定制这个处理器吗?
当我看到处理器的以下源代码时,我知道它已经从记录中读取属性并在流文件中写入相同的属性,那么为什么这些在流文件中不可用?
apache-nifi - 等待通知在 Nifi 中进行并行和顺序处理
我有一个要求,我需要并行执行 4 个作业,并且当在所有 4 个处理器中并行完成相同的项目作业时,然后为此触发下一个处理器,我使用了等待通知
流程就像 4 个并行作业 -> 通知(释放信号标识符 = ${itemid},信号计数器名称 = ${处理器名称}) -> 等待(释放信号标识符 = ${itemid},目标信号计数 = 4)和等待关系连接到同一个等待处理器-> 下一个处理器
这是第一次工作,但我注意到即使在满足目标信号计数条件后等待队列也没有清除,我猜这是它不适用于后续流程的问题。
一旦满足条件,它应该清除等待队列吗?
windows - 如何在 Windows 7 中将 minifi 作为服务运行?
我想将 minifi bat 文件作为窗口服务运行。
有什么方法可以在 Windows 7 中做到这一点?
谢谢!
windows - 在 Windows 上停止 MiNiFi
我需要能够停止在 Windows 机器上运行的 MiNiFi。这里: https ://docs.hortonworks.com/HDPDocuments/HDF3/HDF-3.4.0/minifi-quick-start/content/stopping_minifi.html
它告诉我使用:
或者
不幸的是,我使用的是 Windows,这些命令不起作用,即使是 Cygwin。
有什么想法,或者是我唯一的选择来确定我们在任务管理器中要杀死哪些进程?
apache-nifi - MiNiFi - 如何获取处理器列表和排队流文件的数量?
我想监视正在运行的 MiNiFi 流的状态,特别是获取处理器列表和每个处理器的排队流文件数。我正在尝试使用FlowStatus Script Query,例如:
但我只收到空值。我应该怎么做才能检索我想要的数据(在配置中启用某些选项?)?是否可以使用 flowStatus 查询?我正在运行的流程包含多个处理器,那么为什么systemdiagnostics
只显示两个availableProcessors
以及为什么我不能使用flowStatus processor
命令来获取任何处理器数据?
不幸的是 NiFi/MiNiFi 文档很差,所以我什至不确定我是否可以通过这种方式检索处理器数据(排队元素和处理器列表的数量)。如果没有,也许你知道其他方法吗?
apache-nifi - 如何基于高性能的内容进行路由?
在 nifi 中,如果我从单个主题收听 Kafka 并基于路由逻辑,它将调用相应的进程组。
但是,在RouteOnContent
处理器中,如果我们给出正则表达式来检查字符串的出现是否会影响性能或如何在基于条件的路由时获得良好的性能。
apache-nifi - 如何使用 NiFi 将字符串转换为 JSON 数组
在 NiFi 中,我正在处理一个包含以下属性的流文件:
我想在这个数组上拆分 flowFile 以分别处理每个元素(然后合并)。我尝试使用SplitJson
处理器,但它需要JSON内容才能操作,所以我之前使用AttributesToJSON
过。不幸的是,产生的flowFile的内容是:
我收到错误
$['my_array'] 的评估值 [u'firstElement', u'secondElement'] 不是 JSON Array 兼容类型,无法拆分。
是否可以将my_array
字符串转换为正确的 JSON 数组?我需要使用ExecuteScript
还是有一些更简单的方法?