问题标签 [hortonworks-dataflow]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
kerberos - Hortonworks:如何管理用户
我是 Hadoop 管理和 Hortonworks Hadoop 的新手。我的问题是在 Hortonworks 中管理用户的常见做法是什么。Ambari 允许我创建用户,但公司如何将 Ambari 中的用户映射到他们的用户。我看到在 Hortonworks 中,我可以启用 Kerberos;这是允许公司用户(例如在 LDAP 中)使用相同的用户名/密码登录 Hortonworks 的方式吗?我不是在这里寻找细节,而只是关于常见做法的一些指导。
apache-nifi - 在不重新启动 Nifi 服务的情况下重新加载 Nifi 库
我需要知道是否有任何方法可以在不重新启动服务的情况下刷新/重新加载 nifi 库?
我们有不同国家之间共享的大型 Nifi Central 集群,集群的任何变化都会影响到每个人。任何测试都很难承受停机时间。
有人有办法解决吗?
apache-nifi - Nifi - 通过 Rest API 更新远程进程组
我们正在使用模板来打包两个 nifi 集群之间的一些数据传输作业,一个充当发送者,另一个充当接收者。我们的一项工作包含一个远程进程组,并且在创建模板时一切正常。
然而,当我们通过我们的环境(dev、test、pre、prod)部署模板时,不得不在用户界面中手动删除并重新创建一个远程进程组是乏味和烦人的。我想自动化这个以简化部署模板并减少人工干预。
是否可以通过 rest-api 更新远程处理器组及其端口配置?
我是否只使用 REST api 来创建具有正确配置的新 RPG?
有人对这个有经验么?
json - 使用 Apache NiFi 进行数据操作的 JSON 转换
我想对下面的示例 JSON 进行一些基本转换,我想将 timeStamp 标记的值更改为日期格式,并想使用 NiFi 向我预期的 JSON 输出添加一个created_ts
值为 的新标记。current_timestamp
示例 JSON:
预期的 JSON:
您能否帮助了解在 Apache NiFi/HDF 中要遵循的详细步骤。
apache-nifi - HDF 3.0.1 - Schema_Registry 启动异常
我正在通过 ambari 设置 HDF 3.0.1 集群。我确实成功安装了 Ambari 2.5.1。我正在使用 Postgres 8.3(Ambari 2.5.1 附带的默认版本)。
目前,我面临启动schema_Registry
. 该服务已添加到 Ambari。但是,我无法开始同样的事情。我收到以下异常。请帮助提出解决方案。
apache-kafka - nifi作为kafka的生产者:读取Kafka时数据不连续
我正在使用 publishKafka_0_10 处理器将流文件从 nifi 发布到 kafka。通过代码从 Kafka 读取数据时,不维护数据的顺序(根据时间戳排序)。我的数据集是这样的:时间戳、通道、值。
只是为了调试,我使用 PutSql 将相同的流文件发布到 phoenix,我可以看到在 Phoenix 表中,数据是顺序的(按时间排序)。如果有人向我解释为什么我不能按顺序从 kafka 读取数据,那就太好了。kafka的topic只有一个partition。提前致谢。
apache-nifi - NIfi 控制器服务一对一处理器,还需要吗?
我们有nifi
一对一对一的控制器和处理器,控制器维护一个与特定 JMS 的连接工厂,该 JMS 不能由另一个处理器共享。
对于这种情况,是否建议摆脱控制器并在处理器中创建连接工厂?控制器的逻辑很少,所以我正在考虑整合。
apache-kafka - 从本地机器在 HDF3.0.2 中的 Kafka 中生成消息
我在我的 Mac 上的 VmWare 中运行了 Hortonworks DataFlow (HDF3.0.2)。Kafka broker 运行在 6667 端口,沙箱 IP 地址为 172.17.0.2
在 java 程序中,在我的 mac 上本地运行,我的引导服务器配置如下:
Java 程序只是挂起不能在 kafka 主题中产生消息。我尝试禁用防火墙,在 /etc/hosts 中添加条目为:
并将引导服务器配置条目更改为使用 sandbox-hdf.hortonworks.com,但没有运气。
对 172.17.0.2 6667 的 telnet 命令也挂起,并给出连接超时错误。
非常感谢从 Vmware 外部在 HDF 3.0.2 中运行的 Kafka 中生成消息的任何帮助。如果我遗漏了什么,请告诉我。
感谢您的时间和帮助。
json - 在 nifi 中将 JSON 转换为 CSV
我想在 nifi 中将 JSON 文件转换为 CSV。我们可以在 Python 和其他编程语言中实现这一点,并且有很多关于它的文章。我有多个 JSON 文件,每个文件都有不同的架构(一个特定的文件只有一个架构)。我可以看到有模板可以将 CSV 转换为 JSON 和其他转换。但我没有看到任何将 JSON 数据转换为 CSV 的模板。我已经阅读了文章https://community.hortonworks.com/articles/64069/converting-a-large-json-file-into-csv.html,但是在这里我们对架构进行了硬编码。由于我有多个文件并且每个文件都有不同的架构,因此我无法对架构进行硬编码。请有任何建议。