问题标签 [oozie-coordinator]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - HDFS 文件 FTP 从集群到另一台机器
我想创建一个 Oozie 工作流来将 HDFS 文件从 HDFS 集群传输到另一台服务器。
由于 Oozie 可以在系统中的任何节点上运行命令或脚本,是否可以在其中一个节点上运行 shell 脚本或 SFTP 并将文件传输到目标服务器。
oozie - Oozie workflow id generation
Is is possible to know the workflow id of the next oozie job that gets generated? When oozie is restarted, its hard to know the next oozie workflow id. Any way to get it guys?
Thanks,
Vishnu Ganth
apache-spark - Oozie 不支持 Spark 作业
似乎 apache oozie 目前不支持 Spark 作业,对吗?有什么方法可以将 spark 工作集成到 oozie 中?
hadoop - 使用不同的输入值运行相同的协调器
我有一个协调器,我想用不同的输入值运行它。例如,下面是提供的“输入事件”。我想使用以下参数“苯_hbase_input_offset”值运行协调器作业:
- (-24) - 查看过去 24 小时的数据。
- (-96) - 查看过去 96 小时的数据。
现在我只运行选项'2'。为了避免代码重复,我想为“start-instance”参数运行相同的协调器,但输入不同。我怎样才能做到这一点?
cloudera - Oozie 日期时间开始
我在我的 flume.config 上运行了一个我自己的自定义源,它负责每小时从 Facebook 页面中提取数据。
我想知道是否有任何方法可以设置我的协调员开始时间的提取时间?
就像,我将我的协调器设置为从 2015 年 1 月 1 日上午 12 点开始,然后我的水槽同时开始提取。
这是我的自定义来源:
谢谢您的帮助。
oozie - oozie 作业日志的存储位置
当我需要查找 oozie 工作日志时。我得到了具有以下条目的配置。
${oozie.log.dir}/oozie.log
我想知道,${oozie.log.dir} 参数解析什么?这是 Oozie 服务器中的路径吗?如果是,我们可以访问它吗?
提前致谢 !
hadoop - 使用 oozie 的 hive 循环协调器
我在使用 oozie 运行 hive 协调器时遇到问题。这就是我的 jobs.properties 文件的样子:
这是 coordinator.xml
但是当我运行我的工作时,我遇到了以下错误。
我的工作流程运行良好,当我尝试附加协调器时出现问题。
hadoop - Oozie 作业卡在 Running 状态
我有一个简单的作业工作流程,它将 mapreduce 作业作为 shell 操作执行。提交作业后,其状态变为正在运行,并一直停留在那里,但永远不会结束。mapreduce 集群显示有两个作业正在运行,一个属于 shell 应用程序启动器,另一个用于实际的 mapreduce 作业。然而,mapreduce 作业的一个显示为 UNASSIGNED 并且进度为零(这意味着它已经开始了)。
有趣的是,当我终止 oozie 作业时,mapreduce 作业实际上开始运行并成功完成。看起来 shell 启动器正在阻止它。
ps 这是一个简单的工作流程,没有可能导致它等待的开始或结束日期。
hadoop - 如何提交 oozie 协调员工作
我有一个在 coordinator.xml 文件中定义的 oozie 协调器作业,它运行在 workflow.xml 文件中定义的工作流作业。我想运行协调器作业,但是当我发出命令“oozie job -oozie http://.../oozie/ -config ./job.properties -run”时,它运行的是工作流而不是协调器。我怎么能告诉它运行协调器而不是工作流?
hadoop - 如何阻止 Oozie 协调器?
我运行了一个 Oozie 协调器,它每小时运行一个工作流。我没有它的 ID,当我运行命令oozie jobs -oozie http://localhost:11000/oozie
时,它只显示工作流作业并且没有协调器。我想阻止该协调员进一步处理,我该怎么做?