问题标签 [oozie-workflow]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
414 浏览

apache-spark - 为什么 Oozie 需要 jobTracker 和 nameNode?

我正在使用 Apache Oozie 来安排一些 Apache Spark 应用程序。我阅读了更多关于 Oozie 的文档并创建了一些计划作业的示例。我意识到所有工作流都包含 jobTracker 和 nameNode 属性。为什么 Oozie 需要其中 2 个。如果我没有 jobTracker 属性(它指向纱线资源管理器)。这是怎么回事?任何人都可以为我解释一下吗?谢谢!

0 投票
0 回答
23 浏览

oozie - OOZIE 工作流程的 lastModTime 是什么?

当我与 OOZIE REST API 讨论特定的工作流程时,

我得到这样的回应,

有谁知道这个'lastModTime'到底是什么?

我想监视我今天运行的作业,我不确定“lastModTime”是否是用于此目的的正确字段。

0 投票
1 回答
611 浏览

apache-spark - Oozie Spark HBase 作业,无效凭据异常

我确实对 Kerberos 凭据有疑问。这项工作基于集群,并且在每个数据节点上都提供了密钥表。基本上它是一个 oozie 工作流 shell 操作,其目的是通过 spark 作业写入 HBase。如果作业在没有 oozie 的集群模式下运行,它会按预期工作。但是对于 oozie,它会抛出一个异常,如下所示:

oozie shell 动作如下所示:

submit.sh 文件的 spark-submit 命令如下所示:

0 投票
1 回答
310 浏览

sqoop - Oozie Sqoop 工作流刷新表

我通过查询在 Oozie 编辑器中创建的工作流来更新 impala 表。(但谁在乎呢?只是“我更新表格”。

而且,在工作流程结束时,您需要运行“刷新”。但我不知道该怎么做。我需要非 bash 方法。

Oozie 可以自己执行 impala-ddl 吗?

0 投票
0 回答
136 浏览

oozie - oozie 启动器执行的重复 java 操作

我正面临 oozie-5.0.0 的以下问题。

我的 oozie 工作流有一个 java 动作,它被同一个 oozie 启动器执行了两次。

我发现这种情况正在发生,因为 oozie 启动器被分配了 2 个纱线容器,每个容器调用 java 操作,从而执行重复的操作。

只想知道如何避免重复操作被执行。

0 投票
2 回答
127 浏览

hadoop - 如何找到由 oozie (hadoop) 作业运行的 hadoop 应用程序

我们知道第一个 oozie 运行一个 hadoop 作业,并使用该作业运行其他 hadoop 应用程序。因此,我想找到由 oozie (hadoop) 作业运行的那些 hadoop 应用程序(例如 application_231232133)的列表。目前没有这样的 api 或命令。

0 投票
2 回答
524 浏览

hive - oozie 工作流中使用 hcatalog 的 sqoop 操作有问题

当我使用 sqoop export 命令将数据从 hive 导出到 mirosoft sql server 时,在 ambary-views 中使用带有 hcatalog 的 sqoop actin 时遇到问题。

以下命令在 shell 中正确运行,效果很好。

但是当我在 oozie 工作流程中使用此命令创建 sqoop 操作时,出现以下错误:

为了解决此错误,我执行以下操作:

  • 在workflow.xml所在的文件夹下,我创建文件夹lib并将来自sharedlibDir的所有配置单元jar文件(/user/oozie/share/lib/lib_201806281525405/hive

我的目标是做到这一点,组件识别 hcatalog jar 文件和类路径,所以我不确定,也许我不应该这样做,并为这个错误做不同的解决方案

无论如何,在这样做之后,错误已更改如下:

版本:

HDP 2.6.5.0

纱线 2.7.3

蜂巢 1.2.1000

sqoop 1.4.6

oozie 4.2.0

请帮我解决错误和问题以及为什么 sqoop 命令在 shell 中正常工作但在 oozie 工作流程中有错误?

0 投票
1 回答
391 浏览

sqoop - 如何包含 oozie 的 jar 文件

我正在尝试在 oozie 中执行 sqoop 操作,但 /user/oozie/share/lib/sqoop 中不存在 mysql-connector-java.jar,因为没有权限我现在无法添加 jar,
是有任何方法或解决方法可以在 workflow.xml 中包含 mysql-connector-java.jar

我已将 jar 放在 sqoop 应用程序 / lib 目录中,但它不起作用

0 投票
1 回答
704 浏览

oozie - oozie 4.2.0 版本中的重试最大值

我有 oozie 4.2.0 HDP 版本,我想对我的 spark-action 和 shell action 使用“Max-retries”。当我在 ERROR 状态后提交工作流时,它会进入 USER-RETRY 状态,然后再次重试。当我查看该操作的 oozie -info 时,它给我的重试次数为“0”。

我寻找“-重试”,但它在 5.x.xversion 中可用。

有什么方法可以让我查看重试次数吗?

0 投票
2 回答
139 浏览

hadoop - 查找从 Oozie 协调器启动的工作流作业的堆栈跟踪

我有这个规范的准系统 Oozie 协调器:

它在计划的标称开始时间附近启动了工作流作业。但后来,日志显示工作流作业进入失败状态。为了检索工作信息,我运行了:

它提供了有用的信息,包括以下异常跟踪:

不幸的是,这个堆栈跟踪——显然是由它产生的SparkSubmit——并没有说明为什么我的工作流作业(一个 Scala 程序)实际上失败了。

这似乎是一个足够常见的场景——工作流逻辑失败并触发它自己的堆栈跟踪。

在 Hadoop / Oozie / Coordinator / Workflow 设置中是否有其他地方可以查找此类堆栈跟踪?