我正在尝试将日志文件摄取到 hadoop 中。
我想使用 oozie 来触发我的摄取任务(用 spark 编写),并让 oozie 将文件名传递给我的任务。
我希望将日志文件设置为:
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1/Log1.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1/Log1.1.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1/Log1.2.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/Log2.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/Log2.1.log
/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/Log2.2.log
(ETC)。
所以,现在我有两个问题:1.如何让oozie生成/example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log1下的所有文件名/ 并将其传递给我的应用程序;和
- 如何让 oozie 并行生成 /example/${YEAR}-${MONTH}-${DAY}-${HOUR}:${MINUTE}/Log2/ 下的所有文件名并将其传递给第二次调用我的任务。