3

DataStage 版本是 8.1 - 我没有直接访问权限,但需要提供说明来为我提取一些作业运行时统计信息。我相信存储库在 DB2 数据库中,或者如果在 8.1 中仍受支持,则可能在平面文件中。我无法在那里安装任何工具。

有一个包含几十个作业的主序列。其中一些是平行的。该序列本身一次运行一个,并且在白天不断运行。

在 24 小时内,我需要为此主序列提取性能统计信息。像这样的东西:

job_name, start_time, finish_time, completion_status

我真的只需要时间信息。我可以使用任何格式,但最终我真正想要的是一个 csv 样式的文件,其时间安排如上。

我得到了一些关于 dsjob -report 的提示,但我在 DataStage 中没有足够的背景知识来提供良好的说明。希望自己能够访问,但我还是 DataStage 的菜鸟。

提前致谢。

4

2 回答 2

2

您可以将作业上次运行的元数据导出到 XML 文件。

#!/usr/bin/ksh

project="yourProjectName"
job="yourJobName"

dsjob -report $project $job XML >"$project_$job.xml"
于 2017-03-19T05:39:24.953 回答
1

您可以使用 Director 导出序列日志并在作业开始和完成时进行解析。或者,您可以通过命令行导出日志(请参阅 dsjob -logsum 命令),然后在 awk 中进行解析(如果在 UNIX 或 AIX 系统上)。

如果您有能力修改序列,您可以在序列中的作业之前和之后添加一个活动阶段并写入文件。

于 2013-10-20T00:25:54.743 回答