我注意到我的一个数据流作业产生了输出,我可以最好地描述为太多随机位翻转。例如,年份“2014”(作为文本)写为“0007”或“2016”或“0052”或其他文本值。在某些情况下,输出行格式是有效的(这表明在处理过程中发生了某些事情),但似乎也有几行格式错误(例如,“20141215-04-25”而不是“2014-12-25”之类的东西)。
我偶尔会使用相同的代码和不同的日期范围参数重新运行作业,并且对于这个特定的日期范围,作业直到大约一周前才成功完成。虽然我一直在尝试不同的机器配置(4 cpu 和 1-cpu 实例),但问题似乎更多地发生在 4-cpu 实例上。
有谁知道可能导致这种情况的原因是什么?
谢谢,G