我有一个读取和写入数据库的分区作业。我的分块大小为 100。如果分区失败并且我希望从上次提交开始重新启动,我是否必须明确指定检查点?(在可序列化的 checkpointInfo() 中?)
如果是这样,如何/在哪里?
我有一个读取和写入数据库的分区作业。我的分块大小为 100。如果分区失败并且我希望从上次提交开始重新启动,我是否必须明确指定检查点?(在可序列化的 checkpointInfo() 中?)
如果是这样,如何/在哪里?
您需要为您的 ItemReader 实现这两个方法: checkpointInfo ( )和open()(您也可以为您的ItemWriter 实现)。
您可以在此答案中看到一个示例。
请注意,对于分区步骤,每个分区都有自己的检查点。通过这种方式,编程模型在分区和非分区步骤中从读取器/处理器/写入器的角度来看非常相似,因此它们可以独立于它们是否在分区中运行(大部分情况下)进行编写。