3

我有几个 Spring Batch (2.1.9.RELEASE) 作业在生产中运行,使用org.springframework.batch.core.launch.support.RunIdIncrementer.

偶尔,我收到以下错误:

org.springframework.batch.core.repository.JobInstanceAlreadyCompleteException: A job instance already exists and is complete for parameters={run.id=23, tenant.code=XXX}.  If you want to run this job again, change the parameters.
    at org.springframework.batch.core.repository.support.SimpleJobRepository.createJobExecution(SimpleJobRepository.java:122) ~[spring-batch-core-2.1.9.RELEASE.jar:na]
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) ~[na:1.6.0_39]
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) ~[na:1.6.0_39]
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25) ~[na:1.6.0_39]
    at java.lang.reflect.Method.invoke(Method.java:597) ~[na:1.6.0_39]
    at org.springframework.aop.support.AopUtils.invokeJoinpointUsingReflection(AopUtils.java:318) ~[spring-aop-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at org.springframework.aop.framework.ReflectiveMethodInvocation.invokeJoinpoint(ReflectiveMethodInvocation.java:183) ~[spring-aop-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:150) ~[spring-aop-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at org.springframework.transaction.interceptor.TransactionInterceptor.invoke(TransactionInterceptor.java:110) ~[spring-tx-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:172) ~[spring-aop-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at org.springframework.batch.core.repository.support.AbstractJobRepositoryFactoryBean$1.invoke(AbstractJobRepositoryFactoryBean.java:168) ~[spring-batch-core-2.1.9.RELEASE.jar:na]
    at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:172) ~[spring-aop-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at org.springframework.aop.framework.JdkDynamicAopProxy.invoke(JdkDynamicAopProxy.java:202) ~[spring-aop-3.1.1.RELEASE.jar:3.1.1.RELEASE]
    at sun.proxy.$Proxy64.createJobExecution(Unknown Source) ~[na:na]
    at org.springframework.batch.core.launch.support.SimpleJobLauncher.run(SimpleJobLauncher.java:111) ~[spring-batch-core-2.1.9.RELEASE.jar:na]
    at org.springframework.batch.core.launch.support.CommandLineJobRunner.start(CommandLineJobRunner.java:349) [spring-batch-core-2.1.9.RELEASE.jar:na]
    at org.springframework.batch.core.launch.support.CommandLineJobRunner.main(CommandLineJobRunner.java:574) [spring-batch-core-2.1.9.RELEASE.jar:na]
    at (omitted for brevity)

来自各种 XML 上下文的示例:

<bean
    id="jobParametersIncrementer"
    class="org.springframework.batch.core.launch.support.RunIdIncrementer" />

<batch:job id="rootJob"
    abstract="true"
    restartable="true">
    <batch:validator>
        <bean class="org.springframework.batch.core.job.DefaultJobParametersValidator">
            <property name="requiredKeys" value="tenant.code"/>
        </bean>
    </batch:validator>
</batch:job>

<batch:job id="rootJobWithIncrementer"
    abstract="true"
    parent="rootJob"
    incrementer="jobParametersIncrementer" />

org.springframework.batch.core.launch.support.CommandLineJobRunner用来执行工作:

java org.springframework.batch.core.launch.support.CommandLineJobRunner /com/XXX/job123/job123-context.xml job123 tenant.code=XXX -next 

所有作业(使用增量器)都rootJobWithIncrementer作为父作业。

我做了很多研究,发现一些得到这个错误的人成功地改变了事务管理器的隔离级别。折腾了好几层,终于到了READ_COMMITED

<batch:job-repository
    id="jobRepository"
    data-source="oracle_hmp"
    transaction-manager="dataSourceTransactionManager"
    isolation-level-for-create="READ_COMMITTED"/>

根据我的理解,这种类型的错误只有在多个进程同时执行同一个作业时才会发生——这样可能会出现增量器争用。在这种情况下,情况并非如此,但我们看到了错误。

关于可能导致此问题的任何想法?我应该尝试不同的隔离级别吗?还有什么?

谢谢!

这里有一个类似的问题,但没有很好的记录(也缺乏和答案)。

4

1 回答 1

1

这可能是一个很长的镜头,但我花了很长时间才弄清楚,因为唯一的症状是偶尔会JobInstanceAlreadyCompleteException像你描述的那样,所以我想我会建议它。

我使用的数据库是 Oracle 和BATCH_JOB_SEQBATCH_JOB_EXECUTION_SEQ创建的两者都有CACHE_SIZE10。

这有时会导致JOB_INSTANCE_IDandJOB_EXECUTION_ID无法正确排序。Spring Batch 假设最近JOB_INSTANCE的是带有max(JOB_INSTANCE_ID)(参见 参考资料org.springframework.batch.core.repository.dao.JdbcJobInstanceDao.FIND_LAST_JOBS_BY_NAME)的那个。由于我的序列有时会被抛出,这个假设并不总是成立。

我通过将序列设置为来修复它NO_CACHE

判断这是否是您的问题的一种简单方法是检查您的序列是否完全设置为 CACHE 和/或确保每次新运行时您的JOB_INSTANCE_IDJOB_EXECUTION_ID总是上升。

于 2013-08-16T15:39:01.507 回答