8

我正在尝试实现一个多线程解决方案,这样我就可以并行化我的业务逻辑,包括读取和写入数据库。

技术栈:Spring 4.0.2、Hibernate 4.3.8

这是一些要讨论的代码:

配置

@Configuration
public class PartitionersConfig {

    @Bean
    public ForkJoinPoolFactoryBean forkJoinPoolFactoryBean() {
        final ForkJoinPoolFactoryBean poolFactory = new ForkJoinPoolFactoryBean();
        return poolFactory;
    }
}

服务

@Service
@Transactional
public class MyService {

    @Autowired
    private OtherService otherService;

    @Autowired
    private ForkJoinPool forkJoinPool;

    @Autowired
    private MyDao myDao;

    public void performPartitionedActionOnIds() {
        final ArrayList<UUID> ids = otherService.getIds();

        MyIdPartitioner task = new MyIdsPartitioner(ids, myDao, 0, ids.size() - 1);
        forkJoinPool.invoke(task);
    }
}

存储库/DAO

@Repository
@Transactional(propagation = Propagation.MANDATORY)
public class IdsDao {

    public MyData getData(List<UUID> list) {
        // ... 
    }
}

递归动作

public class MyIdsPartitioner extends RecursiveAction {

    private static final long serialVersionUID = 1L;
    private static final int THRESHOLD = 100;

    private ArrayList<UUID> ids;
    private int fromIndex;
    private int toIndex;

    private MyDao myDao;

    public MyIdsPartitioner(ArrayList<UUID> ids, MyDao myDao, int fromIndex, int toIndex) {
        this.ids = ids;
        this.fromIndex = fromIndex;
        this.toIndex = toIndex;
        this.myDao = myDao;
    }

    @Override
    protected void compute() {
        if (computationSetIsSamllEnough()) {
            computeDirectly();
        } else {
            int leftToIndex = fromIndex + (toIndex - fromIndex) / 2;
            MyIdsPartitioner leftPartitioner = new MyIdsPartitioner(ids, myDao, fromIndex, leftToIndex);
            MyIdsPartitioner rightPartitioner = new MyIdsPartitioner(ids, myDao, leftToIndex + 1, toIndex);

            invokeAll(leftPartitioner, rightPartitioner);
        }
    }

    private boolean computationSetIsSamllEnough() {
        return (toIndex - fromIndex) < THRESHOLD;
    }

    private void computeDirectly() {
        final List<UUID> subList = ids.subList(fromIndex, toIndex);
        final MyData myData = myDao.getData(sublist);
        modifyTheData(myData);
    }

    private void modifyTheData(MyData myData) {
        // ...
        // write to DB
    }
}

执行此操作后,我得到:

没有找到标记为传播“强制”的交易的现有交易

我知道这是完全正常的,因为事务不会通过不同的线程传播。因此,一种解决方案是在另一个类似问题中提出的每个线程中手动创建一个事务。但这对我来说还不够令人满意,所以我一直在寻找。

在 Spring 的论坛中,我发现了关于该主题的讨论。有一段我觉得很有趣:

“我可以想象一个人可以手动将事务上下文传播到另一个线程,但我认为你不应该真正尝试它。事务绑定到单个线程是有原因的 - 基本的底层资源 - jdbc 连接 - 不是线程安全的。使用多线程中的单个连接会破坏基本的 jdbc 请求/响应合同,并且它是否可以在更多琐碎的示例中工作,这将是一个小问题。”

于是第一个问题出现了:并行化对数据库的读/写是否值得,这真的会损害数据库的一致性吗?
如果上面的引用不正确,我怀疑,有没有办法实现以下目标: 由 Spring 管理的 MyIdPartitioner - 使用 @Scope("prototype") - 并将递归调用所需的参数传递给它并以这种方式将事务管理留给 Spring?

4

2 回答 2

1

经过进一步阅读,我设法解决了我的问题。有点(就像我现在看到的那样,一开始没有问题)。

由于我从数据库中读取的内容是分块的,我确信在这段时间内不会编辑结果,我可以在事务之外进行。

在我的情况下,写作也是安全的,因为我写的所有值都是唯一的,并且不会发生违反约束的情况。所以我也从那里删除了交易。

我所说的“我删除了事务”的意思只是在我的 DAO 中覆盖方法的传播模式,例如:

@Repository
@Transactional(propagation = Propagation.MANDATORY)
public class IdsDao {

    @Transactional(propagation = Propagation.SUPPORTS)
    public MyData getData(List<UUID> list) {
        // ... 
    }
}

或者,如果您出于某种原因决定需要事务,那么您仍然可以通过将传播设置为REQUIRED.

所以解决方案比我想象的要简单得多。

并回答我的其他问题:

并行化对数据库的读/写是否值得,这真的会损害数据库的一致性吗?

是的,这是值得的。只要你有每个线程的事务,你就很酷。

有没有办法实现以下目标: MyIdPartitioner 由 Spring 管理 - 使用 @Scope("prototype") - 并将递归调用所需的参数传递给它,然后将事务管理留给 Spring?

是的,有一种方法可以使用池(另一个 stackoverflow 问题)。或者您可以将您的 bean 定义为,@Scope(value = "prototype", proxyMode = ScopedProxyMode.TARGET_CLASS)但是如果您需要为其设置参数,它将无法工作,因为实例的每次使用都会为您提供一个新实例。前任。

@Autowire
MyIdsPartitioner partitioner;

public void someMethod() {
    ...
    partitioner.setIds(someIds);
    partitioner.setFromIndex(fromIndex);
    partitioner.setToIndex(toIndex);
    ...
}

这将创建 3 个实例,并且您将无法使用有益的对象,因为不会设置字段。

简而言之 - 有一种方法,但我不需要一开始就去做。

于 2015-08-05T10:46:28.537 回答
0

这应该可以通过 atomikos ( http://www.atomikos.com ) 和可选的嵌套事务实现。

如果您这样做,那么如果同一根事务的多个线程写入数据库中的相同表,请注意避免死锁。

于 2015-08-01T08:13:28.640 回答