0

我很难理解这个概念。我在网上研究了很多,我唯一理解的是线程需要访问连续的数据。

因此,如果我们有一个 10000 个整数的数组,如果线程i访问数组的i第 - 个数字,那么内存将合并。

如果不是为所有整数设置 10000 个线程,而是决定设置 500 个线程,每个线程访问两个连续的整数,会怎样?在这种情况下,内存合并是可能的吗?

如果我们决定允许一个线程访问超过 2 个值,例如 10,该怎么办?

在这种情况下,内存合并将如何表现?在我上面描述的示例中,“连续访问”何时停止“连续”?

先感谢您

4

1 回答 1

1

我很难理解这个概念

这不是一个简短的描述可以完全涵盖的东西,尤其是您可能会遇到的所有澄清问题。

我的建议是参加以下网络研讨会之一:

使用 CUDA C 的 GPU 计算 – 高级 1 (2010)

CUDA 全球内存使用与策略 + 与 NVIDIA 的 Justin Luitjens 博士进行的实时问答

然后,当您有基于对该主题的一般理解的具体问题时再回来。

于 2013-07-03T04:41:13.073 回答