我想知道是否有任何简单的方法可以将非合并的内存访问转换为合并的内存访问。让我们以这个数组为例:
dW[[w0,w1,w2][w3,w4,w5][w6,w7][w8,w9]]
现在,我知道如果块 0 中的线程 0 访问dW[0]
,然后块 0 中的线程 1 访问dw[1]
,那是全局内存中的合并访问。问题是我有两个操作。第一个是如上所述合并的。但第二个不是因为块 0 中的线程 1 需要对dW[0]
,dW[1]
和进行操作dW[2]
。
我知道容器的初始形状允许或禁止合并访问。但是dW
是一个非常大的数组,在这个过程中我无法对其进行转换。
你知道是否有可能缓解这个问题?