- 下面的代码会按顺序执行吗?(我无法将设备到设备的副本
cudaMemcpy2DArrayToArray()
放入stream
) - 下面的代码会异步执行吗?(
cudaMemcpy2DArrayToArray()
没有异步对应)
我知道代码示例可以更有效地实现,但它仅用作示例。
for( i=0; i<10; i++ )
{
cudaMemcpy2DArrayToArray( dst, src ); // device to device copy.
cudaBindTextureToArray( texture_reference, dst, ... ) // bind dst to texture.
kernel<<< dimGrid, dimBlock, 0, stream >>>( out ) // compute an array.
cudaMemcpy2DToArrayAsync( src_p, out, stream ) // copy result to src.
}