假设我有以下内核:
__kernel void classify_data_points( __global float* data,
__local float* datasegment)
{
int gid0 = get_global_id(0);
int lid = get_local_id(0);
dataSegment[lid] = data[gid];
}
可以看出,我想将数据从全局内存中提取到本地内存中。本地内存的大小对于一次执行此操作是否重要?我的意思是,dataSegment 数组大小是 64 字节。然后,通过这一行'dataSegment [lid] = data [gid]',我可以假设整个64字节的内存空间都被从全局内存中获取的数据填充了吗?(全局内存中有足够的数据)或者512字节长的本地内存,我们可以说同样的话吗?