我想用 cuda 创建上三角矩阵
在上三角矩阵中,位于对角线下方的元素 ed 为零。此函数应将给定值分配给其他元素。
但下面的代码将所有值分配为 0 为什么?
__global__ void initUpperTrinagleGPU(int *devMatrix, int numR, int numC, int value) {
int x = blockDim.x*blockIdx.x + threadIdx.x;
int y = blockDim.y*blockIdx.y + threadIdx.y;
int offset = y * numC + x;
if(numC <= numR) {
devMatrix[offset] = 0;
}
else
devMatrix[offset] = value;
}