c - OpenCl 内核返回异常巨大的数字

Question

一段时间以来，我一直在尝试使用 OpenCL 内核将我的 Marching Cubes 算法从 CPU 转移到 GPU。

我遇到的问题是我的内核中的一个函数返回了奇怪的值，所以我编写了一个测试用例，在其中我指定了一个包含 12 个 float3 的数组中的可能返回值，其中 float3 分量为 0、0.5 和 1（请参见下面的代码)

出于某种原因，我得到了非常大的数字，例如，“11”的 edgeIndex 返回 float3: (-145085952., 6.600e-43#DEN, 0) 而它应该是 (1, 0, 0.5)。虽然据我所知，y 坐标基本上是 0，所以这不是问题，但是 x 坐标让我头疼。

起初我认为 OpenCL 在将给定值转换为 float3 时可能会出现问题，所以我用“.f”指定它们（例如 (float3)(0.f, 0.5f, 0.f)）。这只会导致更奇怪和不同的结果，这让我觉得我必须在某个地方犯错。我对 OpenCL 还很陌生（这是我第一个使用它的真正项目），而且我也没有长时间编程，所以我希望我不会在这里犯一些新手错误，但我试图解决这个问题和相关问题几天来，我找不到解决方案。

我尽可能地缩小了问题的范围，并测试了代码是否在执行它应该执行的每个步骤。直到“CalculateEdgePos”的函数调用，一切似乎都很好，我得到了预期的结果。我剥离了所有不必要代码的功能（因此您可以忽略“值”参数，因为它现在没有被使用）但现在我已经束手无策了。

返回奇怪结果的函数：

float3 CalculateEdgePos(int edgeIndex, __global int* values) 
{ 
    if(edgeIndex == -1) 
    { 
        return (float3)(-1,-1,-1); 
    } 

        float3 EdgePositions[12] = {(float3)(0, 0.5, 0), (float3)(0.5, 1, 0), (float3)(1, 0.5, 0), (float3)(0.5, 0, 0), (float3)(0, 0.5, 1), (float3)(0.5, 1, 1), (float3)(1, 0.5, 1), (float3)(0.5, 0, 1), (float3)(0, 0, 0.5), (float3)(0, 1, 0.5), (float3)(1, 1, 0.5), (float3)(1, 0, 0.5)};

        return EdgePositions[edgeIndex];
} 


and the part of the kernel with the function call and the result getting send back to the CPU 
(edgeIndex is calculated fine beforehand):

__kernel void MarchCubes(__global float* outVertices, __global int* values, __global int* edges) 
{ 
.
.
.
    float3 vertexPos = CalculateEdgePos(edgeIndex, values); 
    float coords[3] = {vertexPos.x, vertexPos.y, vertexPos.z}; 

    outVertices[get_global_id(0)] = coords[coordIndex]; 
}

如果你们中的任何人有任何提示或帮助，我将不胜感激。如果您需要更多代码片段，请告诉我，但我认为这应该就足够了，因为它只是指定的函数行为怪异。

亲切的问候，美食家

score 1 · Accepted Answer

当然，在我发布这个问题后，我已经坐了这么久，我找到了解决方案......

所以如果有人有类似的问题：

如果您在数组本身的声明中声明数组元素，OpenCL 似乎真的不喜欢它。所以不要写：

 float3 EdgePositions[12] = {(float3)(0, 0.5, 0), (float3)(0.5, 1, 0), (float3)(1, 0.5, 0), (float3)(0.5, 0, 0), (float3)(0, 0.5, 1), (float3)(0.5, 1, 1), (float3)(1, 0.5, 1), (float3)(0.5, 0, 1), (float3)(0, 0, 0.5), (float3)(0, 1, 0.5), (float3)(1, 1, 0.5), (float3)(1, 0, 0.5)};

我现在写道：

float3 pos0 = (float3)(0.f, 0.5f, 0.f);
    float3 pos1 = (float3)(0.5f, 1.f, 0.f);
    float3 pos2 = (float3)(1.f, 0.5f, 0.f);
    float3 pos3 = (float3)(0.5f, 0.f, 0.f);
    float3 pos4 = (float3)(0.f, 0.5f, 1.f);
    float3 pos5 = (float3)(0.5f, 1.f, 1.f);
    float3 pos6 = (float3)(1.f, 0.5f, 1.f);
    float3 pos7 = (float3)(0.5f, 0.f, 1.f);
    float3 pos8 = (float3)(0.f, 0.f, 0.5f);
    float3 pos9 = (float3)(0.f, 1.f, 0.5f);
    float3 pos10 = (float3)(1.f, 1.f, 0.5f);
    float3 pos11 = (float3)(1.f, 0.f, 0.5f);

    float3 EdgePositions[12] = {pos0, pos1, pos2, pos3, pos4, pos5, pos6, pos7, pos8, pos9, pos10, pos11};

它现在就像一个魅力。

我仍然不明白为什么不允许这样做或返回错误值，所以如果有人知道并喜欢详细说明，我会非常感激。

c - OpenCl 内核返回异常巨大的数字

1 回答 1

Related

Reference