我已经用 cudafy 测试了一些 GPU 计算样本
我有计算/创建数据的代码,并且我想对集合中的每个对象执行每个循环一些 GPU 操作代码:
public override void CountData(List<IData<int>> datas)
{
for (int i = 0; i < datas.Count; i++)
{
Execute(datas[i]);
}
}
public static void Execute(IData<int> data)
{
CudafyModule km = CudafyTranslator.Cudafy();
GPGPU gpu = CudafyHost.GetDevice(CudafyModes.Target, CudafyModes.DeviceId);
gpu.LoadModule(km);
int c;
int[] dev_c = gpu.Allocate<int>(); // cudaMalloc one Int32
gpu.Launch().add(data.IntData[0], data.IntData[1], dev_c); // or gpu.Launch(1, 1, "add", 2, 7, dev_c);
gpu.CopyFromDevice(dev_c, out c);
Console.WriteLine(c + ";");
gpu.Free(dev_c);
chromozome.Result= c;
}
[Cudafy]
public static void add(int a, int b, int[] c)
{
c[0] = a + b;
}
此代码适用于第一次调用 CountData,但在 Count 数据循环结束程序将卡住并且控制台输出后显示
线程 0xf50 已退出,代码为 259 (0x103)。线程 0x10c 已退出,代码为 259 (0x103)。线程 0xc30 已退出,代码为 259 (0x103)。线程 0xcc0 以代码 0 (0x0) 退出。线程 0x548 以代码 0 (0x0) 退出。
有人知道哪里有问题吗?我尝试 gpu.Synchronize, CudafyHost.ClearDevices() ,但它总是以这个错误结束 谢谢你的帮助
编辑:经过一些测试,我发现
gpu.Launch().add(5, 3, dev_c);
有效,但:
gpu.Launch().add(data.IntData[0], data.IntData[1], dev_c);
不是