使用 VS 2012、.NET 4.5、64 位和 CUDAfy 1.12,我有以下概念证明
using System;
using System.Runtime.InteropServices;
using Cudafy;
using Cudafy.Host;
using Cudafy.Translator;
namespace Test
public struct ChildStruct
public float[] FArray;
public long FArrayLength;
public struct ParentStruct
public ChildStruct Child;
public class Program
public static void KernelFunction(GThread gThread, ParentStruct parent)
long length = parent.Child.FArrayLength;
public static void Main(string[] args)
var module = CudafyTranslator.Cudafy(
ePlatform.x64, eArchitecture.sm_35,
new[] {typeof(ChildStruct), typeof(ParentStruct), typeof(Program)});
var dev = CudafyHost.GetDevice();
float[] hostFloat = new float[10];
for (int i = 0; i < hostFloat.Length; i++) { hostFloat[i] = i; }
ParentStruct parent = new ParentStruct
Child = new ChildStruct
FArray = dev.Allocate(hostFloat),
FArrayLength = hostFloat.Length
dev.Launch(1, 1, KernelFunction, parent);
当程序运行时,我在 dev.Launch 上收到以下错误:
Type 'Test.ParentStruct' cannot be marshaled as an unmanaged structure; no meaningful size or offset can be computed.
如果我从 ChildStruct 中删除浮点数组,它会按预期工作。
过去曾在 C/C++/Cli 和 CUDA C 中工作过,我知道错误的性质。此错误的一些解决方案建议使用Size
我查看了生成的 .cu 文件,它正在生成浮点数组,float *
有没有办法将结构中的数组传递给内核?如果没有最好的第二种选择是什么?这个问题在 CUDA C 中不存在,它只是因为我们从 CLR 编组而存在。