struct - 如何正确地将参数作为结构传递给 NVRTC？

Question

let prog =
    """//Kernel code:
extern "C" {
    #pragma pack(1)
    typedef struct {
        int length;
        float *pointer;
    } global_array_float;
    __global__ void kernel_main(global_array_float x){
        printf("(on device) x.length=%d\n",x.length); // prints: (on device) x.length=10
        printf("(on device) x.pointer=%lld\n",x.pointer); // prints: (on device) x.pointer=0
        printf("sizeof(global_array_float)=%d", sizeof(global_array_float)); // 12 bytes just as expected
    }
;}"""

printfn "%s" prog
let cuda_kernel = compile_kernel prog "kernel_main"

let test_launcher(str: CudaStream, kernel: CudaKernel, x: CudaGlobalArray<float32>, o: CudaGlobalArray<float32>) =
    let block_size = 1 

    kernel.GridDimensions <- dim3(1)
    kernel.BlockDimensions <- dim3(block_size)
    printfn "(on host) x.length=%i"  x.length // prints: (on host) x.length=10
    printfn "(on host) x.pointer=%i" x.pointer // prints: (on host) x.pointer=21535919104
    let args: obj [] = [|x.length;x.pointer|]
    kernel.RunAsync(str.Stream, args)

let cols, rows = 10, 1
let a = d2M.create((rows,cols)) 
        |> fun x -> fillRandomUniformMatrix ctx.Str x 1.0f 0.0f; x 
let a' = d2MtoCudaArray a

//printfn "%A" (getd2M a)

let o = d2M.create((rows,cols)) // o does nothing here as this is a minimalist example.
let o' = d2MtoCudaArray o

test_launcher(ctx.Str,cuda_kernel,a',o')
cuda_context.Synchronize()

//printfn "%A" (getd2M o)

这是我目前正在处理的主要存储库的摘录。我非常接近 Cuda C 编译器的工作 F# 引用，但我无法弄清楚如何从主机端正确地将参数传递给函数。

尽管有 pack pragma，NVRTC 7.5 Cuda 编译器正在做一些其他的优化，我不知道它是什么。

因为我正在处理 F# 引用，所以我需要将参数作为单个结构传递才能使其工作。如果我将函数从更改kernel_main(global_array_float x)为类似的东西，kernel_main(int x_length, float *x_pointer)那么它就可以工作，但我这不是报价系统预先给我的形式，我想避免做额外的工作来使 F# 更像 C。

知道我可以尝试什么吗？

score 1 · Accepted Answer

我做了两个错误的假设。

第一个错误是假设它let args: obj [] = [|x.length;x.pointer|]会整齐地放在彼此相邻的堆栈上。实际上，这是两个不同的论点，而第二个论点在像上面那样传递时会丢失在某个地方。

可以通过制作自定义结构类型并像这样重写表达式来修复它let args: obj [] = [|CudaLocalArray(x.length,x.pointer)|]：

当我像上面那样重写它时发现的另一个错误假设是 using[<StructLayout(LayoutKind.Sequential>]并不意味着字段将被打包在一起。相反，与 C 一样，pack 是一个参数，因此需要像这样使用它：[<StructLayout(LayoutKind.Sequential,Pack=1)>].

struct - 如何正确地将参数作为结构传递给 NVRTC？

1 回答 1

Related

Reference