4

作为加速的替代方法,我试图通过 Haskell 的 FFI 调用 CUDA 代码。

这是一个无法编译的简单程序:

cuda_code.cu:

void cuda_init() {
    cudaFree (0);
    cudaThreadSynchronize ();
}

测试.hs:

foreign import ccall unsafe "cuda_init" cuda_init :: IO ()
main = cuda_init

我编译了

$> nvcc -c -o cuda_code.o cuda_code.cu
$> ghc Test cuda_code.o

并得到了几个链接错误(对 cudaFree 的未定义引用等)。这并不奇怪,显而易见的解决方案(对我来说)是使用-pgml nvcc. (当我在 C 代码中使用 Intel CILK+ 时,这很有效:我只是将链接器更改为 ICC,一切正常。)

但是,使用 NVCC 链接会导致链接错误:

ghc Test -pgml nvcc cuda_code.o
[1 of 1] Compiling Main             ( Test.hs, Test.o )
Linking Test ...
nvcc fatal   : Unknown option 'u'

跑步

strace -v -f -e execve ghc Test -pgml nvcc cuda_code.o

(有没有更简单的方法?)我发现ghc正在调用nvcc

nvcc ... -L~/ghc... -L... -l... -l... -u ghczmprim_GHC... -u ghc...

我假设这些-u选项旨在(并且显然)与未定义的符号链接gcc,这显然是不喜欢的。iccnvcc

我不知道 GHC 如何链接文件。关于如何让 GHC 链接到我的 CUDA 代码的想法?

- - - - 编辑 - - - - - - - - -

有人建议我尝试与 GCC 链接(像往常一样),但传递必要的链接器选项,gcc以便它可以链接到 CUDA 库。如果有人知道这些可能是什么,这可能会起作用!

4

2 回答 2

3

GHC 用于/usr/lib/ghc/settings确定编译器和链接器选项,并且每个包文件都/var/lib/ghc/package.conf.d/builtin_rts.conf用于确定特定于包的链接器选项。(自定义目录安装将分别包含它们${GHC}/lib/ghc-${VERSION}/settings${GHC}/lib/ghc-${VERSION}/package.conf.d

这是我为 RTS 找到的内容:

ld-options: -u ghczmprim_GHCziTypes_Izh_static_info -u
            ghczmprim_GHCziTypes_Czh_static_info -u
            ghczmprim_GHCziTypes_Fzh_static_info -u
            ghczmprim_GHCziTypes_Dzh_static_info
            ...

根据ld手册页,该-u选项将符号定义为extern必须在其他地方定义的未定义符号。

据我所知,这是唯一-uld-options:.package.conf.d

不幸的是,这些必须为使用不同选项接口的编译器/链接器翻译。

如此友善,并让人们在haskell-cafe@haskell.org上发布有关它的信息。我敢肯定还有其他人也在尝试这样的事情!

于 2013-11-13T16:08:23.090 回答
2

我想出了如何使这项工作。

cudaTest.cu:

// the `extern "C"` is important! It tells nvcc to not 
// mangle the name, since nvcc assumes C++ code by default
extern "C" 
void cudafunc() {
  cudaFree(0);
  cudaThreadSynchronize();
}

测试.hs

foreign import ccall unsafe "cudafunc" cudaFunc :: IO ()
main = cudaFunc

编译:

>nvcc -c -o cudaTest.o cudaTest.cu
>ghc --make Test.hs -o Test cudaTest.o -optl-lcudart

我还尝试为 GHC 提供选项-pgmc g++并删除extern "C"(我希望它可以工作),但在一些 CUDA 头文件中出现编译错误。可能有一些简单的方法可以解决这个问题,这样您就不需要用extern "C".

于 2013-12-05T02:38:06.213 回答