我正在研究一个使用 C++ 源代码和 CUDA 的示例程序。这是我的四个源文件中的基本内容。
matrixmul.cu(主要 CUDA 源代码):
#include <stdlib.h>
#include <cutil.h>
#include "assist.h"
#include "matrixmul.h"
int main (int argc, char ** argv)
{
...
computeGold(reference, hostM, hostN, Mh, Mw, Nw); //reference to .cpp file
...
}
matrixmul_gold.cpp(C++源代码,单函数,无main方法):
void computeGold(float * P, const float * M, const float * N, int Mh, int Mw, int Nw)
{
...
}
matrixmul.h(matrixmul_gold.cpp 文件的头文件)
#ifndef matrixmul_h
#define matrixmul_h
extern "C"
void computeGold(float * P, const float * M, const float * N, int Mh, int Mw, int Nw);
#endif
Assist.h(辅助函数)
我正在尝试编译和链接这些文件,以便它们可以正常工作。到目前为止,我可以使用以下方法编译 matrixmul_gold.cpp:
g++ -c matrixmul_gold.cpp
我可以使用以下方法编译 CUDA 源代码而不会出错:
nvcc -I/home/sbu/NVIDIA_GPU_Computing_SDK/C/common/inc -L/home/sbu/NVIDIA_GPU_Computing_SDK/C/lib matrixmul.cu -c -lcutil_x86_64
但我最终得到了两个 .O 文件。我尝试了很多不同的方法来链接这两个 .O 文件,但到目前为止还不行。什么是正确的方法?
更新:根据要求,这里是输出:
nm matrixmul_gold.o matrixmul.o | grep computeGold
nm: 'matrixmul.o': No such file
0000000000000000 T _Z11computeGoldPfPKfS1_iii
我认为'matrixmul.o'缺失错误是因为我在运行建议的编译命令时实际上并没有成功编译:
nvcc -I/home/sbu/NVIDIA_GPU_Computing_SDK/C/common/inc -L/home/sbu/NVIDIA_GPU_Computing_SDK/C/lib -o matrixmul matrixmul.cu matrixmul_gold.o -lcutil_x86_64
extern "C"
更新 2:我从 matrixmul_gold.cpp 的开头丢失了一个。我添加了这一点,建议的编译命令效果很好。谢谢!