我正在尝试在我的笔记本电脑上编译一个项目,其中我需要 CUDA 和 opencv。所以我创建了3个文件
主文件
内核.cu
内核.h
在 main.cpp 我有 opencv 代码,在 kernel.cu 我有我的内核。我正在使用我在另一个项目中找到的这个 makefile:
CXX=g++
CUDA_INSTALL_PATH=/usr/local/cuda
CFLAGS= -I. -I$(CUDA_INSTALL_PATH)/include `pkg-config --cflags opencv`
LDFLAGS= -L$(CUDA_INSTALL_PATH)/lib64 -lcudart `pkg-config --libs opencv`
all:
$(CXX) $(CFLAGS) -c main.cpp -o main.o
nvcc $(CUDAFLAGS) -arch="sm_21" -c kernel.cu -o kernel.o
$(CXX) $(LDFLAGS) main.o kernel.o -o main
我曾在另一台使用 opencv 2.4.2 、CUDA 4.0 和 gcc 4.4 的计算机上尝试过相同的项目,它运行良好,但现在我在笔记本电脑上使用 opencv 2.4.2 、CUDA 4.2 和 gcc 4.6 进行尝试,它不断返回错误最后一行,但它确实创建了 main.o 和 kernel.o,如果我注释掉最后一行,它不会给出错误。
我已经构建并运行了 opencv 和 cuda sdk 示例,它们分别运行良好。你能帮助我吗?
这是它返回的内容:
g++ -L/usr/local/cuda/lib64 -lcudart
pkg-config --libs opencv
main.o kernel_gpu.o -o grayscalemain.o:在函数“main”中:
main.cpp:(.text+0x44): undefined reference to `cv::imread(std::basic_string, std::allocator > const&, int)'
main.cpp:(.text+0x72): undefined reference to `cv::_InputArray::_InputArray(cv::Mat const&)'
main.cpp:(.text+0xa6): undefined reference to `cv::imshow(std::basic_string, std::allocator > const&, cv::_InputArray const&)'
main.cpp:(.text+0xc8): undefined reference to `cv::waitKey(int)'
main.o:在函数 `cv::Mat::~Mat()' 中:
main.cpp:(.text._ZN2cv3MatD2Ev[_ZN2cv3MatD5Ev]+0x39): 未定义引用`cv::fastFree(void*)'
main.o:在函数 `cv::Mat::release()' 中:
main.cpp:(.text._ZN2cv3Mat7releaseEv[cv::Mat::release()]+0x47): 未定义对 `cv::Mat::deallocate()' 的引用
kernel_gpu.o:在函数
cuda_BGsub': tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x41): undefined reference to
cudaConfigureCall'kernel_gpu.o:在函数
cuda_grayscale': tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0xb3): undefined reference to
cudaConfigureCall'kernel_gpu.o:在函数
cuda_Filter': tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x10d): undefined reference to
cudaConfigureCall'kernel_gpu.o:在函数
cuda_Noise_reduc': tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x176): undefined reference to
cudaConfigureCall'kernel_gpu.o:在函数
cuda_RGB': tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x1d9): undefined reference to
cudaConfigureCall'kernel_gpu.o:tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x234):更多未定义的“cudaConfigureCall”引用如下
kernel_gpu.o:在函数“__cudaUnregisterBinaryUtil()”中:
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x409): 对 `__cudaUnregisterFatBinary' 的未定义引用
kernel_gpu.o:在函数`__device_stub__Z5BGsubPhS_S_iib(unsigned char*, unsigned char*, unsigned char*, int, int, bool)'中:
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x442): 未定义对“cudaSetupArgument”的引用
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x465): 未定义对“cudaSetupArgument”的引用
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x488): 对“cudaSetupArgument”的未定义引用
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x4a7): 对“cudaSetupArgument”的未定义引用
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x4c6): 对“cudaSetupArgument”的未定义引用
kernel_gpu.o:tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x4e5): 更多未定义的“cudaSetupArgument”引用
kernel_gpu.o:在函数` sti__cudaRegisterAll_45_tmpxft_000016bc_00000000_4_kernel_gpu_cpp1_ii_cdcbb70e ()'中:
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0xe7e): 未定义引用`__cudaRegisterFatBinary'
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0xedc): 未定义引用`__cudaRegisterFunction'
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0xf29): 未定义引用`__cudaRegisterFunction'
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0xf76): 未定义对“__cudaRegisterFunction”的引用
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0xfc3): 未定义引用`__cudaRegisterFunction'
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x1010): 未定义引用`__cudaRegisterFunction'
kernel_gpu.o:tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(.text+0x105d): 更多未定义的对 `__cudaRegisterFunction' 的引用
kernel_gpu.o:在函数“cudaError cudaLaunch(char*)”中:
tmpxft_000016bc_00000000-1_kernel_gpu.cudafe1.cpp:(. text.Z10cudaLaunchIcE9cudaErrorPT [cudaError cudaLaunch(char*)]+0x14): 未定义对“cudaLaunch”的引用
collect2: ld 返回 1 个退出状态
制作:* [全部] 错误 1
编辑: 此版本有效:
CXX=g++
CUDA_INSTALL_PATH=/usr/local/cuda
CFLAGS= -I. -I$(CUDA_INSTALL_PATH)/include `pkg-config --cflags opencv`
LDFLAGS= -L$(CUDA_INSTALL_PATH)/lib64 -lcudart `pkg-config --libs opencv`
all:
$(CXX) $(CFLAGS) -c main.cpp -o main.o
nvcc $(CUDAFLAGS) -arch="sm_21" -c kernel.cu -o kernel.o
$(CXX) main.o `pkg-config --libs opencv` -L$(CUDA_INSTALL_PATH)/lib64 -lcudart kernel.o -o main