我今天从 4.2 更新到 cuda 5.0 并得到很多这样的链接错误:
AddLevel.o: In function __sti____cudaRegisterAll_43_tmpxft_000034f6_00000000_6_AddLevel
_cpp1_ii_f49b3b40':/tmp/tmpxft_000034f6_00000000-3_AddLevel.cudafe1.stub.c:8: undefined
reference to `__cudaRegisterLinkedBinary_43_tmpxft_000034f6_00000000_6_AddLevel_cpp1_ii
_f49b3b40.
每个目标文件都跟着这样的错误。
正如我搜索过的许多帖子中所建议的那样,我在链接命令的末尾添加了一些 cuda 库,但它仍然不起作用:
nvcc -O3 -o iTrace*.o -L/usr/local/hdf5/lib -L/usr/local/cuda/lib64
`sdl-config--libs` -lhdf5 -lmfhdf -ldf -ljpeg -lz -lcuda -lcudart -lcublas_device
-lcudadevrt.
谁能帮我解决这个问题?我把完整的 Makefile 放在最后,以备不时之需。另外我使用的是 Kubuntu 12.04 64 位版本。我的 GPU 是 GeForce GTX 550 Ti,计算能力为 2.1。此外,我将源文件的所有后缀名称从 .C 更改为 .cu,尽管其中许多不包含任何设备代码。不确定这是否有问题。但它适用于 nvcc 4.2。
顺便说一句,那些带有下划线和数字的奇怪长文件名是如何生成的?我在 /usr/local/cuda/lib64 中搜索了库文件,发现所有以开头的函数__cudaRegisterLinkedBinary_XX(a number here)_
都包含在libcublas_device.a
和libcudadevrt.a
. 所以我认为添加这些 -l 选项应该有效,但它没有。
非常感谢。
这是我的 Makefile。
HDF_DIR = /usr/local/hdf5
HDF_INCLUDE = /usr/local/hdf5/include
X11_DIR = /usr/X11R6
PRECISION = r8
COMPILER="gnu"
DEBUG="no"
OPENMP="no"
ifeq ($(COMPILER), "gnu")
CC = nvcc
CCxx = nvcc
LDR = nvcc
ifeq ($(DEBUG), "yes")
CFLAGS = -O0
LDFLAGS = -O0
else
CFLAGS = -O3
LDFLAGS = -O3
endif
ifeq ($(OPENMP),"yes")
CFLAGS += -fopenmp
LDFLAGS += -fopenmp
endif
endif
ifeq ($(COMPILER), "intel")
CC = icc
CCxx = icpc
LDR = icpc
ifeq ($(DEBUG), "yes")
CFLAGS = -O0
LDFLAGS = -O0
else
CFLAGS = -fast
LDFLAGS = -fast
endif
ifeq ($(OPENMP),"yes")
CFLAGS += -openmp
LDFLAGS += -openmp
endif
endif
DEFINES = INCLUDE = -I. -I$(HDF_INCLUDE) `sdl-config --cflags` -I$(X11_DIR)/include
LIBS = -L$(HDF_DIR)/lib `sdl-config --libs` -L/usr/local/cuda/lib64\
-lhdf5 -lmfhdf -ldf -ljpeg -lz -lcuda -lcudart -lcublas_device -lcudadevrt
OBJS = AddLevel.o \
CreateNewRays.o \
DefineFieldNames.o \
FieldsToLoad.o \
FindField.o \
GetGrid.o \
Grid_ComputeVertexData.o \
Grid_FindNeighbors.o \
Grid_LoadDataHDF4.o \
Grid_LoadDataHDF5.o \
Grid_ReadGridProperties.o \
Grid_SetSubgridMarker.o \
Grid_constructor.o \
Grid_destructor.o \
InterpretKeyPress.o \
LoadCT.o \
Load_RGBA.o \
ListIO.o \
Ray_GridBoundaryCheck.o \
Ray_Initialize.o \
Ray_InterpolateValue.o \
Ray_Trace.o \
Ray_constructor.o \
RayTraceInteractive.o \
LoadAllData.o \
ReadGridInfo.o \
ReadHierarchyEntry.o \
ResetReloadFlag.o \
UnloadAllData.o \
UnloadGrids.o \
UpdateScreen.o \
TraceAllRays.o \
camera.o \
my_vector.o \
print_help.o
%.o:%.cu
$(CCxx) -arch=sm_21 -rdc=true $(DEFINES) $(INCLUDE) -D$(PRECISION) -g -dc
$(CFLAGS) $*.cu
iTrace: $(OBJS)
$(LDR) $(LDFLAGS) -o iTrace $(OBJS) $(LIBS)
clean:
rm -f *~ *.o iTrace
${OBJS}: typedef.h Grid.h my_vector.h Ray.h precision.h colors.h render.h