我无法在 Windows 上使用 Cuda [4.2] 读取纹理。
我的程序读取一个包含所有内核模块的 ptx 文件。此外,编译过程会从一个简短的主机代码例程中生成一个额外的 ptx 文件。这是带有仅主机代码的 .cuh 文件和 .cu 文件:
/////////////// "textureDefs.cuh" file ///////////////////////////////////////////
#ifndef _TEXTUREDEFS_CUH
#define _TEXTUREDEFS_CUH
texture < float, cudaTextureType2D, cudaReadModeElementType> texRefEachRes_1;
texture <float, cudaTextureType2D, cudaReadModeElementType> texRefEachResPrev;
///////////////////////////////////////////////////////////////////////////////
/// myBind.cu
/////////////////////////////////////////////////
#include "cuda.h"
#include "textureDefs.cuh"
extern cudaPitchedPtr gYAllFramesForEachRes[ME_NUM_RES], gPrevYForEachRes[ME_NUM_RES];
//
extern "C" cudaError_t bindTextures(int resNum)
{
cudaChannelFormatDesc channelDesc = cudaCreateChannelDesc(32, 0, 0, 0, cudaChannelFormatKindFloat); // x is 32 bit float
size_t offset;
texRefEachResPrev.addressMode[0] = cudaAddressModeClamp;
texRefEachResPrev.addressMode[1] = cudaAddressModeClamp;
texRefEachResPrev.filterMode = cudaFilterModeLinear;
texRefEachResPrev.normalized = false;
cudaError_t err = cudaBindTexture2D(&offset, &texRefEachResPrev,
(unsigned char *)gPrevYForEachRes[resNum].ptr, &channelDesc,
gPrevYForEachRes[resNum].xsize, gPrevYForEachRes[resNum].ysize,
gPrevYForEachRes[resNum].pitch); // jm bug 1/5
return err;
}
在我的内核代码中对 tex2d 的每次调用都返回值 0 但我已经检查过并且数组中有有效数据。
我想知道我是否还需要加载 myBind.ptx,如果需要,它是如何加载的,何时何地加载?还是不需要?
谢谢你的帮助。