c++ - Nppi 颜色转换问题

Question

我正在尝试使用 Nvidia 的 npp 库将 3 通道打包 rgb 的帧转换为 nv12。这是我到目前为止的代码：

//cpu buffer that will hold converted data
Npp8u* converted_data = (Npp8u*)malloc(frameToWrite.getWidth());
memset(converted_data, 0, frameToWrite.getSize());

//Begin - load data and convert rgb to yuv
{
    NppStatus ret = NPP_SUCCESS;
    int stepSource;
    Npp8u* frame = nppiMalloc_8u_C3(frameToWrite.getWidth(), frameToWrite.getHeight(), &stepSource);
    cudaMemcpy2D(frame, stepSource, frameToWrite.getFrame(), frameToWrite.getSizePerRow(), frameToWrite.getWidth(), frameToWrite.getHeight(), cudaMemcpyHostToDevice);

    int stepDestP1, stepDestP2, stepDestP3;
    Npp8u* m_stYuvP1 = nppiMalloc_8u_C1(frameToWrite.getWidth(), frameToWrite.getHeight(), &stepDestP1);
    Npp8u* m_stYuvP2 = nppiMalloc_8u_C1(frameToWrite.getWidth(), frameToWrite.getHeight(), &stepDestP2);
            Npp8u* m_stYuvP3 = nppiMalloc_8u_C1(frameToWrite.getWidth(), frameToWrite.getHeight(), &stepDestP3);
    int d_steps[3] = { stepDestP1, stepDestP2, stepDestP3 };
    Npp8u* d_ptrs[3] = { m_stYuvP1, m_stYuvP2, m_stYuvP3 };

    NppiSize ROI = { frameToWrite.getWidth(), frameToWrite.getHeight() };

    if ((ret = nppiRGBToYUV_8u_C3P3R(frame, stepSource, d_ptrs, stepDestP1, ROI)) != NPP_SUCCESS)
        return ERROR_CODE_NVENC_ERROR_UNKNOWN;

    cudaMemcpy2D(converted_data, frameToWrite.getWidth(), m_stYuvP1, stepDestP1, frameToWrite.getWidth(), frameToWrite.getHeight(), cudaMemcpyDeviceToHost);
}

它主要基于这个堆栈溢出问题，但我对其进行了调整以适合我的情况。作为旁注，frameToWrite.getSize()计算如下：

mFrameSize = ((getBytesPerPixel() * mWidth) + mPaddingInBytes) * mHeight;

getBytesPerPixel()通常返回的地方3。

最终我的问题是：

我应该如何从设备内存中检索转换后的图像数据？
我是否以正确的方式将未转换的图像数据传递给设备？

score 0 · Accepted Answer

Npp8u* converted_data = (Npp8u*)malloc(frameToWrite.getWidth());
memset(converted_data, 0, frameToWrite.getSize());

首先，如果您还没有注意到，您可能在这里分配的内存很少，然后您在更大的区域上使用 memset，这可能会导致不需要的行为。

至于你的问题：
很难说你做了什么frameToWrite.getWidth()并frameToWrite.getHeight()返回 - 是图像尺寸还是字节尺寸？通常，当您分配 NPP 缓冲区时，您应该使用如下字节尺寸：
nppiMalloc_8u_C1(pixelWidth*bytesPerPixel, pixelHeight, &stepSource);
此外，步长应等于行长度（以字节为单位）加上填充，符合 NPP 文档点 4.2.1。
至于从内存中检索图像，根据我个人的经验，最简单的方法是简单地使用cudaMemcpy，因为 npp 分配 2D 内存时只有虚拟拆分，而原始数据仍然是对齐的，因此单次 1DcudaMemcpy调用足以取回数据。

c++ - Nppi 颜色转换问题

1 回答 1

Related

Reference