c++ - 如何在 Linux 上的 C++ 中读取 JPEG 和 PNG 像素？

Question

我正在做一些图像处理，我想单独读取 JPEG 和 PNG 图像中的每个像素值。

在我的部署方案中，使用 3rd 方库对我来说会很尴尬（因为我在目标计算机上的访问受到限制），但我假设没有标准的 C 或 C++ 库来读取 JPEG/PNG...

因此，如果您知道一种不使用库的方法，那就太好了，如果没有，那么仍然欢迎您回答！

score 23 · Accepted Answer

C 标准中没有标准库来读取文件格式。

但是，大多数程序，尤其是在 linux 平台上的程序都使用相同的库来解码图像格式：

对于 jpeg，它是 libjpeg，对于 png，它是 libpng。

库已经安装的机会非常高。

http://www.libpng.org

http://www.ijg.org

score 21 · Accepted Answer

这是我从 10 年前的源代码中挖掘的一个小例程（使用 libjpeg）：

#include <jpeglib.h>

int loadJpg(const char* Name) {
  unsigned char a, r, g, b;
  int width, height;
  struct jpeg_decompress_struct cinfo;
  struct jpeg_error_mgr jerr;

  FILE * infile;        /* source file */
  JSAMPARRAY pJpegBuffer;       /* Output row buffer */
  int row_stride;       /* physical row width in output buffer */
  if ((infile = fopen(Name, "rb")) == NULL) {
    fprintf(stderr, "can't open %s\n", Name);
    return 0;
  }
  cinfo.err = jpeg_std_error(&jerr);
  jpeg_create_decompress(&cinfo);
  jpeg_stdio_src(&cinfo, infile);
  (void) jpeg_read_header(&cinfo, TRUE);
  (void) jpeg_start_decompress(&cinfo);
  width = cinfo.output_width;
  height = cinfo.output_height;

  unsigned char * pDummy = new unsigned char [width*height*4];
  unsigned char * pTest = pDummy;
  if (!pDummy) {
    printf("NO MEM FOR JPEG CONVERT!\n");
    return 0;
  }
  row_stride = width * cinfo.output_components;
  pJpegBuffer = (*cinfo.mem->alloc_sarray)
    ((j_common_ptr) &cinfo, JPOOL_IMAGE, row_stride, 1);

  while (cinfo.output_scanline < cinfo.output_height) {
    (void) jpeg_read_scanlines(&cinfo, pJpegBuffer, 1);
    for (int x = 0; x < width; x++) {
      a = 0; // alpha value is not supported on jpg
      r = pJpegBuffer[0][cinfo.output_components * x];
      if (cinfo.output_components > 2) {
        g = pJpegBuffer[0][cinfo.output_components * x + 1];
        b = pJpegBuffer[0][cinfo.output_components * x + 2];
      } else {
        g = r;
        b = r;
      }
      *(pDummy++) = b;
      *(pDummy++) = g;
      *(pDummy++) = r;
      *(pDummy++) = a;
    }
  }
  fclose(infile);
  (void) jpeg_finish_decompress(&cinfo);
  jpeg_destroy_decompress(&cinfo);

  BMap = (int*)pTest; 
  Height = height;
  Width = width;
  Depth = 32;
}

score 7 · Accepted Answer

对于 jpeg，已经有一个名为libjpeg的库，并且对于 png 有libpng。好消息是它们可以直接编译，因此目标机器不需要 dll 文件或任何东西。坏消息是它们在 C 中:(

此外，甚至不要考虑自己尝试读取文件。如果您想要一种易于阅读的格式，请改用PPM。

score 4 · Accepted Answer

不幸的是，jpeg 格式是压缩的，因此您必须在读取单个像素之前对其进行解压缩。这是一项不平凡的任务。如果您不能使用某个库，您可能需要参考一个库来了解它是如何解压缩图像的。sourceforge 上有一个开源库：CImg on sourceforge。

score 2 · Accepted Answer

由于它可以使用曝光，我将提到另一个库来调查：IM Toolkit，托管在Sourceforge 上。它是跨平台的，将文件格式完全从用户那里抽象出来，允许加载和处理图像而无需担心大部分细节。它确实支持开箱即用的 PNG 和 JPEG，并且可以根据需要使用其他导入过滤器进行扩展。

它还带有大量图像处理运算符...

它还具有与Lua的高质量绑定。

score 2 · Accepted Answer

正如 Nils 指出的那样，没有用于 JPEG 压缩和图像处理的 C 或 C++ 标准库之类的东西。

如果您能够使用第三方库，您可能想尝试支持 JPEG、PNG 和数十种其他格式、压缩和媒体的GDAL 。

这是一个简单的示例，展示了如何使用 GDAL C++ API 从 JPEG 文件中读取像素数据：

#include <gdal_priv.h>
#include <cassert>
#include <iostream>
#include <string>
#include <vector>

int main()
{
    GDALAllRegister(); // once per application

    // Assume 3-band image with 8-bit per pixel per channel (24-bit depth)
    std::string const file("/home/mloskot/test.jpg");

    // Open file with image data
    GDALDataset* ds = static_cast<GDALDataset*>(GDALOpen(file.c_str(), GA_ReadOnly));
    assert(0 != ds);

    // Example 1 - Read multiple bands at once, assume 8-bit depth per band
    {
        int const ncols = ds->GetRasterXSize();
        int const nrows = ds->GetRasterYSize();
        int const nbands = ds->GetRasterCount();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> data(ncols * nrows * nbands * nbpp);

        CPLErr err = ds->RasterIO(GF_Read, 0, 0, ncols, nrows, &data[0], ncols, nrows, GDT_Byte, nbands, 0, 0, 0, 0);
        assert(CE_None == err);

        // ... use data
    }

    // Example 2 - Read first scanline by scanline of 1 band only, assume 8-bit depth per band
    {
        GDALRasterBand* band1 = ds->GetRasterBand(1);
        assert(0 != band1);

        int const ncols = band1->GetXSize();
        int const nrows = band1->GetYSize();
        int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
        std::vector<unsigned char> scanline(ncols * nbpp);

        for (int i = 0; i < nrows; ++i)
        {
            CPLErr err = band1->RasterIO(GF_Read, 0, 0, ncols, 1, &scanline[0], ncols, 1, GDT_Byte, 0, 0);
            assert(CE_None == err);

            // ... use scanline
        }
    }

    return 0;
}

有更完整的GDAL API 教程可用。

score 1 · Accepted Answer

我对DevIL库有很好的体验。它支持多种图像格式，并遵循与 OpenGL 非常相似的函数风格。

诚然，它是一个图书馆，但绝对值得一试。

score 1 · Accepted Answer

由于其他答案已经提到您很可能需要使用库，因此请查看ImageMagick并查看是否可以执行您需要的操作。它提供了多种与 ImageMagick 核心功能交互的不同方式，包括适用于几乎所有可用编程语言的库。

主页：ImageMagick

score 1 · Accepted Answer

如果速度不是问题，您可以尝试LodePNG，它采用非常简约的方法来加载和保存 PNG。

或者甚至使用来自同一作者的 picoPNG，它是一个函数中的自包含 png 加载器。

c++ - 如何在 Linux 上的 C++ 中读取 JPEG 和 PNG 像素？

9 回答 9

Related

Reference