我正在做一些图像处理,我想单独读取 JPEG 和 PNG 图像中的每个像素值。
在我的部署方案中,使用 3rd 方库对我来说会很尴尬(因为我在目标计算机上的访问受到限制),但我假设没有标准的 C 或 C++ 库来读取 JPEG/PNG...
因此,如果您知道一种不使用库的方法,那就太好了,如果没有,那么仍然欢迎您回答!
C 标准中没有标准库来读取文件格式。
但是,大多数程序,尤其是在 linux 平台上的程序都使用相同的库来解码图像格式:
对于 jpeg,它是 libjpeg,对于 png,它是 libpng。
库已经安装的机会非常高。
这是我从 10 年前的源代码中挖掘的一个小例程(使用 libjpeg):
#include <jpeglib.h>
int loadJpg(const char* Name) {
unsigned char a, r, g, b;
int width, height;
struct jpeg_decompress_struct cinfo;
struct jpeg_error_mgr jerr;
FILE * infile; /* source file */
JSAMPARRAY pJpegBuffer; /* Output row buffer */
int row_stride; /* physical row width in output buffer */
if ((infile = fopen(Name, "rb")) == NULL) {
fprintf(stderr, "can't open %s\n", Name);
return 0;
}
cinfo.err = jpeg_std_error(&jerr);
jpeg_create_decompress(&cinfo);
jpeg_stdio_src(&cinfo, infile);
(void) jpeg_read_header(&cinfo, TRUE);
(void) jpeg_start_decompress(&cinfo);
width = cinfo.output_width;
height = cinfo.output_height;
unsigned char * pDummy = new unsigned char [width*height*4];
unsigned char * pTest = pDummy;
if (!pDummy) {
printf("NO MEM FOR JPEG CONVERT!\n");
return 0;
}
row_stride = width * cinfo.output_components;
pJpegBuffer = (*cinfo.mem->alloc_sarray)
((j_common_ptr) &cinfo, JPOOL_IMAGE, row_stride, 1);
while (cinfo.output_scanline < cinfo.output_height) {
(void) jpeg_read_scanlines(&cinfo, pJpegBuffer, 1);
for (int x = 0; x < width; x++) {
a = 0; // alpha value is not supported on jpg
r = pJpegBuffer[0][cinfo.output_components * x];
if (cinfo.output_components > 2) {
g = pJpegBuffer[0][cinfo.output_components * x + 1];
b = pJpegBuffer[0][cinfo.output_components * x + 2];
} else {
g = r;
b = r;
}
*(pDummy++) = b;
*(pDummy++) = g;
*(pDummy++) = r;
*(pDummy++) = a;
}
}
fclose(infile);
(void) jpeg_finish_decompress(&cinfo);
jpeg_destroy_decompress(&cinfo);
BMap = (int*)pTest;
Height = height;
Width = width;
Depth = 32;
}
不幸的是,jpeg 格式是压缩的,因此您必须在读取单个像素之前对其进行解压缩。这是一项不平凡的任务。如果您不能使用某个库,您可能需要参考一个库来了解它是如何解压缩图像的。sourceforge 上有一个开源库:CImg on sourceforge。
由于它可以使用曝光,我将提到另一个库来调查:IM Toolkit,托管在Sourceforge 上。它是跨平台的,将文件格式完全从用户那里抽象出来,允许加载和处理图像而无需担心大部分细节。它确实支持开箱即用的 PNG 和 JPEG,并且可以根据需要使用其他导入过滤器进行扩展。
它还带有大量图像处理运算符...
它还具有与Lua的高质量绑定。
正如 Nils 指出的那样,没有用于 JPEG 压缩和图像处理的 C 或 C++ 标准库之类的东西。
如果您能够使用第三方库,您可能想尝试支持 JPEG、PNG 和数十种其他格式、压缩和媒体的GDAL 。
这是一个简单的示例,展示了如何使用 GDAL C++ API 从 JPEG 文件中读取像素数据:
#include <gdal_priv.h>
#include <cassert>
#include <iostream>
#include <string>
#include <vector>
int main()
{
GDALAllRegister(); // once per application
// Assume 3-band image with 8-bit per pixel per channel (24-bit depth)
std::string const file("/home/mloskot/test.jpg");
// Open file with image data
GDALDataset* ds = static_cast<GDALDataset*>(GDALOpen(file.c_str(), GA_ReadOnly));
assert(0 != ds);
// Example 1 - Read multiple bands at once, assume 8-bit depth per band
{
int const ncols = ds->GetRasterXSize();
int const nrows = ds->GetRasterYSize();
int const nbands = ds->GetRasterCount();
int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
std::vector<unsigned char> data(ncols * nrows * nbands * nbpp);
CPLErr err = ds->RasterIO(GF_Read, 0, 0, ncols, nrows, &data[0], ncols, nrows, GDT_Byte, nbands, 0, 0, 0, 0);
assert(CE_None == err);
// ... use data
}
// Example 2 - Read first scanline by scanline of 1 band only, assume 8-bit depth per band
{
GDALRasterBand* band1 = ds->GetRasterBand(1);
assert(0 != band1);
int const ncols = band1->GetXSize();
int const nrows = band1->GetYSize();
int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
std::vector<unsigned char> scanline(ncols * nbpp);
for (int i = 0; i < nrows; ++i)
{
CPLErr err = band1->RasterIO(GF_Read, 0, 0, ncols, 1, &scanline[0], ncols, 1, GDT_Byte, 0, 0);
assert(CE_None == err);
// ... use scanline
}
}
return 0;
}
有更完整的GDAL API 教程可用。
我对DevIL库有很好的体验。它支持多种图像格式,并遵循与 OpenGL 非常相似的函数风格。
诚然,它是一个图书馆,但绝对值得一试。
由于其他答案已经提到您很可能需要使用库,因此请查看ImageMagick并查看是否可以执行您需要的操作。它提供了多种与 ImageMagick 核心功能交互的不同方式,包括适用于几乎所有可用编程语言的库。
主页:ImageMagick
如果速度不是问题,您可以尝试LodePNG,它采用非常简约的方法来加载和保存 PNG。
或者甚至使用来自同一作者的 picoPNG,它是一个函数中的自包含 png 加载器。