optimization - 优化灰度文本文档图像的JPEG量化表

Question

信号处理：图像压缩：

我想以 JPEG 或 TIFF-JPEG 格式存储全彩色文本图像。这些图像包含带有一些彩色图形的文本文档。即使 JPEG 质量级别非常高，文本上仍然存在大量伪影和退化。

我可以完全控制 JPEG 编码参数，包括二次采样率和量化矩阵。

我的问题是：

我可以优化文本文档的这些参数吗？（超出质量水平）
我可以为图像的不同部分应用不同的参数设置吗？
如果我在编码之前手动截断（量化）图像不同部分的系数会有所帮助吗？

（稍后将附上示例图像，因为在办公室无法访问 imgur。）

score 2 · Accepted Answer

您是否考虑过使用 PDF 作为输出？使用 PDF，您可以对黑白文本进行动态阈值处理，以将其压缩为 1-bpp CCITT G4。您还可以捕获页面上的颜色对象并使用 FLATE 或 JPEG 压缩它们。PDF 页面可以是这两种对象的组合。您将获得最好的质量和更好的压缩。

score 2 · Accepted Answer

我赞同 BitBank 关于使用 PDF 以不同方式压缩不同内容的建议——我看到这有时被称为“MRC”——混合光栅内容。大量的文学作品。

您不会说您的图像是合成的还是扫描的。对于合成图像，我个人的经验是，即使是 LZW（在 TIFF 中）也可以做得非常出色，特别是如果您愿意进行一些（有损）预处理以使样本值均质化。也就是说，如果您可以量化足够多的相似值，使它们变得相等。

但是，如果您的图像被扫描，则很难预处理到足够干净的图像，LZW 或任何其他无损压缩都可以找到牵引力。所以剩下的JPEG，我想说的几乎与ruslik相反，JPEG的损耗在全局和频域都是高度可调的。当然可以调整量化表以选择性地提高文本质量。我不是专家，但我碰巧记得的起点是 Giordano Bruno Beretta & co 的作品。在 HP 实验室，例如为低带宽应用选择 JPEG 量化表的方法

score 1 · Accepted Answer

标准 JPEG 是有损的，您对此无能为力。丢失的信息在自然（平滑）图像上应该不会被注意到。

我的观点是，对于人造图像，您应该使用无损编解码器。不是无损JPEG，而是至少支持RLE的东西。例如，PNG 或JPEG-LS在此类图像上会有更好的结果。

optimization - 优化灰度文本文档图像的JPEG量化表

3 回答 3

Related

Reference