2

信号处理:图像压缩:

我想以 JPEG 或 TIFF-JPEG 格式存储全彩色文本图像。这些图像包含带有一些彩色图形的文本文档。即使 JPEG 质量级别非常高,文本上仍然存在大量伪影和退化。

我可以完全控制 JPEG 编码参数,包括二次采样率和量化矩阵。

我的问题是:

  • 我可以优化文本文档的这些参数吗?(超出质量水平)
  • 我可以为图像的不同部分应用不同的参数设置吗?
  • 如果我在编码之前手动截断(量化)图像不同部分的系数会有所帮助吗?

(稍后将附上示例图像,因为在办公室无法访问 imgur。)

4

3 回答 3

2

您是否考虑过使用 PDF 作为输出?使用 PDF,您可以对黑白文本进行动态阈值处理,以将其压缩为 1-bpp CCITT G4。您还可以捕获页面上的颜色对象并使用 FLATE 或 JPEG 压缩它们。PDF 页面可以是这两种对象的组合。您将获得最好的质量和更好的压缩。

于 2012-02-20T18:25:56.010 回答
2

我赞同 BitBank 关于使用 PDF 以不同方式压缩不同内容的建议——我看到这有时被称为“MRC”——混合光栅内容。大量的文学作品。

您不会说您的图像是合成的还是扫描的。对于合成图像,我个人的经验是,即使是 LZW(在 TIFF 中)也可以做得非常出色,特别是如果您愿意进行一些(有损)预处理以使样本值均质化。也就是说,如果您可以量化足够多的相似值,使它们变得相等。

但是,如果您的图像被扫描,则很难预处理到足够干净的图像,LZW 或任何其他无损压缩都可以找到牵引力。所以剩下的JPEG,我想说的几乎与ruslik相反,JPEG的损耗在全局和频域都是高度可调的。当然可以调整量化表以选择性地提高文本质量。我不是专家,但我碰巧记得的起点是 Giordano Bruno Beretta & co 的作品。在 HP 实验室,例如 为低带宽应用选择 JPEG 量化表的方法

于 2012-06-21T04:08:18.937 回答
1

标准 JPEG 是有损的,您对此无能为力。丢失的信息在自然(平滑)图像上应该不会被注意到。

我的观点是,对于人造图像,您应该使用无损编解码器。不是无损JPEG,而是至少支持RLE的东西。例如,PNG 或JPEG-LS在此类图像上会有更好的结果。

于 2011-08-02T08:30:55.287 回答