我想压缩扫描的文本(单色或几种颜色)并将其存储在 pdf(可能是 djvu)文件中。我记得我使用 Windows/Acrobat 和“ZRLE”压缩单色 tiff 嵌入到 pdf 中获得了非常好的结果。据我所知,该算法是无损的。现在我寻找一种在 linux 上获得良好结果的方法。它应该节省存储空间并避免丢失(我不介意丢失颜色,但我不希望 jpeg 压缩会为文本扫描产生嘈杂的结果)。我需要它进行批量转换,所以我在考虑 ImageMagick 转换命令。但是我应该使用哪种输出格式才能获得良好的结果并能够将其嵌入到 pdf 文件中(例如使用 pdflatex)?还是使用 djvu 文件通常更好?
问问题
2381 次
2 回答
3
使用 jbig2 压缩的图像的jbig2enc编码器,最初由Adam Langley为 GoogleBooks 编写
https://github.com/agl/jbig2enc
我分叉了 Rubypdf 和其他人的最新改进
https://github.com/DingoDog/jbig2enc
我还为小狗 linux构建了几个jbig2enc二进制文件(它也可以在其他发行版上工作)
于 2011-12-04T22:17:24.147 回答
2
DJVU 不是一个糟糕的选择,但如果您想保留 PDF 以获得更好的兼容性,您可能需要考虑无损 JBIG2压缩。
引用自维基百科:
总体而言,JBIG2 用于压缩文本的算法与 DjVu 文件格式中用于编码二进制图像的 JB2 压缩方案非常相似。
于 2011-12-02T15:37:06.303 回答