我们的文档管理系统中包含大量多页 TIF 文件(主要是文档扫描)。由于各种历史问题和最终用户的误解,其中很大一部分比它们需要的要大得多(例如,它们将以比要求更高的分辨率进行扫描,或者未经压缩存储)。
我一直在研究其中一些文档并进行一些优化,以收回一些宝贵的存储空间(我已经恢复了 25GB,只是取出了非常低的果实)。
到目前为止,我一直在使用 ImageMagick 和 Irfanview 的组合,但我真的很想更加自动化这个过程,因为它目前非常耗费人力。我在创建一些脚本方面很擅长,但不幸的是,所讨论的 TIF 的性质被证明是有问题的。
特别是,它们中的大多数包含混合页面格式;用于基本字母页面的双级/1 位页面和用于图像/地图/计划的全彩色 RGB 页面。大多数文档将混合使用这些类型,并且并不总是以任何特定的顺序排列(实际上它们可能在这两种格式之间来回切换)。
理想情况下,我想在双层页面上使用第 4 组传真压缩并在彩色页面上使用 JPEG 压缩(因此 ImageMagick 中的 -compress group4 / -compress jpeg 标志)但似乎没有任何方法(我可以告诉 - 我IM 方面的经验有限)以按页面格式设置压缩。有谁知道这是否可能?或者任何人都可以推荐一个具有此功能的可编写脚本的工具吗?
Irfanview 可以进行逐页压缩,但必须通过 GUI 逐页手动设置,这显然不理想。
任何提示将非常感谢!