我有一堆未压缩的双色调 TIF 文档图像。中间都有水印。当我通过 OCR 运行它们时,无法识别与水印重叠的文本。我正在尝试查看是否可以应用某种类型的清理来删除这些水印,以便能够识别丢失的文本。
同样,图像是黑白的,但是当您查看水印时,它会显示为灰色,因为它具有黑白像素图案,这使得水印中的字母不如常规文本“密集”。同时,水印字母很大,比普通文字大很多。
一个有点相似的图像的例子是这个(除了这个是彩色的,我的水印字符更厚更大;我的水印也短了很多:只有 3 到 4 个字母长)
似乎可能有某种清理过滤器,类似于从图像中删除大的黑色边框,除了边框通常比水印“更密集”,因此它们看起来“更黑”。
我有 3 种工具可供使用:GIMP、ImageMagick 和 IrfanView。您能否推荐这些工具的任何子集的任何特定功能可能对我有帮助?