我有一个 tiff 文件,其中包含一些由制表符(4 个空格)分隔的文本。但是当我从这个 tiff 图像文件中提取文本时,我总是在两列之间得到一个空格。一个示例:
TIFF IMAGE:
col-a col-b col-c
desired output:
col-a col-b col-c
but I am getting the following:
col-a col-b col-c
我尝试了多张相同格式的图像,但结果总是一样的。我该如何解决这个问题?我可以训练 tesseract 来理解这一点吗?