我正在使用这个PDFParser来解析 PDF 文件。突然,其中一个文件被解析为单词中的空格,例如应该有
周一
, 但它被解析为
周一
或者
鸡
作为
鸡
当我从 pdf 阅读器中选择文本并复制到其他地方时,没有这些奇怪的空格。库中是否存在错误或 pdf 中有一些隐藏字符。如何修复?
编辑:有一个每周菜单的链接。这个 PDF 文件是捷克语,所以有例如 word
庞德利
应该是:
蓬杰利
或者
库日埃西
应该:
库热奇
我可以看到所有这些空格都在带有重音符号的字符周围,但并非总是如此。
我警告你,它可能会在本周之后发生变化,新菜单可能没有这些空格。