2

我正在使用这个PDFParser来解析 PDF 文件。突然,其中一个文件被解析为单词中的空格,例如应该有

周一

, 但它被解析为

周一

或者

作为

当我从 pdf 阅读器中选择文本并复制到其他地方时,没有这些奇怪的空格。库中是否存在错误或 pdf 中有一些隐藏字符。如何修复?

编辑:有一个每周菜单的链接。这个 PDF 文件是捷克语,所以有例如 word

庞德利

应该是:

蓬杰利

或者

库日埃西

应该:

库热奇

我可以看到所有这些空格都在带有重音符号的字符周围,但并非总是如此。

我警告你,它可能会在本周之后发生变化,新菜单可能没有这些空格。

4

0 回答 0