0

我正在尝试使用以下命令从 PDF 文件中获取文本:

pdftotext.exe file.pdf file.txt

问题是如果我的 PDF 文件-在正文中包含任何破折号 ( ),则生成的文本文件将没有它们(使用该-layout选项将得到相同的结果)。

例子:

  • PDF 文件包含:-5:00 Eastern Standard Time

  • 生成的 TXT 文件将包含:5:00 Eastern Standard Time

有没有人遇到过同样的问题?

4

0 回答 0