Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试使用以下命令从 PDF 文件中获取文本:
pdftotext.exe file.pdf file.txt
问题是如果我的 PDF 文件-在正文中包含任何破折号 ( ),则生成的文本文件将没有它们(使用该-layout选项将得到相同的结果)。
-
-layout
例子:
PDF 文件包含:-5:00 Eastern Standard Time
-5:00 Eastern Standard Time
生成的 TXT 文件将包含:5:00 Eastern Standard Time
5:00 Eastern Standard Time
有没有人遇到过同样的问题?