我有一个近 95000 页的大型 pdf 文件。它包含 12000 条语句。我需要拆分成单独的语句。我用的是pdftk,但是太慢了,每7分钟只生成2条语句。你知道任何可以在命令行中运行的好软件吗?
先感谢您
我有一个近 95000 页的大型 pdf 文件。它包含 12000 条语句。我需要拆分成单独的语句。我用的是pdftk,但是太慢了,每7分钟只生成2条语句。你知道任何可以在命令行中运行的好软件吗?
先感谢您
您可以信任 pdfbox。它非常快速和可靠。它还具有拆分或合并 pdf 文档的命令行方式。非常便利!
下载提供的 jar 后,您可以简单地通过以下方式完成工作
java -jar pdfbox-app-x.y.z.jar PDFSplit [OPTIONS] <PDF file>
查看以下有关选项的链接:
http://pdfbox.apache.org/commandline/#pdfSplit
您也可以尝试一些在线工具。http://www.pdfPi.com使用起来也很方便。文件大小上传限制为 100MB。
我认为您可以使用此 java 应用程序:https ://github.com/reinardhz/project-split-file
我自己做的,因为“拆分”应用程序太慢而无法拆分大文件。您可以使用它拆分任何文件。