1

我有一个近 95000 页的大型 pdf 文件。它包含 12000 条语句。我需要拆分成单独的语句。我用的是pdftk,但是太慢了,每7分钟只生成2条语句。你知道任何可以在命令行中运行的好软件吗?

先感谢您

4

3 回答 3

1

尝试cpdf

cpdf -split in.pdf -o %%%.pdf

会生成 001.pdf、002.pdf 等。还有其他特殊代码可以生成漂亮的输出名称。

您可以使用-chunksize n分成多页的组。

既然你说有 95000 页和 12000 条语句,那么语句的长度可能不同。在这种情况下,您可以手动进行:

cpdf in.pdf 3455-3471 -o out.pdf

将第 3455-3471 页提取到 out.pdf

cpdf 可免费用于非商业用途。我们也有一个支持电子邮件地址。

还有一本综合手册

于 2013-10-31T20:04:02.937 回答
0

您可以信任 pdfbox。它非常快速和可靠。它还具有拆分或合并 pdf 文档的命令行方式。非常便利!

下载提供的 jar 后,您可以简单地通过以下方式完成工作

java -jar pdfbox-app-x.y.z.jar PDFSplit [OPTIONS] <PDF file>

查看以下有关选项的链接:

http://pdfbox.apache.org/commandline/#pdfSplit

您也可以尝试一些在线工具。http://www.pdfPi.com使用起来也很方便。文件大小上传限制为 100MB。

于 2013-11-21T10:21:55.587 回答
0

我认为您可以使用此 java 应用程序:https ://github.com/reinardhz/project-split-file

我自己做的,因为“拆分”应用程序太慢而无法拆分大文件。您可以使用它拆分任何文件。

于 2020-07-22T16:47:23.530 回答