20

我一整天都在尝试转换几个。pdf 文件,其中包含从圣保罗到 MS Office Excel 或 Ubuntu 中的 LibreOffice Calc 等电子表格的流量。当我使用 LibreOffice Calc 打开 .pdf 文件时,它会打开 LibreOffice Draw,但我无法获取电子表格。

我发现最有前途的方法是使用 pdftotext。它工作正常,我可以在 LibreOffice Calc 中获取表格,但手动调整列。

我的问题是我有这么多 .pdf 文件,这将花费我很多时间。

有谁知道更好的方法?

4

4 回答 4

34

另一种选择是使用 Okular ( http://okular.kde.org )。它有表格选择工具(Ctrl+5)。您可以选择一个表格,为其他行和列添加行并将生成的表格复制到剪贴板中。这对我来说可以。

于 2014-09-04T16:14:43.847 回答
17

Tabula可以很好地工作。PDF 不是一种易于从中提取结构化信息的格式,因此并非总是可行。

于 2015-02-02T17:33:22.170 回答
11

也许-layout对你有用。设置此选项后,pdftotext将尝试将列布局保留在生成的文本文件中。

现在,您可以使用适当的导入设置将文本文件导入 LibreOffice Calc。在 Calc 中打开txt文件时,系统会询问您如何解析文件内容(请参见下面的屏幕截图)。在 下Separator Options,同时选择选项[separated by] SpaceMerge Delimiters。这样,Calc 将能够恢复列结构(假设单元格数据不包含空格)。

文本导入到 calc

于 2013-08-18T08:43:26.867 回答
4

名为Able2Extract的工具是可以为您做的正是您想要的,且错误最少的选项

于 2015-02-12T08:46:56.023 回答