1

Python 3.7 和 Camelot 0.7.3。目前,Camelot 导出转换后的文件,并在文件名后附加了“ page-- table- ” - 我们的应用程序有非常具体的文件名要求,我正在尝试导出文件而不在文件名后附加额外的字符串. 这可能吗?该文档没有提及有关如何解决此问题的任何内容。

4

1 回答 1

0

该文档没有提及有关如何解决此问题的任何内容。

我不确定你是什么意思。https://camelot-py.readthedocs.io/en/master/说:

下面介绍如何从 PDF 文件中提取表格。在此处查看此示例中使用的 PDF。

>>> import camelot
>>> tables = camelot.read_pdf('foo.pdf')
>>> tables <TableList n=1>
>>> tables.export('foo.csv', f='csv', compress=True) # json, excel, html

使用tables.export将 PDF 中的所有表格导出为单独的文件,并且需要通过文件名来区分它们。

如果您只需要导出特定表,请使用页面下方的示例:

>>> tables[0].to_csv('foo.csv') # to_json, to_excel, to_html

这会将文件名不变地传递给pandas.DataFrame.to_csv,如https://github.com/camelot-dev/camelot/blob/master/camelot/core.py#L571所示。

于 2020-03-12T19:44:50.210 回答