0

我正在尝试从 PDF 中提取表格并使用 python tabula-py 将它们写入 Excel。这是代码。

tabula.convert_into("input.pdf", "output.xlsx", output_format="xlsx", multiple_tables=True, stream=True, spreadsheets=True, pages='all')

一切都很好,我得到了 output.xlsx,但问题是字体大小/样式没有像 PDF 中那样保留。有没有办法保持字体大小/样式?

4

1 回答 1

1

否。默认情况下,tabula-py 强制将 PDF 转换为 CSV,而不是 xlsx。由 tabula-py 调用的 tabula-java 也没有办法转换为 XLSX。

于 2019-08-19T09:21:39.877 回答