1

我有一个 PDF 文件,其中有几个表格,例如:PDF 文件中的 表格

顺便说一句,我了解到我必须使用 Java 中的 tabula-py(注意:我正在使用 Jupyter Notebook 所以,我编写了这个代码:import pandas as pd import numpy as np

从表格导入 read_pdf 导入表格

pdf_path = "..\PDFs\pobreza2.pdf" #文件方向

df=tabula.read_pdf(pdf_path, pages="all", stream=True, guess=False, multiple_tables=True) #PDF有很多页有几个表

我得到了这个: 代码的输出

它就像一个列表,而不是一个数据框

那么,我怎样才能将这张表放入 Dataframe 中呢?表格有字符串和浮点对象

4

0 回答 0