我有一个 PDF 文件,其中有几个表格,例如:PDF 文件中的 表格
顺便说一句,我了解到我必须使用 Java 中的 tabula-py(注意:我正在使用 Jupyter Notebook 所以,我编写了这个代码:import pandas as pd import numpy as np
从表格导入 read_pdf 导入表格
pdf_path = "..\PDFs\pobreza2.pdf" #文件方向
df=tabula.read_pdf(pdf_path, pages="all", stream=True, guess=False, multiple_tables=True) #PDF有很多页有几个表
我得到了这个: 代码的输出
它就像一个列表,而不是一个数据框
那么,我怎样才能将这张表放入 Dataframe 中呢?表格有字符串和浮点对象