1

我正在尝试使用 tabula-py 从我的 pdf 中获取表格。pdf 中的表格没有网格线。当我尝试获取表格时,缺少标题。例如,我有一个如下的pdf。我的代码是从 Physicians and Dentists 340.2 350.3 365.8 359.4 获取的,我还需要标题 2014、2015、2016、2017。

df = read_pdf('Denver.pdf', pages = 4, output_format= 'Csv',encoding='latin-1',pandas_options={'header': None})

pdf的屏幕截图

4

0 回答 0