Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试使用 tabula_py 从 pdf 中提取所有表数据: df=tabula.read_ptabula.read_pdf(test_pdf,stream=True,multiple tables=True,pages="all")
pdf有3个表。第二张表在 2 页上。当我尝试 len(df) 时,它返回 4 而不是 3 扩展页面上第二个表数据的第一行作为标题返回如何将数据作为同一个表从标题提取到最后一行