我试图将 pdf 文档(包括表格)转换为 csv 文件。不幸的是我失败了。我使用了以下方法:
首先使用
pdfminer
将 pdf 转换为文本,但文本文件的结构与 pdf 文件的结构不同。首先使用
pypdf2
将 pdf 转换为文本,但文本文件的结构与 pdf 文件的结构不同。首先使用
pdftotext
将 pdf 转换为文本,但文本文件的结构与 pdf 文件的结构不同。首先使用
slate
将 pdf 转换为文本,但文本文件的结构与 pdf 文件的结构不同。
请告诉我将 pdf 转换为 csv 文件的适当方法。有人建议我将文档解析为 xml 文件,然后再解析为 csv 文件。即便如此,我也没有得到解决方案。
PDF 文档如下所示:
有没有更好的工具可以将 pdf 文档(包括复杂的表格)转换为 csv 文件?
Python 语言的解决方案将不胜感激。