我的文件夹中有一个不同文件的列表,这些文件有多种格式,如 PDF、txt、Docx 和 HTML。我想验证python中文件的格式。
这是我的尝试
import os
import pdftables_api
import glob
path = r"myfolder\*"
files = glob.glob(path)
for i in files:
if i.endswith('.pdf'):
conversion = pdftables_api.Client('my_api')
conversion.xlsx(i,r"destination\*")
这样做的原因是我想遍历每个文件并检查文件是否为pdf,然后是pdf,使用python中PDFTable_api包中的API将其转换为excel并将其保存在目标文件夹中。但我觉得这不是一种有效的方法。
如果有一种有效的方法可以实现这一目标,任何人都可以帮助我吗?