1

我想根据它们在 python 中的扩展名对文件类型进行分类。在自己编写之前,我想检查是否有任何 python 包可用于此目的。通过文件类型,我的意思是将其分类为例如。Doc、ppt、pdf、tar、txt、iso 等。理想情况下,它将文件名作为输入并返回其类型。我在 linux 上运行

4

2 回答 2

2

您应该查看文档元数据解析器。我在一些项目中使用了Apache Tika ,它是一个 java 库。你可以看看这个问题Python-based document metadata parser? 看看如何在 Python 中使用它

于 2012-09-04T08:12:12.840 回答
1

在 Linux 中,您可以使用确定文件类型的“文件”实用程序。因此,如果您愿意,也可以在脚本中使用它:

import subprocess
subprocess.call(['file', 'yourfile'])
于 2012-09-04T07:02:35.837 回答