我希望能够读取前几千字节的未知文件类型,并查看它是否与任何已知文件类型(即 mp3 文件、jpeg 等)匹配。我正在考虑尝试从 PIL、sndhdr、py264 等库中的文件加载元数据……看看他们是否选择了任何有效的格式,但我认为这一定是以前有人解决过的问题。
是否有一个库或要点显示多个库的用法可以做到这一点?
我希望能够读取前几千字节的未知文件类型,并查看它是否与任何已知文件类型(即 mp3 文件、jpeg 等)匹配。我正在考虑尝试从 PIL、sndhdr、py264 等库中的文件加载元数据……看看他们是否选择了任何有效的格式,但我认为这一定是以前有人解决过的问题。
是否有一个库或要点显示多个库的用法可以做到这一点?
用于python-magic
进行指纹识别。
该库只能从字节数据确定文件类型:
import magic
magic.from_buffer(start_data_from_something)
该库提供对libmagic
文件类型标识库的访问,该库也驱动 UNIXfile
命令。