可以从文件的幻数确定文件类型吗?
如果我理解了,幻数可以有不同的大小,也许参考字典或图书馆之类的东西可以帮助我?
Linux 上的file
命令正是这样做的。研究它的内部结构,看看它如何使用它们的幻数(签名字节)来识别文件。完整的源代码可在darwinsys.com/file 获得。
JmimeMagic是一个用于此类的 java 库
使用 libmagic(apt-get install libmagic-dev on Ubuntu 系统)。
下面的示例使用默认的魔术数据库来查询在命令行上传递的文件。(本质上是file命令的实现。有关更多详细信息/功能,请参见man libmagic。
#include <iostream>
#include <magic.h>
#include <cassert>
int main(int argc, char **argv) {
if (argc == 1) {
std::cerr << "Usage " << argv[0] << " [filename]" << std::endl;
return -1;
}
const char * fname = argv[1];
magic_t cookie = magic_open(0);
assert (cookie !=nullptr);
int rc = magic_load(cookie, nullptr);
assert(rc == 0);
auto f= magic_file(cookie, fname);
if (f ==nullptr) {
std::cerr << magic_error(cookie) << std::endl;
} else {
std::cout << fname << ' ' << f << std::endl;
}
}