2

在尝试提出一个基于 servlet 的应用程序来读取文件并操作它们(图像类型转换)时,我想到了一个问题:

  1. 是否可以检查文件内容并知道文件类型?
  2. 是否有标准规定每个文件必须在其内容中提供某种类型的标记,以便应用程序不必依赖文件扩展名约束?

考虑一个应用场景:

我正在创建一个能够将不同的文件格式转换为一组输出格式的应用程序。假设用户上传 PDF,我的应用程序可以建议可能的转换格式是 microsoft word 或 TIFF 或 JPEG 等。

由于我的应用程序将逐渐支持不同的文件格式(在一段时间内),我希望我的应用程序检查输入文件,而不是让用户指定格式。并向用户建议可能的输出格式。

我知道这是一个开放式的、广泛的问题。如果需要修改,请告诉我。

谢谢,阿尤斯曼

4

1 回答 1

3

是的,您可以使用幻数找出没有扩展名的类型。此外,文件命令的计算方式实际上是通过 3 步检查:

  1. 检查文件系统属性以识别空文件、文件夹等...
  2. 所说的幻数
  3. 在文本文件中,检查其中的语言

这是一个可以帮助您使用幻数的库:jmimemagic

于 2012-06-06T22:35:40.323 回答