0

我正在计算文本文件的总数,一个文件夹中有很多文件,包括文本文件和其他二进制文件。

如何判断文件是文本文件还是使用Java语言的二进制文件?

4

1 回答 1

0

如果您在谈论纯文本,那么文本文件中有哪些字符?9(制表符)、10(换行)、13(回车)、32到126(可读字符)

文本文件在此集中应具有接近 100% 的 char 比率。

另一方面,二进制文件使用整个字符集,因此应该具有较低的比率。此外,二进制文件通常包含很多 0 值。

这不是确定文件类型的 100% 确定方法,但我认为应该足够了。

于 2012-04-04T15:56:39.183 回答