Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在计算文本文件的总数,一个文件夹中有很多文件,包括文本文件和其他二进制文件。
如何判断文件是文本文件还是使用Java语言的二进制文件?
如果您在谈论纯文本,那么文本文件中有哪些字符?9(制表符)、10(换行)、13(回车)、32到126(可读字符)
文本文件在此集中应具有接近 100% 的 char 比率。
另一方面,二进制文件使用整个字符集,因此应该具有较低的比率。此外,二进制文件通常包含很多 0 值。
这不是确定文件类型的 100% 确定方法,但我认为应该足够了。