我对文件、文件编码和文件格式的概念缺乏清晰的理解。谷歌在一定程度上提供了帮助。 据我目前了解,所有文件都是二进制文件,即这样一个文件中的每个字节都可以包含 256 个可能的位字符串中的任何一个。ASCII 文件(这是我们进入编码部分的地方)是二进制文件的子集,其中每个字节仅使用 7 位。
这就是事情变得混乱的地方。文件格式似乎是一种解释文件中字节的方法,而文件扩展名似乎是识别文件格式的最常用方法之一。
这是否意味着有为二进制文件定义的格式和为 ASCII 文件定义的格式?xml、pdf、doc、rtf、html、xls、sql、tex、java、cs 等格式是否“引用”ASCII 文件?而像 jpg、mp3、avi、eps、obj、out、dll 这样的格式是我们在谈论二进制文件的线索?