我们的服务器在 CentOS 上运行,我们的 Java 后端有时必须处理最初在 Windows 机器上(由我们的一个客户端)使用 CP-1252 生成的文件,但是在 95% 以上的用例中,我们正在处理UTF-8 文件。
我的问题:如果我们知道某些文件将始终是 UTF-8,而其他文件将始终是 CP-1252,是否可以在 Java 中指定用于读取每个文件的字符集?如果是这样的话:
- 我们需要在系统级别做任何事情来将 CP-1252 添加到 CentOS 吗?如果是这样,这涉及什么?
- 我们将使用哪些 Java 对象来对每个文件应用正确的编码?
提前致谢!