java - 如何处理 Mazovia 编码文本

Question

我使用 Java 来编辑一些包含记录的文本文件。这些文件由最有可能使用 Mazovia ( wiki ) 编码的旧系统处理。我找不到正确处理文件的方法，这开始让我头疼。

当我用我的 Java 代码编辑文本文件时，系统会在其中找到额外的字符，从而破坏整个记录结构（字符位置很重要）。

如何在不引入任何其他字符/破坏编码的情况下编辑这些文件？正确显示所有字符会很棒，但如果不可能，我会尽量不破坏记录结构。

score 1 · Accepted Answer

如果在读写时使用例如 ISO-8859-1，则不会破坏文件，因为每个字节都映射到一个字符，每个字符都映射到一个字节。（任何具有这些特征的编码都可以。）

阅读时你不会得到正确的 Unicode 字符（因为你必须实现一个自定义Charset，我不确定这是多少工作），但至少你不会破坏文件。

1 回答 1