1

我使用 Java 来编辑一些包含记录的文本文件。这些文件由最有可能使用 Mazovia ( wiki ) 编码的旧系统处理。我找不到正确处理文件的方法,这开始让我头疼。

当我用我的 Java 代码编辑文本文件时,系统会在其中找到额外的字符,从而破坏整个记录结构(字符位置很重要)。

如何在不引入任何其他字符/破坏编码的情况下编辑这些文件?正确显示所有字符会很棒,但如果不可能,我会尽量不破坏记录结构。

4

1 回答 1

1

如果在读写时使用例如 ISO-8859-1,则不会破坏文件,因为每个字节都映射到一个字符,每个字符都映射到一个字节。(任何具有这些特征的编码都可以。)

阅读时你不会得到正确的 Unicode 字符(因为你必须实现一个自定义Charset,我不确定这是多少工作),但至少你不会破坏文件。

于 2013-08-07T14:26:52.810 回答