Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我使用 Java 来编辑一些包含记录的文本文件。这些文件由最有可能使用 Mazovia ( wiki ) 编码的旧系统处理。我找不到正确处理文件的方法,这开始让我头疼。
当我用我的 Java 代码编辑文本文件时,系统会在其中找到额外的字符,从而破坏整个记录结构(字符位置很重要)。
如何在不引入任何其他字符/破坏编码的情况下编辑这些文件?正确显示所有字符会很棒,但如果不可能,我会尽量不破坏记录结构。
如果在读写时使用例如 ISO-8859-1,则不会破坏文件,因为每个字节都映射到一个字符,每个字符都映射到一个字节。(任何具有这些特征的编码都可以。)
阅读时你不会得到正确的 Unicode 字符(因为你必须实现一个自定义Charset,我不确定这是多少工作),但至少你不会破坏文件。
Charset