0

我有一个带有重音字符的文件:ÇÍââÇÍ

我需要将它们更改为ISO-8859-15编码

编码:

    String fileName = "C:/Users/User/AppData/Local/Temp/temp6893820181068878551.txt";

    File file = new File(fileName);
    FileInputStream fin = new FileInputStream(file);

    FileChannel ch = fin.getChannel();
    int size = (int) ch.size();
    MappedByteBuffer buf = ch.map(FileChannel.MapMode.READ_ONLY, 0, size);

     byte[] utf8bytes = new byte[size];
    buf.get(utf8bytes);

    System.out.println(new String(utf8bytes));  

    System.out.println();
    System.out.println();

        Charset utf8charset = Charset.forName("UTF-8");
        Charset iso88591charset = Charset.forName("ISO-8859-15");

        String string = new String ( utf8bytes, utf8charset );
        System.out.println(string);
        System.out.println();
        System.out.println();

        byte[] iso88591bytes = string.getBytes(iso88591charset);

        for ( byte b : iso88591bytes )
            System.out.printf("%02x ", b);

        System.out.println();
        System.out.println();

        String string2 = new String ( iso88591bytes, iso88591charset );

        System.out.println(string2);

但我得到输出:

ÇÍââÇÍ


??????


3f 3f 3f 3f 3f 3f 

??????
4

2 回答 2

0

在调用 .getBytes() 之前尝试规范化字符串,即调用 Normalizer.normalize(string, Normalizer.Form.NFC)

相同的重音字符可以用不同的 unicode 二进制形式表示。也许只有 NFC 形式可以转换为 iso-8859-15?

于 2014-09-23T16:28:36.120 回答
0

我找到了解决方案!

问题是文件本身。

写入原始文件时,必须采用 UTF-8 编码。

于 2014-09-26T15:50:33.287 回答