1

我正在尝试将 UTF-8 文本文件转换为 Windows-1250。我正在使用 Java 6 API。

我使用了下面的代码,但结果绝对不是 Cp1250。

import java.io.*; 

public class testing {
    public static void main (String[] args) throws IOException {   

        InputStream  input = null;
        OutputStreamWriter output = null;   

        File destinationFile = new File("C:\\test\\Cp1250.txt");   

        try {      
            input = new FileInputStream("C:\\test\\utf-8.txt");
            output = new OutputStreamWriter(new FileOutputStream(destinationFile), "Windows-1250");

            while (input.read() != -1) {
                output.write(input.read());
            }

        } catch (Exception e) {
            e.printStackTrace(); 
        } finally {
            input.close();
            output.close(); 
        }      
    }
}
4

2 回答 2

4

您需要一个 InputStreamReader,它知道来自 FileInputStream 的数据必须使用 UTF-8 字符集进行解释。

这是一个例子。为简洁起见,我省略了资源的关闭。

    FileInputStream input = new FileInputStream(file);
    InputStreamReader reader = new InputStreamReader(input, "utf-8");
    FileOutputStream output = new FileOutputStream(destinationFile);
    OutputStreamWriter writer = new OutputStreamWriter(output, "Windows-1250");

    int read = reader.read();
    while (read != -1)
    {
        writer.write(read);
        read = reader.read();
    }

还有一件事:在您的 while 循环中,您有两次对 input.read 的调用,但您只调用了一次 output.write()。这意味着你只写了你读过的字节的一半。

于 2014-03-13T15:37:21.390 回答
1

以下是使用 Java 7 时的操作方法:

final Path src = Paths.get("C:\\test\\utf-8.txt");
final Path dst = Paths.get("C:\\test\\Cp1250.txt");

try (
    BufferedReader reader = Files.newBufferedReader(src, StandardCharsets.UTF_8);
    BufferedWriter writer = Files.newBufferedWriter(dst, 
        Charset.forName("windows-1252"));
) {
    String line;
    while ((line = reader.readLine()) != null) {
        writer.write(line);
        writer.newLine();
    }
    writer.flush();
}
于 2014-03-13T15:53:24.570 回答