1

我在将日文文本转换为可读文本时遇到问题。现在我有一个从用户那里获取价值的试用程序。然后这些值通过一个我称之为 word 的类来创建一个对象。创建对象后,我想将对象写入文件并将其读取到文件中。由于我正在读取和写入对象,因此我正在使用 objectouput 和 input 流来执行此操作。这个问题是我不确定如何在使用对象输出和输入流时将正在使用的文件编码为 UTF-8。如果我不使用任何编码,我会在假名或汉字应该在哪里得到问号。

无论如何都可以使用和 objectoutput 或输入流将文件转换为 unicode。如果没有,有没有其他方法可以避免在假名或汉字应该出现的地方出现问号?

    public class JavaApplication1 {

    /**
     * @param args the command line arguments
     */

    Scanner scan = new Scanner(System.in);

    public static void main(String[] args) throws FileNotFoundException, IOException, ClassNotFoundException, FontFormatException {
        // TODO code application logic here
        JavaApplication1 ja = new JavaApplication1();
        ja.start();
    }
    public void start() throws FileNotFoundException, IOException, ClassNotFoundException, FontFormatException{

        System.out.println("Enter Kanji");
        String Kanji = scan.next();
        System.out.println("Enter Romanji");
        String Romanji = scan.next();
        System.out.println("How common is it");
        int common = scan.nextInt();
        System.out.println("How many types of word is it?");
        int loop = scan.nextInt();
        ArrayList type = new ArrayList();
        for(int i = 0; i<loop;i++){
            System.out.println("What type of word");
            type.add(scan.nextInt());
        }
        System.out.println("What type of adjective");
        int adjective = scan.nextInt();
        System.out.println("What type of verb");
        int verb = scan.nextInt();
        System.out.println("How many radicals");
        int loop2 = scan.nextInt();
         ArrayList radical = new ArrayList();
        for(int i = 0; i<loop2;i++){
            System.out.println("radical");
            radical.add(scan.nextInt());
        }
        //String newKanji = GetUnicode(Kanji);
        Word word = new Word(Kanji,Romanji,common,type,adjective,verb,radical);
        word.getKanaKanji();
        store(word);
        //store(word);
        read();

    }
    public void store(Word word) throws FileNotFoundException, IOException, FontFormatException{
        File file = new File("test.dat");
        FileOutputStream outFileStream = new FileOutputStream(file);
        ObjectOutputStream oos = new ObjectOutputStream(outFileStream);
        oos.writeObject(word);
        oos.close();
    }
    public void read() throws FileNotFoundException, IOException, ClassNotFoundException, FontFormatException{
        File file = new File("test.dat");
        FileInputStream filein = new FileInputStream(file);
        ObjectInputStream ois = new ObjectInputStream(filein);
        Word word = (Word) ois.readObject();
        ois.close();
        System.out.println(word.getKanaKanji());//this gets the kanakanji  

    }
}

当我调用 Word 类 getKanaKanji 方法时,我得到了问号。

我确实有一个支持日文字符的操作系统,所以这不是问题。

先感谢您!

4

1 回答 1

0

通过 ObjectOutputStream 写入 String 对象时,首先将 String 对象的长度写入 2 个字节,然后将 String 对象的内容写入修改后的 UTF-8。请参阅 DataOutput.writeUTF(String) 的描述。

http://docs.oracle.com/javase/7/docs/api/java/io/DataOutput.html#writeUTF%28java.lang.String%29

您看到的问号是代表字符串长度的前 2 个字节。

于 2014-02-13T18:51:34.357 回答