0

好吧,我有一个简单的文本文件,其中填充了我的文本数据,需要将其保存为 utf-8,因为我有一些 unicode 符号...

好吧,我只是用记事本写了一个普通的文本文件,并用 utf-8 保存为 txt

但我似乎在前面得到了一些奇怪的东西: 在此处输入图像描述

这是某种奇怪的点,通常甚至无法粘贴到其他任何地方。我也许可以尝试删除第一个符号,但我认为这不是一个真正的解决方案,此外我不确定它是否会一直出现......

这是代码部分:

FileInputStream fstream = new FileInputStream(fileName);
        // Get the object of DataInputStream
        DataInputStream in = new DataInputStream(fstream);
        BufferedReader br = new BufferedReader(new InputStreamReader(in));
        String values;

        //Read File Line By Line

        System.out.println("Generating queries from: " + fileName);
        String fields = br.readLine(); 
        System.out.println("The fields are: " + fields); 

有人遇到过这个并知道解决方案吗?

提前致谢。

4

1 回答 1

3

它可能是一个Unicode 字节顺序标记 (BOM)。一些文本编辑器(在 Windows 上)启动一个带有 BOM 的 UTF-8 文本文件来标记它是 Unicode。

如果您需要在 Java 中处理此问题,请测试您从文件中读取的第一个 Unicode 代码点是否为0xffef,如果是则将其删除。

于 2012-05-06T01:10:48.453 回答