0

您好,我得到了一些 xml 文件它们在 UTF-8 上,所以我遵循一些示例,我的代码看起来像这样

String text = "";   
String str;
BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(Path), "UTF-8"));
while ((str = in.readLine()) != null) {
    text += str;
}
return text;

然后我尝试用dom解析器解析代码

Document doc = parser.getDomElement(result);

这个失败我用十六进制编辑器检查了我的xml文件我在“<”之前有以下字符代码:ef bb bf

我错过了什么?为什么 getDomElement 告诉我 Unexpected token (position:TEXT @1:2)

4

1 回答 1

1
text += str + "\n";

如果标签中有换行符:

<img
src="smile.jpg"/>

你可以得到:

<imgsrc="smile.jpg">

以及其他一些情况。

StringBuilder text = new StringBuilder();   
try (BufferedReader in = new BufferedReader(new InputStreamReader(
        new FileInputStream(Path), "UTF-8"))) {
    String str;
    while ((str = in.readLine()) != null) {
        text.append(str).append("\n");
    }
} // Does an in.close()
return text.toString();
于 2013-05-22T12:30:15.620 回答