0
public XMLParser(InputStream is) {
    try {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder db;
        db = dbf.newDocumentBuilder();
        Document doc = db.parse(is);
        node = doc.getDocumentElement();
    } catch (Exception e) {
        DebugLog.log(e);
    }
}

inputStream 包含如下内容:“嘿,这是一个 ü 字符。” 字符'ü' 是一个'ü';

当读取节点的内容 System.out.println(node.getTextContent()) 我收到“嘿,这是一个字符。” ü 被剪掉了。

4

2 回答 2

0

问题是 XML 实体和 HTML 实体。我请求一个返回 HTML 实体数据的网页。我必须将 HTML 实体转换为 XML 实体,它成功了!

检查此答案以获取一些代码

于 2012-09-22T10:12:11.530 回答
0

那么,这是一份有效的文件吗?是否指定了编码?-> http://www.w3schools.com/XML/xml_encoding.asp

这些可能会有所帮助:

如何让 SAX 解析器从 xml 声明中确定编码? http://www.coderanch.com/t/127052/XML/XML-parsers-encoding-byte-order

于 2012-09-22T09:31:03.790 回答