2

目前正在尝试实现我的 iOS 应用程序的 Android 版本并在解析 XML 时遇到一些问题,其中文本包含单引号或双引号字符(它是外语的字典应用程序)。

我的应用程序的所有数据都是从 XML 资源文件加载的。这是该文件的示例:

<entry>
    <word>afa'i fā</word>
    <definition>See under "afa". Figurative (especially in poetry), king or queen: "hotau afa'i fā".</definition>  
</entry>

XmlResourceParser我通过调用检索:

XmlResourceParser parser = getResources().getXml(R.xml.data);
parse(parser);

这是我的解析代码:

public void parse(XmlResourceParser parser) throws XmlPullParserException, IOException {
    int eventType = parser.getEventType();
    while (eventType != XmlPullParser.END_DOCUMENT) {
        switch (eventType) {
            case XmlPullParser.START_TAG:
                startTag(parser.getName(), parser);
                break;
            case XmlPullParser.END_TAG:
                endTag(parser.getName(), parser);
                break;
            case XmlPullParser.TEXT:
                foundText(parser.getText());
                break;
            default:
                break;
        }
        eventType = parser.next();
    }
}

解析文本时,XmlResourceParser'getText()方法会删除 之后的所有内容,'并在下一个节点内重新拾取文本。此外,它只是忽略了双引号。我的结果如下所示:

(word) 
afa

(definition)
See under afa. Figurative (especially in poetry), king or queen: hotau afa

我已经搜索了文档,似乎在文档中找不到任何提及处理单引号和双引号的内容......我唯一能想到的是XmlResourceParser不喜欢文字字符,而是期待实体代码,但我尝试将它们换掉,但它仍然忽略它们。

4

1 回答 1

1

根据文档,看起来XmlResourceParser返回的人正在做一些额外的事情:getResources().getXml()

https://developer.android.com/reference/android/content/res/Resources.html#getXml(int)

返回一个 XmlResourceParser,您可以通过它读取给定资源 ID 的通用 XML 资源。

此处返回的 XmlPullParser 实现具有一些有限的功能。特别是,您无法更改其输入,并且只有高级解析事件可用(因为文档在构建时已为您预先解析,这涉及合并文本和剥离注释)。

虽然它没有明确说明单引号或双引号,但它显然是在对 XML 做一些事情。在不更改我的任何代码来解析 XML 的情况下,我通过使用以下内容初始化我自己的代码来获得所需的输出XmlPullParser

InputStream in = getResources().openRawResource(R.raw.data);
XmlPullParser parser = Xml.newPullParser();
parser.setInput(in, null);
parse(parser);
于 2018-02-04T20:05:14.190 回答