0

我正在尝试使用 VTD-XML 解析 JMDict 项目中的 JMDict_e.xml 文件。但是,我遇到了解析错误。

出现的唯一错误消息是:

ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char

xml 的简短摘录如下所示:

<entry>
    <ent_seq>1279770</ent_seq>
    <k_ele>
        <keb>構成要素</keb>
    </k_ele>
    <r_ele>
        <reb>こうせいようそ&lt;/reb>
    </r_ele>
    <sense>
        <pos>&n;</pos>
        <pos>&adj-no;</pos>
        <field>&comp;</field>
        <gloss>components</gloss>
        <gloss>elements</gloss>
        <gloss>parts</gloss>
    </sense>
</entry>

我相信在pos字段中,非法字符很可能是&符号。有没有办法让 vtd-xml 不将这些 & 符号视为特殊字符?还是有不同的方法来解决这个问题?

4

1 回答 1

1

VTD-XML 只识别那些内置的字符实体。在我看来,大多数实体都是无效的。您可能需要先解决这些问题,然后再将其提供给解析器。

于 2017-06-29T06:08:37.523 回答