我想解析一个不寻常的 XML 结构,如此处所示。两个自闭标签用于标记文本的开始和结束。因此,文本不在标签分区内。
<article>
<sec>
<clause id="31"/>This says thirty-one <clause_end/>
<clause id="32"/>This says thirty-two <clause_end/>
</sec>
</article>
遗留文档不太适合 XML 的离散层次要求,此模式试图解决这些问题。
- 它与 XML 的任何合理实现一致吗?
- 您对如何应用 XML 解析器有什么建议吗?
保持原始结构是可取的,但如果答案是否定的,那么我将不得不:
- 制作一个通常标记文本的替代模式:
<clause id="32"> text </clause>
. - 通过去除其他干扰
<clause>
. 我很确定我不会错过任何事情。
顺便说一句,我很乐意链接到实时文件,除非我不想让开发人员感到尴尬,假设这个模式和我想的一样不正常。;-)
根据九十九的回答...
- 它与 XML 的任何合理实现一致吗?
- . . . 可能
- 您对如何应用 XML 解析器有什么建议吗?
- . . . 尽可能解析,但在架构中的这个级别,您必须使用字符串。
我可能会保留现有结构,但会引入一个小改进:
<article>
<sec>
<clause id="31"/>This says thirty-one <clause_end id="31"/>
<clause id="32"/>This says thirty-two <clause_end id="32"/>
</sec>
</article>