我正在尝试使用 JSoup 和 Java 在满足我的条件的特定标记之后获取定义列表(或任何标记)的内容。例如,假设我们有一个 html 文档,如下所示。
<p>PageID: 2816; NS: 0; Title: some text;
Image url:
Content:
{{Wort der Woche}}
{{Siehe auch}}
</p>
<h2><span class="1" id="e1">some text</span></h2>
<h3><span class="1" id="e2">some text</span></h3>
<p>{{Transportation}}
</p>
<dl>
<dd>Flying</dd>
<dd>Driving</dd>
<dd>Sailing
<dl>
<dd>Boat</dd>
<dd>Ship</dd>
</dl>
</dd>
</dl>
<p>{{Activities}}
</p>
<dl>
<dd>Shopping</dd>
<dd>Painting</dd>
</dl>
假设我们想要获取在“Transportation”之后出现的“dl”标签的内容。即内容:
<dl>
<dd>Flying</dd>
<dd>Driving</dd>
<dd>Sailing
<dl>
<dd>Boat</dd>
<dd>Ship</dd>
</dl>
</dd>
</dl>
我最初的尝试是获取段落的索引(例如第 1、2 等),然后获取相应的 dl,但这似乎不起作用,因为 dls 可以嵌套。
有人对如何获取此类内容有建议吗?