0

我在这里有这个 HTML 代码:

<hr />
<h3>Academic Recovery and Probation Conference Journal</h3>The Recovery Progress Journal is used to
record and guide conference discussions and to monitor students’ academic, behavioral and social
progress. 
<br />

如您所见,“h3”标题下的文本周围没有任何标签?我正在使用 jSoup 将此信息放入 Android 应用程序中。如果它没有定义它的标签,我将如何提取那段文本?

4

2 回答 2

0

我认为在没有任何其他解析的情况下单独使用 Jsoup 是不可能的。Jsoup 在 DOM 中定位元素,然后允许您访问元素的数据。

您将必须找到包含所需段落的最小元素,在其上运行 .text(),然后自己解析 .text() 的结果。

于 2013-04-09T20:52:59.770 回答
0

在这里回答(谢天谢地):

Jsoup - 提取文本

懒人的释义版本:

// You need to get Nodes, not Elements
Document doc = Jsoup.parse(str);
Element div = doc.select("div").first();

for (Node node : div.childNodes()) {
    System.out.println(
        String.format(
            "%s %s",
            node.getClass().getSimpleName(),
            node.toString()
        )
    );
}
于 2013-08-12T18:06:14.400 回答