0

我正在尝试从以前获取的 HTML 文档中获取 DIV 内容。我正在使用 Java Swing。

final java.io.Reader stringReader = new StringReader(html);
final HTMLEditorKit htmlKit = new HTMLEditorKit();
final HTMLDocument htmlDoc = (HTMLDocument) htmlKit.createDefaultDocument();
final HTMLEditorKit.Parser parser = new ParserDelegator();
parser.parse(stringReader, htmlDoc.getReader(0), true);
final javax.swing.text.Element el = htmlDoc.getElement("id");

这段代码应该得到一个我在 html 中的 ID 为“id”的 DIV。但接下来呢?如何获取div的内容?一直在搜索它,但我发现的唯一一件事是如何获取属性值,而不是元素内容。

我应该搬到jsoup吗?我宁愿使用 Java 本机,但到目前为止我被困住了。

谢谢!

4

1 回答 1

0

不是元素内容。

尝试类似:

int start = el.getStartOffset();
int end = el.getEndOffset();
String text = htmlDoc.getText(start, end - start);
于 2019-12-13T16:38:56.843 回答