0

我有一个 html 文件,我需要使用 jsoup 从中提取部门名称。

Document doc = Jsoup.connect("http://directory.binghamton.edu/directory/directory.deptlist").get();
System.out.println(doc);
Elements departments = doc.select("deptlist");

for (Element department : departments) {
    System.out.println(department.text());
}

我做过类似的事情,但它不起作用。

查看源:http://directory.binghamton.edu/directory/directory.deptlist

谢谢你。

4

1 回答 1

1

开始了!

Document doc = Jsoup.connect("http://directory.binghamton.edu/directory/directory.deptlist").get();

Elements departments = doc.select("table#deptlist a"); // Select all 'a' in a 'table'-tag with id 'deptlist'
String name;


for( Element element : departments ) // Iterate over all Elements available
{
    name = element.text(); // Save the plaintext (no html) of the element
    System.out.println(name); // Simple output (as an example)
}

在您的代码中,您选择标签“deptlist”而不是表格。
如果您想选择所有元素id=deptlist(在我的示例中,您只选择具有该 ID 的表),您可以使用此选择器:doc.select("#deptlist")

在此处查看更多信息:JSoup 选择器 API

于 2012-12-13T20:34:40.080 回答