0

我已经下载了 Java HtmlParser,但我不知道如何使用 API 来提取 HTML 数据。你能举一些例子,以便我可以研究它吗?

4

1 回答 1

2

你在谈论HtmlParser吗?而是选择像Jsoup这样的 API 不那么冗长的解析器。你需要学习的只是CSS 选择器,这些选择器对于普通的前端开发人员来说已经足够明显了。

这是一个启动示例,它显示您当前的问题和所有回答者的姓名:

package com.stackoverflow.q3416036;

import java.net.URL;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Test {

    public static void main(String[] args) throws Exception {
        URL url = new URL("https://stackoverflow.com/questions/3416036");
        Document document = Jsoup.parse(url, 3000);

        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }

}

也可以看看:

于 2010-08-05T15:04:15.713 回答