0

我只需要从网页http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html中提取那些出版物,其中第一作者是 Rahul Rao。

我已经尝试了以下代码,但它没有给我任何输出。

for( Element element : doc.select("table span.this-person.title") ){
System.out.println(element.text());
}

我需要什么才能获得首选输出?先感谢您。

4

2 回答 2

1

下面的代码会给你预期的输出..看看它是否对你有帮助!

文档 doc = Jsoup.connect(" http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html ").get(); 元素 span = doc.select(("div[class=data]"));

    //System.out.println(span.tagName("span"));
    for (Element src : span) {

        for(int i=0;i<src.childNodeSize();i++){
            if(src.childNodes().get(0).toString().contains("Rahul Rao")){
                if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){
                    System.out.println(src.childNodes().get(i));
                }

            }
于 2013-03-02T12:31:49.487 回答
0

我试图提取页面上发布的出版物并取得了一些成功。

代码如下:

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get();
    Elements span = doc.select("span");
    for (Element src : span) {
        if (src.tagName().equals("span")){
            System.out.println();
            System.out.print( src.ownText() );
        }
    }

看看有没有帮助!!

于 2013-03-02T08:12:25.327 回答