0

如何从这些节点获取链接:

script <- getURL("www.r-bloggers.com")
doc <- htmlParse(script)
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']")

提前感谢任何提示。

4

1 回答 1

3

您可以提取a元素并调用xmlGetAttr它们。

library(RCurl)
library(XML)
script <- getURL("www.r-bloggers.com")
doc <- htmlParse(script)
li <- getNodeSet(doc, "//ul[@class='xoxo blogroll']//a")
sapply(li, xmlGetAttr, "href")

也可以xpathApply直接使用:

xpathSApply(doc, 
  "//ul[@class='xoxo blogroll']//a", 
  xmlGetAttr, "href"
)
于 2012-04-05T03:47:47.530 回答