首先,我真的是网络抓取的初学者。
所以在这个网站上工作。我试图通过有关 espisode 的讨论获取下一个网页的链接。使用 SelectorGadget 我设法只获得带有主题框架的 html 部分
html.s1e01 <- html("http://asoiaf.westeros.org/index.php/forum/41-e01-winter-is-coming/")
html.s1e01.page <- html_nodes(html.s1e01, ".ipsBox")
现在我想获取主题的所有链接,所以我尝试了
html_attr(html.s1e01.page, "href")
但我明白了NA。我在互联网上看到了类似的例子,它应该可以工作。有什么建议为什么不这样做?