这篇文章http://www.ajnr.org/content/30/7/1402.full包含四个指向 html-tables 的链接,我想用 rvest 抓取它们。
在 css 选择器的帮助下:
"#T1 a"
可以像这样到达第一个表:
library("rvest")
html_session("http://www.ajnr.org/content/30/7/1402.full") %>%
follow_link(css="#T1 a") %>%
html_table() %>%
View()
css 选择器:
".table-inline li:nth-child(1) a"
可以选择包含链接到四个表的标签的所有四个 html 节点:
library("rvest")
html("http://www.ajnr.org/content/30/7/1402.full") %>%
html_nodes(css=".table-inline li:nth-child(1) a")
怎么可能遍历这个列表并一次检索所有四个表?最好的方法是什么?