试图刮掉维基百科页面,我以前做过很多次这样的事情
library(XML)
myURL <- "http://en.wikipedia.org/wiki/List_of_US_Open_MenUs_Singles_champions"
y <- readHTMLTable(myURL, stringsAsFactors = FALSE)
R 在 RStudio 或标准 GUI 中崩溃
其他关于类似问题的 SO 评论建议使用 readLines
u=url(myURL)
readLines(u) # cannot open: HTTP status was '404 Not Found'
该网址实际上已重定向,因此输入了最终网址
myURL <- "http://en.wikipedia.org/wiki/List_of_US_Open_Men%27s_Singles_champions"
这次 readLines 确实输出了页面,但是使用 XML 函数,包括 htmlParse,仍然会导致崩溃
TIA