我已经从网页中抓取了与不同表格相对应的 URL(使用 RSelenium)。我将这些 URL 存储在一个名为“URL”的对象中。现在我想在下一步以文本格式将每个表格写到我在下面的循环中指定的目录中。但由于某种原因,循环在 5 次迭代后停止,我不知道为什么?有什么想法或提示吗?
for (i in 1:length(URL)){
remDr$navigate(URL[i])
date <- Sys.Date()
file <- paste("./WebScraping Connecting/Connecting_","_", date, ".txt", sep="")
y2 <- remDr$getPageSource()
y2 <- unlist(y2)
y3 <- readHTMLTable(y2, header=TRUE)
l <- unlist(lapply(y3[[1]], paste, collapse=" "))
for (j in 2:length(y3)){
l1 <- unlist(lapply(y3[[j]], paste, collapse=" "))
if (!is.null(l1)){
l <- rbind(l, l1)
}
}
写(as.vector(l),文件=文件)
更新:有时循环即使在 3 次迭代后也会停止。如果我手动完成循环,它似乎工作正常。但是,我确实收到此警告消息:
In rbind(l, l1) :
number of columns of result is not a multiple of vector length (arg 1)