r - 从 URL 检索文件列表

Question

我想获取此地址上所有可用文件的列表：http ://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/ （来自 NOAA 的公开数据） .

对于特定的 URL，它将是某种“list.files”。我开始查看 RCurl，但我能得到的只是 URL 的 HTML 代码。

score 4 · Accepted Answer

在这种情况下，您可以简单地使用readHTMLTable：

readHTMLTable("http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/", 
              skip.rows=1:2)[[1]]$Name -> file.list

然后创建路径列表：

paste("http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/", 
      file.list[!is.na(file.list)], sep="") -> path.list

1 回答 1