我想获取此地址上所有可用文件的列表:http ://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/ (来自 NOAA 的公开数据) .
对于特定的 URL,它将是某种“list.files”。我开始查看 RCurl,但我能得到的只是 URL 的 HTML 代码。
在这种情况下,您可以简单地使用readHTMLTable
:
readHTMLTable("http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/",
skip.rows=1:2)[[1]]$Name -> file.list
然后创建路径列表:
paste("http://www1.ncdc.noaa.gov/pub/data/cmb/drought/weekly-palmers/2005/",
file.list[!is.na(file.list)], sep="") -> path.list