我正在尝试获取网站目录中的文件列表。有没有一种类似于本地目录列表的 dir() 或 list.files() 命令的方法?我可以使用 RCurl 连接到网站(我需要它,因为我需要通过 HTTPS 进行 SSL 连接):
library(RCurl)
text=getURL(*some https website*
,ssl.verifypeer = FALSE
,dirlistonly = TRUE)
但这会创建一个包含文件列表的图像、超链接等的 HTML 文件,但我只需要一个文件的 R 向量,就像使用 dir() 获得的一样。这可能吗?还是我必须进行 HTML 解析才能提取文件名?听起来像一个简单问题的复杂方法。
谢谢,
编辑:如果你可以让它与http://hgdownload.cse.ucsc.edu/goldenPath/hg19/encodeDCC/wgEncodeGencodeV7/一起工作,那么你会明白我的意思。