我可以从未使用以下命令锁定的网站完美下载 PDF:
require(XML)
url <- ('http://www.eluniversal.com.mx/impreso/wportada_20121202.pdf')
download.file(url, 'universal.pdf')
但是对于需要密码的网站,我不能。在我下载它并尝试打开它后,它说文件可能已损坏。这是链接示例:
require(XML)
url <- ('http://www.reforma.com/edicionimpresa/paginas/20121201/pdfs/rPRI20121201-001.pdf')
download.file(url, 'reforma.pdf')