0

我正在处理来自以下 url 的某些数据集(页面为西班牙语):http ://www.aire.cdmx.gob.mx/default.php?opc=%27aKBh%27

在网站上,您可以选择您想要的年份,然后单击下载以获取 xls 文件。

我想自动化该过程以提取从 2001 年到 2020 年的数据集,但我能想到的唯一解决方案(特别是对于“下载”按钮 - 'Descargar archivo')是使用html_form()来自的函数Rvest,例如这个:

url = "http://www.aire.cdmx.gob.mx/default.php?opc=%27aKBh%27"
search = read_html(url)
form = html_form(search)[[1]]
fill = form %>%
    html_form_set(seluniano = "2001")

##The filled form looks like this:

> fill
<form> '<unnamed>' (POST )
  <field> (select) seluniano: 2001
  <field> (submit) unibaja: Descargar archivo
> 

我知道这会出现一些问题:如果我使用html_form_submit(),我会收到错误:

Error: `form` doesn't contain a `action` attribute

然后,如果我让该功能正常工作,我该如何下载文件?

我认为这不是最好的方法,但这就是我寻求帮助的原因。

4

0 回答 0