5

我正在尝试从网站http://www.cityoflondon.gov.uk/events/抓取事件列表,但是当使用 import.io 抓取它时,我只能提取第一页。

我怎样才能一次提取所有页面?

4

1 回答 1

3

您可以使用此站点,使用爬虫或使用批量提取来提取数据。上面的网站使用了一种非常简单的分页形式:

http://www.cityoflondon.gov.uk/events/Pages/default.aspx    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37  

这是我为上述 URL 创建的数据集,其中应包含所有相关信息。

319aebad-88ea-4053-a649-2087011ce041

如果您对个别网站有其他疑问,请联系 support@import.io

谢谢!梅格

于 2015-08-03T15:16:34.883 回答