我正在尝试为此站点http://theaccelblog.squarespace.com/构建一个 import.io 爬虫, 但是当我单击“下一步”进入下一页进行训练时,由于系统原因,它会将我带回第一页正在使用的分页。非常感谢有关如何让 import.io 爬虫爬取这些页面的任何建议。正如 import.io 网站上所建议的那样,我试图在与服务器交换的数据包中找到分页系统,但没有成功。谢谢,如果你能帮忙。JRH
问问题
142 次
1 回答
0
我使用批量提取来创建 API。
https://import.io/data/mine/?id=bc7d67f2-24d3-4b5c-b134-01544430998a
如果您使用下面的偏移分页,您可以将其输入到 Bulk 并获取您需要的数据。
http://theaccelblog.squarespace.com/?offset=1418833411427
http://theaccelblog.squarespace.com/?offset=1409932229141
http://theaccelblog.squarespace.com/?offset=1402342675828
http://theaccelblog.squarespace.com/?offset=1397601000000
http://theaccelblog.squarespace.com/?offset=1397511000000
http://theaccelblog.squarespace.com/?offset=1390543200000
http://theaccelblog.squarespace.com/?offset=1375383600000
http://theaccelblog.squarespace.com/?offset=1359748800000
http://theaccelblog.squarespace.com/?offset=1285959600000
谢谢,
梅格
于 2015-09-11T09:46:58.857 回答