我正在抓取一个结构如下的网站:
Archive
Article 1
Authors
Author 1
Author 2
Title
Body
Comments
Comment 1
Comment 2
...
每个作者Authors
都有自己的个人资料页面。问题是作者写了多篇文章,所以当我的蜘蛛抓取网站时,我最终会一遍又一遍地抓取相同作者的个人资料。
我将如何使用 Scrapy 缓存作者个人资料?