我正在抓取一个网站(只有两个级别的深度),我想从两个级别的网站上抓取信息。我遇到的问题是,我想用两个级别的信息填写一个项目的字段。我该怎么做呢?
我在想有一个项目列表作为一个实例变量,所有线程都可以访问(因为它是蜘蛛的同一个实例),并且 parse_1 将填写一些字段,而 parse_2 必须在填写之前检查正确的键出对应的值。这种方法看起来很繁琐,我仍然不确定如何使它起作用。
我在想必须有更好的方法,也许以某种方式将一个项目传递给回调。我不知道如何使用 Request() 方法来做到这一点。想法?