为了使事情井井有条,我确定蜘蛛将填充三个项目类别。
每个项目类都有各种填充的字段。
class item_01(Item):
item1 = Field()
item2 = Field()
item3 = Field()
class item_02(Item):
item4 = Field()
item5 = Field()
class item_03(Item):
item6 = Field()
item7 = Field()
item8 = Field()
有多个页面可以使用相同的项目进行爬网。在蜘蛛中,我使用 XPathItemLoader 填充“容器”。
目标是将项目传递给 mysql 管道以填充单个表。但问题就在这里。
当我产生三个容器(每页)时,它们作为三个单独的容器传递到管道中。他们作为自己的 BaseItem 通过管道并仅填充 mysql 表的部分,而将其他列保留为“NULL”。
我想做的是将这三个容器重新打包到一个 BaseItem 中,以便它们作为单个 ITEM 传递到管道中。
有人对重新包装这些物品有什么建议吗?无论是在蜘蛛还是管道中?
谢谢