我需要有关此特定情况的帮助。
设想
- 呼叫站点
我可以从<script>
标签中获取此信息
使用密钥,我必须调用此端点
用于检索存储在 javascript 响应中的 SessionID
-- omitted
private._sessID='MYSESSIONID';
-- omitted
最后,使用这个 sessionId 并执行正确的 POST 操作,我可以在我需要的所有页面中导航。
我的僵局
我可以使用scrapy shell
with模拟所有步骤regEx
(并且一切正常),但在开始数据提取之前,我不知道如何在 scrapy 蜘蛛中管理这些步骤。
有人可以帮我吗?