[英]Scrapy - Retrieve Authentication Token from javascript script response
我需要有关此特定情况的帮助。
设想
我可以从<script>
标签获取这些信息
使用密钥,我必须调用此端点
用于检索存储在 javascript 响应中的 SessionID
-- omitted
private._sessID='MYSESSIONID';
-- omitted
最后,使用这个 sessionId 并执行正确的 POST 操作,我可以在我需要的所有页面中导航。
我的僵局
我可以使用带有正则表达式的scrapy shell
regEx
所有步骤(并且一切正常),但我不知道如何在开始数据提取之前在 Z3CD13A277FBC2FEA5EF64364C8B6F85Z 蜘蛛中管理这些步骤。
有人可以帮我吗?
您需要从基础URL http://www.example.com/index.php
开始,通过调用它在启动请求方法中调用它并写入其其他回调并从其他端点提取信息过程。
您需要通过以下方式实现
class CrawlSpider(scrapy.CrawlSpider):
def parse_authentication_token(self, response):
//extract token or whatever require and then call supers parse
yield from super().parse()
def start_request(self):
return Request(url, callback=self.parse_authentication_token)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.