[英]extract text with xpath from multiple sources
我构建了一个刮刀来为我的项目从 3 个站点中提取文本。 我想为 3 个站点使用单个蜘蛛。 其中 2 个站点的内容采用以下结构:
<div id="site1">
<p> this is a test </p>
</div>
<div id="site2">
<p> this is a test </p>
</div>
一个是这样的:
<div class="site3">
<p> <span> this is a test </span> </p>
</div>
我可以使用以下方法从两个站点中提取文本:
response.xpath('//div[@id="site1" or @id="site2" or @class="site3"]//p/text()').extract()
如何修改此代码以从 site3 中提取文本?
response.xpath('//div[@id="site1" or @id="site2"]//p/text() | //div[@class="site3"]//p/span/text()').extract()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.