繁体   English   中英

从多个来源使用 xpath 提取文本

[英]extract text with xpath from multiple sources

我构建了一个刮刀来为我的项目从 3 个站点中提取文本。 我想为 3 个站点使用单个蜘蛛。 其中 2 个站点的内容采用以下结构:

<div id="site1">
   <p> this is a test </p>
</div>

<div id="site2">
   <p> this is a test </p>
</div>

一个是这样的:

<div class="site3">
   <p> <span> this is a test </span> </p>
</div>

我可以使用以下方法从两个站点中提取文本:

response.xpath('//div[@id="site1" or @id="site2" or @class="site3"]//p/text()').extract()

如何修改此代码以从 site3 中提取文本?

response.xpath('//div[@id="site1" or @id="site2"]//p/text() | //div[@class="site3"]//p/span/text()').extract() 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM