[英]Xpath: how to get the text of <a> tag inside a <p> tag
我正在尝试使用scrapy来保存某些网站上的信息,但我发现了一个问题,但我不知道如何解决。
我试图将所有文本都包含在p标签内,但是我的问题是,在某些情况下,这些标签内不仅只有文本,有时还有一些标签,当到达该标签时便停止收集文本。
这是我的Xpath表达式,在没有标签的地方它可以正常工作。
description=descriptionpath.xpath("span[@itemprop='description']/p/text()").extract()
任何帮助,将不胜感激!
提前致谢!
张贴Pawel Miech的评论作为答案,因为到目前为止他的评论似乎已经帮助了我们许多人,并且包含了正确的答案:
在xpath的末尾添加//text()
,以指定应递归提取文本。
因此,您的xpath将如下所示:
span[@itemprop='description']/p//text()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.