Xpath：如何获取<a>标签</a>文本 <p> <a>标签</a>

Question

我正在尝试使用scrapy来保存某些网站上的信息，但我发现了一个问题，但我不知道如何解决。

我试图将所有文本都包含在p标签内，但是我的问题是，在某些情况下，这些标签内不仅只有文本，有时还有一些标签，当到达该标签时便停止收集文本。

这是我的Xpath表达式，在没有标签的地方它可以正常工作。

description=descriptionpath.xpath("span[@itemprop='description']/p/text()").extract()

任何帮助，将不胜感激！

提前致谢！

Answer 1

张贴Pawel Miech的评论作为答案，因为到目前为止他的评论似乎已经帮助了我们许多人，并且包含了正确的答案：

在xpath的末尾添加//text() ，以指定应递归提取文本。

因此，您的xpath将如下所示：

span[@itemprop='description']/p//text()