Xpath：如何獲取<a>標簽</a>文本 <p> <a>標簽</a>

Question

我正在嘗試使用scrapy來保存某些網站上的信息，但我發現了一個問題，但我不知道如何解決。

我試圖將所有文本都包含在p標簽內，但是我的問題是，在某些情況下，這些標簽內不僅只有文本，有時還有一些標簽，當到達該標簽時便停止收集文本。

這是我的Xpath表達式，在沒有標簽的地方它可以正常工作。

description=descriptionpath.xpath("span[@itemprop='description']/p/text()").extract()

任何幫助，將不勝感激！

提前致謝！

Answer 1

張貼Pawel Miech的評論作為答案，因為到目前為止他的評論似乎已經幫助了我們許多人，並且包含了正確的答案：

在xpath的末尾添加//text() ，以指定應遞歸提取文本。

因此，您的xpath將如下所示：

span[@itemprop='description']/p//text()