[英]Xpath: how to get the text of <a> tag inside a <p> tag
我正在嘗試使用scrapy來保存某些網站上的信息,但我發現了一個問題,但我不知道如何解決。
我試圖將所有文本都包含在p標簽內,但是我的問題是,在某些情況下,這些標簽內不僅只有文本,有時還有一些標簽,當到達該標簽時便停止收集文本。
這是我的Xpath表達式,在沒有標簽的地方它可以正常工作。
description=descriptionpath.xpath("span[@itemprop='description']/p/text()").extract()
任何幫助,將不勝感激!
提前致謝!
張貼Pawel Miech的評論作為答案,因為到目前為止他的評論似乎已經幫助了我們許多人,並且包含了正確的答案:
在xpath的末尾添加//text()
,以指定應遞歸提取文本。
因此,您的xpath將如下所示:
span[@itemprop='description']/p//text()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.