简体   繁体   English

如何使用XPath选择链接的内部文本?

[英]How to select inner text of the link using XPath?

I am using Scrapy to crawl data. 我正在使用Scrapy来抓取数据。

On JS console on my browser, I type $x('//div[@class="summary"]//div[contains(@class, "tags")]') to get what I need, but I need to filter the data. 在我的浏览器上的JS控制台上,我输入$x('//div[@class="summary"]//div[contains(@class, "tags")]')来获得我需要的东西,但我需要过滤数据。

The following picture is the $x('//div[@class="summary"]//div[contains(@class, "tags")]') command result. 下图是$x('//div[@class="summary"]//div[contains(@class, "tags")]')命令结果。

JS控制台结果

How should I write xpath command to get the data in the green box? 我应该如何编写xpath命令来获取绿色框中的数据? I tried $x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]') , but that is not what I want。 我试过$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]') ,但这不是我想要的。

Thank you! 谢谢!

要在所选div选择<a>元素的内部文本,您只需要将/a/text()附加到选择div XPath:

//div[@class="summary"]//div[contains(@class, "tags")]/a/text()

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM