![](/img/trans.png)
[英]How to extract text and the xpath to that element of the HTML page in Python
[英]How to extract text from an element that does not have an xpath
我正在尝试在食品配送网站上通过网络刮擦每个餐厅的美元符号评级,但是,没有可用的xpath。
<!-- react-text: 2108 -->
"$$"
<!-- /react-text -->
上面的代码是我检查网站时用于美元评级的代码。 我试过直接在上面的行:
<i class="icon-bullet--small">·</i>
但是,由于不是美元等级,因此会输出该期间。 我也尝试过使用:
cost = ['//li[{}]/a/div[2]/p[2]/!'.format(x) for x in range(1, 999)]
以及在xpath中使用“!-”,“ react”和“ react-text”,但是它们都不起作用。 关于如何处理此问题的任何建议?
这个XPath
//comment()[normalize-space() = "react-text: 2108"]/following-sibling::text()
将在目标注释之后立即选择文本节点,返回
"$$"
按照要求。
重要说明: @DebanjanB有用地指出,包含react-text: 2108
的注释是一个React指令,除非将内容提取为page_source
否则Selenium不会看到。 谢谢,Debanjan!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.