[英]How to extract text and the xpath to that element of the HTML page in Python
[英]How to extract text from an element that does not have an xpath
我正在嘗試在食品配送網站上通過網絡刮擦每個餐廳的美元符號評級,但是,沒有可用的xpath。
<!-- react-text: 2108 -->
"$$"
<!-- /react-text -->
上面的代碼是我檢查網站時用於美元評級的代碼。 我試過直接在上面的行:
<i class="icon-bullet--small">·</i>
但是,由於不是美元等級,因此會輸出該期間。 我也嘗試過使用:
cost = ['//li[{}]/a/div[2]/p[2]/!'.format(x) for x in range(1, 999)]
以及在xpath中使用“!-”,“ react”和“ react-text”,但是它們都不起作用。 關於如何處理此問題的任何建議?
這個XPath
//comment()[normalize-space() = "react-text: 2108"]/following-sibling::text()
將在目標注釋之后立即選擇文本節點,返回
"$$"
按照要求。
重要說明: @DebanjanB有用地指出,包含react-text: 2108
的注釋是一個React指令,除非將內容提取為page_source
否則Selenium不會看到。 謝謝,Debanjan!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.