簡體   English   中英

如何從沒有xpath的元素中提取文本

[英]How to extract text from an element that does not have an xpath

我正在嘗試在食品配送網站上通過網絡刮擦每個餐廳的美元符號評級,但是,沒有可用的xpath。

<!-- react-text: 2108 -->
"$$"
<!-- /react-text -->

上面的代碼是我檢查網站時用於美元評級的代碼。 我試過直接在上面的行:

    <i class="icon-bullet--small">·</i>

但是,由於不是美元等級,因此會輸出該期間。 我也嘗試過使用:

    cost = ['//li[{}]/a/div[2]/p[2]/!'.format(x) for x in range(1, 999)]

以及在xpath中使用“!-”,“ react”和“ react-text”,但是它們都不起作用。 關於如何處理此問題的任何建議?

這個XPath

//comment()[normalize-space() = "react-text: 2108"]/following-sibling::text()

將在目標注釋之后立即選擇文本節點,返回

"$$"

按照要求。


重要說明: @DebanjanB用地指出,包含react-text: 2108的注釋是一個React指令,除非將內容提取為page_source否則Selenium不會看到。 謝謝,Debanjan!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM