簡體   English   中英

xpath在此網站上不起作用

[英]xpath doesn't work in this website

我正在從justproperty.com抓取單個列表頁面(原始問題中的單個列表不再有效)。

我想獲得Ref的價值

這是我的xpath:

>>> sel.xpath('normalize-space(.//div[@class="info_div"]/table/tbody/tr/td[norma
lize-space(text())="Ref:"]/following-sibling::td[1]/text())').extract()[0]

盡管可以在我的瀏覽器中進行操作,但不會造成任何麻煩。

以下內容在lxml.html (與現代Scrapy結合使用)中完美lxml.html

sel.xpath('.//div[@class="info_div"]//td[text()="Ref:"]/following-sibling::td[1]/text()')

請注意,我使用//來獲得divtd之間的距離,而不是布置顯式路徑。 我必須仔細閱讀文檔才能理解原因,但是在該區域給出的路徑是錯誤的。

不要通過查看Firebug或Chrome開發工具來創建XPath表達式,因為它們會更改標記。 刪除/tbody軸步驟,您將准確找到所需的內容。

normalize-space(.//div[@class="info_div"]/table/tr/td[
  normalize-space(text())="Ref:"
]/following-sibling::td[1]/text())

閱讀為什么我的XPath查詢(抓取HTML表)只能在Firebug中工作,而不能在我正在開發的應用程序中工作? 更多細節。

另一個具有相同功能的XPath: (.//td[@class='titles']/../td[2])[1]

我使用XPath Checker嘗試了XPath,並且工作正常。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM