簡體   English   中英

Scrapy shell-正確的 xpath 選擇器用於從表中獲取信息?

[英]Scrapy shell- correct xpath selector for getting info from a table?

我正在嘗試獲取正確的 Xpath 以提取下圖中紅色圈出的信息:

在此處輸入圖像描述

我嘗試復制 xpath 並將其粘貼到 scrapy shell 但它不起作用。 我遇到了困難,因為信息包含在表格中,並且表格的每個元素都具有相同的名稱。 該網站是

https://virtualmuebles.com/muebles-sala/mesa-tv-invy-1c-casa-linda-wg

假設文本Marca在您要抓取的所有頁面上都是不變的。 首先搜索包含文本“Marca”的b元素。 如果它是td元素,則查找其父元素。 如果它是td元素,則獲取以下兄弟。 獲取其文本節點:

response.xpath("//b[contains(text(),'Marca')]/parent::td/following-sibling::td/text()").get()

否則,如果它始終是第四個tr元素的第二個td元素:

response.xpath("//tr[4]/td[2]/text()").get()

輸出:

'RTA Design'

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM