Scrapy 不是第一個子元素的 select 子元素，而是所有子元素

Question

有這個 HTML：

<table class="myTable>
    <tbody>
        <tr>A1</tr>
        <tr>A2</tr>
    </tbody>
<table>

<table class="myTable>
    <tbody>
        <tr>A1</tr>
        <tr>A2</tr>
    </tbody>
<table>

<table class="myTable>
    <tbody>
        <tr>A1</tr>
        <tr>A2</tr>
    </tbody>
<table>

我只想提取A1和A2一次。 所以我有這個選擇：

table = response.xpath('.//table[@class="myTable"]')[0]
row = table.xpath("//tr")

但是，當檢查len(row)時，我得到 6，而不是 2，即使我檢查了len(table)並且只得到 1（僅第一個表）。 那我該怎么做 select 呢？

Answer 1

您需要使用相對的 XPath：

row = table.xpath(".//tr")

或者您可以使用它來處理頁面上的第一個表格：

rows = response.xpath('(//table[@class="myTable"])[1]//tr')

Scrapy 不是第一個子元素的 select 子元素，而是所有子元素

問題描述

1 個解決方案

解決方案1
1 已采納 2019-10-28 07:29:57

Scrapy 不是第一個子元素的 select 子元素，而是所有子元素

問題描述

1 個解決方案

解決方案1 1 已采納 2019-10-28 07:29:57

解決方案1
1 已采納 2019-10-28 07:29:57