Xpath獲取除具有特定標簽的節點以外的所有節點的文本

Question

因此，我得到了這種類型的html模式：

<table id="proposal-details" class="details">

                        <tbody><tr>
                            <th>
                                Application type:
                            </th>
                            <td>
                                P
                            </td>
                        </tr>
                        <tr>
                            <th>
                                Proposed development
                            </th>
                            <td>
                                Prune 1 x Eucalyptus
                            </td>
                        </tr>
                        <tr>
                            <th>
                                Date received:
                            </th>
                            <td>
                                06 Feb 2015
                            </td>
                        </tr>
                        <tr>
                            <th>
                                Registration date:
                                <br>
                                (Statutory start date)
                            </th>
                            <td>
                                06 Feb 2015
                            </td>
                        </tr>

我已經得到了XPath來捕獲所有的次 ; 一切順利，一路到最后個文本登記日期：在這里我其實不需要的BR文本被選中。

我已經解決了這個問題，問題出在這個xpath上，

len(response.xpath("//table//tr//th[not(.//br)]/text()").extract())

整個標簽被忽視。 有什么建議嗎？

這是我得到的輸出：

[u' Application type: ',
 u' Proposed development ',
 u' Date received: ']

我實際需要的注冊日期：列表中沒有（法定開始日期） 。

Answer 1

據我了解你的問題，你想獲得的所有文字th元素，但忽視之后的文本<br> 。 如果是這樣，則以下XPath

//table//tr//th/text()[not(preceding-sibling::br)]

當應用於您的輸入時會產生結果

Application type:
Proposed development
Date received:
Registration date:

您使用的XPath只是忽略每個th有孩子的br ：

th[not(.//br)]

而th/text()[not(preceding-sibling::br)]檢索th所有沒有前一個兄弟br文本元素。

Xpath獲取除具有特定標簽的節點以外的所有節點的文本

問題描述

1 個解決方案

解決方案1
2 已采納 2015-02-14 10:26:33

Xpath獲取除具有特定標簽的節點以外的所有節點的文本

問題描述

1 個解決方案

解決方案1 2 已采納 2015-02-14 10:26:33

解決方案1
2 已采納 2015-02-14 10:26:33