簡體   English   中英

用Nokogiri排除HTML標簽

[英]Exclude HTML tag with Nokogiri

我正在嘗試獲取TD標簽中的所有文本,除了<strong>標簽內的內容(可能有任意數量)。

在此示例中,我想獲取:“ graavis ● diakriitik ( )↝ " and "急性口音`”:

<tr class="level2">
    <td> 
        <strong> grave accent </strong> 
         <strong> (=backquote character) </strong>
         graavis ● diakriitik (`) ↝ 
         <a href="?word=sv82">acute accent</a>
    </td>
</tr>

我正在嘗試使用下面的代碼,但是它不起作用:

desc = page.css('tr td:not(strong)').text

考慮:

page.search("strong").remove
page.css(".level2 > td").text.strip

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM