[英]Exclude HTML tag with Nokogiri
我正在嘗試獲取TD標簽中的所有文本,除了<strong>
標簽內的內容(可能有任意數量)。
在此示例中,我想獲取:“ graavis ● diakriitik (
)↝ " and "
急性口音`”:
<tr class="level2">
<td>
<strong> grave accent </strong>
<strong> (=backquote character) </strong>
graavis ● diakriitik (`) ↝
<a href="?word=sv82">acute accent</a>
</td>
</tr>
我正在嘗試使用下面的代碼,但是它不起作用:
desc = page.css('tr td:not(strong)').text
考慮:
page.search("strong").remove
page.css(".level2 > td").text.strip
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.