如何使用Nokogiri在頁面上查找文本

Question

我正在嘗試找到使用Nokogiri在頁面上找到單詞的最佳方法。

我有一個包含以下文本的頁面。

<p>Modelo: ABC123-A</p>

我想找到“ Modelo：”文本，然后獲取其后的型號。

我環顧四周，但似乎找不到。 因此，我想我會在這里發布信息，看看有Nokogiri經驗的人是否可以為我提供一些啟示。

Answer 1

一個簡單的例子：

doc = Nokogiri::HTML('<html><body><p>Modelo: ABC123-A</p></body></html>')
doc.css('p').first.content  # => Modelo: ABC123-A
str.split( ': ' )[-1]  # => ABC123-A

您也可以嘗試鹿，它比引入nokogiri輕。

Answer 2

使用p:contains選擇器並獲取匹配的p節點。

doc = Nokogiri::HTML('<html><body><p>Modelo: ABC123-A</p><br/><p>Nothing here</p><p>Modelo: 4321</p></body></html>')
doc.css('p:contains("Modelo")').map { |x| x.text.split(': ').last }
#=> ["ABC123-A", "4321"]

如何使用Nokogiri在頁面上查找文本

問題描述

2 個解決方案

解決方案1
1 2018-06-10 18:20:38

解決方案2
1 已采納 2018-06-10 19:20:11

如何使用Nokogiri在頁面上查找文本

問題描述

2 個解決方案

解決方案1 1 2018-06-10 18:20:38

解決方案2 1 已采納 2018-06-10 19:20:11

解決方案1
1 2018-06-10 18:20:38

解決方案2
1 已采納 2018-06-10 19:20:11