[英]How to find text on a page using Nokogiri
我正在嘗試找到使用Nokogiri在頁面上找到單詞的最佳方法。
我有一個包含以下文本的頁面。
<p>Modelo: ABC123-A</p>
我想找到“ Modelo:”文本,然后獲取其后的型號。
我環顧四周,但似乎找不到。 因此,我想我會在這里發布信息,看看有Nokogiri經驗的人是否可以為我提供一些啟示。
一個簡單的例子:
doc = Nokogiri::HTML('<html><body><p>Modelo: ABC123-A</p></body></html>')
doc.css('p').first.content # => Modelo: ABC123-A
str.split( ': ' )[-1] # => ABC123-A
您也可以嘗試鹿 ,它比引入nokogiri輕。
使用p:contains
選擇器並獲取匹配的p
節點。
doc = Nokogiri::HTML('<html><body><p>Modelo: ABC123-A</p><br/><p>Nothing here</p><p>Modelo: 4321</p></body></html>')
doc.css('p:contains("Modelo")').map { |x| x.text.split(': ').last }
#=> ["ABC123-A", "4321"]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.