如何使用Nokogiri解析元素中的一部分字符串值？紅寶石，機械化

Question

如何從字符串中提取數字？ 如果xpath是'td [5] p / @ title'

HTML：

<td valign="top" align="center">
  <p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">   
   <b>10</b>
  </p>
</td>

我需要從標題屬性字符串值“ 6 en su sucusal”中僅提取數字6

Answer 1

在html內添加一些HTML，您將執行以下操作：

doc     = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^\d]/, '') }

然后，您將在numbers數組中擁有numbers 。 當然，您必須調整XPath和正則表達式以匹配您的真實數據，但是基本技術應該很清楚。

花費一些時間來制作Nokogiri文檔和教程可能會碩果累累。

如何使用Nokogiri解析元素中的一部分字符串值？ 紅寶石，機械化