[英]How to parse only part of a string-value from an element using Nokogiri? RUBY, Mechanize
如何從字符串中提取數字? 如果xpath是'td [5] p / @ title'
HTML:
<td valign="top" align="center">
<p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">
<b>10</b>
</p>
</td>
我需要從標題屬性字符串值“ 6 en su sucusal”中僅提取數字6
在html
內添加一些HTML,您將執行以下操作:
doc = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^\d]/, '') }
然后,您將在numbers
數組中擁有numbers
。 當然,您必須調整XPath和正則表達式以匹配您的真實數據,但是基本技術應該很清楚。
花費一些時間來制作Nokogiri文檔和教程可能會碩果累累。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.