簡體   English   中英

如何使用Nokogiri解析元素中的一部分字符串值? 紅寶石,機械化

[英]How to parse only part of a string-value from an element using Nokogiri? RUBY, Mechanize

如何從字符串中提取數字? 如果xpath是'td [5] p / @ title'

HTML:

<td valign="top" align="center">
  <p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">   
   <b>10</b>
  </p>
</td>

我需要從標題屬性字符串值“ 6 en su sucusal”中僅提取數字6

html內添加一些HTML,您將執行以下操作:

doc     = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^\d]/, '') }

然后,您將在numbers數組中擁有numbers 當然,您必須調整XPath和正則表達式以匹配您的真實數據,但是基本技術應該很清楚。

花費一些時間來制作Nokogiri文檔和教程可能會碩果累累。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM