從Ruby中的字符串獲取多個子字符串

Question

我有

tmp_body_symbols="things <st>hello</st> and <st>blue</st> by <st>orange</st>"
str1_markerstring = "<st>"
str2_markerstring = "</st>"
frags << tmp_body_symbols[/#{str1_markerstring}(.*?)#{str2_markerstring}/m, 1]

碎片是“你好”，但我想要[“你好”，“藍色”，“橙色”]

我該怎么做？

Answer 1

使用scan ：

tmp_body_symbols.scan(/#{str1_markerstring}(.*?)#{str2_markerstring}/m).flatten

另請參閱： String#scan Ruby文檔。

Answer 2

您可以使用Nokogiri解析HTML / XML

require 'open-uri'
require 'nokogiri' 

doc = Nokogiri::HTML::Document.parse("things <st>hello</st> and <st>blue</st> by <st>orange</st>")
doc.css('st').map(&:text)
#=> ["hello", "blue", "orange"]

更多信息： http : //www.nokogiri.org/tutorials/parsing_an_html_xml_document.html

Answer 3

您可以像@Doorknob一樣使用捕獲組來執行此操作，也可以不使用捕獲組來執行此操作，方法是使用（“零寬度”）正向后看和正向先行：

tmp = "things <st>hello</st> and <st>blue</st> by <st>orange</st>"
s1 = "<st>"
s2 = "</st>"

tmp.scan(/(?<=#{ s1 }).*?(?=#{ s2 })/).flatten
  #=> ["hello", "blue", "orange"]

(?<=#{ s1 })值為(?<=<st>) ，是正向后看。
(?=#{ s2 })計算結果為(?=</st>) ，是正向后看。
? 后面的.*使其“非貪婪”。 沒有它：

tmp.scan(/(?<=#{ s1 }).*(?=#{ s2 })/).flatten
  #=> ["hello</st> and <st>blue</st> by <st>orange"]

從Ruby中的字符串獲取多個子字符串

問題描述

3 個解決方案

解決方案1
3 已采納 2015-01-28 03:25:35

解決方案2
2 2015-01-28 05:33:55

解決方案3
0 2015-01-28 04:09:17

從Ruby中的字符串獲取多個子字符串

問題描述

3 個解決方案

解決方案1 3 已采納 2015-01-28 03:25:35

解決方案2 2 2015-01-28 05:33:55

解決方案3 0 2015-01-28 04:09:17

解決方案1
3 已采納 2015-01-28 03:25:35

解決方案2
2 2015-01-28 05:33:55

解決方案3
0 2015-01-28 04:09:17