Ruby 1.8正则表达式：utf字符串中的匹配项索引

Question

我正在尝试搜索文本以找到匹配项，并在其周围添加摘要。 对于这一点，我要找到匹配的正则表达式，然后用切配建指标+字符串 - 片断半径（text.mb_chars [start..finish]）。

但是，我无法获取ruby（1.8）的正则表达式来返回匹配索引，该索引将是多字节感知的。

据我所知，正则表达式是在1.8一个地点的应该是UTF知道，但它似乎并不尽管/ u开关的工作：

"Résumé" =~ /s/u
=> 3

"Resume" =~ /s/u
=> 2

如果正则表达式确实在多字节（/ u）中工作，则结果应该相同，但它返回的是字节索引。

你如何获得字符，而不是字节匹配指数？

或者一些其他的办法让周围的片断（每个）的比赛？

Answer 1

这不是一个真正的答案，但是评论太久了。

编码

print "Résumé" =~ /s/u
print "\n"
print "Resume" =~ /s/u

在Windows（Ruby 1.8.6，版本26.）上打印：

2
2

在Linux（红宝石1.8.7（2009-06-12补丁程序级别174）[i486-linux]）上打印：

3
2

Answer 2

如何使用这个jindex功能我写的，这对应于其它方法jcode库：

class String
  def jslice *args
    split(//)[*args].join rescue ""
  end
  def jindex match, start=0
    if match.is_a? String
      match = Regexp.new(Regexp.escape(match))
    end
    if self.jslice(start..-1) =~ match
      $PREMATCH.jlength + start
    else
      nil
    end
  end
end

Ruby 1.8正则表达式：utf字符串中的匹配项索引

问题描述

2 个解决方案

解决方案1
0 2010-04-21 09:53:56

解决方案2
0 2011-02-08 17:05:41

Ruby 1.8正则表达式：utf字符串中的匹配项索引

问题描述

2 个解决方案

解决方案1 0 2010-04-21 09:53:56

解决方案2 0 2011-02-08 17:05:41

解决方案1
0 2010-04-21 09:53:56

解决方案2
0 2011-02-08 17:05:41