使用正则表达式的Scala捕获组

Question

假设我有这段代码：

val string = "one493two483three"
val pattern = """two(\d+)three""".r
pattern.findAllIn(string).foreach(println)

我希望findAllIn只返回483 ，但相反，它返回了two483three 。 我知道我可以使用unapply只提取那部分，但我必须有一个整个字符串的模式，如：

 val pattern = """one.*two(\d+)three""".r
 val pattern(aMatch) = string
 println(aMatch) // prints 483

有没有另一种方法来实现这一点，而不直接使用java.util的类，而不使用unapply？

Answer 1

以下是如何访问每个匹配的group(1)的示例：

val string = "one493two483three"
val pattern = """two(\d+)three""".r
pattern.findAllIn(string).matchData foreach {
   m => println(m.group(1))
}

这打印"483" （如ideone.com上所示）。

环视选项

根据模式的复杂程度，您还可以使用外观仅匹配所需的部分。 它看起来像这样：

val string = "one493two483three"
val pattern = """(?<=two)\d+(?=three)""".r
pattern.findAllIn(string).foreach(println)

以上还打印"483" （如ideone.com上所示）。

参考

regular-expressions.info/Lookarounds

Answer 2

val string = "one493two483three"
val pattern = """.*two(\d+)three.*""".r

string match {
  case pattern(a483) => println(a483) //matched group(1) assigned to variable a483
  case _ => // no match
}

Answer 3

你想看看group(1) ，你当前正在查看group(0) ，这是“整个匹配的字符串”。

请参阅此正则表达式教程。

Answer 4

def extractFileNameFromHttpFilePathExpression(expr: String) = {
//define regex
val regex = "http4.*\\/(\\w+.(xlsx|xls|zip))$".r
// findFirstMatchIn/findAllMatchIn returns Option[Match] and Match has methods to access capture groups.
regex.findFirstMatchIn(expr) match {
  case Some(i) => i.group(1)
  case None => "regex_error"
}
}
extractFileNameFromHttpFilePathExpression(
    "http4://testing.bbmkl.com/document/sth1234.zip")

Answer 5

启动Scala 2.13 ，作为正则表达式解决方案的替代方案，也可以通过取消应用字符串插补器来模式匹配String ：

"one493two483three" match { case s"${x}two${y}three" => y }
// String = "483"

甚至：

val s"${x}two${y}three" = "one493two483three"
// x: String = one493
// y: String = 483

如果您希望不匹配输入，可以添加默认模式保护：

"one493deux483three" match {
  case s"${x}two${y}three" => y
  case _                   => "no match"
}
// String = "no match"

使用正则表达式的Scala捕获组

问题描述

5 个解决方案

解决方案1
92 已采纳 2010-06-16 06:51:17

环视选项

参考

解决方案2
29 2015-11-23 09:13:21

解决方案3
14 2010-06-16 05:41:42

解决方案4
1 2018-07-13 09:51:05

解决方案5
1 2019-06-26 21:22:59

使用正则表达式的Scala捕获组

问题描述

5 个解决方案

解决方案1 92 已采纳 2010-06-16 06:51:17

环视选项

参考

解决方案2 29 2015-11-23 09:13:21

解决方案3 14 2010-06-16 05:41:42

解决方案4 1 2018-07-13 09:51:05

解决方案5 1 2019-06-26 21:22:59

解决方案1
92 已采纳 2010-06-16 06:51:17

解决方案2
29 2015-11-23 09:13:21

解决方案3
14 2010-06-16 05:41:42

解决方案4
1 2018-07-13 09:51:05

解决方案5
1 2019-06-26 21:22:59