Scala 中的模式匹配是如何在字节码级别实现的?

它像一系列if (x instanceof Foo)构造,还是其他什么? 它的性能影响是什么?

例如,给定以下代码(来自Scala By Example第 46-48 页), eval方法的等效 Java 代码是什么样的?

abstract class Expr
case class Number(n: Int) extends Expr
case class Sum(e1: Expr, e2: Expr) extends Expr

def eval(e: Expr): Int = e match {
  case Number(x) => x
  case Sum(l, r) => eval(l) + eval(r)

PS 我可以阅读 Java 字节码,所以字节码表示对我来说已经足够了,但对于其他读者来说,了解它作为 Java 代码的样子可能会更好。

PPS Scala 编程这本书是否回答了这个问题以及关于 Scala 是如何实现的类似问题? 我已经订购了这本书,但还没有到。

可以使用反汇编器探索低级别,但简短的回答是它是一堆 if/else,其中谓词取决于模式

case Sum(l,r) // instance of check followed by fetching the two arguments and assigning to two variables l and r but see below about custom extractors 
case "hello" // equality check
case _ : Foo // instance of check
case x => // assignment to a fresh variable
case _ => // do nothing, this is the tail else on the if/else

你可以用像“case Foo(45, x)”这样的模式或模式和组合做更多的事情,但通常这些只是我刚刚描述的逻辑扩展。 模式也可以有守卫,这是对谓词的额外约束。 也有编译器可以优化模式匹配的情况,例如,当情况之间有一些重叠时,它可能会合并一些东西。 高级模式和优化是编译器中的一个活跃工作领域,因此如果字节码在当前和未来版本的 Scala 中比这些基本规则有显着改进,请不要感到惊讶。

除此之外,您可以编写自己的自定义提取器,以补充或代替 Scala 用于案例类的默认提取器。 如果这样做,那么模式匹配的成本就是提取器所做的任何事情的成本。 http://lamp.epfl.ch/~emir/written/MatchingObjectsWithPatterns-TR.pdf 中有一个很好的概述

詹姆斯(上)说得最好。 但是,如果您很好奇,查看反汇编的字节码总是一个很好的练习。 您还可以使用-print选项调用scalac ,该选项将在删除所有 Scala 特定功能的情况下打印您的程序。 它基本上是披着 Scala 外衣的 Java。 这是您提供的代码片段的相关scalac -print输出:

def eval(e: Expr): Int = {
  <synthetic> val temp10: Expr = e;
  if (temp10.$isInstanceOf[Number]())
    if (temp10.$isInstanceOf[Sum]())
        <synthetic> val temp13: Sum = temp10.$asInstanceOf[Sum]();
      throw new MatchError(temp10)

从 2.8 版开始,Scala 有了@switch注释。 目标是确保模式匹配将被编译到tableswitch 或 lookupswitch 中,而不是一系列条件if语句。

扩展@Zifre 的评论:如果您将来正在阅读本文,并且 Scala 编译器采用了新的编译策略,并且您想知道它们是什么,那么您可以通过以下方式了解它的作用。

将您的match代码复制粘贴到一个独立的示例文件中。 在该文件上运行scalac 然后运行javap -v -c theClassName$.class


object question {
  abstract class Expr
  case class Number(n: Int) extends Expr
  case class Sum(e1: Expr, e2: Expr) extends Expr

  def eval(e: Expr): Int = e match {
    case Number(x) => x
    case Sum(l, r) => eval(l) + eval(r)

然后我运行scalac question.scala ,它产生了一堆*.class文件。 稍微翻了一下,我在question$.class找到了 match 语句。 下面提供了javap -c -v question$.class输出。

由于我们正在寻找条件控制流构造,因此了解 java 字节码指令集表明寻找“if”应该是一个很好的起点。

在两个位置,我们在表单isinstanceof <something>; ifeq <somewhere>上找到了一对连续的行isinstanceof <something>; ifeq <somewhere> isinstanceof <something>; ifeq <somewhere> ,这意味着:如果最近计算的值不是something的实例,则转到somewhere ifeqjump if zeroisinstanceof给你一个零来表示假。)

如果您遵循控制流程,您会发现它与@Jorge Ortiz 给出的答案一致:我们这样做if (blah isinstanceof something) { ... } else if (blah isinstanceof somethingelse) { ... }

这是javap -c -v question$.class输出:

