scala - 使用 Scala 的 REPL 进行比较性能基准测试是否合理？

Question

Scala 的 REPL 是交互式测试某些代码的绝佳场所。最近，我一直在使用 REPL 进行一些性能比较，以重复执行操作并比较测量挂钟时间。

这是我最近创建的一个示例，用于帮助回答 SO 问题 [1][2]：

// Figure out the perfomance difference between direct method invocation and reflection-based method.invoke

def invoke1[T,U](obj:Any, method:Method)(param:T):U = method.invoke(obj,Seq(param.asInstanceOf[java.lang.Object]):_*) match { 
    case x: java.lang.Object if x==null => null.asInstanceOf[U]
    case x => x.asInstanceOf[U]
}

def time[T](b: => T):(T, Long) = {
    val t0 = System.nanoTime()
    val res = b
    val t = System.nanoTime() - t0
    (res,t )
}

class Test {
  def op(l:Long): Long = (2 until math.sqrt(l).toInt).filter(x=>l%x==0).sum
}

val t0 = new Test

val method = classOf[Test].getMethods.find(_.getName=="op").get

def timeDiff = {
  val (timeDirectCall,res) = time { (0 to 1000000).map(x=>t0.op(x)) }
  val (timeInvoke, res2) = time { (0 to 1000000).map(x=>{val res:Long=invoke1(t0,method)(x);res}) }
  (timeInvoke-timeDirectCall).toDouble/timeDirectCall.toDouble
}


//scala> timeDiff
//res60: Double = 2.1428745665357445
//scala> timeDiff
//res61: Double = 2.1604176409796683

在另一种情况下，我一直在生成随机数据点的 MM 来比较开源项目的并发模型。REPL 非常适合在没有代码编译测试周期的情况下使用不同的配置。

我知道常见的基准测试缺陷，例如 JIT 优化和热身需求。

我的问题是：

在使用它来执行宏观基准的比较微观时，是否有任何 REPL 特定元素需要考虑？
这些测量值在相对于彼此使用时是否可靠？即他们能回答这个问题：A比快B吗？
相同代码的初步执行是 jit 编译器的良好预热吗？
还有其他需要注意的问题吗？

[1] Scala 反射：如何将对象的方法作为参数传递给另一个方法

[2] https://gist.github.com/maasg/6808879

score 6 · Accepted Answer

这是一个很好的问题。我无法想象为什么有人反对它。

其中一条评论完全错误的事实表明 REPL 需要在 scala-lang.org 的常见问题解答或教程中占有一席之地。快速搜索后我找不到描述性文件。

答案是肯定的，REPL 符合您的期望。

这是一个关于为什么这个问题很有趣的旧页面：REPL 感觉是动态的，但实际上是静态编译的。正如链接页面上的临时评论所说，它“跨越两个世界”。

REPL 将每一行编译成它自己的包装对象。每个这样的对象都从交互式会话的历史中导入符号，这就是代码神奇地引用到前几行的方式。一切都是编译好的，所以当它运行时，它是在 JVM 上本地运行的，可以这么说；没有额外的解释器层。这是 REPL 的杀手级设计功能。

这就是为什么您的问题的答案是肯定的，您的代码以编译代码的速度运行。调用方法不需要重新编译所有历史记录。

这是另一个旧链接，显示其他人对时间和微基准测试有同样的问题。

当前有一个未解决的问题可以自定义 REPL 如何包装代码行。微基准测试是一个有趣的用例，其中代码可以包装在任意框架中进行基准测试。那很快就会到来。

基准框架应该负责热身。由于提交给 REPL 的每个表达式都是单独编译的（尽管由同一个编译器编译），您会注意到一个方法可以在第一次被冷调用而第二次被热调用（通过 scalac 进行模内联）。

警告：

使用-Yrepl-class-based或注意不要将计算放在包装对象的静态初始化程序中。

这是一些示例混淆，这里是相同的问题，不那么隐蔽。

scala - 使用 Scala 的 REPL 进行比较性能基准测试是否合理？

1 回答 1

Related

Reference