29

是否可以在 Scala 中专门化泛型函数(或类)?例如,我想编写一个将数据写入 ByteBuffer 的通用函数:

def writeData[T](buffer: ByteBuffer, data: T) = buffer.put(data)

但是由于 put 方法只需要一个字节并将其放入缓冲区,因此我需要将其专门用于 Ints 和 Longs,如下所示:

def writeData[Int](buffer: ByteBuffer, data: Int) = buffer.putInt(data)
def writeData[Long](buffer: ByteBuffer, data: Long) = buffer.putLong(data)

它不会编译。当然,我可以分别编写 3 个不同的函数 writeByte、writeInt 和 writeLong,但假设数组还有另一个函数:

def writeArray[T](buffer: ByteBuffer, array: Array[T]) {
  for (elem <- array) writeData(buffer, elem)
}

如果没有专门的 writeData 函数,这将无法工作:我将不得不部署另一组函数 writeByteArray、writeIntArray、writeLongArray。每当我需要使用依赖于类型的写入函数时,必须以这种方式处理这种情况并不酷。我做了一些研究,一种可能的解决方法是测试参数的类型:

def writeArray[T](buffer: ByteBuffer, array: Array[T]) {
  if (array.isInstanceOf[Array[Byte]])
    for (elem <- array) writeByte(buffer, elem)
  else if (array.isInstanceOf[Array[Int]])
    for (elem <- array) writeInt(buffer, elem)
  ...
}

这可能有效,但效率较低,因为类型检查是在运行时完成的,这与专用函数版本不同。

所以我的问题是,在 Scala 或 Java 中解决此类问题的最理想和首选的方法是什么?我提前感谢您的帮助!

4

4 回答 4

22

如果您可以同时拥有紧凑且高效的解决方案,那不是很好吗?事实证明,鉴于 Scala 的@specialized特性,您可以。首先是一个警告:该功能有些错误,如果您尝试将其用于过于复杂的事情,可能会损坏。但对于这种情况,它几乎是完美的。

注释为每个原始类型创建单独的@specialized类和/或方法,然后在编译器确定原始类型是什么时调用它而不是泛型版本。唯一的缺点是它完全自动完成所有这些工作——您无法填写自己的方法。这有点可惜,但是您可以使用类型类来克服这个问题。

让我们看一些代码:

import java.nio.ByteBuffer
trait BufferWriter[@specialized(Byte,Int) A]{
  def write(b: ByteBuffer, a: A): Unit
}
class ByteWriter extends BufferWriter[Byte] {
  def write(b: ByteBuffer, a: Byte) { b.put(a) }
}
class IntWriter extends BufferWriter[Int] {
  def write(b: ByteBuffer, a: Int) { b.putInt(a) }
}
object BufferWriters {
  implicit val byteWriter = new ByteWriter
  implicit val intWriter = new IntWriter
}

这给了我们一个BufferWriter通用的特征,但是我们用适当的实现覆盖了我们想要的每个特定的原始类型(在本例中为Byte和)。Int专业化足够聪明,可以将这个显式版本与它通常用于专业化的隐藏版本联系起来。所以你有你的自定义代码,但你如何使用它?这就是隐式 vals 的用武之地(为了速度和清晰度,我已经这样做了):

import BufferWriters._
def write[@specialized(Byte,Int) A: BufferWriter](b: ByteBuffer, ar: Array[A]) {
  val writer = implicitly[BufferWriter[A]]
  var i = 0
  while (i < ar.length) {
    writer.write(b, ar(i))
    i += 1
  }
}

A: BufferWriter符号意味着为了调用此write方法,您需要有一个隐式的BufferWriter[A]方便。我们已经为他们提供了 vals BufferWriters,所以我们应该做好准备。让我们看看这是否有效。

val b = ByteBuffer.allocate(6)
write(b, Array[Byte](1,2))
write(b, Array[Int](0x03040506))
scala> b.array
res3: Array[Byte] = Array(1, 2, 3, 4, 5, 6)

如果您将这些东西放在一个文件中并开始在类中查找,javap -c -private您会发现正在使用适当的原始方法。

(请注意,如果您不使用专门化,此策略仍然有效,但它必须在循环内将值装箱以将数组复制出来。)

于 2012-11-01T13:24:38.230 回答
16

使用类型类模式。与 instanceOf 检查(或模式匹配)相比,它具有类型安全的优势。

import java.nio.ByteBuffer

trait BufferWriter[A] {
  def write(buffer: ByteBuffer, a: A)
}

class BuffPimp(buffer: ByteBuffer) {
  def writeData[A: BufferWriter](data: A) = { 
    implicitly[BufferWriter[A]].write(buffer, data)
  }
}

object BuffPimp {
  implicit def intWriter = new BufferWriter[Int] {
    def write(buffer: ByteBuffer, a: Int) = buffer.putInt(a)
  }
  implicit def doubleWriter = new BufferWriter[Double] {
    def write(buffer: ByteBuffer, a: Double) = buffer.putDouble(a)
  }
  implicit def longWriter = new BufferWriter[Long] {
    def write(buffer: ByteBuffer, a: Long) = buffer.putLong(a)
  }
  implicit def wrap(buffer: ByteBuffer) = new BuffPimp(buffer)
}

object Test {
  import BuffPimp._
  val someByteBuffer: ByteBuffer
  someByteBuffer.writeData(1)
  someByteBuffer.writeData(1.0)
  someByteBuffer.writeData(1L)
}

所以这段代码并不是类型类的最佳演示。我对他们还是很陌生。该视频对它们的好处以及如何使用它们进行了非常全面的概述:http ://www.youtube.com/watch?v=sVMES4RZF-8

于 2012-11-01T09:01:35.450 回答
3
  1. 声明

    def writeData[Int](buffer: ByteBuffer, data: Int) 
    def writeData[Long](buffer: ByteBuffer, data: Long)
    

不要编译,因为它们是等价的,因为 Int 和 Long 是formal类型参数,而不是标准的 Scala 类型。要使用标准 Scala 类型定义函数,只需编写:

def writeData(buffer: ByteBuffer, data: Int) = buffer.putInt(data)
def writeData(buffer: ByteBuffer, data: Long) = buffer.putLong(data)

这样,您可以使用相同的名称声明不同的函数。

  1. 由于它们是不同的函数,因此您不能将它们应用于静态未知类型的 List 的元素。您必须首先确定列表的类型。请注意,List 的类型可能是 AnyRef,然后您可以动态确定每个元素的类型。可以按照isInstanceOf您的原始代码或按照rolve建议使用模式匹配来完成确定。我认为这会产生相同的字节码。

  2. 总之,您必须选择:

    • 具有多个功能的快速代码等writeByteArray, writeIntArray。它们都可以具有相同的名称writeArray,但可以通过它们的实际参数进行静态区分。Dominic Bou-Sa 提出的变体就是这种类型。

    • 具有运行时类型确定的简洁但缓慢的代码

不幸的是,你不能同时拥有快速和简洁的代码。

于 2012-11-01T09:53:05.170 回答
2

这个怎么样:

def writeData(buffer: ByteBuffer, data: AnyVal) {
  data match {
    case d: Byte => buffer put d
    case d: Int  => buffer putInt d
    case d: Long => buffer putLong d
    ...
  }
}

在这里,您在方法中区分大小写writeData,这使得所有其他方法都非常简单:

def writeArray(buffer: ByteBuffer, array: Array[AnyVal]) {
  for (elem <- array) writeData(buffer, elem)
}

优点:简单、简短、易懂。

缺点:如果您不处理所有AnyVal类型,则不是完全类型安全的:有人可能会调用writeData(buffer, ())(第二个参数是 type Unit),这可能会导致运行时出错。但是您也可以进行()无操作处理,从而解决问题。完整的方法如下所示:

def writeData(buffer: ByteBuffer, data: AnyVal) {
  data match {
    case d: Byte   => buffer put d
    case d: Short  => buffer putShort d
    case d: Int    => buffer putInt d
    case d: Long   => buffer putLong d
    case d: Float  => buffer putFloat d
    case d: Double => buffer putDouble d
    case d: Char   => buffer putChar d
    case true      => buffer put 1.asInstanceOf[Byte]
    case false     => buffer put 0.asInstanceOf[Byte]
    case ()        =>
  }
}

顺便说一句,由于 Scala 严格的面向对象的性质,这很容易实现。在 Java 中,原始类型不是对象,这会更加麻烦。在那里,您实际上必须为每个原始类型创建一个单独的方法,除非您想做一些丑陋的装箱和拆箱。

于 2012-11-01T08:57:46.593 回答