1

我想实现以下目标:

  1. 有一个我需要处理的字符串列表。
  2. 这些处理器有几种不同的类型,每一种都知道要读取字符串的哪一部分。
  3. 我需要分两个阶段工作:首先,处理器需要查看每个输入字符串以构建特定于处理器的数据;其次,每个输入字符串由每个处理器处理,并将生成的字符串合并为一个。

以可变的方式很容易做到:所有处理器都有一个通用的基类,它们聚合的不同类型的数据被封装在具体的实现中;该界面仅包含 2 个功能——“查看输入字符串并构建内部数据”和“使用您的内部数据处理输入字符串”。

当我在 Scala 中编写它时,我想知道是否存在纯函数方法。问题是现在这些处理器的基本特征是由它们的内部数据类型参数化的,而且似乎没有办法列出不同类型的处理器。

这个问题可以用一个更简单的例子来证明:假设我坚持使用可变方法,但由于某种原因已经参数化了处理器从字符串中获取的类型:

trait F[V] {
  def get(line: String) : V
  def aggregate(value: V)
  def process(value: V) : String
}

class F1 extends F[Int] // ...
class F2 extends F[HashMap[Int, Int]] // ...

for (s <- List("string1", "string2"); 
  f <- List(new F1(), new F2()) 
{
  f.aggregate(f.get(s)); // Whoops --- doesn't work   
}

它不起作用,因为f.get(s)返回Any。看起来我需要在 Scala 的类型系统中表达,List(new F1(), new F2())其中包含F[?]不同但一致的内容,因为如果我采用该列表的一个元素,它的类型参数有一些具体值,并且f.get(s)属于那种类型,应该被f.aggregate().

最后,我想要这样的东西(有遗漏,因为我不知道该怎么做):

trait F[D] {
  def initData : D
  def aggregate(line: String, data: D) : D
  def process(line: String, data: D) : String
}

class F1 extends F[Int] // ...
class F2 extends F[HashMap[Int, Int]] // ...

// Phase 1
// datas --- List of f.initData, how to?
for (s <- List("string1", "string2")) {
  for (f <- List(new F1(), new F2()) {
    // let fdata be f's data
    // update fdata with f.aggregate(s, fdata)
  }
}

// Phase 2
for (s <- List("string1", "string2")) {
  for (f <- List(new F1(), new F2()) {
    // let fdata be f's data
    // for all fs, concatenate f.process(s, fdata) into an output string
  }
}

问题:

  1. 这个任务可以在 Scala 中以纯函数方式解决吗?
  2. 这个任务可以用其他函数式语言解决吗?
  3. 这种情况看起来很一般。有它的名字我可以搜索吗?
  4. 假设几乎没有类型理论和函数式编程语言的背景,最好的阅读地点在哪里?
4

2 回答 2

1

此外,您可以使用抽象类型而不是泛型,因此:

trait F {
  type D
  def initData: D
  def aggregate(line: String, data: D): D
  def process(line: String, data: D): String
}

class F1 extends F { type D = Int } // ...
class F2 extends F { type D = Map[Int, Int] } // ...

val strings = List("string1", "string2")
for (f <- List(new F1(), new F2())) {
  val d = strings.foldLeft(f.initData) { (d, s) => f.aggregate(s, d) }

  for (s <- strings)
    f.process(s, d)
}

不确定,如果我没有恢复正确的操作顺序,但这可能是一个起点。

于 2013-02-25T22:23:13.980 回答
0

编辑刚刚注意到,我以前的解决方案过于冗长,不需要任何临时数据结构。

我不确定,您所说的“纯功能”是什么意思。println以下解决方案(如果它是您的问题的解决方案)是“纯粹的功能性”,因为它除了最终调用之外没有任何副作用main

请注意,这List[F[_]](...)很重要,否则编译器将为列表的元素推断出一个非常具体的内部类型,这与aggregateAndProcess函数不匹配。

trait F[D] {

    type Data = D  // Abbreviation for easier copy+paste below. Does not
                       // contribute to the actual solution otherwise

    def initData: Data
    def aggregate(line: String, data: Data) : Data
    def process(line: String, aggData: Data): String
}

class F1 extends F[Int] {
    def initData: Data = 1
    def aggregate(line: String, data: Data) : Data = data + 1
    def process(line: String, aggData: Data): String = line + "/F1" + aggData
}

class F2 extends F[Boolean] {
    def initData: Data = false
    def aggregate(line: String, data: Data) : Data = !data
    def process(line: String, aggData: Data): String = line + "/F2" + aggData
}

object Main {

    private def aggregateAndProcess[T](line: String, processor: F[T]): String =
        processor.process(line, processor.aggregate(line, processor.initData))

    def main(args: Array[String]) {

        val r = for {
            s <- List("a", "b")
            d <- List[F[_]](new F1, new F2)
        } yield
            aggregateAndProcess(s, d)

        println(r.toList)
    }
}

但请注意,我仍然不确定您真正想要完成什么。接口并没有真正指定哪些信息在F什么时间从哪个方法流到任何位置,所以:这仍然是最好的猜测。

于 2013-02-25T21:22:14.230 回答