0

使用 Scala 解析器组合库是否可以按行解析,而不是按字符解析?我希望我的自定义解析器有签名

(in: Reader[String]) => ParserResult[T]

这样 String in.first将是一行文本和in.rest - 剩余的行。

我假设我需要继承 Parsers并将Elem类型定义为String。然后实现Reader[String]将输入拆分为行。我想知道这是正确的方法吗?还有其他解决方案吗?

4

1 回答 1

0

以下代码执行此操作:

import scala.util.parsing.combinator.Parsers
import scala.util.parsing.input.{Position, Reader}

object Main {
  def main(args: Array[String]): Unit = CVParser("one\ntwo\nthree")
}

object CVParser {
  def apply(in: String): Any = impl.parse(in)

  private object impl extends Parsers {
    override type Elem = String

    def parse(in: String): ParseResult[String~String~String] = {
      val reader = new ByLineReader(in.split(System.lineSeparator).toList, 1)
      grammar(reader)
    }

    // private

    private val grammar = SampleParser ~ SampleParser ~ SampleParser

    private class ByLineReader(lines: List[String], lineNo: Int) extends Reader[String] {
      override def first: String = lines.headOption getOrElse ""
      override def rest: Reader[String] =
        if (!lines.isEmpty) new ByLineReader(lines.tail, lineNo + 1)
        else new ByLineReader(lines, lineNo)
      override def pos: Position = new Position {
        def line: Int = lineNo
        def column: Int = 0
        def lineContents: String = first
      }
      override def atEnd: Boolean = lines.size == 1
    }

    private object SampleParser extends Parser[String] {
      def apply(in: Input): ParseResult[String] = {
        println(in.first + "\n---------")
        Success(in.first, in.rest)
      }
    }
  }
}

输出:

one
---------
two
---------
three
---------

现在,可以使用通常的解析器组合器来编写和组合接受一行文本的新解析器,例如 ~、~>、<~、|、rep 等。

于 2013-10-14T16:14:53.507 回答