2

迭代文本文件的字符时出现一些不一致的行为。

以下脚本

import io.Source
val source = Source.fromFile("blah")
val iter = source.buffered
iter.dropWhile(_.isWhitespace)
for( c <- iter ) {
    println("""char="%c", byte=%d, isWhitespace=%b""".format(c, c.toByte, c.isWhitespace))
}
source.close()

读取以下文件(以 3 个空格开头,然后是 'a' 和第二行文本)

   a
bc de

输出以下内容

char=" ", byte=32, isWhitespace=true
char=" ", byte=32, isWhitespace=true
char=" ", byte=32, isWhitespace=true
char="a", byte=97, isWhitespace=false
char="
", byte=10, isWhitespace=true
char="b", byte=98, isWhitespace=false
char="c", byte=99, isWhitespace=false
char=" ", byte=32, isWhitespace=true
char="d", byte=100, isWhitespace=false
char="e", byte=101, isWhitespace=false
char="
", byte=10, isWhitespace=true

dropWhile(_.isWhitespace)没有删除 3 个空格,但在c.isWhitespace之后立即在 for 循环中迭代时返回 true。

有人可以为我解释一下吗?我已经在十六进制编辑器中打开了文本文件,对我来说它看起来不错(纯 ascii,没有 UTF 的东西)。

编辑:在 Ubuntu 上使用 Scala 2.9.2

EDIT2:现在我很困惑。以下来自 Windows 7 上的 REPL:

c:\projects\scratch>scala
Welcome to Scala version 2.10.2 (Java HotSpot(TM) 64-Bit Server VM, Java 1.7.0_21).
Type in expressions to have them evaluated.
Type :help for more information.

scala> val it = Iterator("a", "b", "cde", "f")
it: Iterator[String] = non-empty iterator

scala> val it2 = it.dropWhile(_.length < 2)
it2: Iterator[String] = non-empty iterator

scala> println(it.next)
cde

scala> println(it2.next)
f

将这段确切的代码作为脚本运行会产生原始问题的行为(迭代器不被 修改dropWhile)。

4

1 回答 1

2

在 scala 中,val 是不可变的对象。一旦设置了 val,就无法更改。当您调用 时iter.dropWhile(_.isWhitespace),会创建一个新对象,但不会存储在任何地方。如果你想删除空格,你应该分配iter.dropWhile(_.isWhitespace)一个新的 val 并在 for 表达式中调用这个新的 val。

于 2013-10-06T15:42:12.300 回答