当从 Java 代码中使用从 Scala 代码生成的字节码时,我刚刚发现了 Scala 范围界定的一个非常奇怪的行为。考虑使用 Spark(Spark 1.4、Hadoop 2.6)的以下代码段:
import java.util.Arrays;
import java.util.List;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.broadcast.Broadcast;
public class Test {
public static void main(String[] args) {
JavaSparkContext sc =
new JavaSparkContext(new SparkConf()
.setMaster("local[*]")
.setAppName("test"));
Broadcast<List<Integer>> broadcast = sc.broadcast(Arrays.asList(1, 2, 3));
broadcast.destroy(true);
// fails with java.io.IOException: org.apache.spark.SparkException:
// Attempted to use Broadcast(0) after it was destroyed
sc.parallelize(Arrays.asList("task1", "task2"), 2)
.foreach(x -> System.out.println(broadcast.getValue()));
}
}
这段代码失败了,这是预料之中的,因为我Broadcast
在使用它之前自愿销毁了它,但问题是在我的心智模型中它甚至不应该编译,更不用说运行良好了。
事实上,Broadcast.destroy(Boolean)
被声明为private[spark]
它不应该在我的代码中可见。我会尝试查看字节码,Broadcast
但这不是我的专长,这就是我更喜欢发布这个问题的原因。另外,抱歉我懒得创建一个不依赖于 Spark 的示例,但至少你明白了。请注意,我可以使用 Spark 的各种包私有方法,而不仅仅是Broadcast
.
知道发生了什么吗?