我在本地机器和集群中运行 spark 代码。
我使用以下代码为本地机器创建 SparkContext 对象:
val sc = new SparkContext("local[*]", "Trial")
我使用以下代码为集群创建 SparkContext 对象:
val spark = SparkSession.builder.appName(args(0)+" "+args(1)).getOrCreate()
val sc = spark.sparkContext
我使用以下代码将本地机器和集群的分区数设置为 4
val dataset = sc.textFile("Dataset.txt", 4)
在我的集群中,我创建了 5 个工人。其中之一是驱动节点,其余的作为工作节点运行。
我希望结果应该是一样的。但是,本地和集群两部分的结果是不同的。问题的原因是什么?