1

2 spark应用程序是否会导致任何一致性

我有 2 个火花应用程序。一种是通过 Hive Metastore 写入数据,如下所示:

df.write
  .option("path", "adl:///test-data/hive_tables")
  .mode(SaveMode.Append)
  .format("json")
  .partitionBy("col1")
  .saveAsTable("sample")

而其他人正在从同一张表中读取数据,如下所示:

spark.read.table("sample")

如果两个作业并行运行,是否存在第二个应用程序读取的数据不一致的可能性?如果是这样,我该如何避免它

4

0 回答 0