2 spark应用程序是否会导致任何一致性
我有 2 个火花应用程序。一种是通过 Hive Metastore 写入数据,如下所示:
df.write
.option("path", "adl:///test-data/hive_tables")
.mode(SaveMode.Append)
.format("json")
.partitionBy("col1")
.saveAsTable("sample")
而其他人正在从同一张表中读取数据,如下所示:
spark.read.table("sample")
如果两个作业并行运行,是否存在第二个应用程序读取的数据不一致的可能性?如果是这样,我该如何避免它