apache-spark - 2 spark应用程序是否会导致任何一致性

问问题 2019-07-09T10:46:46.990

22 次

2 spark应用程序是否会导致任何一致性

我有 2 个火花应用程序。一种是通过 Hive Metastore 写入数据，如下所示：

df.write
  .option("path", "adl:///test-data/hive_tables")
  .mode(SaveMode.Append)
  .format("json")
  .partitionBy("col1")
  .saveAsTable("sample")

而其他人正在从同一张表中读取数据，如下所示：

spark.read.table("sample")

如果两个作业并行运行，是否存在第二个应用程序读取的数据不一致的可能性？如果是这样，我该如何避免它

0 回答 0