我正在尝试通过使用 Alluxio 来减少 Spark 用于读取和写入数据的时间。
但是我发现我必须指定读取数据的路径。
我发现可以使用 Hive 的 metatool 将 Hive 的仓库从 HDFS 改为 Alluxio,这样我就可以通过 Spark sql 向 Alluxio 写入数据。但是我不知道如何通过sql读取Alluxio的数据。
有没有办法像 Hive 一样读/写 Alluxio 的数据?也许读取 Alluxio 的元数据并将其添加到 Metastore?
我正在尝试通过使用 Alluxio 来减少 Spark 用于读取和写入数据的时间。
但是我发现我必须指定读取数据的路径。
我发现可以使用 Hive 的 metatool 将 Hive 的仓库从 HDFS 改为 Alluxio,这样我就可以通过 Spark sql 向 Alluxio 写入数据。但是我不知道如何通过sql读取Alluxio的数据。
有没有办法像 Hive 一样读/写 Alluxio 的数据?也许读取 Alluxio 的元数据并将其添加到 Metastore?