我有一个用例,需要大约 200 个蜂巢式镶木地板。我需要从平面文本文件中加载这些镶木地板表。但是我们不能直接从平面文本文件中加载拼花表。所以我使用以下方法
- 创建了一个临时托管文本表。
- 加载带有文本数据的临时表。
- 创建外部镶木地板表。
- 使用选择查询加载带有文本表的镶木地板表。
- 删除临时文本表的文本文件(但将表保留在元存储中)。
由于这种方法将临时元数据(用于 200 个表)保存在元存储中。所以我有第二种方法是我也会删除临时文本表以及来自 hdfs 的文本文件。下次重新创建临时表并在创建镶木地板后删除。
现在,由于我需要每 2 小时对所有 200 个表执行上述步骤,所以从 Metastore 创建和删除表会影响生产期间集群中的任何内容吗?
哪种方法会影响生产,将临时元数据保存在元存储中,从 hive 元存储中创建和删除表(元数据)?