我们有两个集群,一个是旧的,一个是新的。他们都在 AWS - EMR 上。这些集群上的 Hive 指向 RDS 上的相同 Hive 元存储。我们正在从旧迁移到新。
现在的问题是,如果我停止旧集群,访问旧表会有任何问题吗?" 所有数据都在 S3 上。所有表都是外部的。但数据库仍然在 HDFS 上......就像
hdfs://old:1234/user/hive/warehouse/myfirst.db
如果我停止旧集群,这个位置是无效的,这使得 db 和表无效?尽管它们是外部的。
我真的不确定这是否会成为一个问题,但这是在生产中,所以我试图找出是否有人已经遇到过这个问题。
谢谢!