我想一次对 1000 多个表进行 Hive 元数据和 Hive 数据的月度/季度备份,并且具有轻松的恢复能力。到目前为止,我找到了以下选项,但不确定哪个最适合在生产中备份 Hive 表。有小费吗 ?
- Pro:在 Ambari 中作为服务轻松提供以进行安装
- 缺点:没有社区支持
- Hortonworks 数据流 - https://docs.hortonworks.com.s3.amazonaws.com/HDPDocuments/Ambari-2.7.4.0/bk_ambari-upgrade-major/content/prepare_hive_for_upgrade.html
- 临:最新
- 缺点:没有太多要测试的文档。请分享有关如何使用 Hortonworks 数据流进行备份的任何资源
- 其他方式 - 使用 Distcp、导出/导入、快照和使用关系数据库转储的 Hive 元数据备份的 Hive 数据备份
- 缺点:不确定 Hive 数据和 Hive 元数据是否同时备份。花费时间实施每月/每季度的调度程序。