0

我想一次对 1000 多个表进行 Hive 元数据和 Hive 数据的月度/季度备份,并且具有轻松的恢复能力。到目前为止,我找到了以下选项,但不确定哪个最适合在生产中备份 Hive 表。有小费吗 ?

  1. 阿帕奇猎鹰 - http://saptak.in/writing/2015/08/11/mirroring-datasets-hadoop-clusters-apache-falcon
  • Pro:在 Ambari 中作为服务轻松提供以进行安装
  • 缺点:没有社区支持
  1. Hortonworks 数据流 - https://docs.hortonworks.com.s3.amazonaws.com/HDPDocuments/Ambari-2.7.4.0/bk_ambari-upgrade-major/content/prepare_hive_for_upgrade.html
  • 临:最新
  • 缺点:没有太多要测试的文档。请分享有关如何使用 Hortonworks 数据流进行备份的任何资源
  1. 其他方式 - 使用 Distcp、导出/导入、快照和使用关系数据库转储的 Hive 元数据备份的 Hive 数据备份
  • 缺点:不确定 Hive 数据和 Hive 元数据是否同时备份。花费时间实施每月/每季度的调度程序。
4

0 回答 0