我们计划从 CDH3 迁移到 CDH4,作为此迁移的一部分,我们还计划将 HBASE 引入系统,因为它也会更新数据,在 CDH3 中,我们使用 Hive 作为仓库。
这里我们遇到了迁移的主要问题,Hive 支持对表的分区。我们的系统有许多不同模式的表,有些表有基于日期的分区,我们有过去 5 年的数据历史记录(某些表中存在 365 * 5 个分区)。
我们也想在 HBase 中实现相同的行为,当我浏览时我找不到在 HBase 中创建分区的解决方案。任何人都可以帮助我在 HBase 中实现这个分区明智的表创建。
我们选择 HBASE 的原因是,它支持更新。
如果 HBASE 不支持这一点,那么其他(如 MangoDB、Cassandra)支持我们的行为。
如果我们也能找到至少一些解决方案,那真的很有帮助。