hadoop - 此时确保 HBase 表中的行数增加的最有效方法是什么？

Question

我想确保此时数据存储在 HBase 表中。我不需要确切的行数。为此，我count 'table_name'在 HBase shell 中执行了两次命令：

hbase(main):001:0> count 'test_table', 100000
...
558549 row(s) in 360.1440 seconds

hbase(main):001:0> count 'test_table', 100000
...
558623 row(s) in 354.0270 seconds

但是当行数很大（> 200,000）时，时间太长了。

最有效的方法是什么？

score 4 · Accepted Answer

尝试使用缓存值更大的count命令，我认为默认是10

count 'test_table', CACHE => 1000

如果仍然太慢，您应该尝试使用 MapReduce Job

Run '$HADOOP_HOME/bin/hadoop jar hbase.jar rowcount'

hadoop - 此时确保 HBase 表中的行数增加的最有效方法是什么？

1 回答 1

Related

Reference