0

我想确保此时数据存储在 HBase 表中。我不需要确切的行数。为此,我count 'table_name'在 HBase shell 中执行了两次命令:

hbase(main):001:0> count 'test_table', 100000
...
558549 row(s) in 360.1440 seconds

hbase(main):001:0> count 'test_table', 100000
...
558623 row(s) in 354.0270 seconds

但是当行数很大(> 200,000)时,时间太长了。

最有效的方法是什么?

4

1 回答 1

4

尝试使用缓存值更大的count命令,我认为默认是10

count 'test_table', CACHE => 1000

如果仍然太慢,您应该尝试使用 MapReduce Job

Run '$HADOOP_HOME/bin/hadoop jar hbase.jar rowcount'
于 2012-10-11T15:36:07.733 回答