-1

我想使用 YCSB 对 HBase 进行基准测试。这是我第一次使用。

我已经浏览了一些在线教程,现在我需要创建一个大小为 5 GB 的示例表。但我不知道如何:

  1. 将一堆数据批量放入一个表中
  2. 将大小控制在 5 GB 左右

谁能给我一些帮助?

4

2 回答 2

1

这很简单,默认(核心)工作负载使用每个约 1KB 的字符串。所以要获得 5GB,只需使用 5,000,000 条记录。

您可以通过recordcount在命令行中指定参数来执行此操作,或者在内部使用此参数创建您自己的工作负载文件。

以下是在命令行上执行此操作的方法(使用包含的工作负载workloada):

./bin/ycsb load hbase12 -P workloads/workloada -p recordcount=5000000

自定义文件如下所示:

recordcount=5000000
operationcount=1000000
workload=com.yahoo.ycsb.workloads.CoreWorkload

readproportion=0.8
updateproportion=0.2
scanproportion=0
insertproportion=0

然后你只需运行:

./bin/ycsb load hbase12 -P myWorkload

这会将所有数据插入到您的数据库中。

于 2018-05-15T21:27:40.710 回答
1

之前,我使用 HBase 性能评估工具将数据加载到 HBase 中。也许它可以帮助你。

hbase org.apache.hadoop.hbase.PerformanceEvaluation

此工具有多种选择。对于您的情况,您可以将数据大小设置为 5GB。

于 2018-01-17T08:55:46.067 回答