我想使用 YCSB 对 HBase 进行基准测试。这是我第一次使用。
我已经浏览了一些在线教程,现在我需要创建一个大小为 5 GB 的示例表。但我不知道如何:
- 将一堆数据批量放入一个表中
- 将大小控制在 5 GB 左右
谁能给我一些帮助?
这很简单,默认(核心)工作负载使用每个约 1KB 的字符串。所以要获得 5GB,只需使用 5,000,000 条记录。
您可以通过recordcount
在命令行中指定参数来执行此操作,或者在内部使用此参数创建您自己的工作负载文件。
以下是在命令行上执行此操作的方法(使用包含的工作负载workloada
):
./bin/ycsb load hbase12 -P workloads/workloada -p recordcount=5000000
自定义文件如下所示:
recordcount=5000000
operationcount=1000000
workload=com.yahoo.ycsb.workloads.CoreWorkload
readproportion=0.8
updateproportion=0.2
scanproportion=0
insertproportion=0
然后你只需运行:
./bin/ycsb load hbase12 -P myWorkload
这会将所有数据插入到您的数据库中。
之前,我使用 HBase 性能评估工具将数据加载到 HBase 中。也许它可以帮助你。
hbase org.apache.hadoop.hbase.PerformanceEvaluation
此工具有多种选择。对于您的情况,您可以将数据大小设置为 5GB。