我设置了 TiDB、TiKV 和 PD 集群,以便使用 YCSB 工具对它们进行基准测试,并通过 MySQL 驱动程序连接。集群由 TiDB、TiKV 和 PD 各 5 个实例组成。每个节点运行一个 TiDB、TiKV 和 PD 实例。
然而,当我在更新语句中玩弄 YCSB 代码时,我注意到如果更新字段的值是固定的并且是硬编码的,那么总吞吐量约为 30K tps,延迟约为 30ms。如果更新的字段值是随机的,则总吞吐量约为 2k tps,延迟约为 300 毫秒。
更新语句创建代码如下:
@Override
public String createUpdateStatement(StatementType updateType) {
String[] fieldKeys = updateType.getFieldString().split(",");
StringBuilder update = new StringBuilder("UPDATE ");
update.append(updateType.getTableName());
update.append(" SET ");
for (int i = 0; i < fieldKeys.length; i++) {
update.append(fieldKeys[i]);
String randStr = RandomCharStr(); // 1) 3K tps with 300ms latency
//String randStr = "Hardcode-Field-Value"; // 2) 20K tps with 20ms latency
update.append(" = '" + randStr + "'");
if (i < fieldKeys.length - 1) {
update.append(", ");
}
}
// update.append(fieldKey);
update.append(" WHERE ");
update.append(JdbcDBClient.PRIMARY_KEY);
update.append(" = ?");
return update.toString();
}
我们如何解释这种性能差距?如本文所述,是否由于 DistSQL 查询缓存?