我已经elasticsearch
使用elasticsearch-hadoop
来自elastic
.
我需要获取唯一帐号的计数。我用hql
和编写了以下查询queryDSL
,但它们返回不同的计数。
蜂巢查询:
select count(distinct account) from <tableName> where capacity="550";
// Returns --> 71132
同样,在 Elasticsearch 中,查询看起来像这样:
{
"query": {
"bool": {
"must": [
{"match": { "capacity": "550"}}
]
}
},
"aggs": {
"unique_account": {
"cardinality": {
"field": "account"
}
}
}
}
// Returns --> 71607
难道我做错了什么?我该怎么做才能匹配这两个查询?
Note:
hive 和 elasticsearch 中的记录数完全相同。