我在 Elasticsearch 中有一个简单的 SQL 查询,我知道它返回的结果少于 100 行。我怎样才能一次得到所有这些结果(即,不使用滚动)?我尝试了该limit n
子句,但它在n
小于或等于 10 时有效,但在n
大于 10 时无效。
调用 Elasticsearch SQL API 的 Python 代码如下。
import requests
import json
url = 'http://10.204.61.127:9200/_xpack/sql'
headers = {
'Content-Type': 'application/json',
}
query = {
'query': '''
select
date_start,
sum(spend) as spend
from
some_index
where
campaign_id = 790
or
campaign_id = 490
group by
date_start
'''
}
response = requests.post(url, headers=headers, data=json.dumps(query))
上面的查询返回一个游标 ID。我试图将游标 ID 提供给同一个 SQL API,但它没有给我更多的结果。
我还尝试使用 SQL 翻译 API 将上述 SQL 查询翻译为本机 Elasticsearch 查询,并将其包装到以下 Python 代码中,但它也不起作用。我仍然只有 10 行结果。
import requests
import json
url = 'http://10.204.61.127:9200/some_index/some_doc/_search'
headers = {
'Content-Type': 'application/json',
}
query = {
"size": 0,
"query": {
"bool": {
"should": [
{
"term": {
"campaign_id.keyword": {
"value": 790,
"boost": 1.0
}
}
},
{
"term": {
"campaign_id.keyword": {
"value": 490,
"boost": 1.0
}
}
}
],
"adjust_pure_negative": True,
"boost": 1.0
}
},
"_source": False,
"stored_fields": "_none_",
"aggregations": {
"groupby": {
"composite": {
"size": 1000,
"sources": [
{
"2735": {
"terms": {
"field": "date_start",
"missing_bucket": False,
"order": "asc"
}
}
}
]
},
"aggregations": {
"2768": {
"sum": {
"field": "spend"
}
}
}
}
}
}
response = requests.post(url, headers=headers, data=json.dumps(query)).json()