我已经在 Elasticsearch 中索引了 100 个文档,我需要通过使用以下函数添加一个新的简单字段来更新每个文档:
def add_new_field( ):
ES_HOST = {"host" : "localhost", "port" : 9200}
ES= Elasticsearch(hosts = [ES_HOST], timeout = 180)
for i in range(100):
ES.update(
index='history',
doc_type='resources',
id=i,
body={ "doc" : {"square" : i**2} }
)
问题是:执行此函数后,某些术语的'doc_freq'超过了预期的document_frequency。(注意:我设置了'dfs = True')。
例如:'term1' 存在于所有文档中(所以 'doc_freq' 应该是 100),而不是我得到 'doc_freq'=113