问题标签 [significant-terms]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
997 浏览

elasticsearch - Elasticsearch 重要术语聚合:doc_count 和 bg_c​​ount 的含义

我无法找到文档来解释对重要术语聚合的响应中的doc_count和字段。bg_count

例如,我希望,如果我不设置背景过滤器,则bg_count应该是索引中的文档总数。但是我看到的是,bg_count每个结果的结果都不一样,而且它也不接近文档总数。

我假设这doc_count是包含返回的文档的数量key.

这些值的实际含义是什么?我在哪里可以找到更完整的文档?

0 投票
1 回答
618 浏览

elasticsearch - 排除具有不同字段的重要术语聚合

是否可以使用要过滤的多个字段来过滤重要术语聚合的桶列表结果?我正在尝试根据中等https://towardsdatascience.com/how-to-build-a-recommendation-engine-quick-and-simple-aec8c71a823e上的这篇文章使用 ES 创建推荐功能。

我将搜索数据存储为对象数组而不是字符串数组,因为我需要过滤其他字段以获得正确的存储桶列表结果。这是索引映射:

我有2个条件要过滤:

  1. Comic_subscribes.type 只能是“serial”
  2. Comic_subscribes.genre 不得在“hentai”或“echii”中

我已经尝试了两种方法来应用条件。首先,我尝试使用这样的 bool 查询对其进行过滤:

和过滤聚合方法:

但是,这两种方法都给了我未经过滤的漫画清单。有没有其他方法可以达到这些要求的条件?我是否应该再创建一个存储预过滤漫画列表的字段以用作源字段重要术语?非常感谢。

0 投票
1 回答
28 浏览

r - terms.formula 数据参数无效

我是 R Studio 的新手,现在想做一个“cca”。我遵循了描述,但 R 说不。这就是我正在使用的:

UVcca 是环境变量,如树类、树直径、高度、覆盖率 .. 树类是数字的,所以我在 1、2、3 中更改了树的类型,因为我认为它会有机会并且会起作用,但它没有. PreAbscca 包括苔藓植物的发生率。如果它们出现在树上是(1)或否(0)。在列表中只是数字。

R 提出了这个错误:

terms.formula(对象,数据=数据)中的错误:'。' 出现在公式中且“数据”参数无效

我能做什么,也许有人可以帮助我,这会很好。谢谢你

0 投票
1 回答
245 浏览

elasticsearch - Elasticsearch 重要术语聚合 doc_count 在对相同术语进行匹配短语搜索时与命中不同

我正在使用重要术语聚合,它使用以下查询为我提供了 n 重要术语及其 doc_count 和 bg_c​​ount:

如果我采用重要术语聚合返回的术语并对该术语进行匹配短语查询。然后,我得到的 hits 值与聚合中的 doc_count 不同。

匹配词组查询:

该字段preprocess_data.results.alternatives.transcript具有以下映射:

在进行聚合和匹配短语搜索时,我无法解释文档计数的差异。请帮忙。