我们有一个索引,其中包含 241.047 个项目。这些项目可以有任意数量的子项目,这些子项目被索引为嵌套文档。子项总数为 381.705。
两者include_in_parent
和include_in_root
都没有在映射中设置,这意味着每个嵌套文档都被索引为附加文档。这应该意味着索引中总共会有 241.047 + 381.705 = 622.752 个文档。
当我运行以下 Curl 命令来查找索引中的文档数时,我得到了一个不同的数字,它并不遥远,但我想知道为什么它给了我一个不同的数字,它没有返回我期待的数字。
curl -XGET 'http://localhost:9200/catawiki_development/_status?pretty'
返回 622.861
接下来,当我运行 Curl 命令来获取根文档的数量时,我得到的数字与我运行match_all
查询并询问返回的文档数量不同
curl -XGET 'http://localhost:9200/elasticsearch_development/_count?pretty'
返回 241.156match_all
查询返回正确数量的文档,241.047
如何解释这些差异?