2

我有一个被索引的文档语料库。我还在索引时存储了术语向量。现在我想检索满足某些过滤选项的所有文档的术语向量。通过提供文档 ID,我能够获得单个文档或一组文档的术语向量。但是有没有办法在不提供文档 ID 的情况下获取所有文档的术语向量?最终我想要做的是获取一个字段中所有术语的频率计数,对于索引中的所有文档(即,一个词袋矩阵)。

我使用 elasticsearch-py 作为客户端。

感谢任何指针。谢谢!

4

0 回答 0