0

我在天蓝色搜索中建立了索引。该索引包含几个字段,但我标记为可搜索的字段中只有 2 个。该索引包含各种大小的完整单词 pdf 文件(当然是它们的文本),其目的是能够在文档搜索中使用。

该索引的大小很大 - 160k 文档和 7.2 GB 大小。

当我查询到 2 个字母时,一切正常,但是当我遇到复杂的单词时,性能很差。

例如:短语 - elasti 耗时 59 秒。

在我的查询中 - 我使用过滤器,得分配置文件突出显示

经过一番调查 - 我可以看到突出显示功能导致了问题。

任何的想法?如何提高性能 - 可能分成索引中的几个字段或类似的东西?

4

2 回答 2

1

本周,我们部署了一项改进,以提高荧光笔的性能。需要重新索引才能启用该功能。如果问题仍然存在,请随时通过 nateko@microsoft.com 直接与我联系。再次感谢您的宝贵时间。

内特

于 2015-05-01T21:49:04.483 回答
0

您的猜测是正确的 - 搜索突出显示导致了这里的问题。启用突出显示后,Azure 搜索会在查询时处理结果集中的每个项目/文本,以查找包含搜索命中的文本段。如果每个文本是 4.5mb (7.2gb/160k),这个过程可能需要很长时间。对于需要较长时间的复杂术语或短语,这是因为 Azure 搜索在找到足够数量的段后停止处理结果。我在 Azure 搜索团队工作。我将查看代码并确认。

于 2015-02-25T18:11:50.047 回答