lucene - umbraco pdf 搜索结果排名

Question

我们在我们的 Umbraco 应用程序之一中使用了 pdf 搜索器（nuget 包）。当我看到 pdf 搜索结果时，它看起来不是 100% 正确的。

搜索结果中的前 2 个 pdf 包含搜索词，但搜索结果中的第 3 个、第 4 个和其余其他 pdf 没有搜索词。不知道为什么在搜索结果中添加了没有搜索词的 pdf。

谁能提供一些关于 umbraco pdf 搜索器如何工作的信息？并对结果项进行排名？

有没有办法从搜索结果中删除根本不包含搜索词的pdf。

score 0 · Accepted Answer

去下载 LUKE ( https://code.google.com/archive/p/luke/ )。这是一个工具，可让您查看索引内部并查看它们已索引的内容等。

使用 LUKE，您应该能够查看索引并查看已编入索引的内容。

您可以通过在条件对象上调用 .ToString 来让 Umbraco Examine 输出它用于搜索的原始 Lucene 字符串。您可以将其粘贴到 LUKE 中进行搜索，您将能够看到各种有用的详细信息，例如匹配的术语和排名等。

:)

1 回答 1