我们在我们的 Umbraco 应用程序之一中使用了 pdf 搜索器(nuget 包)。当我看到 pdf 搜索结果时,它看起来不是 100% 正确的。
搜索结果中的前 2 个 pdf 包含搜索词,但搜索结果中的第 3 个、第 4 个和其余其他 pdf 没有搜索词。不知道为什么在搜索结果中添加了没有搜索词的 pdf。
谁能提供一些关于 umbraco pdf 搜索器如何工作的信息?并对结果项进行排名?
有没有办法从搜索结果中删除根本不包含搜索词的pdf。
去下载 LUKE ( https://code.google.com/archive/p/luke/ )。这是一个工具,可让您查看索引内部并查看它们已索引的内容等。
使用 LUKE,您应该能够查看索引并查看已编入索引的内容。
您可以通过在条件对象上调用 .ToString 来让 Umbraco Examine 输出它用于搜索的原始 Lucene 字符串。您可以将其粘贴到 LUKE 中进行搜索,您将能够看到各种有用的详细信息,例如匹配的术语和排名等。
:)