问题标签 [lucene]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
404 浏览

lucene - 在 lucene 搜索结果中冒泡最新内容

我将各种文章存储在我的 lucene 索引中。当用户搜索包含特定术语或短语的文章时,我需要显示所有文章(可能在 1000 到 10000 篇文章之间),但最新文章“冒泡”在搜索结果中。

我相信您可以使用“日期字段提升”在 Lucene 中冒泡搜索结果。有人可以告诉我如何去做吗?

提前致谢!

0 投票
3 回答
343 浏览

lucene - 优化搜索查询

我正在开发一个使用 Lucene.net(版本 2.0.0.4)进行商店搜索的 Web 应用程序。虽然我的 Web 应用程序用户可以搜索位于美国的商店,这些商店距离给定位置 50 英里以内。我正在使用第三方 API 来查找半径内的所有城市。对于一个城市,比如新泽西州的爱迪生,它在 40 英里范围内为我提供了大约 450 个城市(API 返回一个包含 450 个城市的 .Net 哈希表)。通过迭代这个哈希表,我正在使用 BooleanQuery/Query 类来构建 lucene 查询。

在这种情况下,我发现通过 lucene 构建、执行和返回搜索结果需要花费大量时间。有什么办法可以优化这段代码吗?

谢谢!

0 投票
3 回答
17209 浏览

lucene - 具有多个不同值的字段

我正在使用 Lucene 构建“图书搜索”API。我需要在 Lucene 索引中索引 Book Name、Author 和 Book category 字段。

一本书可以属于多个不同的书籍类别……例如:

书名1——小说、幽默、哲学。书名1——小说、科学。书名1——幽默、商业。BookName4-幽默等等......

用户应该能够搜索特定类别下的所有书籍,例如“homour”。

鉴于这种情况,我如何索引以上字段并在 lucene 中构建查询?

0 投票
6 回答
3117 浏览

lucene - 需要 Lucene 查询优化建议

我正在使用 Lucene 开发基于 Web 的求职应用程序。我网站上的用户可以搜索距离“波士顿,马萨诸塞州”或任何其他位置 100 英里范围内的工作。另外,我需要以降序显示按“相关性”(即lucene返回的分数)排序的搜索结果。

我正在使用第 3 方 API 来获取城市给定半径内的所有城市。这个 API 返回我在“波士顿,MA”半径 100 英里内的大约 864 个城市。

我正在使用以下逻辑构建城市/州 Lucene 查询,这是我的“BuildNearestCitiesQuery”方法的一部分。这里nearestCities 是上述API 返回的哈希表。它包含864 个城市,CityName 作为key,StateCode 作为value。finalQuery 是一个 Lucene BooleanQuery 对象,其中包含用户输入的其他搜索条件,例如:技能、关键字等。

然后我将 finalQuery 对象输入到 Lucene 的 Search 方法中,以获取 100 英里半径内的所有工作。:

我发现这个 BuildNearestCitiesQuery 方法平均需要高达 29 秒的时间来执行,这显然是任何网站标准都不能接受的。我还发现涉及“Parse”的语句与其他语句相比需要相当长的时间来执行陈述。

给定位置的工作是一个动态属性,因为一个城市今天可能有 2 个工作(满足特定搜索条件),但 3 天后相同搜索条件的工作为零。所以,我不能使用任何“缓存”这边。

有什么方法可以优化这个逻辑吗?或者我的整个方法/算法可以使用 Lucene 在 100 英里内找到所有工作?

仅供参考,这是我在 Lucene 中的索引的样子:

非常感谢您的阅读!非常感谢您对此的帮助。

贾尼斯

0 投票
1 回答
1262 浏览

hibernate - nHibernate.Search 使用 nHibernate v2

我无法让 nHibernate.Search 创建索引。

如果我使用 nHibernate.dll 和 nHibernate.Search.dll 的 1.2.1.4,那么索引会正确创建,我可以使用 Luke(Lucene 实用程序)对其进行检查。创建一个段文件以及一个片段文件等

但是,当我使用 nHibernate.dll 和 nHibernate.Search.dll 的 v 2 时,索引没有正确创建。在 Index 目录中只创建了一个 1k 段文件,Luke 无法检查它。

我在 v1 中使用的代码如下:

我在配置文件中有以下内容

在版本 2 中没有 SearchFactory。我能找到的唯一类似的东西是

所以我设置了如下配置

这创建了索引的基本框架,但 Luke 看不到它 - 这告诉我它已损坏

我还使用以下代码尝试手动创建索引,但同样它只创建段文件,没有别的

所以我的问题是 - 如果我想使用 nHibernate.Search,我是否必须使用 v1.1.4 的 nHibernate?或者我可以使用 v2 吗?在这种情况下我做错了什么?

网上关于这方面的内容很少。

任何人?

0 投票
2 回答
139 浏览

lucene - 所有这些词的特点

我有一个在 Lucene 中索引的“描述”字段。该字段包含一本书的描述。如何使用 BooleanQuery 类在此字段上实现“所有这些单词”功能?例如,如果用户输入“畅销书”,那么它应该返回在其描述中包含所有这些词的书籍。

谢谢!

0 投票
1 回答
321 浏览

lucene - 搜索确切的短语

如何使用 BooleanQuery/任何其他类在此字段上实现“精确短语”功能?例如,如果用户输入“畅销书”,那么它应该返回描述中包含该短语的书籍。

再次感谢!

0 投票
8 回答
25575 浏览

python - 有纯 Python Lucene 吗?

红宝石人有雪貂。有人知道 Python 有什么类似的倡议吗?我们目前正在使用 PyLucene,但我想研究转向纯 Python 搜索。

0 投票
5 回答
10831 浏览

java - 查找 Lucene 索引中的文档数

使用 Java 版本的 Lucene,如何找出索引中的文档数?

0 投票
3 回答
1269 浏览

lucene - Lucene 索引更新和性能

我正在一个工作门户网站上工作,并且一直在使用 Lucene 进行工作搜索功能。用户每天都会在我们的网站上发布一些职位。我们需要确保发布的新职位可以尽快在网站上搜索到。在这种情况下,当发布新工作或编辑现有工作时,如何更新 Lucene 索引?lucene 索引更新和搜索可以并行工作吗?

另外,我能知道关于 Lucene 索引、优化、性能等方面的任何提示/最佳实践吗?

感谢您的帮助!

谢谢!