问题标签 [lucene]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1034 浏览

lucene - 使用 Lucene 的提示/建议

我正在使用 asp.net 3.5 开发工作门户 我使用 Lucene 实现工作和简历搜索功能。想知道关于 Lucene 性能优化、可扩展性等方面的提示/建议。

万分感谢!

0 投票
1 回答
387 浏览

lucene - 显示每个类别下的搜索文档计数

我需要在搜索结果中显示每个类别的文档总数...例如:Rock(1010) Blues(5030) Pop(2209) : :

我在某处读到使用 TopFieldDocCollector 比 HitCollector 类更有效。

鉴于我的要求,我该如何使用 TopFieldDocCollector 类?或者在 Lucene 中还有其他方法吗?

0 投票
1 回答
311 浏览

sql-server - 您是否推荐使用 Sql Server 来存储和索引文件(pdf、office 等)?

可能重复:
Lucene.Net 和 SQL Server

我需要存储和索引文件,例如 PDF 和办公文件。目前我正在使用 Sql Server 2k8 使用带有 IFilters 的全文搜索来执行此任务。我的问题是:这是“最好”的方式吗?例如,我应该切换到 Lucene 进行索引吗?

0 投票
9 回答
30619 浏览

lucene - 哪些是 Lucene 的最佳替代品?

它可以在 Unix 上运行,并将用于电子邮件搜索(Dovecot、Postfix 和 maildir)。

Lucene 不是问题,我只是在分析一些替代方案。

0 投票
2 回答
452 浏览

lucene - 使 lucene 将一个字段中的所有术语视为一个术语

在我的 Lucene 文档中,我有一个“公司”字段,其中公司名称被标记化。我需要对我的应用程序的某个部分进行标记化。但是对于这个查询,我需要能够在整个公司字段上创建一个 PrefixQuery。

例子:

  • 我的品牌
    • 我的
    • 品牌
  • 婆罗门农场
    • 婆罗门
    • 农场

定期查询“bra”将返回两个文档,因为它们都有一个以 bra 开头的术语。
不过,我想要的结果只会返回最后一个条目,因为第一个词以 bra 开头。

有什么建议么?

0 投票
2 回答
9336 浏览

lucene - 在 lucene 查询中防止“太多子句”

在我的测试中,当我尝试从由术语查询和通配符查询组成的布尔查询中获取命中时,我突然遇到了太多子句异常。

我在网上搜索并找到了他们建议增加 BooleanQuery.SetMaxClauseCount() 的资源。
这对我来说听起来很可疑。我应该怎么做?我怎么能相信这个新的幻数足以满足我的查询?在所有地狱崩溃之前,我可以将这个数字增加多远?

总的来说,我觉得这不是一个解决方案。一定有更深层次的问题。。

查询是 +{+companyName:mercedes +paintCode:a*} 并且索引有大约 250 万个文档。

0 投票
4 回答
10228 浏览

c# - 从 Lucene Query 获取不同值的更快方法

目前我喜欢这样:

如您所见,我首先收集所有字段(数千个)然后区分它们,可能会跳过一些并取出一些。

我觉得应该有更好的方法来做到这一点。

0 投票
1 回答
1703 浏览

c# - 获取所有具有特定 fieldName 的 lucene 值

为了解决这个问题,我创建了一个新的 Lucene 索引,其中每个字段的所有可能的不同值都被单独索引。

所以它是一个包含几千个文档的索引,这些文档只有一个术语。
我想提取某个术语的所有值。例如,我想要所有具有字段名称“companyName”的值。
定义通配符查询当然不是解决方案。既不是枚举所有字段,也不是只保存具有正确字段名的字段。

0 投票
1 回答
1403 浏览

lucene - Lucene 搜索错误堆栈

尝试使用 Lucene 进行搜索时,我看到以下错误。(版本 1.4.3)。关于为什么我会看到这个以及如何解决它的任何想法?

在同一环境中,我还看到以下错误:

相同的代码在测试环境中有效,但在生产环境中无效。无法识别两种环境之间的任何明显差异。

0 投票
2 回答
10676 浏览

lucene - 删除和更新 Lucene 索引中的文档

我正在使用Lucene.Net.dll2.0.0.4 版。

看起来它的IndexWriter类没有DeleteDocumentor的方法UpdateDocument。我在这里错过了什么吗?如何在这个版本的 Lucene.Net 中实现删除、更新功能?

2.1 版 Lucene.dll 似乎支持删除和更新文档:

这里是 2.1 版的源代码,但我必须一个一个地下载所有文件,然后从中构建一个 DLL 。

我可以Lucene.dll从某个网站下载最新的和荧光笔吗?