问题标签 [lucene.net]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
920 浏览

.net - 如何使用 Lucene.Net 索引和搜索业务实体?

我想知道如何使用 Lucene.NET 来索引和搜索我的业务实体。我看到 NHibernate.Search 有很好的功能来解决这个问题,但它仍然需要数据库。我不需要数据库,我只想将所有数据存储在我的 Lucene.NET 的索引中。我还看到像 Compass 这样的 java 框架可以轻松完成这些工作,但它不是 .NET 库。

对象设计或框架有没有办法解决这个问题?

0 投票
3 回答
561 浏览

asp.net - Lucene.Net 和孵化状态

我正在评估选项,以使我们的 .Net 网站上的搜索功能更强大。我需要调查我们是否购买了诸如 Google Search Appliance (GSA) 之类的软件/硬件,或者使用诸如 Lucene.Net 之类的框架来开发解决方案

我们是一家初创公司,GSA 提供了很多开箱即用的好功能,但我们需要两个盒子,第二个作为备份/开发环境,事情开始变得昂贵......

我们过去使用过 SQL Server 全文,但我们热衷于为我们的站点提供非常直观的“Googlesque”类型搜索,并且我们一直在努力使用 SQL Server 做我们想做的一切。

但是,我不确定 Lucene.Net 项目的“孵化器状态”实际上意味着什么。我应该考虑一个处于孵化器状态的项目吗?它不活跃吗?它会在某个时候进入更活跃的状态还是被归档?

谢谢

0 投票
1 回答
1320 浏览

nhibernate - NHibernate.Search,未创建 Lucene 索引文件

我遇到了 NHibernate.Search 的问题,它突然停止工作,它根本无法创建文件或读取索引文件。

NHibernate 似乎可以正确加载它:

但在那之后,似乎没有任何效果。没有文件被创建,并且 c:\temp\Lucene 也从未被创建。我已经检查了权限,我似乎找不到任何问题。

这对我来说已成为死胡同,并且不知道如何进行调试。非常感谢任何反馈。

好的,更新:

我发现 FullTextIndexEventListener.Initialize(NHibernate.Cfg.Configuration cfg) 永远不会被调用。

我假设当将监听器添加到 NHibernate 配置时会触发它(因为它实现了 NHibernate.Event.IInitializable),但是在检查 NHibernate 的源时,这似乎不是这种情况?

奇怪的是,它可以在我的同事开发机器上运行,而无需手动调用。我们运行相同的源代码以及相同的库。

0 投票
3 回答
4783 浏览

vb.net - 解析 Microsoft Office 和 PDF 文档的最佳方法是什么?

我正在使用 VB9 (VS2008) 和 Lucene.NET 开发桌面搜索引擎。Lucene.NET 中的索引器仅接受原始文本数据,无法直接从 Microsoft Office(DOC、DOCX、PPT、PPTX)和 PDF 文档中提取原始文本。从此类文件中提取原始文本数据的最佳方法是什么?

0 投票
3 回答
3792 浏览

lucene - 前导通配符在 Lucene.NET 中引发错误

如果搜索查询包含前导通配符(*?),则QueryParser'Parse函数将引发错误。

有没有办法在 Lucene.NET v2.0.0.4 中解决这个问题?

0 投票
4 回答
22166 浏览

vb.net - 如何在 QueryParser 中合并多个字段?

我正在使用“Lucene.Net”库并有以下问题。

与其创建两个单独的QueryParser对象并使用它们来获得两个 Hits 对象,是否可以使用单个QueryParser对象在两个字段上执行搜索,以便我只有一个 Hits 对象可以为我提供每个文档的总分?

0 投票
7 回答
16283 浏览

vb.net - 如何更新 Lucene.NET 索引?

我正在使用 Lucene.NET (v2.0) 在 Visual Basic 9 (VS2008) 中开发桌面搜索引擎。

我使用以下代码来初始化 IndexWriter

如果我两次选择同一个文件夹(包含要编制索引的文件),则会在索引中为该文件夹中的每个文件创建两个不同的条目。

我希望 IndexWriter 丢弃索引中已经存在的任何文件。

我应该怎么做才能确保这一点?

0 投票
1 回答
906 浏览

vb.net - 如何使用索引中的字段来删除条目?

我正在使用 Lucene.NET 在 VB 9 中开发桌面搜索引擎

我希望删除并为更新的文件创建一个新条目。

索引存储完整的文件路径和最后修改日期。

我正在使用 IndexReader 检查索引中是否存在文件(以避免重新索引相同的文件)。

我有以下疑问:

  1. 如何使用modified字段中的值来检查特定文件的索引条目是否旧?IndexReader 的什么功能可以让我这样做?

  2. 如何获取函数 deleteDocument() 的文档编号 (docNum)

0 投票
5 回答
18552 浏览

sql-server - SQL Server 2008 全文搜索 (FTS) 与 Lucene.NET

我知道过去有关于 SQL 2005 与 Lucene.NET 的问题,但自 2008 年问世以来,他们对其进行了很多更改,并且想知道是否有人可以给我优点/缺点(或链接到文章)。

0 投票
4 回答
3028 浏览

c# - 缓存 Lucene.net 搜索结果

我已经使用Lucene.net在几个小型网站上实现了搜索功能(数据库内容和上传的文档),没有任何问题。现在我有一个网站,我正在索引 5000 多个文档(主要是 PDF)并且查询变得有点慢。

我假设加速它的最佳方法是实现某种缓存。谁能给我关于从哪里开始的任何指示/示例?如果您除了缓存还有其他建议(例如,我应该使用多个索引吗?)我也想听听这些建议。

编辑:

导致查询缓慢的愚蠢用户错误。我一次为整个结果集创建了亮点,而不仅仅是我正在显示的“页面”。哎呀。