问题标签 [lucene]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
10656 浏览

lucene - 在 Solr 中使用 Nutch 爬虫

我能否将 Apache Nutch 爬虫与 Solr 索引服务器集成?

编辑:

我们的一位开发人员从这些帖子中想出了一个解决方案

  1. 运行 Nutch 和 Solr
  2. 运行 Nutch 和 Solr 的更新

回答

是的

0 投票
1 回答
1220 浏览

lucene - 用于记录/分析查询的 Solr 过滤器

我正在使用 Solr,并希望能够将查询/令牌记录到数据库中,以便对营销和建议的搜索功能进行分析。

我猜测 Lucene 过滤器将是一个很好的方法,可能会在查询过滤器链中为给定的字段类型放置一个过滤器,该字段类型记录到指定的数据库。我想知道最好的方法来减少对 Solr 响应时间的影响。

如果有人过去这样做并愿意分享他们的解决方案,那就太好了。

0 投票
10 回答
8556 浏览

lucene - 我们如何使用 Lucene、Solr 或 Nutch 创建一个简单的搜索引擎?

我们公司有数千份PDF文件。我们如何使用 Lucene、Solr 或 Nutch 创建一个简单的搜索引擎?我们将提供一个基本的 Java/JSP 网页,人们可以输入单词并执行基本和/或查询,然后向他们显示所有匹配 PDF 的文档链接。

0 投票
2 回答
2593 浏览

c# - Web 应用程序中带有 IndexSearcher/IndexWriter 的 Lucene.net

我目前正在一个 Web 应用程序中运行 Lucene.net,并且想知道性能方面的最佳方法。

我目前已对其进行设置,以便在计划的过程中一起处理所有索引写入,同时优化索引。

但是对于搜索 - 我目前正在打开和关闭每个搜索的搜索器,我知道这并不理想。

您认为在这种情况下最好的方法是什么?

处理完更新/优化后,我需要关闭并重新打开索引搜索器,因此计划的进程(这是一个 Windows 控制台应用程序)需要将其完成传达给 Web 应用程序。

0 投票
4 回答
2989 浏览

java - 你如何在 .net 上运行 Lucene?

Lucene 是一个优秀的搜索引擎,但是 .NET 版本落后于官方 Java 版本(.NET 最新的稳定版本是 2.0,但是最新的 Java Lucene 版本是 2.4,它有更多的功能)。

你如何解决这个问题?

0 投票
3 回答
1503 浏览

java - 使用带注释的 Hibernate 配置 Compass

我正在将 Hibernate 用于基于 Java 的 Web 应用程序,并希望通过 Compass 添加全文搜索。Compass 应该支持这一点,但未能提供任何有用的入门指南。

我可以弄清楚我必须用@Searchable 和各种@SearchableXXX 变体注释我的实体,并通过HibernateHelper.getCompass(sessionFactory) 在我的服务代码中访问Compass。

我最终得到一个 HibernateException 说“未配置指南针事件侦听器,请检查参考文档和应用程序的 hibernate.cfg.xml”。

参考文档再次提示和 hibernate.cfg.xml,而我用 Spring 的 AnnotationSessionFactoryBean 配置 Hibernate。对于这种情况,文档中提到:“如果使用 Hibernate Annotations 或 Hibernate EntityManager (JPA),只需将 Compass jar 文件放到类路径中即可启用它(确保类路径中没有 Hibernate Search,因为它使用相同的事件类名称)。” 这对我不起作用。

我缺少什么想法或入门的好资源?

0 投票
6 回答
17131 浏览

lucene - 如何让 Lucene QueryParser 更宽容?

我正在使用 Lucene.net,但我为 .NET 和 Java 版本都标记了这个问题,因为 API 是相同的,我希望这两个平台上都有解决方案。

我确信其他人已经解决了这个问题,但我还没有找到任何好的讨论或例子。

默认情况下,Lucene 对查询语法非常挑剔。例如,我刚刚收到以下错误:

在处理来自用户的查询时,防止 ParseExceptions 的最佳方法是什么?在我看来,最有用的搜索界面是始终执行查询的界面,即使它可能是错误的查询。

似乎有一些可能的互补策略:

  • 在将查询发送到 QueryProcessor 之前“清理”查询
  • 优雅地处理异常
    • 向用户显示智能错误消息
    • 也许执行一个更简单的查询,留下错误的位

对于如何执行这些策略,我真的没有什么好主意。有没有其他人解决过这个问题?有没有我不知道的“简单”或“优雅”解析器?

0 投票
1 回答
740 浏览

php - Zend Framework - 是否有脚本来索引视图中的静态内容?

我想在我的网站上添加一个搜索框——它是使用 Zend Framework 1.6 构建的——使用 Zend Search Lucene。我的大部分内容是静态的,并保存在控制器视图中。

有没有人有一个脚本可以索引视图中的内容,并将它们添加到 Lucene 搜索数据库中以便我可以搜索它们?

非常感谢,
马特

0 投票
5 回答
43530 浏览

lucene - 检索 Solr 查询中的特定字段?

我在 Jetty 上运行 Solr 实例,当我使用 Solr 管理面板进行搜索时,它会返回整个文档。我应该怎么做才能从搜索返回的每个 Solr 文档中只获取指定的字段?

0 投票
2 回答
2225 浏览

c# - 在 Lucene 中索引多个表

我想使用 lucene.net 来索引我们数据库中的记录。记录存储在几个不同的表中,并通过记录表绑定在一起。单独索引每个表并在代码中将搜索结果捆绑在一起会更好,还是应该将来自数据库的记录捆绑在一起并将它们全部放在一个索引中?

任何其他建议也会有所帮助。