问题标签 [solr4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
522 浏览

tomcat - 如何在 solrconfig.xml 中指定分片编号/zookeeper 路径?

在 solr 4教程示例中显示我可以从 start.jar 启动 solr。

我想从 war 文件中的 tomcat 启动它(我已经配置了 initctl 守护程序,所以它会更容易和更稳定),因此我必须在配置文件 solr.xml 或 solrconfig.xml 的某处指定这些云参数。我怎样才能做到这一点?

0 投票
1 回答
574 浏览

json - 如何更新 Solr 4 中的动态字段范围?

我的 Solr 4 架构中有以下字段

我可以在下面使用它进行原子更新,效果很好,并且不理会其他领域

现在我想在用新的等级更新之前清除任何现有的等级,而不必先查询它们是什么。如果我使用上面的方法并只更新新等级,那么旧的两个将保留在那里,因为更新是原子的。

我曾尝试在一篇文章或其他更新中使用通配符,但 solr 认为有一个名为 rank_* 的字段,而不是将 null 设置应用于所有等级。

如何对所有 rank_* 动态字段应用更新?

原因是我不想先查询以查看之前的内容,因为我将一次批量更新多达 200 个(这可以在一篇文章中完成)。如果我必须查询那将是 201 个帖子而不是 1 个,或者更改我的事件以了解已删除的内容,这也很困难。

0 投票
2 回答
822 浏览

postgresql - 从 PostgreSQL 到 Solr4 的预定导入

我们在 PostgreSQL 数据库中有“文章”表,其结构如下(简化):

我想定期将所有非 solrized 行导入 solr4。

是否有工具或内置 solr 的机制来执行此操作?

我将使用 blackjack 和 hookers实现我自己的导入工具,并使用 cron 运行它。有没有更好的办法?

0 投票
1 回答
178 浏览

java - Solr 4 - 索引发布的文本文件

我正在尝试创建一个名为“sku”的字段 - 它使用以下分析器进行索引:

这是通过阅读此处的文档http://lucidworks.lucidimagination.com/display/solr/Tokenizers#Tokenizers-RegularExpressionPatternTokenizer

我已经有一个成功发布到 solr 服务器的 Java 程序,但是它没有从任何文件中抓取 sku 并为它们编制索引。这是我的Java代码:

任何帮助表示赞赏。

我知道我可以自己解析文本文件并提取 SKU 并将它们在参数中发布到服务器,但我认为 Solr 可以为我做到这一点?

0 投票
1 回答
1867 浏览

solr - Solr 4 空间查询过滤器仍然返回超出范围的文档

目标是按分数然后距离执行多重排序,并将半径限制为 0.14 度,我执行以下查询:

返回所有匹配查询的文档,无论是否在圆圈内,但0.14度以内的返回距离(distdeg),其他不返回该字段。

如何省略不相交的文档?

位置字段声明:

更新: 查询的工作版本

0 投票
1 回答
71 浏览

java - Solr4 创建自定义过滤器

我正在尝试创建一个自定义过滤器。一切正常,但是我不确定如何返回多个索引结果。这是我的 incrementToken() 覆盖方法:

可以看出我的自定义方法的结果进入了一个 ArrayList,我现在不确定如何将它们中的每一个作为可索引的片段返回?

0 投票
1 回答
814 浏览

solr - solr 中 keepwordfilterfactory 的分词器

我想使用 solrkeepwordfilterfactory但没有为此获得适当的标记器。用例是,我有一个字符串说hi i am coming, bla-bla go out.现在从下面的字符串中我想保留像hi icoming,bla-bla这样的词。那么与过滤器工厂一起使用什么标记器,以便我能够在方面获得任何这样的组合。尝试了不同的标记器,但没有得到确切的结果。我正在使用solr 4.0. 是否有任何这样的标记器可以根据使用的 keepwords 进行标记。

0 投票
2 回答
10323 浏览

java - 使用 SolrJ 和 Solr4 进行刻面

我已经浏览了这个网站上的相关问题,但没有找到相关的解决方案。

使用表单的 HTTP 请求查询我的 Solr4 索引时

响应包含所有不同的国家以及每个国家的计数。

如何使用 SolrJ 获取此信息?我尝试了以下方法,但它只返回所有国家的总计数,而不是每个国家:

以下似乎确实有效,但我不想事先明确设置所有分组:

其次,我不确定如何从 QueryResponse 对象中提取方面数据。

所以两个问题:

1) 使用 SolrJ 如何在字段上分面并返回分组而不明确指定组?

2) 使用 SolrJ 如何从 QueryResponse 对象中提取分面数据?

谢谢。

更新:

我还尝试了类似于 Sergey 的回应(如下)的东西。

上面的代码显示了 size=1 的 ffList 并且循环经历了 1 次迭代。在输出中 ffname="country" 和 ffcount 是匹配原始查询的总行数。

这里没有按国家/地区细分。

我应该提到,在同一个 solrQuery 对象上,我还调用了 addField 和 addFilterQuery。不确定这是否会影响刻面:

更新 2:

我想我明白了,再次基于 Sergey 在下面所说的话。我使用 FacetField.getValues() 提取了 List 对象。

在上面的代码中,标签变量匹配每个方面组,计数是该分组的相应计数。

0 投票
3 回答
433 浏览

solr - 如何在 solr4 中对存储在其他服务器上的 XML 文件进行索引

我将所有 XML 文件都存储在另一台服务器上,并且我已经在不同的服务器上安装和配置了 SOLR。如何将这些 XML 文件索引到 SOLR。我已经检查过 nutch,但它的主要目的是抓取 html 页面并将它们编入索引。我不需要爬行。我在其他服务器上的特定路径上有所有这些文件。我只需要在 SOLR 中索引这些 XML 文件。我已经安装并配置了 SOLR4。

如果有人做过这样的事情,请告诉我该怎么做。谢谢

0 投票
1 回答
161 浏览

java - Solr - 匹配以特定单词开头的句子

关于如何做到这一点的任何提示?

我试过使用PatternTokenizerFactory,但它没有按预期工作。

是否可以在不编写的情况下做到这一点custom tokenizer