“solr4”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

522 浏览

tomcat - 如何在 solrconfig.xml 中指定分片编号/zookeeper 路径？

在 solr 4教程示例中显示我可以从 start.jar 启动 solr。

我想从 war 文件中的 tomcat 启动它（我已经配置了 initctl 守护程序，所以它会更容易和更稳定），因此我必须在配置文件 solr.xml 或 solrconfig.xml 的某处指定这些云参数。我怎样才能做到这一点？

2013-01-09T01:59:56.870

0 投票

1 回答

574 浏览

json - 如何更新 Solr 4 中的动态字段范围？

我的 Solr 4 架构中有以下字段

我可以在下面使用它进行原子更新，效果很好，并且不理会其他领域

现在我想在用新的等级更新之前清除任何现有的等级，而不必先查询它们是什么。如果我使用上面的方法并只更新新等级，那么旧的两个将保留在那里，因为更新是原子的。

我曾尝试在一篇文章或其他更新中使用通配符，但 solr 认为有一个名为 rank_* 的字段，而不是将 null 设置应用于所有等级。

如何对所有 rank_* 动态字段应用更新？

原因是我不想先查询以查看之前的内容，因为我将一次批量更新多达 200 个（这可以在一篇文章中完成）。如果我必须查询那将是 201 个帖子而不是 1 个，或者更改我的事件以了解已删除的内容，这也很困难。

json solr dynamic-data solr4

2013-01-11T14:46:52.083

0 投票

2 回答

822 浏览

postgresql - 从 PostgreSQL 到 Solr4 的预定导入

我们在 PostgreSQL 数据库中有“文章”表，其结构如下（简化）：

我想定期将所有非 solrized 行导入 solr4。

是否有工具或内置 solr 的机制来执行此操作？

我将~~使用 blackjack 和 hookers~~实现我自己的导入工具，并使用 cron 运行它。有没有更好的办法？

postgresql solr solr4

2013-01-13T16:15:27.943

0 投票

1 回答

178 浏览

java - Solr 4 - 索引发布的文本文件

我正在尝试创建一个名为“sku”的字段 - 它使用以下分析器进行索引：

这是通过阅读此处的文档http://lucidworks.lucidimagination.com/display/solr/Tokenizers#Tokenizers-RegularExpressionPatternTokenizer

我已经有一个成功发布到 solr 服务器的 Java 程序，但是它没有从任何文件中抓取 sku 并为它们编制索引。这是我的Java代码：

任何帮助表示赞赏。

我知道我可以自己解析文本文件并提取 SKU 并将它们在参数中发布到服务器，但我认为 Solr 可以为我做到这一点？

java solr solr4

2013-01-21T16:29:15.067

0 投票

1 回答

1867 浏览

solr - Solr 4 空间查询过滤器仍然返回超出范围的文档

目标是按分数然后距离执行多重排序，并将半径限制为 0.14 度，我执行以下查询：

返回所有匹配查询的文档，无论是否在圆圈内，但0.14度以内的返回距离（distdeg），其他不返回该字段。

如何省略不相交的文档？

位置字段声明：

更新： 查询的工作版本

solr geospatial spatial spatial-query solr4

2013-01-21T16:44:44.157

0 投票

1 回答

71 浏览

java - Solr4 创建自定义过滤器

我正在尝试创建一个自定义过滤器。一切正常，但是我不确定如何返回多个索引结果。这是我的 incrementToken() 覆盖方法：

可以看出我的自定义方法的结果进入了一个 ArrayList，我现在不确定如何将它们中的每一个作为可索引的片段返回？

java solr solr4

2013-01-22T16:04:39.120

0 投票

1 回答

814 浏览

solr - solr 中 keepwordfilterfactory 的分词器

我想使用 solrkeepwordfilterfactory但没有为此获得适当的标记器。用例是，我有一个字符串说hi i am coming, bla-bla go out.现在从下面的字符串中我想保留像hi i，coming,等bla-bla这样的词。那么与过滤器工厂一起使用什么标记器，以便我能够在方面获得任何这样的组合。尝试了不同的标记器，但没有得到确切的结果。我正在使用solr 4.0. 是否有任何这样的标记器可以根据使用的 keepwords 进行标记。

solr lucene tokenize solr4 filterfactory

2013-01-23T12:13:17.633

0 投票

2 回答

10323 浏览

java - 使用 SolrJ 和 Solr4 进行刻面

我已经浏览了这个网站上的相关问题，但没有找到相关的解决方案。

使用表单的 HTTP 请求查询我的 Solr4 索引时

响应包含所有不同的国家以及每个国家的计数。

如何使用 SolrJ 获取此信息？我尝试了以下方法，但它只返回所有国家的总计数，而不是每个国家：

以下似乎确实有效，但我不想事先明确设置所有分组：

其次，我不确定如何从 QueryResponse 对象中提取方面数据。

所以两个问题：

1) 使用 SolrJ 如何在字段上分面并返回分组而不明确指定组？

2) 使用 SolrJ 如何从 QueryResponse 对象中提取分面数据？

谢谢。

更新：

我还尝试了类似于 Sergey 的回应（如下）的东西。

上面的代码显示了 size=1 的 ffList 并且循环经历了 1 次迭代。在输出中 ffname="country" 和 ffcount 是匹配原始查询的总行数。

这里没有按国家/地区细分。

我应该提到，在同一个 solrQuery 对象上，我还调用了 addField 和 addFilterQuery。不确定这是否会影响刻面：

更新 2：

我想我明白了，再次基于 Sergey 在下面所说的话。我使用 FacetField.getValues() 提取了 List 对象。

在上面的代码中，标签变量匹配每个方面组，计数是该分组的相应计数。

java solr solrj faceted-search solr4

2013-01-23T16:52:56.933

0 投票

3 回答

433 浏览

solr - 如何在 solr4 中对存储在其他服务器上的 XML 文件进行索引

我将所有 XML 文件都存储在另一台服务器上，并且我已经在不同的服务器上安装和配置了 SOLR。如何将这些 XML 文件索引到 SOLR。我已经检查过 nutch，但它的主要目的是抓取 html 页面并将它们编入索引。我不需要爬行。我在其他服务器上的特定路径上有所有这些文件。我只需要在 SOLR 中索引这些 XML 文件。我已经安装并配置了 SOLR4。

如果有人做过这样的事情，请告诉我该怎么做。谢谢

solr dataimporthandler data-import solr4

2013-01-23T21:10:59.980

0 投票

1 回答

161 浏览

java - Solr - 匹配以特定单词开头的句子

关于如何做到这一点的任何提示？

我试过使用PatternTokenizerFactory，但它没有按预期工作。

是否可以在不编写的情况下做到这一点custom tokenizer？

java solr solr4

2013-01-24T09:46:26.517

问题标签 [solr4]

Reference