问题标签 [solr4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tomcat - 如何在 solrconfig.xml 中指定分片编号/zookeeper 路径?
在 solr 4教程示例中显示我可以从 start.jar 启动 solr。
我想从 war 文件中的 tomcat 启动它(我已经配置了 initctl 守护程序,所以它会更容易和更稳定),因此我必须在配置文件 solr.xml 或 solrconfig.xml 的某处指定这些云参数。我怎样才能做到这一点?
json - 如何更新 Solr 4 中的动态字段范围?
我的 Solr 4 架构中有以下字段
我可以在下面使用它进行原子更新,效果很好,并且不理会其他领域
现在我想在用新的等级更新之前清除任何现有的等级,而不必先查询它们是什么。如果我使用上面的方法并只更新新等级,那么旧的两个将保留在那里,因为更新是原子的。
我曾尝试在一篇文章或其他更新中使用通配符,但 solr 认为有一个名为 rank_* 的字段,而不是将 null 设置应用于所有等级。
如何对所有 rank_* 动态字段应用更新?
原因是我不想先查询以查看之前的内容,因为我将一次批量更新多达 200 个(这可以在一篇文章中完成)。如果我必须查询那将是 201 个帖子而不是 1 个,或者更改我的事件以了解已删除的内容,这也很困难。
postgresql - 从 PostgreSQL 到 Solr4 的预定导入
我们在 PostgreSQL 数据库中有“文章”表,其结构如下(简化):
我想定期将所有非 solrized 行导入 solr4。
是否有工具或内置 solr 的机制来执行此操作?
我将使用 blackjack 和 hookers实现我自己的导入工具,并使用 cron 运行它。有没有更好的办法?
java - Solr 4 - 索引发布的文本文件
我正在尝试创建一个名为“sku”的字段 - 它使用以下分析器进行索引:
我已经有一个成功发布到 solr 服务器的 Java 程序,但是它没有从任何文件中抓取 sku 并为它们编制索引。这是我的Java代码:
任何帮助表示赞赏。
我知道我可以自己解析文本文件并提取 SKU 并将它们在参数中发布到服务器,但我认为 Solr 可以为我做到这一点?
solr - Solr 4 空间查询过滤器仍然返回超出范围的文档
目标是按分数然后距离执行多重排序,并将半径限制为 0.14 度,我执行以下查询:
返回所有匹配查询的文档,无论是否在圆圈内,但0.14度以内的返回距离(distdeg),其他不返回该字段。
如何省略不相交的文档?
位置字段声明:
更新: 查询的工作版本
java - Solr4 创建自定义过滤器
我正在尝试创建一个自定义过滤器。一切正常,但是我不确定如何返回多个索引结果。这是我的 incrementToken() 覆盖方法:
可以看出我的自定义方法的结果进入了一个 ArrayList,我现在不确定如何将它们中的每一个作为可索引的片段返回?
solr - solr 中 keepwordfilterfactory 的分词器
我想使用 solrkeepwordfilterfactory
但没有为此获得适当的标记器。用例是,我有一个字符串说hi i am coming, bla-bla go out.
现在从下面的字符串中我想保留像hi i
,coming,
等bla-bla
这样的词。那么与过滤器工厂一起使用什么标记器,以便我能够在方面获得任何这样的组合。尝试了不同的标记器,但没有得到确切的结果。我正在使用solr 4.0
. 是否有任何这样的标记器可以根据使用的 keepwords 进行标记。
java - 使用 SolrJ 和 Solr4 进行刻面
我已经浏览了这个网站上的相关问题,但没有找到相关的解决方案。
使用表单的 HTTP 请求查询我的 Solr4 索引时
响应包含所有不同的国家以及每个国家的计数。
如何使用 SolrJ 获取此信息?我尝试了以下方法,但它只返回所有国家的总计数,而不是每个国家:
以下似乎确实有效,但我不想事先明确设置所有分组:
其次,我不确定如何从 QueryResponse 对象中提取方面数据。
所以两个问题:
1) 使用 SolrJ 如何在字段上分面并返回分组而不明确指定组?
2) 使用 SolrJ 如何从 QueryResponse 对象中提取分面数据?
谢谢。
更新:
我还尝试了类似于 Sergey 的回应(如下)的东西。
上面的代码显示了 size=1 的 ffList 并且循环经历了 1 次迭代。在输出中 ffname="country" 和 ffcount 是匹配原始查询的总行数。
这里没有按国家/地区细分。
我应该提到,在同一个 solrQuery 对象上,我还调用了 addField 和 addFilterQuery。不确定这是否会影响刻面:
更新 2:
我想我明白了,再次基于 Sergey 在下面所说的话。我使用 FacetField.getValues() 提取了 List 对象。
在上面的代码中,标签变量匹配每个方面组,计数是该分组的相应计数。
solr - 如何在 solr4 中对存储在其他服务器上的 XML 文件进行索引
我将所有 XML 文件都存储在另一台服务器上,并且我已经在不同的服务器上安装和配置了 SOLR。如何将这些 XML 文件索引到 SOLR。我已经检查过 nutch,但它的主要目的是抓取 html 页面并将它们编入索引。我不需要爬行。我在其他服务器上的特定路径上有所有这些文件。我只需要在 SOLR 中索引这些 XML 文件。我已经安装并配置了 SOLR4。
如果有人做过这样的事情,请告诉我该怎么做。谢谢
java - Solr - 匹配以特定单词开头的句子
关于如何做到这一点的任何提示?
我试过使用PatternTokenizerFactory
,但它没有按预期工作。
是否可以在不编写的情况下做到这一点custom tokenizer
?