问题标签 [solr4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
280 浏览

regex - Solr - 自定义片段

我想在我的 solr 突出显示功能中使用 Regexp Fragmenter 来自定义我的片段。

根据要求,我们需要在突出显示术语之前和之后返回 25 个单词。

下面是一个示例高亮片段。

Some polls show a major gender gap between men and women when it comes to gun control. A Washington Post/ABC News poll in January showed that <span class="highclass">women</span> supported a semi-automatic gun ban by 20 more points than men. They favored a ban on high-capacity magazines by 15 points.

为此,我制作了下面的正则表达式

这个正则表达式可以很好地处理简单的字符串。(tested) ,但是在将它与 solr 一起使用时,它似乎无法正常工作。

很少有亮点很好,但是对于很少的亮点,亮点术语出现在突出显示片段的开头。

我不确定,那个正则表达式碎片器可以做什么,我需要什么。还有其他方法可以满足这个要求吗?

有人可以建议我吗?

0 投票
2 回答
499 浏览

solr - 为每个最终用户分离 solr 索引

对于我们的应用程序,我们希望以某种方式为使用该应用程序的每个用户分离索引数据(它使用 solr 来索引上传的数据)。那可能吗?

所有被索引文档的 schema.xml 和文档结构都是相同的。出于安全原因,我们只想隔离。

澄清:我忘了提到 solr 只能由网络应用程序访问。最终用户从不直接连接到 Solr。

0 投票
0 回答
200 浏览

solr - Solr 上的查询变慢。我有哪些选择?

我在服务器上运行单个 Solr 实例。此实例中的文档数量已达到查询变慢的程度。我有哪些选择?

0 投票
1 回答
1876 浏览

solr - Solr全进口性能

我有一小部分查询和实体,即使性能很差,我只是想知道我可以采取哪些技巧和配置来提高性能?

注意我使用的是 Solr 4.1。

0 投票
2 回答
14134 浏览

solr - 如何配置 Solr 以提高索引速度

我有一个客户端程序,它生成 1-50 百万个 Solr 文档并将它们添加到 Solr。
我正在使用 ConcurrentUpdateSolrServer 从客户端推送文档,每个请求 1000 个文档。
文档相对较小(很少有小文本字段)。
我想提高索引速度。
我尝试将“ramBufferSizeMB”增加到 1G,将“mergeFactor”增加到 25,但没有看到任何变化。
我想知道是否还有其他推荐的设置来提高 Solr 索引速度。
任何指向相关材料的链接将不胜感激。

0 投票
1 回答
1880 浏览

solr - 将与 jboss 的连接限制为某些 IP 地址

我们在我们的应用程序中使用 Apache Solr 来提供搜索功能。我们正在将 solr.war 文件与我们的应用程序一起部署到 jboss。然而,现在每个人都可以从 jboss_host/solr URL 访问 solr。

我们如何防止 /solr/ 被所有 IP 地址访问?我们希望限制某些 IP 地址,即 jboss_host 和其他几个管理 API 主机。

0 投票
1 回答
912 浏览

solr - Solr 拼写检查过滤器查询

我试图在 solr 上构建拼写检查器。基本信息看起来足够好http://wiki.apache.org/solr/SpellCheckComponent#Introduction

我可以以某种方式将拼写检查器的范围限制为特定查询吗?例如,我希望拼写检查器只纠正流派=国际的拼写。(流派是我的 schema.xml 中定义的文本字段)

编辑

为了使问题更准确:如何过滤拼写检查器组件的查询。fq=流派:音乐&查询=jacksn

然后拼写校正器应该只查看具有流派的文档:音乐

0 投票
1 回答
366 浏览

solr - 通过 Collections API (Solr 4.x) 的集合名称

我正在使用 Solr 集合 API 创建一个集合。

我期待新集合被命名为“test2”,而我得到的是“test2_shard1_replica2”。我不想将我的索引名称绑定到任何当前设置。

0 投票
2 回答
508 浏览

solr - 使用空格、斜杠和冒号转义 LukeRequest

我正在使用 Solr 4.1。使用 LukeRequest,我想获取包含特定字段数据的文档数量。该字段的名称类似于http://foo.org/bar/ baz(注意和之间的空格bar/baz。当我访问时,http://127.0.0.1:8983/root/admin/luke我会得到一份我所有领域的列表,包括上述领域。当我访问

http://127.0.0.1:8983/root/admin/luke?fl=http://foo.org/bar/ baz

我没有命中。我尝试过对字符串进行 url 编码,转义斜杠,转义冒号,转义空格,使用 + 代替空格,以及我能想到的所有可能的反斜杠组合。在 solr中的另一个 StackOverflow 问题字段列表中发布的解决方案,其中“fl”参数用于中间有空格的字段对我不起作用。

我真的只是在寻找是否有任何文档对这个特定字段有价值的答案,所以如果有比 LukeRequest 更好的方法来做到这一点,我也很乐意。

0 投票
1 回答
3862 浏览

solr - Solr 4中按距离排序结果的理想方法?

我正在努力阅读和理解 Solr 4 中有关空间搜索的文档:

http://wiki.apache.org/solr/SolrAdaptersForLuceneSpatial4

但是我很难找到一个简单的答案:在 Solr 4 中按距离对结果进行排序的理想方法是什么?

我的文档集中有两个可用的位置字段:

geo是一个location_rpt定义为的字段:

并且ll是一个位置字段,定义为:

我在上面引用的文档中看到的示例引用了相交的圆圈和各种似乎没有必要的事情,如果我感兴趣的只是在我的查询中提供一个起点(纬度/经度),并获得一个按距离排序的结果列表。

更新:接受的答案提供了一个很好的解决方案,适用于 Solr 3 和 4。David Smiley对该答案的评论为感兴趣的人提供了严格的“Solr 4”排序方式。