问题标签 [solrcloud]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2027 浏览

solr - solrcloud副本等待时间配置

我已经设置了具有 2 个分片 2 副本配置的 solrcloud 集群。但是当我启动我的分片节点并且每个分片只有一个副本节点时,分片领导节点不断打印一条消息:waiting until we see more replicas up,total 3 found 2 timeoutin 175000,其他副本到这里的等待时间大约是 3 分钟。

我的问题是如何减少等待时间,加快开发速度?

0 投票
4 回答
20606 浏览

solr - 重新加载 SolrCloud 配置(存储在 Zookeeper 上) - schema.xml

我已经使用独立的 zookeeper 设置了 SolrCloud 复制。但现在我希望对我的 Schema.xml 进行一些更改并重新加载核心。问题是,当我运行单个服务器 Solr(没有 solrcloud)时,会加载新模式,但我不知道如何在所有复制服务器上重新加载模式。我尝试在其中一台服务器上重新加载架构,但没有任何预期的影响。有没有一种方法可以在使用 Zookeeper 的分布式复制设置中重新加载 Solr 中的 schema.xml。

0 投票
1 回答
799 浏览

solr - SolrCloud - 分片数量的最佳实践

是否有关于如何计划系统中的分片数量以允许系统增长而不不必要地创建太多分片的最佳实践来源?太多的分片会增加复杂性,在某些时候甚至可能会影响性能

过去有几个关于这个问题的问题,但没有具体的建议。

0 投票
2 回答
663 浏览

solr - 使 CloudSolrServer 仅在领导者上运行数据导入

我用 SolrCloud 建立了一个两台服务器的 Solr 集群。目前我有Master和Replica。

我想将数据导入到领导者,因为在从属上进行增量导入没有任何意义(更新不会分发给领导者)。

从文档中我得到 CloudSolrServer 知道集群状态(从 Zookeeper 获得)并且默认情况下只将所有更新发送给领导者。

我想要的是让 CloudSolrServer 将所有数据导入命令发送到主服务器。我有以下代码:

但我看到请求仍然发送到我的服务器 localhost:8080 和 localhost:8983。有没有什么办法解决这一问题?

0 投票
1 回答
3218 浏览

solr - Solr 服务器 HttpParse 错误

嗨,当我使用 http 客户端向 solr 服务器发送查询时,solr 服务器会打印异常日志,说明 HttpParser 已满。

我在码头服务器上运行 solrcloud 4.0。这是码头的问题吗?

这可能是什么原因,我该如何解决?

0 投票
1 回答
6555 浏览

solr - SolrCloud 与 Solr 主从复制

本周我遇到了 Solr 索引的问题:http: //lucene.472066.n3.nabble.com/corrupted-index-in-slave-td4054769.html

今天,几乎每个请求都开始不断发生该错误,我创建了一个 JIRA 问题,因为我认为这是一个错误https://issues.apache.org/jira/browse/SOLR-4707

如您所见,最后是由于 Solr 主从复制失败,现在我不知道我们是否应该考虑迁移到 SolrCloud,因为 Solr 主从复制似乎不适合我们要求:

  • 索引大小:~2000 万份文档,~9GB
  • ~1200 次更新/分钟
  • ~10000 次查询/分钟(分布在 2 个从属设备上)MoreLikeThis、RealTimeGet、TermVectorComponent、SearchHandler

如果有人能帮我回答这些问题,我会非常感谢:

  • 迁移到 SolrCloud 是否可取?它会对复制性能产生影响吗?
  • 在那种情况下,什么会有更好的性能?在每个服务器中维护索引的副本,还是使用分片服务器?
  • 您建议使用多少分片和副本来确保高可用性?

亲切的问候,

胜利者

0 投票
1 回答
2883 浏览

solr - Solrj 客户端和 XML 响应

我在码头服务器中使用 solr4.0。我想使用 solrj 查询 solr 并期望结果以 XML 格式格式化。所以我使用了 HttpSolrServer(CloudSolrServer 和 LBHttpSolrServer 不支持设置解析器)并将解析器设置为 Xmlparser。此外,我还在设置 SolrQuery 参数 wt=xml。但我无法在 XML 中获得结果。这是我的测试代码

知道这里出了什么问题吗?

0 投票
1 回答
1580 浏览

solr - AWS EC2 机器上的 Solrcloud 配置

我在 AWS EC2 机器上设置 SolrCloud 时遇到问题。剧情如下,

我为 zookeeper 和 solr 提供了三台服务器。

每台服务器上都运行着 zookeeper。当我使用 zookeeper 主机信息启动 Solr 时,它会按预期启动并工作。

问题是zookeeper在生成集群信息时使用服务器的私有IP,因此我无法使用无法识别私有IP的Solrj查询它。例如 server1。私有 IP ip-a,b,c,d 公共 IP : u,v,w,x Zookeeper 通过私有 IP 识别 solr 实例(显然从外部 EC2 机器看不到)

活动节点 IP 是私有 IP 而不是公共 IP

有什么方法可以让zookeeper将集群信息存储为主机名而不是ip。如果无法做到这一点,我该如何在 AWS EC2 机器上运行 solr Cloud?

0 投票
2 回答
7695 浏览

sorting - 在 solr 中对文本字段进行排序

我正在使用 solr 3.4 并希望在文本字段中对 solr 搜索结果进行排序。如何像 int 自然排序一样实现对文本字段的排序?

有什么方法可以在查询期间将文本字段转换为 int 吗?

我的排序字段是字符串类型,我希望它在排序时表现为 int 字段。我无法更改字段类型,因为索引大小太大且无法重新索引。

知道如何实现这一目标吗?

0 投票
1 回答
213 浏览

solr - dataimporthandler 不在 solr 云上分发文档

我们使用 4 个分片 solr 云,当我们尝试使用 dataimporthandler 导入数据时,它不会在所有 4 个分片中分发文档。