问题标签 [solrcloud]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
843 浏览

java - 连接到远程 Solr 实例的异常(407 错误)

我已经编写了下面提到的代码。

但是对于上述情况,我收到以下错误:-

我无法解决这个问题。相同的代码可以正常使用 urlhttp://localhost:8080/solr/prime-core请让我知道如何修改以无错误地连接到服务器。

谢谢。

注意:prime-core 是我的 Solr Core 我正在使用 Solr 4.3

0 投票
3 回答
13574 浏览

solr - 在 SolrCloud 设置中更改 Schema.xml

如何更改 SolrCloud 中集合的 schema.xml?

我已经在 3 个节点上建立了 zookeeper-ensemble,我想我可以在那里进行更改,但不确切知道。

0 投票
1 回答
392 浏览

solr - SolrCloud 中的不同分片使用不同的 solrconfig 设置?

我想用一个由三个不同分片组成的集合来设置 SolrCloud。

我知道,因为集合代表一个单一的逻辑索引,它必须有一个单一的架构。但是,我想知道每个分片是否可以有不同的 solrconfig

尽管进行了大量搜索,但我还没有看到任何集合由单个模式但多个 solrconfig 组成的示例。我用一个引导配置完成了所有初始化集合的 SolrCloud 教程:

但是,SolrCloud 文档中有一些元素让我相信 SolrCloud 设置为单一模式,但每个分片的不同 solrconfig 文件可能是可能的。来自“Solr 词汇表”:

"集合:在 Solr 中,一个或多个文档组合在一个逻辑索引中。集合必须有一个模式,但可以分布在多个核心上。 "

如果一个集合必须有一个单一的模式,但可以包含多个核心,这是否表明这些不同的核心可以有不同的 solrconfig?如果是这样,如何设置?

任何帮助将非常感激。

0 投票
2 回答
447 浏览

solr - solr 4.4 多数据源连接

在我的 db-data-config.xml 中,我配置了两个数据源,每个数据源都有他的参数名称,例如:

但是当我在数据导入的 solr 中执行第二个实体名称查询时,它会启动一个异常:

"表 'firstdb.secondTable' 不存在\n\tat " 有人可以帮我吗?先感谢您

0 投票
1 回答
194 浏览

solr4 - Solr 云复制优势

谁能告诉我,除了故障托伦之外,拥有更多数量的分片副本有什么好处?拥有更多副本是否能够在可用副本和领导者之间分配负载,从而提高查询响应时间?

0 投票
1 回答
547 浏览

solr - 如何创建具有不同核心名称的 solr 分片集群?

我能够在两个 solr 实例中创建具有默认集合名称的 solr 分片集群,即 (collection1)。我应该如何继续在两个 solr 实例中创建具有不同核心名称的分片集群。IE。solr instance1 与“collection1”核心 & solr instance2 与“collection2”?可能吗 ?

0 投票
2 回答
2153 浏览

solr - 使用和不使用 Solrcloud 时的索引速度性能

我已经完成了 2 次性能测试,以使用 235280 个文档的集合来衡量索引速度:

第一次测试:1 个没有SolrCloud 的solr 实例:索引速度 = 6191 doc/s

第二次测试:SolrCloud链接的 4 个 solr 实例(4 个分片) :索引速度 = 4506 doc/s

我使用 8 个 CPU。

所以,我对这些结果有一些疑问:

Q1:通常,solr 实例的数量会提高还是降低索引速度?

Q2: SolrCloud 会降低索引速度吗?

Q3:为什么我使用 SolrCloud 时性能会下降?我错过了什么(设置?)?

编辑 :

我使用 CSV 更新处理程序来索引我的收藏。

0 投票
1 回答
3639 浏览

solr - Solr:尽管存在字段,但文档缺少所需的 uniqueKey 错误

我正在使用 Solr 4.3 我设置了两个 Solr 核心:userCoremainCore

userCore有自己的schema.xmlandsolrconfig.xml并且托管在localhost:8983.

mainCore有自己不同的schemaand solrconfig,并且有一个SolrCloud设置,一个分片在运行localhost:8080,另一个在localhost:7574

我将文档发布到 中userToMain定义的更新链userCore,它为文档编制索引,然后将其转发到 中的另一个更新链mainCore。文档在这里处理并索引到mainCore中,然后我们就完成了。

在涉及分布式搜索之前,所有这一切都运行良好:文档已成功编入索引,我可以通过 Luke 查询不同核心和分片的索引来判断。但是,分布式 Solr 查询不适用于此设置,因为当它变成 otu 时,我的mainCore(即设置了 SolrCloud 的那个)没有uniqueKey定义。

所以我试图解决这个问题。我已经在mainCore架构中有以下字段:

<field name="doc-id" type="string" indexed="true" stored="true" multiValued="false" required="true"/>

我希望通过在架构中指定将其用作 uniqueKey:

<uniqueKey>doc-id</uniqueKey>

现在,当我将文档发布到userCorevia

我收到错误

Document is missing mandatory uniqueKey field: doc-id

不仅在mainCore, 在其模式uniqueKey中实际定义了,而且 userCore在其模式中甚至没有提到 a uniqueKey

具体来说,这是错误的一部分 mainCore

userCore 的部分错误

总之,让我感到困惑的是两方面

1)为什么,当我实际上doc-id在我的 mainCore 模式中定义了字段时,当我指向uniqueKey它时,当它所有其他情况下被索引时,Solr 会抱怨吗Document is missing mandatory uniqueKey field:doc-id???

2)即使 mainCore 在这个领域确实有问题,为什么 userCore 似乎也在抱怨这个?它们位于完全不同的服务器上,具有完全不同的配置。userCore 所做的只是将它接收到的文档发布到 mainCore,由该 mainCore 的 URL 指定。

任何帮助将非常感激!

编辑:我想为评论提供一些答案。发布到 test_doc0.xml 的原始文档userCore如下所示:

<add><doc>

<field name="docid">docid0</field>

<field name="coref_input">Bill Clinton was the 42nd president. Clinton's wife Hillary is currently Secretary of State. Hillary Clinton ran for president unsuccessfully.</field>

</doc></add>

在它被索引到 之后userCore,它被发送到mainCore通过相关 updateRequestProcessor 中的这个特定逻辑进行处理,userToMainUpdateRequestProcessor.java

其中mainServer定义UserToMainUpdateRequestProcessorFactory.java为:

mainServer = new HttpServer("http://localhost:8080/solr/mainCore");

因此userCore将文档发布到mainCore,并mainCore进行一系列处理以生成更多这样的字段(我不能包含完整文档):

Name_Data:
hillary clinton Name_FullnameOverrides: enghillary clinton
Name_CompletedData: hillary clinton
name-token-count: 2
doc-id: docid0
doc-language: eng
indoc-chain-id: 5
最长提及: Hillary Clinton
信心: 0.9443013649773926

0 投票
1 回答
104 浏览

search - solr 查询为同一查询返回不正确的结果

我在生产中使用 solr 4.3.0,在 Windows 上使用 zookeeper 3.4.5,在本地环境中的 Linux 机器上使用 solr 4.0.0。我已经实现了 solr 搜索和 solr 索引更新架构,它们似乎在本地和生产上也能正常工作。但是在生产中的某些时候,当我更新索引文档然后查询以检索更新后的文档时,它会产生奇怪的行为,有时它返回正确的更新文档,而有时返回旧文档。最初我的想法是我正在使用 JMS 进行文档更新,这可能是一个问题,但这种行为是随机的,并且在本地是不可重现的。所以我认为solr 4.3.0版中的NRT搜索一定有问题。

任何帮助都会非常有帮助。

0 投票
2 回答
648 浏览

solr - Solr : 强制 solr 节点在特定分片下启动

在 solr 云设置中,有没有办法强制 solr 节点在特定分片下启动?

我在项目中的当前设置有

  1. 4个solr节点
  2. 4 个动物园管理员实例
  3. 对于将作为第一个实例启动的 solr 节点,具有以下启动参数

    -DnumShards=2 -DshardId=1,但由于某种原因,第一个服务器仍然作为第二个分片的领导者开始。

我也尝试设置-DshardId=shard1。

我是否遵循正确的配置设置?或遗漏什么?