问题标签 [solrcloud]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 连接到远程 Solr 实例的异常(407 错误)
我已经编写了下面提到的代码。
但是对于上述情况,我收到以下错误:-
我无法解决这个问题。相同的代码可以正常使用 urlhttp://localhost:8080/solr/prime-core
请让我知道如何修改以无错误地连接到服务器。
谢谢。
注意:prime-core 是我的 Solr Core 我正在使用 Solr 4.3
solr - 在 SolrCloud 设置中更改 Schema.xml
如何更改 SolrCloud 中集合的 schema.xml?
我已经在 3 个节点上建立了 zookeeper-ensemble,我想我可以在那里进行更改,但不确切知道。
solr - SolrCloud 中的不同分片使用不同的 solrconfig 设置?
我想用一个由三个不同分片组成的集合来设置 SolrCloud。
我知道,因为集合代表一个单一的逻辑索引,它必须有一个单一的架构。但是,我想知道每个分片是否可以有不同的 solrconfig?
尽管进行了大量搜索,但我还没有看到任何集合由单个模式但多个 solrconfig 组成的示例。我用一个引导配置完成了所有初始化集合的 SolrCloud 教程:
但是,SolrCloud 文档中有一些元素让我相信 SolrCloud 设置为单一模式,但每个分片的不同 solrconfig 文件可能是可能的。来自“Solr 词汇表”:
"集合:在 Solr 中,一个或多个文档组合在一个逻辑索引中。集合必须有一个模式,但可以分布在多个核心上。 "
如果一个集合必须有一个单一的模式,但可以包含多个核心,这是否表明这些不同的核心可以有不同的 solrconfig?如果是这样,如何设置?
任何帮助将非常感激。
solr - solr 4.4 多数据源连接
在我的 db-data-config.xml 中,我配置了两个数据源,每个数据源都有他的参数名称,例如:
但是当我在数据导入的 solr 中执行第二个实体名称查询时,它会启动一个异常:
"表 'firstdb.secondTable' 不存在\n\tat " 有人可以帮我吗?先感谢您
solr4 - Solr 云复制优势
谁能告诉我,除了故障托伦之外,拥有更多数量的分片副本有什么好处?拥有更多副本是否能够在可用副本和领导者之间分配负载,从而提高查询响应时间?
solr - 如何创建具有不同核心名称的 solr 分片集群?
我能够在两个 solr 实例中创建具有默认集合名称的 solr 分片集群,即 (collection1)。我应该如何继续在两个 solr 实例中创建具有不同核心名称的分片集群。IE。solr instance1 与“collection1”核心 & solr instance2 与“collection2”?可能吗 ?
solr - 使用和不使用 Solrcloud 时的索引速度性能
我已经完成了 2 次性能测试,以使用 235280 个文档的集合来衡量索引速度:
第一次测试:1 个没有SolrCloud 的solr 实例:索引速度 = 6191 doc/s
第二次测试:与SolrCloud链接的 4 个 solr 实例(4 个分片) :索引速度 = 4506 doc/s
我使用 8 个 CPU。
所以,我对这些结果有一些疑问:
Q1:通常,solr 实例的数量会提高还是降低索引速度?
Q2: SolrCloud 会降低索引速度吗?
Q3:为什么我使用 SolrCloud 时性能会下降?我错过了什么(设置?)?
编辑 :
我使用 CSV 更新处理程序来索引我的收藏。
solr - Solr:尽管存在字段,但文档缺少所需的 uniqueKey 错误
我正在使用 Solr 4.3 我设置了两个 Solr 核心:userCore
和mainCore
userCore
有自己的schema.xml
andsolrconfig.xml
并且托管在localhost:8983
.
mainCore
有自己不同的schema
and solrconfig
,并且有一个SolrCloud
设置,一个分片在运行localhost:8080
,另一个在localhost:7574
我将文档发布到 中userToMain
定义的更新链userCore
,它为文档编制索引,然后将其转发到 中的另一个更新链mainCore
。文档在这里处理并索引到mainCore
中,然后我们就完成了。
在涉及分布式搜索之前,所有这一切都运行良好:文档已成功编入索引,我可以通过 Luke 查询不同核心和分片的索引来判断。但是,分布式 Solr 查询不适用于此设置,因为当它变成 otu 时,我的mainCore
(即设置了 SolrCloud 的那个)没有uniqueKey
定义。
所以我试图解决这个问题。我已经在mainCore
架构中有以下字段:
<field name="doc-id" type="string" indexed="true" stored="true" multiValued="false" required="true"/>
我希望通过在架构中指定将其用作 uniqueKey:
<uniqueKey>doc-id</uniqueKey>
现在,当我将文档发布到userCore
via
我收到错误
Document is missing mandatory uniqueKey field: doc-id
不仅在mainCore
, 在其模式uniqueKey
中实际定义了,而且 userCore
在其模式中甚至没有提到 a uniqueKey
!
具体来说,这是错误的一部分 mainCore
:
userCore 的部分错误:
总之,让我感到困惑的是两方面:
1)为什么,当我实际上doc-id
在我的 mainCore 模式中定义了字段时,当我指向uniqueKey
它时,当它在所有其他情况下被索引时,Solr 会抱怨吗Document is missing mandatory uniqueKey field:doc-id
???
2)即使 mainCore 在这个领域确实有问题,为什么 userCore 似乎也在抱怨这个?它们位于完全不同的服务器上,具有完全不同的配置。userCore 所做的只是将它接收到的文档发布到 mainCore,由该 mainCore 的 URL 指定。
任何帮助将非常感激!
编辑:我想为评论提供一些答案。发布到 test_doc0.xml 的原始文档userCore
如下所示:
<add><doc>
<field name="docid">docid0</field>
<field name="coref_input">Bill Clinton was the 42nd president. Clinton's wife Hillary is
currently Secretary of State. Hillary Clinton ran for president
unsuccessfully.</field>
</doc></add>
在它被索引到 之后userCore
,它被发送到mainCore
通过相关 updateRequestProcessor 中的这个特定逻辑进行处理,userToMainUpdateRequestProcessor.java
:
其中mainServer
定义UserToMainUpdateRequestProcessorFactory.java
为:
mainServer = new HttpServer("http://localhost:8080/solr/mainCore");
因此userCore
将文档发布到mainCore
,并mainCore
进行一系列处理以生成更多这样的字段(我不能包含完整文档):
Name_Data:
hillary clinton Name_FullnameOverrides: enghillary clinton
Name_CompletedData: hillary clinton
name-token-count: 2
doc-id: docid0
doc-language: eng
indoc-chain-id: 5
最长提及: Hillary Clinton
信心: 0.9443013649773926
search - solr 查询为同一查询返回不正确的结果
我在生产中使用 solr 4.3.0,在 Windows 上使用 zookeeper 3.4.5,在本地环境中的 Linux 机器上使用 solr 4.0.0。我已经实现了 solr 搜索和 solr 索引更新架构,它们似乎在本地和生产上也能正常工作。但是在生产中的某些时候,当我更新索引文档然后查询以检索更新后的文档时,它会产生奇怪的行为,有时它返回正确的更新文档,而有时返回旧文档。最初我的想法是我正在使用 JMS 进行文档更新,这可能是一个问题,但这种行为是随机的,并且在本地是不可重现的。所以我认为solr 4.3.0版中的NRT搜索一定有问题。
任何帮助都会非常有帮助。
solr - Solr : 强制 solr 节点在特定分片下启动
在 solr 云设置中,有没有办法强制 solr 节点在特定分片下启动?
我在项目中的当前设置有
- 4个solr节点
- 4 个动物园管理员实例
对于将作为第一个实例启动的 solr 节点,具有以下启动参数
-DnumShards=2 -DshardId=1,但由于某种原因,第一个服务器仍然作为第二个分片的领导者开始。
我也尝试设置-DshardId=shard1。
我是否遵循正确的配置设置?或遗漏什么?