问题标签 [solr5]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - SolrCloud 与独立 Solr
我正在尝试将标准 4.x Solr 安装升级到 Solr cloud 5.x 我在两者之间进行了一些性能测试,发现了巨大的差异。在同一台服务器上,在不同的时间,我运行了以下命令:
- Solr 云 5.2.1 和 5.3,2 个分片,2 个副本,3 个 Zookeeper
- Solr 标准 两者都有相同的配置(solrconfig 等)。
两者具有相同的数据
多次执行示例查询时,平均结果是标准 Solr 比 Solr 云快 5 倍。
数据导入处理程序也比标准 solr 快 2 倍。
有什么想法为什么会出现这种差异以及如何提高 solrcloud 的性能?
solr - 了解 Solr 文档=
我有两个索引文档,我试图找出其中一个高于另一个的相关性。所以我跑去DebugQuery=True
寻求解释。以下是两个文件的相关差异。
两种不同类型的文件
它可能是相关的;这些文档有两种不同的类型,我使用 *_s 字段来区分它们。所以我的字段 module_s 有两个模块 1 和 2。我的查询有:
所以我认为这不会引起问题,但我想添加此信息。
相关解释差异:
文档 1 - 模块类型 = 1
文档 2 - 模块类型 = 2
概要和问题
如您所见,解释几乎相同。它们都具有相同的 queryWeight、boost、idf 和 queryNorm。不同的是,doc=XXX。对于文档 1 它是351328
,文档 2 它是174
. 有人能解释一下这个数字是什么吗?它来自哪里?为什么它与众不同?
使用的资源
solr - 具有多值字段的 Solr stats.facet
我正在将 Solr 从 1.x 升级到 Solr 5.2.1。这张 jira 票说,多值字段的统计数据分面已被收回。所以当我尝试这样做时说
统计信息只能针对单值字段,而不是:市场
市场是我架构中的多值字段。
是否存在任何解决方法或解决方案来实现这一目标?或者我必须从 Solr 获取所需的数据并在我的代码级别计算统计信息?
solr - 嵌套查询和检索子过滤器的父属性
我正在浏览 Yonik 的博客。我正在使用 solr 5.3.0,我有一个我正在尝试解决的场景。任何帮助将不胜感激。
概括 Yonik 的例子:
旧文件:
家长:
嵌套的孩子:
计算一些场景: 1)如果我为颜色:红色和大小:LI 设置过滤器,则仅获取子文档。是否有可能获得响应的父字段(因为我有多个颜色:红色和大小:L 的产品)。
2)如果我搜索颜色:红色和数量大于 0,我会得到多个文档,而此搜索只是为了检查红色项目是否可用。虽然 group by 是一种解决方法,但还有其他方法吗?
solr - Merge Solr Index with CoreAdmin Api
I am trying to merge solr indexes from multiple solr cores into a new core. i am using coreAdmin api for this. but all i get is an empty response header with no error or success message.
Here is the api from solr Documentation.
after this i get this response
Please guide. how to successfully merge indexes from multiple cores. I am using Solr 5.3
Here is the link for Mergin Indexes from Solr Documentation MERGEINDEXES.
xml - Solr DataImportHandler is not indexing all data defined
I am using solr5.3.
I am trying to upload wikipedia page article dump to solr using "DataImportHandler" but I am getting only id and title files when i am querying.
Below is my data-config.xml
Also I have added below entires to schema.xml.
I have copied schema.xml from "example/example-DIH/solr/solr/conf/schema.xml" and removed all field entries with few exceptions as mentioned in comments.
After importing data I am just trying to fetch all fields but I am getting only "Id" and "Title".
Also I tried to run documentImport using debug mode so that I can get some information regarding indexing, but at whenever i am selecting debug mode it is only importing 2 documents. I am not sure why? Due to this reason I am not able to debug the indexing process.
Please guide me further.
EDIT-I am now sure that other fields are not getting indexed because when I am specifying df=user or text, I am getting below message.
"msg": "undefined field user",
I am querying like below: http://localhost:8983/solr/wiki/select?q=%3A&fl=id%2Ctitle%2Ctext%2Crevision&wt=json&indent=true&debugQuery=true
solr - Solr Cloud - 查询唯一字段会返回不同的结果
我遇到了一个问题,对 Solr 搜索的查询将返回不同的值。但是我正在查询设置为唯一键字段的 id。
因此,在 Solr Admin UI 中,我将运行类似的查询。
相关响应信息如下。
现在多次运行该查询最终将导致不同的响应。
请注意,网址是不同的。
检查调试查询。您可以看到不同的 url 在该GET_FIELDS
部分中。
为什么/如何获得不同的信息?我正在查询标记为唯一字段的 id。据我了解,不应该超过这些。这可能是同步问题吗?我正在使用 Solr 管理 UI 查询并选择了一个核心。
有没有办法检查索引中是否只有一个具有该 ID 的文档?
更新:
我运行了一个方面查询,唯一返回 2
与没有问题的人相比。
这是正确的吗?这是否解释了我的问题,因为存在重复的文档,但如果是这种情况,为什么不返回两个文档而不仅仅是返回不同的数据?
solr - 如何在 Solr 5.3.0 中获得建议
我正在尝试使用 Solr 5.3.0 实现自动完成功能
solrconfig.xml 看起来像这样
托管模式如下所示:
现在,当我使用 Solr 管理面板中的分析器时,我可以看到索引的 ngram。它成功地指出了比赛。
但是,当我使用查询时:
我收到 0 条建议。回复在这里: https ://api.myjson.com/bins/47r3i
在其中一个文档中,名称键存在一个值“Jindal Panther”。
此外,我发现如果我创建一个类型为“String”、源为“name”的虚拟复制字段“suggest”,则任何适用于“name”的建议都不适用于“suggest”。这可能是复制字段的任何错误配置以启用建议吗?
任何帮助,将不胜感激。提前致谢。
编辑:得到解决方案。请参阅下面接受的答案及其评论。我遇到的一个博客很好地解释了建议者。对于 Solr Search 的新手来说,这绝对值得一读。
solr - Haystack 是否支持 SOLR 5.3 的多核跨核搜索?
Haystack 是否支持 SOLR 5.3 的多核跨核搜索?我在 SOLR 中有三个核心,core0、core1 和 core2。如何在 Haystack 中实现跨核心搜索?如何设置 Haystack 连接 URL?谢谢!
solr - 在 Solr 中存储类别信息
我的 solr 数据库中存储了产品信息。一个产品可以是多个类别的一部分。
现在,我想在属于这些类别的产品中存储有关这些类别的信息。(还有其他方法吗?)
因此,假设产品 A 属于类别 C1 和 C2,ID 为 I1 和 I2。现在如何将 I1 到 C1 的映射存储在我的产品 A 中?这样做的架构应该是什么?
但是,如果简单地存储 id、名称和一些其他数据(例如 url)的列表,那么每个 id 到 name 或 url 的映射将丢失。像这样:
那么我应该如何存储文档呢?