问题标签 [solr5]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
72 浏览

solr - Solr 5 无模式复制模式

我在无模式模式下使用 Solr 5.3.1,所以managed-schema当我通过 API 添加字段时,Solr 创建了一个文件。

我的配置包含

但该文件没有被复制。(从站仍然包含标准托管模式文件)。有什么提示吗?

0 投票
0 回答
441 浏览

php - solarium-3x 和 Curl :超过 30 秒的最大执行时间

我必须使用面向 Apache Solr 的 solarium Client php 提取丰富的文档并提交;在日光浴室 Curl 的文档中是默认适配器,然后我不需要:

然后我想强制连接在完成处理后显式关闭,当发生这种情况时,Curl 只会打开另一个连接;为此,我尝试了以下代码:

最后执行请求:

但在 30 秒超时后停止索引过程。

0 投票
1 回答
329 浏览

solr - 为什么 Solr for Windows 需要这么多内存?

为什么 Solr for Windows 需要这么多内存?

我的 Solr 数据是 SEO 关键字(1-10 个词,最多 120 个符号长度,8 亿行)和一些其他数据。架构是:

Solr for Windows 占用约 10 GB 的 RAM,有时需要更多(高达 16 GB)。现在我将它配置为使用SOLR_JAVA_MEM=-Xms8192m -Xmx16384m并且它可以工作,但是当它是 4 GB 或更少时 - Java 因错误 OutOfMemory 而崩溃。

那么,我做错了什么?如何配置 Solr 以减少 RAM?我可以提供任何部分solrconfig.xml

solrconfig.xml

所以,我到底在做什么和想要什么。

我向 Solr 添加了 8 亿行。这还不是全部——我有 30 亿行的数据集。行是搜索引擎优化关键词,如“求职”、“在纽约找工作”等。“建议”字段包含许多相同的常用词,如“工作”、“下载”等。我认为,“下载”一词存在于所有行的 10% 中。

我做服务,用户可以在其中进行“下载”等查询并获取所有包含“下载”一词的文档。

我创建了一个桌面软件 (.NET) 来在 Web 服务界面 (PHP+MySQL) 和 Solr 之间进行通信。该软件从 Web 服务获取任务,向 Solr 进行查询,下载 Solr 结果并将其提供给用户。

为了获得所有结果,我将 GET-query 发送到 Solr,例如:

如您所见 - 我使用 fq 和排序而不使用分组。也许有人看到我在 Solr 查询或方法中的错误 - 请随时告诉我。谢谢。

0 投票
1 回答
613 浏览

solr - SOLR 结果不正确

我在使用 SOLR 进行搜索时遇到问题。我的架构定义如下:

问题是当我尝试在“成分”字段上执行搜索时。

主要查询:

q=(主题:“短语搜索输入”或描述:“短语搜索输入”)AND成分:(“一些成分短语”)

或成分:搜索词

没有成分参数的查询可以正常工作,并输出正确的结果。

但是,在过滤成分时,无论我使用 fq 还是直接在查询字符串中,我都会出错或根本没有结果。

成分字段的数据如下:

成分:[成分 1,成分 2,成分 3 短语]

另一个问题是当成分具有“(”或“)”字符并且我正在搜索这样的短语时 - 无法匹配。

SOLR 版本:5.3

有人可以帮助我吗?

谢谢!

0 投票
2 回答
160 浏览

solr - 在 Solr5 中更新后获取文档版本

在通过 Solrj 5.2.1 添加或更新文档后,有没有办法在更新响应中获取文档版本?我不想再打一个额外的电话 getById 来获取版本。我可以以某种方式在更新响应本身中获取版本吗?

0 投票
2 回答
2482 浏览

solr - Nutch 1.11(1.x) 和 Solr 5.3.1(5.x) 之间的集成

我刚开始使用Nutch 1.11Solr 5.3.1

我想用 Nutch 抓取数据,然后用 Solr 索引并准备搜索

我知道如何使用Nutch'sbin/crawl命令从网络上抓取数据,并成功地从我本地的网站上获取了大量数据。

我还在根文件夹Solr下使用以下命令在本地启动了一个新服务器,Solr

files并使用以下命令在示例文件夹下启动示例核心:

我可以在管理 url 下面登录并管理files核心,

所以我相信我开始Solr正确,并开始使用命令将Nutch数据发布到:SolrNutchbin/nutch index

希望有了Solr5新的Auto Schema功能,我可以让自己平静下来,但是,我得到了以下错误(从日志文件复制):

我记得这个

Solr网址有关,但我仔细检查了我使用的网址127.0.0.1:8983/solr/files,我认为它是正确的。

有谁知道问题是什么?我在网上搜索,在这里,没有什么有用的。

注意:我还尝试了禁用Solr5's Auto Schema功能examples/files/conf/solrconfig.xml并替换examples/files/conf/managed-schema.xmlNutch's 的方式conf/schema.xml,仍然遇到相同的错误。

更新:在尝试了DEPRECATED命令后bin/nutch solrindex(感谢Thangaperumal),之前的错误消失了,但又遇到了另一个错误:

错误信息:

0 投票
1 回答
1126 浏览

node.js - node-solr-client:更新文档并提交

我正在使用 node-solr-client 来处理 solr 查询。我已经按照这里的帖子写了一个更新查询

使用节点模块 solr-client 向 Solr-4.3.0 添加和更新数据

我的数据是:

我已启用自动提交为 true

当我运行代码时,它会给我一个响应

意味着它已被添加到索引中。但是当我使用 solr admin 进行交叉检查时,我看不到更新。现在,当我运行http://localhost:8983/solr/jobs/update?commit=true并再次检查时,它在 solr admin 中可见。

0 投票
0 回答
617 浏览

apache - Solr 5 重启丢失核心

Noob Solr 问题

我正在尝试设置 Solr,为了帮助我一直在使用来自 bitnami 的 Apache Solr 安装程序。

这将安装 Solr 5.4。

我已经创建了一个新的核心,一切看起来都很好。但是,当我重新启动 solr 时,我刚刚创建的核心丢失了。

我没有更改 Bitnami 安装的任何配置项

我一直在阅读有关 Solr 5 如何自我发现的信息,我确信一切都是正确的。

这是我的 solr.xml 文件的副本,来自 C:\Bitnami\solr-5.4.0-0\apache-solr\solr

我已经检查过了,在我创建的 core 文件夹中,conf 文件夹中有一个 core.properties 文件。这是文件的内容

所以我不明白为什么没有发现核心。非常感谢任何帮助

附言。我在 Windows 而不是 *nix 上这样做

0 投票
2 回答
81 浏览

solr - 匹配 2 个或更多关键字的 Solr 查询数据

Solr version 5用于搜索数据。我正在使用下面的查询,它返回的结果甚至single keyword是匹配的。

任何人都可以建议我查询以仅在2 or more关键字匹配时获取结果。

谢谢。

0 投票
2 回答
72 浏览

lucene - Solr 返回不匹配的文档

我正在编写查询获取名称中包含“am”或“pm”的所有文档,我的查询如下所示:(sellerName:am pm)

返回文件如下:

文档1:

文档2:

文档3:

前两个文件被退回,因为我们在他们的名字中有ampm,我的问题是,即使我们在Doc3的卖方名称中没有 am 或 pm,这仍然是匹配的。这是因为如果 doc3 ,我们在邮政编码中有pm 。

我不希望这个结果被退回。我怎样才能做到这一点?以及为什么它与 Doc3 匹配,即使 doc3 不包含 am 或 pm。

提前致谢。