问题标签 [solr5]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr 5 无模式复制模式
我在无模式模式下使用 Solr 5.3.1,所以managed-schema
当我通过 API 添加字段时,Solr 创建了一个文件。
我的配置包含
但该文件没有被复制。(从站仍然包含标准托管模式文件)。有什么提示吗?
php - solarium-3x 和 Curl :超过 30 秒的最大执行时间
我必须使用面向 Apache Solr 的 solarium Client php 提取丰富的文档并提交;在日光浴室 Curl 的文档中是默认适配器,然后我不需要:
然后我想强制连接在完成处理后显式关闭,当发生这种情况时,Curl 只会打开另一个连接;为此,我尝试了以下代码:
最后执行请求:
但在 30 秒超时后停止索引过程。
solr - 为什么 Solr for Windows 需要这么多内存?
为什么 Solr for Windows 需要这么多内存?
我的 Solr 数据是 SEO 关键字(1-10 个词,最多 120 个符号长度,8 亿行)和一些其他数据。架构是:
Solr for Windows 占用约 10 GB 的 RAM,有时需要更多(高达 16 GB)。现在我将它配置为使用SOLR_JAVA_MEM=-Xms8192m -Xmx16384m
并且它可以工作,但是当它是 4 GB 或更少时 - Java 因错误 OutOfMemory 而崩溃。
那么,我做错了什么?如何配置 Solr 以减少 RAM?我可以提供任何部分solrconfig.xml
。
solrconfig.xml
所以,我到底在做什么和想要什么。
我向 Solr 添加了 8 亿行。这还不是全部——我有 30 亿行的数据集。行是搜索引擎优化关键词,如“求职”、“在纽约找工作”等。“建议”字段包含许多相同的常用词,如“工作”、“下载”等。我认为,“下载”一词存在于所有行的 10% 中。
我做服务,用户可以在其中进行“下载”等查询并获取所有包含“下载”一词的文档。
我创建了一个桌面软件 (.NET) 来在 Web 服务界面 (PHP+MySQL) 和 Solr 之间进行通信。该软件从 Web 服务获取任务,向 Solr 进行查询,下载 Solr 结果并将其提供给用户。
为了获得所有结果,我将 GET-query 发送到 Solr,例如:
如您所见 - 我使用 fq 和排序而不使用分组。也许有人看到我在 Solr 查询或方法中的错误 - 请随时告诉我。谢谢。
solr - SOLR 结果不正确
我在使用 SOLR 进行搜索时遇到问题。我的架构定义如下:
问题是当我尝试在“成分”字段上执行搜索时。
主要查询:
q=(主题:“短语搜索输入”或描述:“短语搜索输入”)AND成分:(“一些成分短语”)
或成分:搜索词
没有成分参数的查询可以正常工作,并输出正确的结果。
但是,在过滤成分时,无论我使用 fq 还是直接在查询字符串中,我都会出错或根本没有结果。
成分字段的数据如下:
成分:[成分 1,成分 2,成分 3 短语]
另一个问题是当成分具有“(”或“)”字符并且我正在搜索这样的短语时 - 无法匹配。
SOLR 版本:5.3
有人可以帮助我吗?
谢谢!
solr - 在 Solr5 中更新后获取文档版本
在通过 Solrj 5.2.1 添加或更新文档后,有没有办法在更新响应中获取文档版本?我不想再打一个额外的电话 getById 来获取版本。我可以以某种方式在更新响应本身中获取版本吗?
solr - Nutch 1.11(1.x) 和 Solr 5.3.1(5.x) 之间的集成
我刚开始使用Nutch 1.11和Solr 5.3.1。
我想用 Nutch 抓取数据,然后用 Solr 索引并准备搜索。
我知道如何使用Nutch
'sbin/crawl
命令从网络上抓取数据,并成功地从我本地的网站上获取了大量数据。
我还在根文件夹Solr
下使用以下命令在本地启动了一个新服务器,Solr
files
并使用以下命令在示例文件夹下启动示例核心:
我可以在管理 url 下面登录并管理files
核心,
所以我相信我开始Solr
正确,并开始使用命令将Nutch
数据发布到:Solr
Nutch
bin/nutch index
希望有了Solr5
新的Auto Schema功能,我可以让自己平静下来,但是,我得到了以下错误(从日志文件复制):
我记得这个
与Solr
网址有关,但我仔细检查了我使用的网址127.0.0.1:8983/solr/files
,我认为它是正确的。
有谁知道问题是什么?我在网上搜索,在这里,没有什么有用的。
注意:我还尝试了禁用Solr5
's Auto Schema功能examples/files/conf/solrconfig.xml
并替换examples/files/conf/managed-schema.xml
为Nutch
's 的方式conf/schema.xml
,仍然遇到相同的错误。
更新:在尝试了DEPRECATED命令后bin/nutch solrindex
(感谢Thangaperumal
),之前的错误消失了,但又遇到了另一个错误:
错误信息:
node.js - node-solr-client:更新文档并提交
我正在使用 node-solr-client 来处理 solr 查询。我已经按照这里的帖子写了一个更新查询
使用节点模块 solr-client 向 Solr-4.3.0 添加和更新数据
我的数据是:
我已启用自动提交为 true
当我运行代码时,它会给我一个响应
意味着它已被添加到索引中。但是当我使用 solr admin 进行交叉检查时,我看不到更新。现在,当我运行http://localhost:8983/solr/jobs/update?commit=true并再次检查时,它在 solr admin 中可见。
apache - Solr 5 重启丢失核心
Noob Solr 问题
我正在尝试设置 Solr,为了帮助我一直在使用来自 bitnami 的 Apache Solr 安装程序。
这将安装 Solr 5.4。
我已经创建了一个新的核心,一切看起来都很好。但是,当我重新启动 solr 时,我刚刚创建的核心丢失了。
我没有更改 Bitnami 安装的任何配置项
我一直在阅读有关 Solr 5 如何自我发现的信息,我确信一切都是正确的。
这是我的 solr.xml 文件的副本,来自 C:\Bitnami\solr-5.4.0-0\apache-solr\solr
我已经检查过了,在我创建的 core 文件夹中,conf 文件夹中有一个 core.properties 文件。这是文件的内容
所以我不明白为什么没有发现核心。非常感谢任何帮助
附言。我在 Windows 而不是 *nix 上这样做
solr - 匹配 2 个或更多关键字的 Solr 查询数据
我Solr version 5
用于搜索数据。我正在使用下面的查询,它返回的结果甚至single keyword
是匹配的。
任何人都可以建议我查询以仅在2 or more
关键字匹配时获取结果。
谢谢。
lucene - Solr 返回不匹配的文档
我正在编写查询获取名称中包含“am”或“pm”的所有文档,我的查询如下所示:(sellerName:am pm)。
返回文件如下:
文档1:
文档2:
文档3:
前两个文件被退回,因为我们在他们的名字中有am或pm,我的问题是,即使我们在Doc3的卖方名称中没有 am 或 pm,这仍然是匹配的。这是因为如果 doc3 ,我们在邮政编码中有pm 。
我不希望这个结果被退回。我怎样才能做到这一点?以及为什么它与 Doc3 匹配,即使 doc3 不包含 am 或 pm。
提前致谢。