问题标签 [pysolr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
430 浏览

python - 如何使用 python 检查 solr 是否正在运行?

我正在使用 pysolr 库,我想检查 solr 是否正在运行,并在 solr 和其他搜索引擎之间切换。我发现了类似的问题,我尝试了很多建议但没有奏效。 如何知道 solr 服务器是否正在运行 我如何检查 cassandra 和 solr 是否启动? 用于检查服务是否正在运行的 Python 代码。?

0 投票
1 回答
48 浏览

python-3.x - 关于将更改加载到架构的 Solr 问题

我是 Solr 的新手,通过添加文档时收到以下错误pysolr

我最终发现periodical_nlm添加的第一个值是404536.0,所以我认为这是一个类型问题。在 Python 中,我periodical_nlm在添加之前将 every 显式转换为字符串2984692R。但是,错误仍然存​​在。

我用谷歌搜索了一下,发现我可能应该明确告诉 Solr 我希望该字段是一个字符串。我还没有非常“动手”使用模式,所以我有一些问题:

(1) 似乎有两个模式文件:managed-schema在核心目录和核心文件夹managed-schemaconf。我假设正在使用的初始化模式是conf文件夹中的模式?

(2) 为了让事情顺利进行,我应该更新哪些内容?我尝试将以下内容添加到核心目录中的架构文件中,但错误仍然存​​在:

我是否需要重新运行一些初始化过程或conf单独向文件中添加一些内容?

非常感谢,如果您需要更多信息,请告诉我。我在 Windows 10 Home x64 平台上运行(如果我需要运行任何命令行的东西,不确定这是否重要......)。

0 投票
2 回答
1989 浏览

django - Django-Haystack 和 Solr 8.5.1

Django haystack 是否适用于最新的 Solr 更新(8.5.1)?另外我如何设置我的 Django 博客项目

0 投票
0 回答
42 浏览

python - 有没有办法一次读取 Solr 数据库中的每个条目?

我正在尝试使用 pysolr add() 和 commit() 方法更新 Solr 数据库中的条目。我有一个庞大的数据库,我需要想办法一次更改每个条目。我知道我可以查询整个数据库并将其保存为列表,但这需要大量内存。所以我想知道是否有人知道一个内置功能,它允许我一次读取一个条目,而无需将整个数据库保存在内存中。

0 投票
0 回答
28 浏览

solr - 通过 pysolr 包使用 min_rf 功能

我使用Pysolr包将数据发送到 Apache Solr。Apache Solr 有一项称为min_rf ( Doc )的功能

我在我的 java 代码中使用了 min_rf 但 Pysolr 抛出一个错误。

Pysolr软件包是否支持此功能?如何在代码中使用此功能?

0 投票
1 回答
51 浏览

python - 连接到运行 https 的 Solr 服务器时 ACM 证书的路径

我正在尝试使用以下自定义身份验证连接到在 AWS EC2 实例上运行的 solr 服务器:https ://github.com/django-haystack/pysolr/tree/5c3a68447734e77be9e9648b184f8d600fd661c5

问题:如果证书存在于 AWS ACM 中,如何提供证书路径?

我尝试保持 verify=False 有效,但我想找出提供证书的正确方法

0 投票
0 回答
26 浏览

python - 使用 Pysolr 在新节点上添加副本或移动副本

我想使用 PySolr/或通过 api 调用将副本添加到新实例。

场景:为了更新运行 Solr 且停机时间为 0 的 EC2 实例的 AMI,我计划添加新实例(使用新 AMI)在新实例上添加副本,然后在副本成功复制到新实例后停用旧副本和实例实例

我正在尝试使用 PySolr 来做到这一点。有人可以指导如何使用 PySolr 添加新副本:https ://github.com/django-haystack/pysolr/tree/5c3a68447734e77be9e9648b184f8d600fd661c5

如果无法通过 PySolr 实现,可以通过 solrpy 或Simple Python来完成

PySolr 可以实现像 Autoscaling 这样的功能吗?https://lucene.apache.org/solr/guide/7_2/solrcloud-autoscaling-overview.html#quick-start-automatically-adding-replicas

我是 Solr 的新手,示例将非常受欢迎

谢谢

0 投票
1 回答
185 浏览

solr - 将同一文档重新索引/添加回 Solr 核心时,如何防止版本冲突?

我有一个包含 60k 文档的 Solr 核心。我已经更新了 schema.xml 中的字段类型,并且我不想删除 Solr 核心以进行重新索引。我正在尝试使用 Solr 搜索检索文档,然后尝试将具有相同 ID 的相同文档添加回 Solr。在这样做时,我遇到了版本冲突。

示例: 我使用 Pysolr 搜索请求检索一个文档。该文档如下所示:

上面的文档仍然存在于 Solr 中,我不想更改它。我想重新索引它/再次将其添加回 Solr,因为 schema.xml 中的字段类型已更改。

当我做:

我收到以下错误:

为什么“实际”版本会发生变化,而不是“预期”版本?

我该如何解决这个问题(示例表示赞赏)?

0 投票
1 回答
62 浏览

python - 如何将 Solr 日期转换回 python 可读日期,例如“日期时间”,反之亦然?

是否有一种简单/有效的方法可以将“当前 Solr 日期”转换为如下所示的“所需输出”?我曾想过使用正则表达式或字符串方法来清理 Solr 日期,但如果在 Python 中有一种方法可以将这些日期从 Solr 转换过来,那就太好了。

当前Solr 日期:

所需的输出(以datetime模块格式):

0 投票
1 回答
492 浏览

solr - Pysolr add throws (HTTP 500): [原因:任务队列处理已停止

我正在使用 Pysolr 向 solr 添加数据。我一次添加 100 个文档。但我收到以下错误。

Solr 以错误 (HTTP 500) 响应:[原因:任务队列处理已停止 20121 毫秒,剩余 0 个元素要处理。]

solr 是否在内部有队列,是否由于点击次数过多而被填满?我可以增加队列的大小(我的意思是限制)