问题标签 [pysolr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 python 检查 solr 是否正在运行?
我正在使用 pysolr 库,我想检查 solr 是否正在运行,并在 solr 和其他搜索引擎之间切换。我发现了类似的问题,我尝试了很多建议但没有奏效。 如何知道 solr 服务器是否正在运行 我如何检查 cassandra 和 solr 是否启动? 用于检查服务是否正在运行的 Python 代码。?
python-3.x - 关于将更改加载到架构的 Solr 问题
我是 Solr 的新手,通过添加文档时收到以下错误pysolr
:
我最终发现periodical_nlm
添加的第一个值是404536.0
,所以我认为这是一个类型问题。在 Python 中,我periodical_nlm
在添加之前将 every 显式转换为字符串2984692R
。但是,错误仍然存在。
我用谷歌搜索了一下,发现我可能应该明确告诉 Solr 我希望该字段是一个字符串。我还没有非常“动手”使用模式,所以我有一些问题:
(1) 似乎有两个模式文件:managed-schema
在核心目录和核心文件夹managed-schema
中conf
。我假设正在使用的初始化模式是conf
文件夹中的模式?
(2) 为了让事情顺利进行,我应该更新哪些内容?我尝试将以下内容添加到核心目录中的架构文件中,但错误仍然存在:
我是否需要重新运行一些初始化过程或conf
单独向文件中添加一些内容?
非常感谢,如果您需要更多信息,请告诉我。我在 Windows 10 Home x64 平台上运行(如果我需要运行任何命令行的东西,不确定这是否重要......)。
django - Django-Haystack 和 Solr 8.5.1
Django haystack 是否适用于最新的 Solr 更新(8.5.1)?另外我如何设置我的 Django 博客项目
python - 有没有办法一次读取 Solr 数据库中的每个条目?
我正在尝试使用 pysolr add() 和 commit() 方法更新 Solr 数据库中的条目。我有一个庞大的数据库,我需要想办法一次更改每个条目。我知道我可以查询整个数据库并将其保存为列表,但这需要大量内存。所以我想知道是否有人知道一个内置功能,它允许我一次读取一个条目,而无需将整个数据库保存在内存中。
solr - 通过 pysolr 包使用 min_rf 功能
我使用Pysolr包将数据发送到 Apache Solr。Apache Solr 有一项称为min_rf ( Doc )的功能
我在我的 java 代码中使用了 min_rf 但 Pysolr 抛出一个错误。
Pysolr软件包是否支持此功能?如何在代码中使用此功能?
python - 连接到运行 https 的 Solr 服务器时 ACM 证书的路径
我正在尝试使用以下自定义身份验证连接到在 AWS EC2 实例上运行的 solr 服务器:https ://github.com/django-haystack/pysolr/tree/5c3a68447734e77be9e9648b184f8d600fd661c5
问题:如果证书存在于 AWS ACM 中,如何提供证书路径?
我尝试保持 verify=False 有效,但我想找出提供证书的正确方法
python - 使用 Pysolr 在新节点上添加副本或移动副本
我想使用 PySolr/或通过 api 调用将副本添加到新实例。
场景:为了更新运行 Solr 且停机时间为 0 的 EC2 实例的 AMI,我计划添加新实例(使用新 AMI)在新实例上添加副本,然后在副本成功复制到新实例后停用旧副本和实例实例
我正在尝试使用 PySolr 来做到这一点。有人可以指导如何使用 PySolr 添加新副本:https ://github.com/django-haystack/pysolr/tree/5c3a68447734e77be9e9648b184f8d600fd661c5
如果无法通过 PySolr 实现,可以通过 solrpy 或Simple Python来完成
PySolr 可以实现像 Autoscaling 这样的功能吗?https://lucene.apache.org/solr/guide/7_2/solrcloud-autoscaling-overview.html#quick-start-automatically-adding-replicas
我是 Solr 的新手,示例将非常受欢迎
谢谢
solr - 将同一文档重新索引/添加回 Solr 核心时,如何防止版本冲突?
我有一个包含 60k 文档的 Solr 核心。我已经更新了 schema.xml 中的字段类型,并且我不想删除 Solr 核心以进行重新索引。我正在尝试使用 Solr 搜索检索文档,然后尝试将具有相同 ID 的相同文档添加回 Solr。在这样做时,我遇到了版本冲突。
示例: 我使用 Pysolr 搜索请求检索一个文档。该文档如下所示:
上面的文档仍然存在于 Solr 中,我不想更改它。我想重新索引它/再次将其添加回 Solr,因为 schema.xml 中的字段类型已更改。
当我做:
我收到以下错误:
为什么“实际”版本会发生变化,而不是“预期”版本?
我该如何解决这个问题(示例表示赞赏)?
python - 如何将 Solr 日期转换回 python 可读日期,例如“日期时间”,反之亦然?
是否有一种简单/有效的方法可以将“当前 Solr 日期”转换为如下所示的“所需输出”?我曾想过使用正则表达式或字符串方法来清理 Solr 日期,但如果在 Python 中有一种方法可以将这些日期从 Solr 转换过来,那就太好了。
当前Solr 日期:
所需的输出(以datetime
模块格式):
solr - Pysolr add throws (HTTP 500): [原因:任务队列处理已停止
我正在使用 Pysolr 向 solr 添加数据。我一次添加 100 个文档。但我收到以下错误。
Solr 以错误 (HTTP 500) 响应:[原因:任务队列处理已停止 20121 毫秒,剩余 0 个元素要处理。]
solr 是否在内部有队列,是否由于点击次数过多而被填满?我可以增加队列的大小(我的意思是限制)