问题标签 [pysolr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
2124 浏览

python-2.7 - pysolr 中的文档总数

如何获得与给定查询匹配的文档总数。我使用了以下查询:

由于默认返回值为'10',所以输出只有10,但计数是4000。我怎样才能得到计数的总数?

0 投票
1 回答
105 浏览

python - 使用 Solar 索引大型文档会导致异常

我正在尝试使用 pysolr 将文档添加到 Solr (5.3.2)。我生成了一个包含大文本和一些元数据(日期、作者...)的简单 JSON 对象,然后我尝试将其添加到 Solr。我的问题是超过一定大小,Solr 将无法索引文档并返回以下错误:

字段长度的某处似乎确实存在硬编码限制,但我找不到。

通过在 python 中玩耍,我发现:

会正常工作

会导致错误。

内容字段在我的 schema.xml 中定义为普通的 type="text_general" 字段。

编辑:这里是 schema.xml 定义

我尝试通过 Solr 的 Web 管理界面手动添加内容,但我遇到了完全相同的问题。

0 投票
1 回答
779 浏览

python - Apache Solr 6.6 替换文档而不是更新

我已经为测试设置配置了 solr 6.6.1。索引几个文档后,我必须更新几个字段。我正在使用solr的 python 客户端。要更新,以下是我的代码片段

执行(和提交)后,所有其他字段都从所有文档中删除,只剩下两个字段,即 doc_id 和 group2。这个 API 或我的代码有什么问题?

0 投票
3 回答
1715 浏览

solr - 使用 pysolr 连接到 solr 云集合

我已经配置了一个多核 solr 云。创建了一个包含 2 个碎片且没有复制的集合。solr 的 UI 中的云

通过 solr UI 192.168.1.56:8983,我可以得到查询结果。

我想对 pysolr 做同样的事情,所以尝试运行以下命令:

最后一行无法找到集合,即使它在那里。以下是错误跟踪:

Solr 版本是 6.6.2,zookeeper 版本是 3.4.10

如何创建与 solr 云集合的连接?

0 投票
1 回答
1046 浏览

python-3.x - 使用 pysolr 将数据保存到 solr 被拒绝'AttributeError:'str'对象没有属性'items''

我正在使用 pysolr 将类列表保存到我的本地 solr 数据库中,我的问题是,当我使用 jsonpickle 对类列表进行编码时,查询被此消息拒绝,尽管如果我打印由 josnpickle 生成的 json,我得到将数据保存到solr中没问题。

我的代码:

这是在将类列表编码为 json 之后打印的内容,[{"content": "content text", "id": "000002", "label": "some label"}] 正如我之前所说,如果我用这个字符串替换 json 变量,则数据被保存,但我不知道为什么,即使像这样转换为字符串也会solr.add(str(json))得到相同的错误消息。

0 投票
0 回答
736 浏览

python - pySolr : 添加多值字段

我想从熊猫数据框中填充一个 solr 索引。数据框如下:

等等

我正在执行以下操作将数据框转换为 json 对象,然后将其添加到 solr:

我收到以下错误:

非多值字段位置遇到多个值

如果我将 fied职位的名称更改为_position,那么它会起作用。从 pysolr 的文档页面,我了解到这会创建一个我并不真正想要的父/子依赖项。实际上,使用以下方法从索引中读取:

我得到这样的东西:

尽管有这种“骇人听闻”的解决方案,但我仍然没有得到好的结果:每个元素都是一个列表。我会更喜欢 tuples 的position和简单的 float 的value。我猜这来自转换为 json 时的orient关键字。

问题和预期输出

首先,我想避免将position重命名为_position。为了 pysolr,Solr 数据库不必包含重命名的字段。

其次,我想在从构建的 Solr 索引中读取时避免使用列表。我知道 Solr 不必包含列表作为数字元素。问题似乎来自从 DataFrame 到 json 的转换。这个怎么做?

0 投票
1 回答
2437 浏览

python - Python:使用 Pysolr 从 Solr 访问数据

我正在使用简单的 Python 脚本使用 Pysolr 从 Solr 获取示例数据。首先,我使用以下内容创建了我的核心

创建核心后,我运行简单的 python 脚本来获取数据

我收到此错误

但是当我尝试直接从 solr 运行查询时,我得到如下结果在此处输入图像描述

有人可以指导我在这里做错了什么吗?谢谢

0 投票
1 回答
425 浏览

python - 在 Solr/Python 中处理 facet.pivot 数据

我正在使用此 url 查询 Solr 核心:

使用Facet Pivot功能

部分 JSON 响应,注意字段是如何正确嵌套的:

现在我用 pySolr 复制相同的查询:

出于某种原因,当我打印数据(pdb 或 Django 模板)时,结果中的字典有 3 个不同的品牌数组、系列和子系列,没有原始嵌套。换句话说,pivot 字段消失了。

0 投票
1 回答
407 浏览

django - Djando-haystack 使用 Solr 索引列表而不是原始数据

我在使用django-haystack + Solr时遇到了一个奇怪的问题:每个字段都会收到一个列表,而不是实际的原始值。

索引后,这是我的 Solr 索引的摘录(从 Solr 管理员粘贴):

如您所见,每个相关数据都在一个 1 元素列表中建立索引,这使得进一步的查询变得不可能。

这是我的索引定义:

有什么建议吗?提前谢谢。

0 投票
1 回答
1339 浏览

python - 如何使用 Pysolr 进行构面搜索

当我们使用 curl 或 urlopen 和 facet 执行查询时,我们得到一个包含 3 个元素的嵌套字典 1. responseHeader 2. response 3. facet_counts

我想在使用 Pysolr 搜索时显示 facet_counts。它只显示查询输出的“响应”值。我正在尝试以下代码,请帮助。