问题标签 [pysolr]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

89 问题

0 投票

5 回答

2124 浏览

python-2.7 - pysolr 中的文档总数

如何获得与给定查询匹配的文档总数。我使用了以下查询：

由于默认返回值为'10'，所以输出只有10，但计数是4000。我怎样才能得到计数的总数？

2017-09-23T11:56:19.827

0 投票

1 回答

105 浏览

python - 使用 Solar 索引大型文档会导致异常

我正在尝试使用 pysolr 将文档添加到 Solr (5.3.2)。我生成了一个包含大文本和一些元数据（日期、作者...）的简单 JSON 对象，然后我尝试将其添加到 Solr。我的问题是超过一定大小，Solr 将无法索引文档并返回以下错误：

字段长度的某处似乎确实存在硬编码限制，但我找不到。

通过在 python 中玩耍，我发现：

会正常工作

会导致错误。

内容字段在我的 schema.xml 中定义为普通的 type="text_general" 字段。

编辑：这里是 schema.xml 定义

我尝试通过 Solr 的 Web 管理界面手动添加内容，但我遇到了完全相同的问题。

python search indexing solr pysolr

2017-10-12T09:20:31.417

0 投票

1 回答

779 浏览

python - Apache Solr 6.6 替换文档而不是更新

我已经为测试设置配置了 solr 6.6.1。索引几个文档后，我必须更新几个字段。我正在使用solr的 python 客户端。要更新，以下是我的代码片段

执行（和提交）后，所有其他字段都从所有文档中删除，只剩下两个字段，即 doc_id 和 group2。这个 API 或我的代码有什么问题？

python solr lucene pysolr

2017-11-13T05:02:08.473

0 投票

3 回答

1715 浏览

solr - 使用 pysolr 连接到 solr 云集合

我已经配置了一个多核 solr 云。创建了一个包含 2 个碎片且没有复制的集合。

通过 solr UI 192.168.1.56:8983，我可以得到查询结果。

我想对 pysolr 做同样的事情，所以尝试运行以下命令：

最后一行无法找到集合，即使它在那里。以下是错误跟踪：

Solr 版本是 6.6.2，zookeeper 版本是 3.4.10

如何创建与 solr 云集合的连接？

solr apache-zookeeper solrcloud pysolr

2017-11-13T11:53:05.980

0 投票

1 回答

1046 浏览

python-3.x - 使用 pysolr 将数据保存到 solr 被拒绝'AttributeError：'str'对象没有属性'items''

我正在使用 pysolr 将类列表保存到我的本地 solr 数据库中，我的问题是，当我使用 jsonpickle 对类列表进行编码时，查询被此消息拒绝，尽管如果我打印由 josnpickle 生成的 json，我得到将数据保存到solr中没问题。

我的代码：

这是在将类列表编码为 json 之后打印的内容，[{"content": "content text", "id": "000002", "label": "some label"}] 正如我之前所说，如果我用这个字符串替换 json 变量，则数据被保存，但我不知道为什么，即使像这样转换为字符串也会solr.add(str(json))得到相同的错误消息。

python-3.x solr pysolr

2017-12-15T02:00:20.517

0 投票

0 回答

736 浏览

python - pySolr : 添加多值字段

我想从熊猫数据框中填充一个 solr 索引。数据框如下：

等等

我正在执行以下操作将数据框转换为 json 对象，然后将其添加到 solr：

我收到以下错误：

非多值字段位置遇到多个值

如果我将 fied职位的名称更改为_position，那么它会起作用。从 pysolr 的文档页面，我了解到这会创建一个我并不真正想要的父/子依赖项。实际上，使用以下方法从索引中读取：

我得到这样的东西：

尽管有这种“骇人听闻”的解决方案，但我仍然没有得到好的结果：每个元素都是一个列表。我会更喜欢 tuples 的position和简单的 float 的value。我猜这来自转换为 json 时的orient关键字。

问题和预期输出

首先，我想避免将position重命名为_position。为了 pysolr，Solr 数据库不必包含重命名的字段。

其次，我想在从构建的 Solr 索引中读取时避免使用列表。我知道 Solr 不必包含列表作为数字元素。问题似乎来自从 DataFrame 到 json 的转换。这个怎么做？

python pandas solr pysolr

2017-12-16T11:15:56.843

0 投票

1 回答

2437 浏览

python - Python：使用 Pysolr 从 Solr 访问数据

我正在使用简单的 Python 脚本使用 Pysolr 从 Solr 获取示例数据。首先，我使用以下内容创建了我的核心

创建核心后，我运行简单的 python 脚本来获取数据

我收到此错误

但是当我尝试直接从 solr 运行查询时，我得到如下结果

有人可以指导我在这里做错了什么吗？谢谢

python solr pysolr

2017-12-18T16:59:53.557

0 投票

1 回答

425 浏览

python - 在 Solr/Python 中处理 facet.pivot 数据

我正在使用此 url 查询 Solr 核心：

使用Facet Pivot功能

部分 JSON 响应，注意字段是如何正确嵌套的：

现在我用 pySolr 复制相同的查询：

出于某种原因，当我打印数据（pdb 或 Django 模板）时，结果中的字典有 3 个不同的品牌数组、系列和子系列，没有原始嵌套。换句话说，pivot 字段消失了。

python solr pysolr

2018-03-26T21:15:59.923

0 投票

1 回答

407 浏览

django - Djando-haystack 使用 Solr 索引列表而不是原始数据

我在使用django-haystack + Solr时遇到了一个奇怪的问题：每个字段都会收到一个列表，而不是实际的原始值。

索引后，这是我的 Solr 索引的摘录（从 Solr 管理员粘贴）：

如您所见，每个相关数据都在一个 1 元素列表中建立索引，这使得进一步的查询变得不可能。

这是我的索引定义：

有什么建议吗？提前谢谢。

django solr lucene django-haystack pysolr

2018-04-21T09:54:38.153

0 投票

1 回答

1339 浏览

python - 如何使用 Pysolr 进行构面搜索

当我们使用 curl 或 urlopen 和 facet 执行查询时，我们得到一个包含 3 个元素的嵌套字典 1. responseHeader 2. response 3. facet_counts

我想在使用 Pysolr 搜索时显示 facet_counts。它只显示查询输出的“响应”值。我正在尝试以下代码，请帮助。

python solr pysolr

2018-06-06T12:14:57.330

1 2 3 4 5 6 7 8 9 10

问题标签 [pysolr]

Reference