问题标签 [pysolr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - pysolr 中的文档总数
如何获得与给定查询匹配的文档总数。我使用了以下查询:
由于默认返回值为'10',所以输出只有10,但计数是4000。我怎样才能得到计数的总数?
python - 使用 Solar 索引大型文档会导致异常
我正在尝试使用 pysolr 将文档添加到 Solr (5.3.2)。我生成了一个包含大文本和一些元数据(日期、作者...)的简单 JSON 对象,然后我尝试将其添加到 Solr。我的问题是超过一定大小,Solr 将无法索引文档并返回以下错误:
字段长度的某处似乎确实存在硬编码限制,但我找不到。
通过在 python 中玩耍,我发现:
会正常工作
会导致错误。
内容字段在我的 schema.xml 中定义为普通的 type="text_general" 字段。
编辑:这里是 schema.xml 定义
我尝试通过 Solr 的 Web 管理界面手动添加内容,但我遇到了完全相同的问题。
python - Apache Solr 6.6 替换文档而不是更新
我已经为测试设置配置了 solr 6.6.1。索引几个文档后,我必须更新几个字段。我正在使用solr的 python 客户端。要更新,以下是我的代码片段
执行(和提交)后,所有其他字段都从所有文档中删除,只剩下两个字段,即 doc_id 和 group2。这个 API 或我的代码有什么问题?
python-3.x - 使用 pysolr 将数据保存到 solr 被拒绝'AttributeError:'str'对象没有属性'items''
我正在使用 pysolr 将类列表保存到我的本地 solr 数据库中,我的问题是,当我使用 jsonpickle 对类列表进行编码时,查询被此消息拒绝,尽管如果我打印由 josnpickle 生成的 json,我得到将数据保存到solr中没问题。
我的代码:
这是在将类列表编码为 json 之后打印的内容,[{"content": "content text", "id": "000002", "label": "some label"}]
正如我之前所说,如果我用这个字符串替换 json 变量,则数据被保存,但我不知道为什么,即使像这样转换为字符串也会solr.add(str(json))
得到相同的错误消息。
python - pySolr : 添加多值字段
我想从熊猫数据框中填充一个 solr 索引。数据框如下:
等等
我正在执行以下操作将数据框转换为 json 对象,然后将其添加到 solr:
我收到以下错误:
非多值字段位置遇到多个值
如果我将 fied职位的名称更改为_position,那么它会起作用。从 pysolr 的文档页面,我了解到这会创建一个我并不真正想要的父/子依赖项。实际上,使用以下方法从索引中读取:
我得到这样的东西:
尽管有这种“骇人听闻”的解决方案,但我仍然没有得到好的结果:每个元素都是一个列表。我会更喜欢 tuples 的position和简单的 float 的value。我猜这来自转换为 json 时的orient关键字。
问题和预期输出
首先,我想避免将position重命名为_position。为了 pysolr,Solr 数据库不必包含重命名的字段。
其次,我想在从构建的 Solr 索引中读取时避免使用列表。我知道 Solr 不必包含列表作为数字元素。问题似乎来自从 DataFrame 到 json 的转换。这个怎么做?
python - 在 Solr/Python 中处理 facet.pivot 数据
我正在使用此 url 查询 Solr 核心:
使用Facet Pivot功能
部分 JSON 响应,注意字段是如何正确嵌套的:
现在我用 pySolr 复制相同的查询:
出于某种原因,当我打印数据(pdb 或 Django 模板)时,结果中的字典有 3 个不同的品牌数组、系列和子系列,没有原始嵌套。换句话说,pivot 字段消失了。
django - Djando-haystack 使用 Solr 索引列表而不是原始数据
我在使用django-haystack + Solr时遇到了一个奇怪的问题:每个字段都会收到一个列表,而不是实际的原始值。
索引后,这是我的 Solr 索引的摘录(从 Solr 管理员粘贴):
如您所见,每个相关数据都在一个 1 元素列表中建立索引,这使得进一步的查询变得不可能。
这是我的索引定义:
有什么建议吗?提前谢谢。
python - 如何使用 Pysolr 进行构面搜索
当我们使用 curl 或 urlopen 和 facet 执行查询时,我们得到一个包含 3 个元素的嵌套字典 1. responseHeader 2. response 3. facet_counts
我想在使用 Pysolr 搜索时显示 facet_counts。它只显示查询输出的“响应”值。我正在尝试以下代码,请帮助。