问题标签 [pysolr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 尝试将数据添加到 solr 时使用 pysolr 出现 400 错误
使用 pysolr 尝试使用 Python3.9 将文档添加到 solr 并且即使只有 1 或 2 个字段也低于错误 400。我在这里使用的字段是动态字段。连接到 solr 没有问题。
出现以下错误:
dataframe - PySpark 地图功能 - 发送 n 行而不是 1 行来构建列表
我在 Python 中使用 Spark 3.x。我在 CSV 文件中有一些数据(以百万计),我必须在 Apache Solr 中编制索引。我为此目的部署了 pysolr 模块
index_module 模块只需将一行数据帧作为 json 获取,然后通过 pysolr 模块在 Solr 中进行索引。Pysolr 支持索引文档列表而不是一个。我必须更新我的逻辑,而不是在每个请求中发送一个文档,而是发送一个文档列表。确定性,它将提高性能。
如何在 PySpark 中实现这一点?是否有任何替代或最佳方法代替 map 和 toJSON ?
此外,我的所有活动都在转换功能中完成。我正在使用 count 来开始工作。spark中是否有任何替代的虚拟函数(动作类型)来做同样的事情?
最后,我每次都必须创建 Solr 对象,有什么替代方法吗?
python - pysolr.SolrError:Solr 响应错误(HTTP 409):[原因:预期版本冲突=实际=]
我正在尝试使用 Solr 搜索检索文档,然后尝试将具有相同 ID 的相同文档添加回 Solr。在这样做时,我遇到了版本冲突。基本上我正在添加url
链接,如下面的代码所示。
输出:
python - TypeError: index_queryset() 得到了一个意外的关键字参数“使用”
我正在按照 https://django-haystack.readthedocs.io/en/master/tutorial.html中的教程使用 Solr 创建 Django 应用程序。
在执行时./manage.py rebuild_index
,我收到如下错误:
自解决此错误 3 天以来,我一直坚持。尝试使用 solr 6.6 降级每个软件包(Django、pysolr、haystack,但没有帮助我。
请帮助我摆脱这个升级和降级的循环......在此先感谢
python - unicode' 对象没有属性 'items'
我正在使用 pysolr python 更新 solr 中的文档。我正在从 solr 文档中获取一个字段数据,并在更新后再次使用
基本上我再次在 solr 中摄取字典。但是我收到此错误:
solr - 如何在 Windows 中添加 solr 内核?
已下载(Apache solr 8.8.1)[https://archive.apache.org/dist/lucene/solr/8.1.1/]
在路径 \solr-8.8.1\bin
打开命令提示符,并执行以下命令
solr start
在浏览器中访问http://localhost:8983/solr/#/
点击 -> 核心管理员 -> 新核心
*填充核心名称,instanceDir,dataDir-data,config-(默认)solrconfig.xml,schema-(默认)schema.xml *
当我点击添加核心时,
我收到以下错误:
Error CREATEing SolrCore 'new_core': Unable to create core [new_core] Caused by: Can't find resource 'solrconfig.xml' in classpath or 'C:\Users\AnanyaStitipragyan\Desktop\CollabAI\solr-8.8.1\server\solr\new_core'
python-3.x - pysolr 在 solr 重启后第一次需要时间
pysolr 在 solr 重启后第一次需要时间。场景是这样的。1)重新启动 Solr 服务器 2)直接在 solr 中执行查询需要 4 秒 3)当我们尝试使用 pysolr 执行相同的查询时,第一次需要 300 秒或更长时间。刷新后只需不到 2 秒。
当我检查 pysolr 代码时,时间在下面的代码中。
4)任何人都可以帮助我第一次更快地出去。我认为这是不正常的,因为直接在 Solr 中执行查询只需要几秒钟。
python - 尝试使用 pandas 读取 excel 并将它们添加为 Pysolar/Solar 上的记录但得到 TypeError: a bytes-like object is required, not 'str'
我正在尝试使用熊猫从 excel 文件中读取特定列。当我尝试将这些记录添加到 Solr 时,得到了 TypeError。
我正在使用的代码 -
放置错误的堆栈跟踪 -
python - pysolr 搜索结果与具有相同查询的 apache solr 云结果不同
我在 pysolr 中有一个查询,结果与我在 solr 云中查询的结果不同,这很奇怪。
在 pysolr 中
这不能在 pysolr 中给出任何结果
但是当我在 solr cloud 中输入查询时,它实际上给了我结果。
这真是令人沮丧,有人可以帮助我吗?还是 pysolr 的 q.op 与 solr cloud 的 q.op 不一样?那可能吗?