问题标签 [whoosh]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
353 浏览

django - Haystack/Whoosh SearchQuerySet 的 order_by 问题

我定义了一个索引,如下所示,对 doc中指定的 order_key 整数字段进行零填充。

当我运行 python manage.py rebuild_index 时,我可以正确地 order_by 我的 SearchQuerySet,但是一旦我运行 python manage.py update_index,带有 order_by 的 SearchQuerySet 总是返回一个空列表。

怎么了?

谢谢

0 投票
2 回答
1226 浏览

python - MongoDB 和嗖嗖声。我需要两者吗?

我正在开发使用 MongoDB 和 Whoosh 的项目。我想知道如果我可以使用 MongoDB 搜索,是否需要 Whoosh。我确信在系统中设置了 Whoosh,但我不确定我是否正确理解它的目的。请给我一些关于 MongoDB 本身没有提供什么的想法。

0 投票
1 回答
1376 浏览

python - Instant search with Whoosh - 使用 Whoosh 输出 JSON 结果索引和搜索 MySQL 表

我想使用 Whoosh 为 MySQL 表建立索引并创建一个即时搜索页面,因此我需要 Whoosh 搜索的结果为 JSON。是否已经有实现此功能的脚本或项目?我试过搜索,但我只发现 Haystack 搜索 Django。

如果不能,我可以得到一些广泛的指示,我应该如何去做。

谢谢。

0 投票
1 回答
715 浏览

django - django-cms-search 不显示任何结果

嘿,我一直在努力让 haystack 与 whoosh 一起为我一直在从事的 django cms 项目实施搜索后端。在找出一些非常奇怪的权限错误之后,我几乎可以尝到成功的滋味。

我现在有 haystack 正确创建索引,它甚至会显示我创建索引的自定义应用程序的结果,但是我无法让它显示 cms 页面内容的任何结果。由于我没有收到“无结果”消息,因此返回了结果,但在 results.html 模板中没有打印任何内容。

请记住,我让 django-cms-search 处理 cms 应用程序的索引,我认为我不需要添加任何额外内容来显示结果。

因此,概述一下我到目前为止使用 Whoosh 后端安装的 Haystack

我的setting.py设置是

我的search_sites.ph文件看起来像

我的主题模型有一个自定义索引,看起来像这样(这正在工作并恢复 Reuslts)

我的results.html模板看起来像

我显然在这里遗漏了一些明显的东西,任何帮助将不胜感激!

干杯

0 投票
4 回答
5614 浏览

python - 在 Python 中使用 Whoosh 进行模糊字符串搜索

我在 MongoDB 中建立了一个大型银行数据库。我可以轻松地获取这些信息并用它创建索引。例如,我希望能够匹配银行名称“Eagle Bank & Trust Co of Missouri”和“Eagle Bank and Trust Company of Missouri”。以下代码适用于简单的模糊等,但无法实现上述匹配:

给我:

Whoosh可以实现我想要的吗?如果不是,我还有什么其他基于 python 的解决方案?

0 投票
1 回答
1293 浏览

python - 内置支持 doc、docx 和 pdf 文件的文本索引器(用于 python)

我目前正在为我的 python 程序寻找文本索引器。我入围了 Solr,一个 Lucene 项目和 Whoosh,它是 Python 原生的。我搜索了很多关于对 doc、docx 和 pdf 文件的支持的文档,Solr 一直将我指向 Tika 包,它的一个版本与 Solr 集成。

结果并没有在某些方面提及是否有任何包具有对这三种格式的内置支持。Whoosh 和 Solr 是否支持他们?还有哪些其他开源索引器本机读取这些格式?

0 投票
3 回答
2930 浏览

python - 在 Lucene/Solr、Whoosh、Sphinx、Xapian 中,哪个与 python 集成得最好?

我是一家初创公司的新手编码员,我正在实现在网络主机的目录中搜索文档。

我在比较 Lucene/Solr、Whoosh、Sphinx 和 Xapian。Whoosh 是原生的 python。但我也想听听你的意见。其中哪些有

  • 成熟好用的python安装接口?(嗖嗖嗖嗖嗬嗬)
  • 没有发生崩溃、瓶颈和其他故障的机会
  • 最佳文档接口(我不阅读 PHP 文档,因为 python 文档很少)
  • 最容易启动和运行(只有一个有快速入门教程)
0 投票
1 回答
972 浏览

solr - Lucene/Solr、Whoosh、Sphinx、Xapian 中的文档搜索

我正在比较 Lucene/Solr、Whoosh、Sphinx 和 Xapian 在 DOC、DOCX、HTML 和 PDF 中搜索文档。只有 Solr 被记录为具有直接索引文档的文档解析器 (Tika)。所以这似乎是一个明显的赢家。

但为了公平竞争,我喜欢考虑替代方案。其他人是否有直接的文档索引(我可能错过了)?如果不是,它们可以轻松实施吗?还是 Solr 是压倒性的选择?

0 投票
1 回答
2494 浏览

python - Whoosh:索引 MS 文档、PDF

我想使用 python 进行文档搜索。Solr 是不行的,因为 Java 托管是一个限制。

所以嗖嗖似乎是显而易见的选择。但它似乎不能原生索引 doc 或 pdf 文件(就像 Solr 一样)。让它直接索引这些文件的方法是什么?

0 投票
1 回答
1935 浏览

python - whoosh 是否要求所有字符串都是 unicode?

我正在从 Solr 重做我在 Whoosh 中的搜索应用程序。我现在正在从快速入门中学习。但是每次我必须处理字符串时,我都会遇到问题

>>>writer.add_document(iden=fil, content=F2T.file_to_text(fil_path)) ValueError: 'File Name.doc' is not unicode or sequence

接着:

那条线直接来自快速入门教程!Whoosh 是否要求所有字段都为 unicode?让我的应用程序能够识别 unicode 将是一项非常艰巨的工作(甚至不值得)。至于“不是unicode或sequence”,我理解string也是一种sequence数据类型。