问题标签 [whoosh]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
308 浏览

python - 非布尔搜索查询的嗖嗖声

我正在构建一个问答系统,为了加快进程,我希望 IR 系统从可能包含该问题答案的语料库中返回一组文档(我的 NLP 算法将尝试从全文)。

由于我使用的是 Python,因此 Whoosh 似乎是一个不错的选择,但我很难用纯布尔查询以外的方法进行搜索,这些方法不适合问答。我想要一个与字符串查询具有高 TF-IDF 相似性的文档列表。

我想输入:

“谁是美国总统?”

并获得最相似的文档,但我只是去掉了停用词:

“总统或美国或美国”

准确性不适用于 QA 流程。谁能指出一些方法或高级 API 方法以非布尔方式获取顶级文档?我愿意尝试其他库,但大多数库似乎很难与 Python 快速交互,我希望有一些超级简单的东西,这样我就可以继续专注于自然语言组件。

0 投票
2 回答
137 浏览

python - 某些关键字上的 Django Haystack 错误

我在我的平台上使用haystackwhoosh,它每小时运行一次,为我的内容编制索引。

我发现对于某些字符串,它会引发

错误。

其中一些字符串包括“Shoot”、“Zero”和其他一些我不记得的字符串。

你以前有没有遇到过这个问题,有没有办法摆脱这个问题?

0 投票
2 回答
2031 浏览

django - Django haystack,搜索中某些字段的优先级

我有一个这样的模型:

我想在这个模型的字段上搜索字符串。假设 MyModel 的这些实例:

当我搜索“你”时,它应该向我显示第一个和第二个实例。最后,我需要显示 desc1 中“你”的结果高于其他结果。例如,在此示例中,第二个应该高于第一个。

我已经使用 haystack 进行搜索并为此创建了一个模板。但我无法解决优先级问题。

0 投票
1 回答
957 浏览

django - 干草堆搜索多个字段

我目前正在 django 中构建一个页面,其中有 4 个表单字段、2 个文本、2 个选择字段,当提交时,它会获取这些字段并搜索多个模型以查找匹配项。

模型如下所示:

我正在尝试搜索 first_name 字段、last_name 字段、nationality 字段和 experience 字段,但是如果 first_name 字段为空,我需要传递一个空值,以便它返回所有行,然后从那里过滤姓氏以同样的方式,由于某种原因,它对我来说根本不起作用。这是我的sqs:

有任何想法吗?

0 投票
1 回答
548 浏览

django - 使用 Whoosh 的 Django Haystack 随机错误

我在我的 Ubuntu 服务器上使用django-haystackandWhoosh并发现某些搜索查询只会引发错误页面,我不知道为什么会发生这种情况......

我正在使用以下

我也python manage.py update_index每小时跑一次

示例回溯

0 投票
1 回答
961 浏览

django-haystack - Django haystack,如何匹配部分单词?

我在 Django 1.4 中使用 haystack 1.2.7 + whoosh 2.4.0(Python 是 2.7)

示例:搜索查询“sear”应匹配包含“search”、“sear”和“searching”(等)的项目。

我的设置:

搜索索引:

还尝试使用 EdgeNgramField 和/或 RealTimeSearchIndex

自定义 urlCONF:

自定义视图:

对于 sqs,我已经尝试了所有可以想象的方法,使用过滤器和自动完成功能,如文档和我能找到的每个相关论坛帖子中所见;将 __startswith 和 __contains 与我的 content_auto 或文本字段结合使用根本没有帮助(后者根本不匹配任何内容;而前者仅匹配 1 个字符或完整的字符串)

上面粘贴的变体至少具有返回带有空格的字符串的结果的好处(每个单词仍然必须完全匹配相应的数据库条目,因此需要这篇文章)

任何帮助将不胜感激

0 投票
1 回答
63 浏览

whoosh - Whoosh 按时间间隔分组

我有以下结构,并使用 Whoosh 进行索引。

我想进行查询以获取以下结构,因此它每 5 分钟显示一次名称频率

0 投票
1 回答
2490 浏览

python - 使用 whoosh 的智能字符串搜索 python(也许)

我需要制作一个比 python 中的 find() 更智能的搜索方法。可以找到类似单词的东西更像是搜索引擎。我听说过 Whoosh,安装了它,但我什至不明白从哪里开始。有人可以教我一些非常基本的嗖嗖字符串搜索方法或给我另一种选择吗?

0 投票
3 回答
1331 浏览

django - 按模型类型查找 haystack 结果的数量?

假设我想使用 django-haystack 搜索 3 个模型(注释、评论、文章),并设置了 3 个这样的索引。

当我得到我的结果时,我可以使用作者方面来显示作者的结果数量。

但是我怎样才能找出模型类型有多少结果呢?例如。

注释:4 评论:2 文章:1

理想情况下,我想过滤它,就像一个正常的方面。我现在正在使用 FacetedModelSearchForm,我可以看到模型类型,只是无法获取计数值。这可能吗?如果是这样,怎么做?

类似问题:

看起来其他人也问过这个问题,但可能没有问得足够清楚。

模型类型上的 Django Haystack 刻面

这个类似,但他们只想按内容类型排序,我想按内容类型计数。

使用 django-haystack,如何按内容类型对结果进行排序

这是另一个类似的问题,但不完全相同,同样也没有答案。

Django Haystack 分面示例

0 投票
1 回答
464 浏览

python - 带有嗖嗖声的干草堆-搜索结果不重定向

我成功安装了 whoosh 并使它与 Haystack 一起工作。一切正常,但我面临一个问题:搜索关键字并打印出结果后,当我点击结果(标题)时,它不会将我重定向到我点击的关键字的页面,它只是静态的。我尝试添加一个 get_absolute_url 方法。然而它不起作用。我错过了什么?

楷模

搜索/search.html

网址配置

意见: