问题标签 [xapian]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
667 浏览

django-haystack - Django-haystack 不更新索引

使用django-haystack 2.0.0和 xapian-haystack 2.0.0,从 1.1.5 迁移所有代码,如docs中所述。现在我的 search_indexes.py 看起来像:

但是当我去rebuild_index时,它说:

您确定要继续吗?[是/否] 是

因为您这么说,所以从您的索引中删除所有文档。删除所有文件。

冗长:

所以,我不知道为什么 haystack 不索引这个模型。

0 投票
1 回答
228 浏览

python-2.7 - 索引网页时如何使用返回URL的xapian

我正在使用 Ubuntu 12.04、Python 2.7

我从给定 URL 获取内容的代码:

要过滤由提供的页面的内容get_page(url)

如何对 in 进行索引filteredContentXapian以便在查询时返回URLs查询所在的位置?

0 投票
0 回答
129 浏览

django - 使用 django-cms-search 0.2.6 所需的最少代码量是多少?

我想在我的项目中使用 django-cms-search 并将它与 xapian 和 xapian_backend 一起安装。在我的设置文件中,我定义了HAYSTACK_SEARCH_ENGINE, HAYSTACK_SITECONFand HAYSTACK_XAPIAN_PATH(因为 django 系统有点老了)。此外,我还包含了 haystack.urls 并创建了相应的模板。

运行时未创建索引manage.py update_index

是否有必要将任何代码放入代码中HAYSTACK_SITECONF

文档建议我在HAYSTACK_SITECONF 中定义的目录中创建一个 models.py 文件并将此代码放入其中:

但这没有效果。

0 投票
2 回答
231 浏览

c++ - 带空格的 Xapian 过滤

如何使用带有空格的查询过滤搜索结果。

第一个查询“xapian title:good”效果很好。

但是“xapian title:Xapian is good”失败了。

谁能解释一下是什么问题

0 投票
1 回答
134 浏览

ruby - 如何有效地计算大型集合中的所有短语?

我需要创建一个短语频率表,计算包含几百万个单词的非常大的集合中的所有短语。最终结果将是一个表格,例如此处创建的表格: http ://www.hermetic.ch/wfca/phrases.htm

什么是实现这一点的有效算法?如果您能够展示一些细节,那么在 Ruby 中实现它会更好。或者,坦率地说,我什至对使用xapian或 lucene 持开放态度,但在根据需要构建频率表输出方面,并没有看到一种直接的方法来实现这一点。

0 投票
2 回答
898 浏览

python - Django Haystack-Xapian 搜索因特殊字符和空格而失败

我正在开发一个现有的 Django 项目,该项目使用带有 xapian 后端的 haystack 来实现全局搜索功能。但是,当我使用一些特殊字符(如 & 和空格等)进行搜索时,搜索似乎失败了。我尝试过但找不到修复它的方法。

有没有办法可以逃避这些字符并使搜索工作?我在后端使用 PostgreSQL。任何指针都会非常有帮助。

更新:搜索功能使用 SearchForm,查询字符串来自 q 字段。这在代码中如下所示。

我试过使用:

没有运气。我仍然无法使用空格和特殊字符(如 &)进行搜索。

0 投票
1 回答
293 浏览

macos - Nvim - 在 Macintosh 上安装 xapian 时遇到问题

系统:Mac OSX 最新

我使用端口安装了 xapian-core -

然后我打开 vim 并尝试使用 :Nvim 打开 nvim。我收到了一些错误-

有人可以让我知道我需要做什么才能让 Nvim 认识到我已经安装了 xapian。我猜我需要将 nvim.py 中的 import xapian 指向一个“硬编码”地址。就像是

import /usr/libs/xapian

有人可以让我知道我是否走在正确的轨道上,或者是否有更简单的方法让系统了解 xapian 现在对于 vim 的位置?

0 投票
1 回答
47 浏览

python - Django Haystack Xapian:默认和链接等,不起作用

这是我的干草堆配置:

我正在使用 haystack 的 views.SearchView

包括 Xapian 在内的所有软件包昨天都更新到了最新版本。

我正在搜索蔬菜和位置索引。当我搜索“carrot California”(不带引号)时,我会得到来自各地的结果,以及不同的蔬菜。当我搜索“胡萝卜和加利福尼亚”或“胡萝卜+加利福尼亚”时,也会发生同样的事情。但是,当我搜索“carrot AND California”时,我得到了正确的结果。

我手动设置HAYSTACK_DEFAULT_OPERATOR = 'AND',但这也不起作用。

有没有我缺少的设置?

更大的问题是,Haystack+Xapian 的最佳/最佳配置是什么?

0 投票
0 回答
33 浏览

python - Djapian:单字母查询加上通配符会导致错误

我一直在试验一个自动完成功能,它开始搜索用户输入的第一个字母。目前,对于自动完成,我们将通配符 ( *) 附加到搜索词的末尾,以便我们可以匹配以该查询开头的词。但是,当使用只有一个字母加上通配符(例如s*)的查询时,我收到以下回溯错误:

当我尝试查找带有异常值 ID 的记录时,找不到它,所以我不知道这个值是从哪里来的。有没有其他人经历过这个?

0 投票
1 回答
379 浏览

database - 如何通过编辑 omegaScript 来编辑 Omindex 生成的数据库文档的数据部分?

我已经能够使用本教程从数据库中设置和搜索一些文档:

a) http://www.ibm.com/developerworks/opensource/library/os-xapianomega/index.html?cmp=dw&cpb=dwope&ct=dwnew&cr=dwnen&ccy=zz&csr=110410

数据字段被添加到从这个 bash 调用开始的索引过程中的每个文档中:

该调用索引目录中 /mnt/data0/Information 中的所有文件,并将其保存在名为 info 的数据库中。根据此处文档的最后一部分:

http://xapian.org/docs/omega/overview.html

根据上述文档,您可以通过编辑 OmegaScript 模板来设置进入文档数据字段的字段,但我无法在任何地方找到此模板。我希望我能从熟悉编辑 OmegaScript 以设置数据字段的人那里获得一些指导。

我最终希望数据具有以下字段:

示例字幕类型

没有 url 字段的标准。