问题标签 [xapian]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
django-haystack - Django-haystack 不更新索引
使用django-haystack 2.0.0和 xapian-haystack 2.0.0,从 1.1.5 迁移所有代码,如docs中所述。现在我的 search_indexes.py 看起来像:
但是当我去rebuild_index时,它说:
您确定要继续吗?[是/否] 是
因为您这么说,所以从您的索引中删除所有文档。删除所有文件。
冗长:
所以,我不知道为什么 haystack 不索引这个模型。
python-2.7 - 索引网页时如何使用返回URL的xapian
我正在使用 Ubuntu 12.04、Python 2.7
我从给定 URL 获取内容的代码:
要过滤由提供的页面的内容get_page(url)
:
如何对 in 进行索引filteredContent
,Xapian
以便在查询时返回URLs
查询所在的位置?
django - 使用 django-cms-search 0.2.6 所需的最少代码量是多少?
我想在我的项目中使用 django-cms-search 并将它与 xapian 和 xapian_backend 一起安装。在我的设置文件中,我定义了HAYSTACK_SEARCH_ENGINE
, HAYSTACK_SITECONF
and HAYSTACK_XAPIAN_PATH
(因为 django 系统有点老了)。此外,我还包含了 haystack.urls 并创建了相应的模板。
运行时未创建索引manage.py update_index
。
是否有必要将任何代码放入代码中HAYSTACK_SITECONF
?
文档建议我在HAYSTACK_SITECONF 中定义的目录中创建一个 models.py 文件并将此代码放入其中:
但这没有效果。
c++ - 带空格的 Xapian 过滤
如何使用带有空格的查询过滤搜索结果。
第一个查询“xapian title:good”效果很好。
但是“xapian title:Xapian is good”失败了。
谁能解释一下是什么问题
ruby - 如何有效地计算大型集合中的所有短语?
我需要创建一个短语频率表,计算包含几百万个单词的非常大的集合中的所有短语。最终结果将是一个表格,例如此处创建的表格: http ://www.hermetic.ch/wfca/phrases.htm
什么是实现这一点的有效算法?如果您能够展示一些细节,那么在 Ruby 中实现它会更好。或者,坦率地说,我什至对使用xapian或 lucene 持开放态度,但在根据需要构建频率表输出方面,并没有看到一种直接的方法来实现这一点。
python - Django Haystack-Xapian 搜索因特殊字符和空格而失败
我正在开发一个现有的 Django 项目,该项目使用带有 xapian 后端的 haystack 来实现全局搜索功能。但是,当我使用一些特殊字符(如 & 和空格等)进行搜索时,搜索似乎失败了。我尝试过但找不到修复它的方法。
有没有办法可以逃避这些字符并使搜索工作?我在后端使用 PostgreSQL。任何指针都会非常有帮助。
更新:搜索功能使用 SearchForm,查询字符串来自 q 字段。这在代码中如下所示。
我试过使用:
和
没有运气。我仍然无法使用空格和特殊字符(如 &)进行搜索。
macos - Nvim - 在 Macintosh 上安装 xapian 时遇到问题
系统:Mac OSX 最新
我使用端口安装了 xapian-core -
然后我打开 vim 并尝试使用 :Nvim 打开 nvim。我收到了一些错误-
有人可以让我知道我需要做什么才能让 Nvim 认识到我已经安装了 xapian。我猜我需要将 nvim.py 中的 import xapian 指向一个“硬编码”地址。就像是
import /usr/libs/xapian
有人可以让我知道我是否走在正确的轨道上,或者是否有更简单的方法让系统了解 xapian 现在对于 vim 的位置?
python - Django Haystack Xapian:默认和链接等,不起作用
这是我的干草堆配置:
我正在使用 haystack 的 views.SearchView
包括 Xapian 在内的所有软件包昨天都更新到了最新版本。
我正在搜索蔬菜和位置索引。当我搜索“carrot California”(不带引号)时,我会得到来自各地的结果,以及不同的蔬菜。当我搜索“胡萝卜和加利福尼亚”或“胡萝卜+加利福尼亚”时,也会发生同样的事情。但是,当我搜索“carrot AND California”时,我得到了正确的结果。
我手动设置HAYSTACK_DEFAULT_OPERATOR = 'AND'
,但这也不起作用。
有没有我缺少的设置?
更大的问题是,Haystack+Xapian 的最佳/最佳配置是什么?
python - Djapian:单字母查询加上通配符会导致错误
我一直在试验一个自动完成功能,它开始搜索用户输入的第一个字母。目前,对于自动完成,我们将通配符 ( *
) 附加到搜索词的末尾,以便我们可以匹配以该查询开头的词。但是,当使用只有一个字母加上通配符(例如s*
)的查询时,我收到以下回溯错误:
当我尝试查找带有异常值 ID 的记录时,找不到它,所以我不知道这个值是从哪里来的。有没有其他人经历过这个?
database - 如何通过编辑 omegaScript 来编辑 Omindex 生成的数据库文档的数据部分?
我已经能够使用本教程从数据库中设置和搜索一些文档:
数据字段被添加到从这个 bash 调用开始的索引过程中的每个文档中:
该调用索引目录中 /mnt/data0/Information 中的所有文件,并将其保存在名为 info 的数据库中。根据此处文档的最后一部分:
http://xapian.org/docs/omega/overview.html
根据上述文档,您可以通过编辑 OmegaScript 模板来设置进入文档数据字段的字段,但我无法在任何地方找到此模板。我希望我能从熟悉编辑 OmegaScript 以设置数据字段的人那里获得一些指导。
我最终希望数据具有以下字段:
示例字幕类型
没有 url 字段的标准。