问题标签 [xapian]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
533 浏览

php - 如何处理xapian php异常

帮助使用 xapian php 包装器。

我有几个针对不同类别错误的自定义异常处理程序(我正在考虑将它们分开更多)。
Xapian 通过抛出标准异常对象来处理错误。我想为这些使用自定义异常处理程序。如何为已经抛出的标准异常使用自定义异常?或任何其他想法,也许如何让 Xapian 抛出其他异常类型?

0 投票
2 回答
1557 浏览

solr - Xapian 的爬虫/解析器

我想实现一个搜索引擎,它应该抓取一组网站,从页面中提取特定信息并创建该特定信息的全文索引。

在我看来,Xapian 可能是搜索引擎库的不错选择。

爬虫/解析器与 Xapian 集成的选项有哪些?

在与开源爬虫/解析器集成时,Solr 会比 Xapian 更好吗?

0 投票
1 回答
260 浏览

ruby-on-rails - act_as_xapian 工作表

有人可以向我解释acts_as_xapian_jobs 表的内部工作原理吗?

我最近遇到了这个acts_as_xapian插件的问题,当它创建一个带有 xapian 索引字段的对象时,我一直收到以下错误:

事实证明,model_id超出了最大 int 值 2147483647。解决方法是更新model_id以使用 bigint。为什么会model_id这么大?通过查看 的内容acts_as_xapian_jobs,它似乎为每个被索引的字段创建了一行。了解如何在表中创建作业将有很大帮助。

这是该表的示例:

提前致谢,

艾米

0 投票
1 回答
180 浏览

django - 基于 djapian 的搜索冻结

当我尝试运行基于 djapian 的搜索时,它会冻结应用程序并且我没有从服务器得到任何响应。我正在使用 mod_wsgi 部署站点。当我在 python shell 或 django 开发服务器中运行搜索时,搜索运行良好。问题似乎只有在我将网站部署到 apache 时才会出现。有谁知道我该如何解决这个问题?

0 投票
1 回答
652 浏览

search - 使用停用词进行 Xapian 多语言搜索?

我有两个 Xapian 数据库,我们称一个为“EN”,另一个为“DE”,假设前者包含一些英文文档,而后者包含一些德文文档。

如果我希望用户能够同时搜索这两个数据库,我可以轻松加载这两个数据库。但是,似乎我只能使用一个词干分析器和一组停用词?

没有办法实例化一个英语词干分析器并让它只应用于那些来自“EN”数据库的结果?没有办法用英文单词创建一个 Stopper,并且只适用于来自“EN”数据库的那些结果?

这可能是对的吗?

0 投票
2 回答
825 浏览

php - 狮身人面像 + 东京暴君 + mysql

我正在考虑为我的一个项目创建一个全文搜索引擎。我们有一个Mysql、Tokyo Tyrant 和需要索引的文件文档。

我现在正在查看 Sphinx,但我不知道是否可以使用它来索引每个文档。

我知道让 Sphinx 使用 Mysql 是可能的,但我正在寻找一种让 Sphinx 索引和查询 Tokyo Tyrant 以及索引文件文档的方法。

它可能是 Sphinx 或 Xapian 或另一个,但没有 JAVA(Lucene 已退出),但可以与 PHP 一起使用并在 Linux 上运行。

任何可以接受更多 Mysql 作为来源的搜索引擎的想法?

谢谢

0 投票
2 回答
860 浏览

python - Djapian - 过滤结果

我使用 Djapian 按关键字搜索对象,但我希望能够过滤结果。最好为此使用 Django 的 QuerySet API,例如:

但是 Djapian 返回 a ResultSetofHit对象,而不是Model对象。我当然可以在 Python 中“手动”过滤对象,但在过滤所有对象的情况下(当查询为空时)是不现实的——我必须从数据库中检索整个表。

我对此使用 Djapian 不走运吗?

0 投票
2 回答
416 浏览

django - Djapian 没有为 Django 创建索引器

我正在完成设置 Djapian 的教程,并尝试使用 indexshell(如本步骤所示)。当我运行命令“列表”时,我得到以下输出:

因此,我无法运行任何查询:

这导致我尝试:

我的 index.py 如下:

更新:我将 djapian 文件夹从 site-packages 移动到我的项目文件夹中,并将 index.py 从项目根目录移动到 djapian 文件夹中。当我在 indexshell 中运行“列表”时,现在返回以下内容:

我仍然无法做任何事情,因为当我尝试选择一个索引时,我仍然收到以下错误:

更新 2:我的 DJAPIAN_DATABASE_PATH 设置有问题,现在已修复。我可以使用命令“使用 0.0.0”选择索引器,但是当我尝试运行查询时,它会引发以下 ValueError:“空切片”。

0 投票
1 回答
266 浏览

django - Django、Xapian 和 Haystack 的 DataBaseLock 错误

我正在用 xapian/haystack 索引一个模型。当我在本地机器上测试它时,一切正常,但是当我尝试在服务器上保存模型时,Xapian 抛出 DatabaseLockError

我在官方 django haystack 网站上阅读了一些关于排队的信息。这是要走的路吗,如果是,我该如何实施?

0 投票
1 回答
2597 浏览

python - 使用 Djapian 的 Django 模板中的“权限被拒绝”

我遵循 Djapian 教程并“按书”设置所有内容,以便 Djapian 提供的 indexshell 命令行显示成功的查询。

但是,当集成来自 Djapian 教程的示例搜索时,我得到了这个无意义的错误:

/search/ 处的 TemplateSyntaxError

渲染时遇到异常:(13,'Permission denied')

它指向这一行:

{% 如果结果 %}

更改或省略该行将在引用“结果”中的字段的任何行产生下一个(相同的)错误。

堆栈跟踪显示此异常:

OSError(13, '权限被拒绝')

在:

/usr/local/lib/python2.6/dist-packages/django/template/debug.py 在 render_node

django-debug-toolbar 显示结果:

<djapian.resultset.ResultSet 对象在 0x7f7142affcd0>

这是 Djapian 的问题吗?无论如何,为什么会产生“权限被拒绝”错误?