问题标签 [xapian]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 如何处理xapian php异常
帮助使用 xapian php 包装器。
我有几个针对不同类别错误的自定义异常处理程序(我正在考虑将它们分开更多)。
Xapian 通过抛出标准异常对象来处理错误。我想为这些使用自定义异常处理程序。如何为已经抛出的标准异常使用自定义异常?或任何其他想法,也许如何让 Xapian 抛出其他异常类型?
solr - Xapian 的爬虫/解析器
我想实现一个搜索引擎,它应该抓取一组网站,从页面中提取特定信息并创建该特定信息的全文索引。
在我看来,Xapian 可能是搜索引擎库的不错选择。
爬虫/解析器与 Xapian 集成的选项有哪些?
在与开源爬虫/解析器集成时,Solr 会比 Xapian 更好吗?
ruby-on-rails - act_as_xapian 工作表
有人可以向我解释acts_as_xapian_jobs 表的内部工作原理吗?
我最近遇到了这个acts_as_xapian
插件的问题,当它创建一个带有 xapian 索引字段的对象时,我一直收到以下错误:
事实证明,model_id
超出了最大 int 值 2147483647。解决方法是更新model_id
以使用 bigint。为什么会model_id
这么大?通过查看 的内容acts_as_xapian_jobs
,它似乎为每个被索引的字段创建了一行。了解如何在表中创建作业将有很大帮助。
这是该表的示例:
提前致谢,
艾米
django - 基于 djapian 的搜索冻结
当我尝试运行基于 djapian 的搜索时,它会冻结应用程序并且我没有从服务器得到任何响应。我正在使用 mod_wsgi 部署站点。当我在 python shell 或 django 开发服务器中运行搜索时,搜索运行良好。问题似乎只有在我将网站部署到 apache 时才会出现。有谁知道我该如何解决这个问题?
search - 使用停用词进行 Xapian 多语言搜索?
我有两个 Xapian 数据库,我们称一个为“EN”,另一个为“DE”,假设前者包含一些英文文档,而后者包含一些德文文档。
如果我希望用户能够同时搜索这两个数据库,我可以轻松加载这两个数据库。但是,似乎我只能使用一个词干分析器和一组停用词?
没有办法实例化一个英语词干分析器并让它只应用于那些来自“EN”数据库的结果?没有办法用英文单词创建一个 Stopper,并且只适用于来自“EN”数据库的那些结果?
这可能是对的吗?
php - 狮身人面像 + 东京暴君 + mysql
我正在考虑为我的一个项目创建一个全文搜索引擎。我们有一个Mysql、Tokyo Tyrant 和需要索引的文件文档。
我现在正在查看 Sphinx,但我不知道是否可以使用它来索引每个文档。
我知道让 Sphinx 使用 Mysql 是可能的,但我正在寻找一种让 Sphinx 索引和查询 Tokyo Tyrant 以及索引文件文档的方法。
它可能是 Sphinx 或 Xapian 或另一个,但没有 JAVA(Lucene 已退出),但可以与 PHP 一起使用并在 Linux 上运行。
任何可以接受更多 Mysql 作为来源的搜索引擎的想法?
谢谢
python - Djapian - 过滤结果
我使用 Djapian 按关键字搜索对象,但我希望能够过滤结果。最好为此使用 Django 的 QuerySet API,例如:
但是 Djapian 返回 a ResultSet
ofHit
对象,而不是Model
对象。我当然可以在 Python 中“手动”过滤对象,但在过滤所有对象的情况下(当查询为空时)是不现实的——我必须从数据库中检索整个表。
我对此使用 Djapian 不走运吗?
django - Djapian 没有为 Django 创建索引器
我正在完成设置 Djapian 的教程,并尝试使用 indexshell(如本步骤所示)。当我运行命令“列表”时,我得到以下输出:
因此,我无法运行任何查询:
这导致我尝试:
我的 index.py 如下:
更新:我将 djapian 文件夹从 site-packages 移动到我的项目文件夹中,并将 index.py 从项目根目录移动到 djapian 文件夹中。当我在 indexshell 中运行“列表”时,现在返回以下内容:
我仍然无法做任何事情,因为当我尝试选择一个索引时,我仍然收到以下错误:
更新 2:我的 DJAPIAN_DATABASE_PATH 设置有问题,现在已修复。我可以使用命令“使用 0.0.0”选择索引器,但是当我尝试运行查询时,它会引发以下 ValueError:“空切片”。
django - Django、Xapian 和 Haystack 的 DataBaseLock 错误
我正在用 xapian/haystack 索引一个模型。当我在本地机器上测试它时,一切正常,但是当我尝试在服务器上保存模型时,Xapian 抛出 DatabaseLockError
我在官方 django haystack 网站上阅读了一些关于排队的信息。这是要走的路吗,如果是,我该如何实施?
python - 使用 Djapian 的 Django 模板中的“权限被拒绝”
我遵循 Djapian 教程并“按书”设置所有内容,以便 Djapian 提供的 indexshell 命令行显示成功的查询。
但是,当集成来自 Djapian 教程的示例搜索时,我得到了这个无意义的错误:
/search/ 处的 TemplateSyntaxError
渲染时遇到异常:(13,'Permission denied')
它指向这一行:
{% 如果结果 %}
更改或省略该行将在引用“结果”中的字段的任何行产生下一个(相同的)错误。
堆栈跟踪显示此异常:
OSError(13, '权限被拒绝')
在:
/usr/local/lib/python2.6/dist-packages/django/template/debug.py 在 render_node
django-debug-toolbar 显示结果:
<djapian.resultset.ResultSet 对象在 0x7f7142affcd0>
这是 Djapian 的问题吗?无论如何,为什么会产生“权限被拒绝”错误?