问题标签 [xapian]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby-on-rails-3 - Rails 3 的全文搜索
我正在评估 Rails 3 ATM 的全文搜索方法。这里有人推荐吗?在我看来,好像大多数已知的方法(Sunspot、Sphinx、Ferret、Xapian)还没有为 Rails 3 做好准备。是这样吗?目前,如果我想部署我的应用程序,我的机器上还剩下大量资源,但是,我希望尽可能降低搜索引擎的空闲负载。如果这里有任何相关性,我打算使用 PostgreSQL。
经过一番阅读,我几乎可以肯定我想使用 Sunspot 或 Xapian。但是如果有任何其他(和更好的)解决方案,请告诉我:-) 特别是关于 Sunspot,我不确定除了我的 Rails 应用程序之外运行一个完整的 Tomcat 是否聪明。有人对这个星座有经验吗?
提前致谢, 乌尔夫
python - 在 CentOS 5.5 上安装 Xapian for Python 2.6
我在 CentOS 5.5 上将 Django 1.2 用于 Python 2.6,并且我正在尝试安装 Django Haystack,并将 Xapian 作为搜索后端。我遵循了http://docs.haystacksearch.org/dev/installing_search_engines.html#xapian上的安装说明以及http://xapian.org/download上的 RedHat Enterprise Linux RPM 包的说明。Xapian 已安装,但已附加到 Python 2.4,由于其他原因需要存在于 CentOS 中。因此,如果我进入“python”外壳并“导入 xapian”,它可以正常工作,但如果我进入“python26”外壳和“导入 xapian”,我会收到错误“没有名为 Xapian 的模块”。
然后,我尝试在 python 2.6 站点包中创建指向 python 2.4 站点包中 Xapian 的符号链接,当尝试在 python 2.6 shell 中导入 xapian 时,这给了我以下错误:
RuntimeWarning: Python C API version mismatch for module _xapian: This Python 的 API 版本为 1013,模块 _xapian 的版本为 1012。
我还尝试指定在配置 xapian-core 时使用的 python 库,如http://invisibleroads.com/tutorials/xapian-search-pylons.html#install-xapian-on-webfaction所示,所以我的命令使用的是: ./
configure PYTHON=/usr/bin/python2.6
然后用于安装 xapian-bindings 我使用:./
configure PYTHON=/usr/bin/python26 PYTHON_LIB=/usr/lib/python2.6 --with- python
这没有明显的区别,所以我现在有点卡住了。有没有人有任何想法?
java - Java CSS 爬虫
我正在寻找一个能够抓取页面 CSS 的网络爬虫。我不需要任何其他花哨的爬行能力。
我正在尝试通过 Xapian、Nutch 和 Heritrix。它们似乎都有点复杂。如果有人有任何经验或建议,我很想听听。也欢迎提供上述任何平台的可访问教程。
大卫
python - Py_InitModule4 与 Djapian/Xapian
我正在尝试在 RedHat5 / Python2.6 上安装 Djapian。我已经在我的 OSX 10.6 机器上成功安装了它。
我已经为 Py2.6 构建和编译 Xapian 和 Djapian 没有问题。然后我为 Xapian 安装 Python 绑定,它工作正常,但是,如果打开 Python 解释器并输入“import xapian,或者尝试在我的 Django 应用程序中包含 djapian,我会收到以下错误:
/usr/lib64/python2.6/site-packages/_xapian.so:未定义符号:Py_InitModule4
在搜索中,我已经在几个模块中看到了这个问题,而不仅仅是 Xapian,但我似乎找不到一个好的解决方案。我确实安装了 python-devel。
我猜问题出在 Python 方面,而不是 Xapian。
django - django centos xapian haystack
我刚刚在我的 root 用户和最终我的其他用户上使用 django-haystack 和 xapian 进行了一些安装过程,所有响应似乎都还可以。
即使我在我other_user
的外壳中,并且正在运行import xapian
,并且import haystack
它全部运行而没有任何错误。
一旦我#'haystack',
在我的设置文件中取消注释。并重新启动 apache 它会引发错误
安装了 xapian-core,xapian-bindings
任何想法为什么它仍然不起作用?
这是我的配置
c# - xapian 问题 - 32 位 C# windows
关于如何使用 C# 在 Windows 上编译和使用 Xapian。我有同样的问题,但我运行的是 32 位 Windows,并且我的平台也设置为在 x86 上运行。我能做些什么?
我也无法引用 zlib1.dll,每次我尝试它都告诉我它不是有效的 COM 或程序集。我正在使用视觉工作室 2010
对于那些尝试过的人,有什么建议吗?或者可能知道这样的错误:'Xapian.Xapian' 的类型初始化程序引发了异常。
lucene - 部分单词的文档搜索
我正在寻找能够搜索部分术语的文档搜索引擎(如 Xapian、Whoosh、Lucene、Solr、Sphinx 或其他)。
例如,当搜索术语“brit”时,搜索引擎应该返回包含“britney”或“britain”的文档,或者通常包含与 r 匹配的单词的任何文档*brit*
切线地,我注意到大多数引擎使用 TF-IDF(词频-逆文档频率)或其基于完整词而不是部分词的派生词。除了 TF-IDF 之外,还有没有其他成功实现文档检索的技术?
django - django xapian-haystack 权限问题
我一直在尝试让 xapian 工作 django haystack 用于我正在从事的项目,该项目需要一些搜索功能,但遇到了一些障碍!基本上我按照说明安装了所有东西,所以:
为 xapian-core 和 xapian 绑定运行 make install 运行 pip install haystack 和 pip install xapian-haystack 并正确安装所有内容
当我使用 django cms 应用程序时,我只是复制了他们的示例以对搜索功能进行测试并遇到此错误
我已经为 HAYSTACK_XAPIAN_PATH 设置尝试了几种不同的路径,并且还遇到了另一个错误
文件夹 xapain_search 已获得完整权限(chmod 777),并且还有一个具有完整权限的 xapian_index.php 文件。我不确定我在这里缺少什么,但我很想尝试让这个工作!
我的干草堆设置看起来像
任何建议将不胜感激!!
编辑
嘿,我再次认为这个错误与没有索引的事实有关(对吗?)我已经运行了命令 update_index rebuild_index clear_index 所有这些似乎都没有做任何事情,没有输出错误,但索引仍然没有出现运行命令时构建
我有一个名为 lactose_search 的应用程序,我的 HAYSTACK_SITECONF 指向这样的应用程序文件夹中的 projectname.lactose_search 我有一个名为 search_indexs.py 的文件。现在我只需 c+p 来自 django cms 站点的示例,因为它是我要搜索的 cms_app 内容,这个文件看起来像
可以在这里找到http://docs.django-cms.org/en/2.1.3/extending_cms/searchdocs.html
希望这些额外的信息可以使回答这个问题更容易!
qt - Qt + xapian 库
我正在尝试在我的 Qt 项目中使用 Xapian 库。我刚刚添加了标题:
这里已经有一些错误:
还有这个:
我不知道这是什么意思。但我想我应该在我的个人资料中添加一些东西。请你帮助我好吗?谢谢。
full-text-search - Sphinx 与 Haystack 的搜索性能
我想知道是否有人已经或可以指出使用 Sphinx 进行搜索与带有 Xapian 后端的 Haystack 的性能基准测试结果的方向。我主要关心单个表中单个字段的全文搜索。
其中哪一个会“更快”?两者都有哪些优点/缺点?谢谢你。