我们在研究档案中遇到了不同的搜索引擎,并浏览了 Xapian-Omega 文档,我们决定尝试一下,因为 Omega 选项似乎是一个合适的解决方案,有几个有趣的搜索选项。
我们在 Linux 服务器(Deb 7)上安装了 Xapian-Omega,并成功测试了设置。但是,我们不确定如何在 Xapian-Omega 中使用或什至启用通配符或正则表达式。
我们读到,对于 Xapian,必须启用通配符选项“QueryParser flags”有人可以澄清一下吗?IE。用一两个例子解释或指出一个页面。
但是我们没有看到太多关于 Omega CGI 示例的信息,尽管后者运行良好,但通配符选项(例如通用通配符的 * 和作为单个字符的 ?),默认情况下似乎没有按预期工作,它们会很有用,即使词干和子字符串等可能是有用的。
例如:能够使用具有一定精度的标准简单野生字符搜索会很有趣,例如:medic* 用于医学医学药物或使用?对于单个字符
Omega 可以识别 Regexp 吗?例如:sep[ae]r[ae]te(\w+)? 或搜索结构化格式,例如电子邮件或信用卡号码或研究论文中的某些公式类型等。
在 Olly Betts 很久以前(开发邮件列表)的一份说明中,关于这个建议是 grep 索引文件,但这会破坏 Omega 的 RAD 优势。
任何使用带有通配符或正则表达式的 Omega 进行搜索的示例都将不胜感激......即使是一个页面的指示,该页面的有关此主题的信息也很好地展示了如何单独使用 Xapian 开发高级搜索的示例(PHP或者 Python 可能)。
(我们暂时不担心索引大小或索引存档时间的最终大幅增加)