0

我正在考虑为我的一个项目创建一个全文搜索引擎。我们有一个Mysql、Tokyo Tyrant 和需要索引的文件文档。

我现在正在查看 Sphinx,但我不知道是否可以使用它来索引每个文档。

我知道让 Sphinx 使用 Mysql 是可能的,但我正在寻找一种让 Sphinx 索引和查询 Tokyo Tyrant 以及索引文件文档的方法。

它可能是 Sphinx 或 Xapian 或另一个,但没有 JAVA(Lucene 已退出),但可以与 PHP 一起使用并在 Linux 上运行。

任何可以接受更多 Mysql 作为来源的搜索引擎的想法?

谢谢

4

2 回答 2

3

您可以使用xmlpipe2从任何来源将数据发送到 sphinx

您只需要编写一些代码(可能在 PHP 中)以从 Tokyo Tyrant 读取(不确定那是什么,所以您自己在那里)和文件系统并将其打包为 XML。然后,您只需设置您的 sphinx 源以运行一个执行您的自定义代码的命令,然后 sphinx 会负责其余的工作。

于 2009-09-24T12:57:02.167 回答
0

如果您没有太多文档,并且只想使用 PHP,您应该看看Zend_Search_Lucene

Zend_Search_Lucene 是一个完全用 PHP 5 编写的通用文本搜索引擎。由于它将索引存储在文件系统上并且不需要数据库服务器,它可以为几乎所有 PHP 驱动的网站添加搜索功能。

尽管如此,如果您使用自己的服务器,您可能可以安装软件,这意味着您可以部署 Sphinx 的 Lucence/SolR,即使它们不是仅用 PHP 编写的——如果您需要,这实际上可能是一个更安全的解决方案索引很多内容。

于 2009-09-24T03:29:18.960 回答