1

我在一家新公司工作,我们的目标之一是为我们的团队和客户实施文档搜索门户。我有点担心,如果我们在云中使用 Salesforce 或其他一些 ECM 等外部服务提供商,将来会有很多集成工作。从客户的角度来看,这些文档也将与我们的结构化内容存在于同一个存储桶中(存储在数据库中,而不是 MS Word 文档中)。

如果您实现了文档搜索,您使用了哪些语言、框架和技术?你有失败的故事吗?我使用开箱即用的东西没有问题,但我认为我们控制文档和访问它们的 API 很重要。如果我们完全定制,我想使用 Rails。

4

2 回答 2

2

根据您的许可需求,Lucene (LGPL) 和Xapian (GPL) 都是出色、成熟、快速的搜索引擎 API,具有多种语言的绑定。我已经成功地使用了它们。

于 2010-05-04T14:02:05.720 回答
1

Lucene可能是最安全的选择,因为它被广泛使用并且相当不错。

从 Lucene 中受益的最简单方法可能是使用Alfresco,它安装起来很容易,并且默认具有 Lucene。这意味着您只需要安装 Alfresco,将您的文档放入存储库,您就可以使用强大的网络搜索界面搜索您的文档。

如果您需要以编程方式搜索,我的建议是使用 Alfresco 的CMIS接口,它允许您以 REST 方式进行搜索。JCR API 也可用。

于 2010-06-11T03:18:28.723 回答