1

我将第一次尝试索引和 Zend Lucene 搜索,考虑到性能,我想知道是否应该对数据库中的数据进行索引。如果是这样,什么时候(在哪种情况下)?

我的第一个目标是索引文档(pdf)以进行搜索。

在我们开发的应用程序的通讯模块中,用户可以通过输入关键字来搜索通讯。该应用程序搜索存储在数据库中的通信主题和内容,现在,它还使用索引搜索通信所附文档的内容。

这样,我必须在数据库和索引中进行搜索。

所以现在我想知道我是否应该索引通信的主题和内容(例如:UnIndexed Lucene Field)?会更快吗?考虑到文档和通信的数量会迅速增加,索引也是如此。

有人有这方面的经验吗?

4

1 回答 1

0

是的,引入您希望能够搜索的任何内容将是一个非常好的主意。您在搜索数据库和索引时遇到了一些问题。

首先,性能会更差。必须对两个不同的来源进行搜索通常会比将所有可搜索内容放在一个地方要慢得多。

其次,合并和排序搜索结果往往会出现问题。如果您正在使用相关性分数排序(并且如果您正在搜索全文内容,您可能应该这样做),那么合并来自两个不同来源的结果就变得很困难。您最终可能会得到一个不太有用的排序,以及另一个性能损失。

特别是如果您只是索引(而不是存储)您正在考虑添加到索引的内容,我认为没有理由不这样做。能够在索引中搜索您需要的任何内容将更加强大和快速。

于 2013-07-17T15:20:37.013 回答