1

我正在为我们的应用程序实现一个基于 lucene (Compass) 的搜索引擎,我们将部署到一个 vmware 环境。客户端告诉我,vmware 主机上的 I/O 性能非常糟糕,因此 lucene 的 JDBC 存储将优于索引文件的共享存储。我对此感到惊讶。

所以我想知道您是否可以选择,在集群环境中为 lucene 索引使用数据库或共享存储有哪些优点和缺点?它是否取决于预期的索引写入次数?

4

1 回答 1

0

我会要求一些数据来支持这个断言。数据库不也使用 I/O 吗?或者您的 JDBC 解决方案会连接到非虚拟化数据库实例吗?

您多久使用 Lucene 重新索引一次?如果您每天只使用单独的批处理作业执行一次,我看不出这会是什么问题。

我更喜欢 Lucene 而不是 JDBC,因为该解决方案需要搜索功能。尝试使用 SQL 和 LIKE 子句进行自由格式搜索。那似乎效率低得多。

如果这是一个大问题,请尝试一个小的基准。

于 2012-01-11T10:57:14.220 回答