0

I search a way to estimate indexing time, index size, search time with lucene library.

I have some number for 500 files and i would like to estimate value for 5000 document.

I search on the web and i don't found any good way to estimate theses number.

4

1 回答 1

0

答案很大程度上取决于您在索引中输入的内容。显然,如果您存储完整的字段内容,那么您至少可以预期线性增长,因子在 1 的一个数量级内。如果您只索引术语,您将需要更少的空间,但同时估计会变得更加困难。例如,唯一索引项的数量是一个非常重要的因素。这可能会在很大程度上取决于您的内容细节的某个数字开始趋于平稳。总而言之,在这种情况下,测量可能是您唯一可靠的方法。

于 2012-03-30T10:55:52.353 回答