0

我知道有一些半相似的问题,但在这种情况下,我正在构建一个离线索引,直到构建完成。我正在从头开始构建两个核心,一个有大约 30 万条记录,有很多引文信息和大块全文(这是文档索引),另一个核心有大约 660 万条记录,有全文(这是页面索引)。

鉴于此索引是离线构建的,唯一真正的性能问题是构建速度。没有人应该查询这些数据。

如果我停止添加项目 50 秒,自动提交显然会触发?我不这样做。我一次添加十个,每隔几秒钟添加一次。

那么,我应该更频繁地提交吗?我觉得它运行的时间越长越慢,至少在我要索引的 6k 个文档的测试用例中。

由于没有人搜索此索引,有人建议我多久提交一次?

应该说我正在使用 Solr 3.1 和 SolrNet。

4

2 回答 2

0

尽管提交对您来说需要时间,但您可能需要考虑查看提交频率以外的其他调整。

是索引核心也在进行搜索,还是在索引结束后复制到其他地方?如果是后者,那么关闭缓存可能会对性能产生非常明显的影响(solr 每次提交时都会重建缓存)。

于 2011-04-12T13:23:40.133 回答
0

您还可以考虑使用 Solr 的 autoCommit 或 commitWith 功能。

于 2011-04-13T00:39:08.767 回答