我目前索引了 120GB 的输入数据(不存储数据,只是 doc ID 和索引),索引完整数据集需要大约 12 小时的时间。
我们还没有将它投入生产,我想知道我需要什么时候开始考虑分片,将索引分离到多个服务器上?
对索引进行分片是索引大小的问题,还是仅仅是索引时间/磁盘空间/用户负载的问题?
随着我的索引增长到 200GB、300GB 的输入数据等,我会遇到内存限制吗?
我目前索引了 120GB 的输入数据(不存储数据,只是 doc ID 和索引),索引完整数据集需要大约 12 小时的时间。
我们还没有将它投入生产,我想知道我需要什么时候开始考虑分片,将索引分离到多个服务器上?
对索引进行分片是索引大小的问题,还是仅仅是索引时间/磁盘空间/用户负载的问题?
随着我的索引增长到 200GB、300GB 的输入数据等,我会遇到内存限制吗?