我们有一个产品(我们称之为“prod1”),我们想与另一个产品“集成”(我们称之为“prod2”),当“集成”意味着 prod1 + prod2 将是“prod3”时。我们还计划在 prod3 中添加更多“产品”。
到现在为止还挺好。
我们使用 Solr 为这两个产品中的用户提供搜索,并且两个索引都可能非常非常大,并且每秒接收很多电话。如果我们将所有内容都留在一台服务器中,吞吐量将是一团糟。
所以,我们正在考虑使用分片(我相信这是正确的术语,如果我错了,对不起),但是,我对此有一些疑问:
是否可以按“每台机器一个产品索引”或类似的方式拆分索引?如果是,你建议我怎么做?
如果(问题 1 == true)那么让我们假设 prod1 索引将是 machine1,prod2 索引 machine2,我可以在 machine1 和 2 中进行搜索“合并”结果与分数、偏移量等,“简单”和正确的方法?
我读了一些关于复制因子的东西,但我认为我理解不正确。它的具体目的是什么?
我不确定我是否在这里使用了正确的术语,所以,也许有人可以澄清一下究竟什么是核心、分片等。这种“简单”的疑问在我的团队中产生了很多误解。
到现在为止,这是个问题。也许我稍后会编辑它并添加更多。
提前致谢。