对大量分层数据进行分区是否有任何最佳实践/模式或一般建议?
比如说,一个特定国家/地区所有人的数据库,并跟踪谁与谁共事过。孤立地考虑“人”实体,如果要保存有关每个人的大量数据,那么一种自然的方法似乎是将总体划分为多个水平分区。然而,关系(谁与谁一起工作)可以(并且将)跨越分区a。随着数据变得越来越交叉链接,随着时间的推移,对这些关系进行聚类(例如,使用雇主作为分区键以最小化交叉分区引用)将不可行。这种集群还会导致不平衡的分区,这会妨碍可扩展性。
我现在很困惑,所以对于提供的任何帮助都会非常感激。
谢谢。