我正在使用的数据库目前超过 100 GiB,并有望在未来一年左右变得更大。我正在尝试设计一个可以与我的数据集一起使用的分区方案,但到目前为止都失败了。我的问题是,针对这个数据库的查询通常会测试这个大表中多个列的值,最终导致结果集以不可预测的方式重叠。
每个人(与我一起工作的 DBA)都警告不要让表超过一定大小,我已经研究和评估了我遇到的解决方案,但它们似乎都依赖于允许逻辑表分区的数据特征。不幸的是,鉴于我的表格结构,我看不到实现这一目标的方法。
这是我们的两个主要表格的结构,以便对此进行透视。
Table: Case
Columns:
Year
Type
Status
UniqueIdentifier
PrimaryKey
etc.
Table: Case_Participant
Columns:
Case.PrimaryKey
LastName
FirstName
SSN
DLN
OtherUniqueIdentifiers
请注意,上面的任何列都可以用作查询参数。