我有一个非常大的表,目前大约有 70M 行,并且每天增长数千,这个模式现在每天都在翻转,所以我正在移动到一个分区表并重新设计 ddl。
该表基本上是 NOT NULL INTEGERS(一些中等一些 INT 一些很小)的集合,它们需要对一组 7 列(表中的列更多)具有唯一约束,每次插入计算成本非常高,并且增加索引文件的大小要大得多,因为我从不检索它,我宁愿删除它,并且以某种方式 md5/也许简单地连接值......还不知道。
问题是唯一可以容纳如此大的唯一数字的列类型是 varchar 我在质疑这个 PK 是否真的会更好?另外,因为我将有一个 PRIMARY KEY 'part_key' (site_id,id) 我将不得不在分区的设计中采用唯一约束,总结一下......我确信这不是一个新问题,但我不是'无法找到比较两者的任何基准/文档,有人对这个问题有任何经验吗?问题是,当我从未通过 pk 检索或只是唯一字段的散列值 PS 时,PK 是否应该是整个 8 个字段(请记住,此表可能有超过 100M 行):检索主要是由 7 列中的两列完成磁盘大小不是问题,谢谢。