我得到了一大堆杂乱无章的数据来分析,现在我陷入了困境。我有一个 ~200 万行表,其非唯一标识符为 datatype varchar(50)
。此标识符对 a 是唯一的personID
。在我弄清楚我需要如何规范化这个垃圾之前,我现在有另一个问题可能对我有帮助:如果我将数据类型更改varchar(25)
为例如,这将有助于查询在非连接时运行得更快PK场?字符串中的所有字符都是整数,但尝试将它们转换为 int 会导致溢出。或者我可以暂时以某种方式索引该列以使某些查询运行得更快吗?
编辑:这personID
将是另一个表的外键,其中包含一个人的人口统计信息。