我对这一切都很陌生,并且努力解决一些提出的难题。我感兴趣的领域是census data
。我目前正在做的是将数据从1901 and a 1911 censuses and merging
它们中取出到一个新的数据库中。然后我确定一个特定的人在两次人口普查中实际上是同一个人,一旦我确定 ID 为 55 的 1901 年 Jack Thelad(31 岁)与 ID 为 777 的 1911 年 Jack Thelad(41 岁)相同,那么最好的方法是什么处理主键问题?
1901 Jack Thelad ID55
1911 Jack Thelad ID777
MergedCensus Jack Thelad ID???
我是否应该将主键视为社会安全号码,在我的 MergedCensus 中为 Jack Thelad 分配一个号码,然后将该号码复制回 1901 年和 1911 年的数据中,从而有效地覆盖 ID55 和 ID77?