我有一个大型地理空间数据集(约 30m 记录),我目前正在将其导入 PostgreSQL 数据库。我需要为每条记录分配一个唯一 ID,但递增整数可能不是一个好主意,因为如果我需要重新导入数据集,就无法可靠地重新创建它。
似乎确定投影中几何数据的唯一散列可能是可靠标识符的最佳选择。能够在 Postgres 中计算散列将是有益的,而且速度也将是有益的。
在这种情况下,我的选择是什么?有没有非常适合这种情况的特定方法?
我有一个大型地理空间数据集(约 30m 记录),我目前正在将其导入 PostgreSQL 数据库。我需要为每条记录分配一个唯一 ID,但递增整数可能不是一个好主意,因为如果我需要重新导入数据集,就无法可靠地重新创建它。
似乎确定投影中几何数据的唯一散列可能是可靠标识符的最佳选择。能够在 Postgres 中计算散列将是有益的,而且速度也将是有益的。
在这种情况下,我的选择是什么?有没有非常适合这种情况的特定方法?