我在带有标识符列的 DataFrame 中有一些数据。
data = DataFrame({'id' : [50,50,30,10,50,50,30]})
对于每个唯一 ID,我想提出一个新的唯一标识符。我希望 id 是从 0 开始的连续整数。这是我到目前为止所拥有的:
unique = data[['id']].drop_duplicates()
unique['group'] = np.arange(len(unique))
unique.set_index('id')
data = data.merge(unique, 'inner', on = 'id')
这可行,但似乎有点脏。有没有更好的办法?