我有一个从设备收集读数的数据框。有时同一样本有多个读数,并且在我的数据框中存储为单独的 ID。有没有办法让我通过使用具有相同值的列来检测重复的 ID?
示例数据框:
test_df = {'ID': [1,2,3,4,5,6], 'Age': [18,18,19,19,20,21], 'Sex':['Male','Male','Female','Female','Male','Female'], 'Values':[1200,200, 300, 400, 500,600]}
我希望结果返回 ID,因为当我们比较和列值1,2,3,4时它们是重复的。AgeSex
预期输出:
ID Age Sex Values
1 18 Male 1200
2 18 Male 200
3 19 Female 300
4 19 Female 400