我有一个数据集,我想用更快的方法删除一些行。我试过下面的代码,但花了很长时间
我想删除所有少于 3 次操作的用户。
每个操作都存储在 user_id 不是我的数据 ID 的行中
undesirable_users=[]
for i in range(len(operations_per_user)):
if operations_per_user.get_value(operations_per_user.index[i])<=3:
undesirable_users.append(operations_per_user.index[i])
for i in range(len(undesirable_users)):
data = data.drop(data[data.user_id == undesirable_users[i]].index)
data
是一个数据框,operation_per_user
是由以下人员创建的系列:operation_per_user = data['user_id'].value_counts()
.