0

我有一个数据框,其中有 2 条值很少的记录,我想用更多值的其他记录替换这些记录,制作一个副本。有谁知道如何在 pandas 或 vaex 上做到这一点?

图片

想将值 148 替换为值 140 有人帮忙吗?

编辑:我的数据框是这个

图片

我想用 day_of_week = 140 的值替换 day_of_week = 148 的所有值,因为 (day_of_week = 148) 有 1000 条记录, (day_of_week = 140) 有 200000 条记录

我想复制所有行 day_of_year == 140 并替换所有行 day_of_year == 148

4

1 回答 1

0

如果我理解正确,这在 vaex 中应该很简单:

df['new_col'] = df.func.where(df.day_of_week==148, 140, df.day_of_week)

在 vaex 中,新列将是虚拟的,即不占用任何内存。因此,如果您覆盖现有的,或者保留一个单独的映射并不重要(最好保留一个单独的,以防您稍后需要调试您的过程)。

我认为可以用熊猫做类似的事情,numpy.where就像我之前已经评论过的那样。

于 2020-11-04T11:28:06.690 回答