我想取一个包含值的列,通过一个条件分成两列,然后为这些分布生成 pmf 并绘制为直方图。
给定一列a
,通过创建一个新数据框的条件来拆分该列的最佳方法是什么?
import numpy as np
df = DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
我尝试使用原始的过滤系列创建一个新的 DataFrame .. 但这似乎不起作用:
DataFrame([df2[df2.a> 0.5].a, df2[df2.a <= 0.5].a], columns=("a_gt", "a_lt"))