1

熊猫:

data = data.dropna(axis = 'columns')

我正在尝试使用 cudf 数据框做类似的事情,但 api 不提供此功能。

我的解决方案是转换为 pandas df,执行上述命令,然后重新转换为 cudf。有更好的解决方案吗?

4

2 回答 2

2

cuDF 现在支持基于列的dropna,因此以下将起作用:

import cudf
​
df = cudf.DataFrame({'a':[0,1,None], 'b':[None,0,2], 'c':[1,2,3]})
print(df)
      a     b  c
0     0  null  1
1     1     0  2
2  null     2  3
df.dropna(axis='columns')
    c
0   1
1   2
2   3
于 2020-03-30T14:31:09.477 回答
1

实施之前dropna,您可以检查null_count每列的 并删除带有null_count>0.

于 2019-06-25T14:42:15.717 回答