熊猫-> cuDF
将一些为 pandas 编写的 python 转换为在 Rapids 上运行
熊猫
temp=df_train.copy()
temp['buildingqualitytypeid']=temp['buildingqualitytypeid'].fillna(-1)
temp=temp.groupby("buildingqualitytypeid").filter(lambda x: x.buildingqualitytypeid.size > 3)
temp['buildingqualitytypeid'] = temp['buildingqualitytypeid'].replace(-1,np.nan)
print(temp.buildingqualitytypeid.isnull().sum())
print(temp.shape)
有人知道用什么代替pandas.Series.filter
相同的结果cuDF
吗?