1

我正在尝试构建一个自定义函数来为给定字段生成摘要统计信息,如代码片段所示。

def estadistica_dt_summario(dt,col,por):
    dt_summary= dt[{'mean_of_specific_col':mean(col),'median_of_specific_col':median(col)},by(por)]
    return dt_summary

在哪里:

  • dt- 数据表框架对象
  • col- 要计算的字段(平均值、中位数等)
  • por- 要聚合的字段

在这里,我正在调用该函数。

estadistica_dt_summario(comida_dt,"co2_emission","food_category")

它没有按预期工作,您的任何人都可以让我知道如何以 pydatatable 方式实现它吗?

4

1 回答 1

1

你可以试试这个:

def estadistica_dt_summario(DT, col, por):
    dt_summary = DT[{'mean_of_specific_col': mean(f[col]),
                     'median_of_specific_col': median(f[col])},
                    by(f[por])]
    return dt_summary

f将字段传递给函数时,请记住使用表达式

于 2020-05-18T11:26:01.907 回答