1

我有一个数据框,想为类别的频率创建一个自定义功能。如何使用 featuretools 自定义原语来实现这一点?

在 pandas 中,这如下所示:

df = pd.DataFrame({'category': ['a' ,'b', 'a']})
df['frequency' ] = df.groupby('category')['category'].transform('count')

df
|   | category | frequency |
|---|:--------:|----------:|
| 0 |     a    |         2 |
| 1 |     b    |         1 |
| 2 |     a    |         2 |

这似乎是这里问题的一个更普遍的例子,并且可能对 ft 新手有所帮助。


注意:这专门针对 featuretools 库和自定义原语,而不是关于计算数据框中的类别频率。

4

0 回答 0