我有一个数据框,想为类别的频率创建一个自定义功能。如何使用 featuretools 自定义原语来实现这一点?
在 pandas 中,这如下所示:
df = pd.DataFrame({'category': ['a' ,'b', 'a']})
df['frequency' ] = df.groupby('category')['category'].transform('count')
df
| | category | frequency |
|---|:--------:|----------:|
| 0 | a | 2 |
| 1 | b | 1 |
| 2 | a | 2 |
这似乎是这里问题的一个更普遍的例子,并且可能对 ft 新手有所帮助。
注意:这专门针对 featuretools 库和自定义原语,而不是关于计算数据框中的类别频率。