我正在尝试在分组数据集上应用函数。为此,我有这个 Pandas 数据框:
test_df = pd.DataFrame({
'A':list('aabdee'),
'AA':['2020-03-22', '2020-03-22', '2020-03-29', '2020-03-22','2020-03-22', '2020-03-29'],
'B':[1,0.5,4,5,5,4],
'C':[7,8,9,4,2,3],
'D':[1,3,1,7,1,1],
'E':[5,3,6,9,2,4]
})
我想将 Zscore 应用于每一列(按变量 A 和 AA 分组)。所以我做了:
numeric_columns = test_df.select_dtypes(np.number)
test_df.groupby(['A', 'AA'])[numeric_columns.columns].apply(stats.zscore)
但后来我有很多错误,像这样:
Series.name must be a hashable type
和这个:
RuntimeWarning: invalid value encountered in true_divide
return (a - mns) / sstd