更新:如果有人想知道,这两个答案都有效。它们都将实现汇总表,就像您在 Excel 中模拟 Sumifs 时创建的一样。这正是我一直在寻找的。再次感谢你们俩。
我有一个看起来像这样的数据框(df),但产品更多。
df$Yr
基于截止日期 >= 2012 年 3 月
Product Classif Yr Revenue
a paid_yes TRUE 25
a paid_yes TRUE 20
a paid_yes TRUE 35
a paid_yes FALSE 20
a paid_yes FALSE 30
a paid_yes FALSE 30
a paid_partial TRUE 15
a paid_partial TRUE 15
a paid_partial FALSE 18
a leased TRUE 12
a leased TRUE 12
a leased FALSE 14
a Other TRUE 27
a Other FALSE 30
a Other TRUE 25
a Other FALSE 22
a Other TRUE 32
a Other FALSE 30
a Other TRUE 24
a Other FALSE 27
b paid_yes TRUE 45
b paid_yes FALSE 32
b paid_yes TRUE 35
b paid_yes FALSE 39
b paid_partial FALSE 42
b paid_partial FALSE 45
b paid_partial TRUE 47
b paid_partial FALSE 33
b paid_partial FALSE 28
b leased TRUE 48
b leased FALSE 46
b leased FALSE 45
b leased TRUE 37
b leased FALSE 33
b leased TRUE 46
b leased FALSE 44
b Other TRUE 49
b Other FALSE 45
b Other TRUE 43
b Other FALSE 39
我正在尝试按产品(a、b、c 等)绘制小平面散点图。我希望我的 y 轴是,并且 x 轴是每个中df$Classif
的总百分比。或者换句话说,在给定年份的产品总收入中,每个分类占多少百分比?Revenue
Product
Yr
我希望我的摘要框架看起来像......
Product Classif Yr perc.rev
a paid_yes TRUE .332
a paid_partial TRUE .123
a leased TRUE .099
a Other TRUE .446
每个 perc.rev 加起来为 100%,给定一个Product
, Classif
, 和Yr
我尝试使用以下代码获取我的摘要数据集/列:
df.perc <- ddply(df, .(Product, Classif, Yr), summarise,
perc.rev = sum(Revenue)/count(Classif))
结果数据框为我提供了、和的平均收入。我需要的是一个给定的收入的百分比,与所有相比-由Product
Classif
Yr
Classif
Classif
Product
Year
我很确定我只需要一些关于我的 perc.rev 公式.variables
或ddply
. 我习惯了 Excel,通常会使用 2 个 sumifs 公式,但不确定如何在 R 函数中表达我需要在此处执行的操作。