伙计们,
我被以下挑战难住了。我有一个如下所示的数据集:
BuyerID Fruit.1 Fruit.2 Fruit.3 Amount.1 Amount.2 Amount.3
879 Banana Apple 4 3
765 Strawberry Apple Orange 1 2 4
123 Orange Banana 1 1 1
11 Strawberry 3
773 Kiwi Banana 1 2
我想做的是简化数据(如果可能的话)并折叠“水果”和“金额”变量
BuyerID Fruit Amount Total Count
879 "Banana" "Apple" 4 3 7 2
765 "Strawberry" "Apple" "Orange" 1 2 4 7 3
123 "Orange" "Banana" 1 1 1 3 2
11 "Strawberry" 3 3 1
773 "Kiwi" "Banana" 1 2 3 2
我曾尝试使用 c() 和 rbind() 但它们没有产生我想要的结果 - 我在这里尝试过提示:data.frame rows to a list但我不太确定这是否是最好的方法简化我的数据。
这样一来,对于我来说,处理更少的变量来计算某些项目的出现可能会更容易(例如,60% 的买家购买香蕉)。
我希望这是可行的——我也愿意接受任何建议。任何解决方案表示赞赏!
谢谢你。