我有一个看起来像这样的数据集(请注意,每个产品都有一个空格):
Client_ID Purchase
121212 "Orange_Juice Lettuce"
121212 "Banana Bread "
230102 "Banana Apple"
230102 "Chicken"
121212 "Chicken Bread"
301450 "Grapes Lettuce"
... ...
现在,我想知道每个人购买什么产品,对每个项目使用一个虚拟变量:
Client_ID Apple Banana Bread Chicken Grapes Lettuce Orange_Juice
121212 0 1 1 1 0 1 1
230102 1 1 0 1 0 0 0
301450 0 0 0 0 1 1 0
... ... ... ... ... ... ... ...
几周前我问了一个类似的问题,但我没有在同一行中有几个项目,就像这里的情况一样。所以我真的迷路了。我试图将项目分成多列,但这并不理想,因为每次购买可以有不同数量的项目(据我所知最多几十个)。
关于如何进行的任何想法?提前致谢!