我有一个看起来像这样的数据集:
IDnum State Product Consumption
123 MI A 30
123 MI B 20
123 MI C 45
456 NJ A 15
456 NJ D 10
789 MI B 60
... ... ... ...
我想创建一个新的数据集,其中每个 IDnum 有一行,每个不同的产品都有一个新的虚拟变量(在我的真实数据集中,我有接近 1000 个产品),以及它的相关消耗。它看起来像这些行中的东西
IDnum State Prod.A Cons.A Prod.B Cons.B Prod.C Cons.C Prod.D Cons.D
123 MI yes 30 yes 20 yes 45 no -
456 NJ yes 15 no - no - yes 10
789 MI no - yes 60 no - no -
... ... ... ... ... ... ... ... ... ...
像“State”这样的一些变量在同一个 IDnum 内不会发生变化,但原始银行中的每一行都相当于一次购买,因此同一 IDnum 的“product”和“consumption”变量会发生变化。我希望我的新数据集在一行中显示每个客户的所有消费习惯,但到目前为止我失败了。
任何帮助将不胜感激。