我一直在试图操纵熊猫数据框。希望有人可以帮助我!
我有一个看起来像这样的 DataFrame:
Index Product ID Category Sale Amount
----- ------- -- -------- ---- ------
200 Prod1 01 Online Yes 100
201 Prod1 01 Offline Yes 150
202 Prod1 01 Online No 123
203 Prod1 01 Offline No 123
204 Prod1 02 Online Yes 198
205 Prod1 02 Offline Yes 175
206 Prod1 02 Online No 148
207 Prod1 03 Online No 193
208 Prod1 03 Offline No 134
我想要创建的是一个如下所示的 DataFrame:
Index Product ID Category Sale Amount Online-Sale Online-NoSale Offline-Sale Offline-NoSale
----- ------- -- -------- ---- ------ ----------- ------------- ------------ --------------
200 Prod1 01 Online Yes 100 100 0 0 0
201 Prod1 01 Offline Yes 150 0 0 150 0
202 Prod1 01 Online No 123 0 123 0 0
203 Prod1 01 Offline No 123 0 0 0 123
204 Prod1 02 Online Yes 198 198 0 0 0
205 Prod1 02 Offline Yes 175 0 0 175 0
206 Prod1 02 Online No 148 0 148 0 0
207 Prod1 03 Online No 193 0 193 0 0
208 Prod1 03 Offline No 134 0 0 0 134
DataFrame 中有 4 列额外的列,每列对应 (Category, Sale) 的一种组合。
我最终会将这个 DataFrame 进一步细分为:
Index Product ID Online-Sale Online-NoSale Offline-Sale Offline-NoSale
----- ------- -- ----------- ------------- ------------ --------------
200 Prod1 01 100 0 0 0
201 Prod1 01 0 0 150 0
202 Prod1 01 0 123 0 0
203 Prod1 01 0 0 0 123
204 Prod1 02 198 0 0 0
205 Prod1 02 0 0 175 0
206 Prod1 02 0 148 0 0
207 Prod1 03 0 193 0 0
208 Prod1 03 0 0 0 134
由于 Sale 和 Category 列是多余的,我可以去掉它们。
在今天的大部分时间里,我一直在研究这个问题,但我没有运气。我怀疑我被不同选择/切片方法的浅拷贝和深拷贝搞砸了。
谢谢!