在 python 2.7.3 上使用 pandas 0.11 我正在尝试使用以下值旋转一个简单的数据框:
StudentID QuestionID Answer DateRecorded
0 1234 bar a 2012/01/21
1 1234 foo c 2012/01/22
2 4321 bop a 2012/01/22
3 5678 bar a 2012/01/24
4 8765 baz b 2012/02/13
5 4321 baz b 2012/02/15
6 8765 bop b 2012/02/16
7 5678 bop c 2012/03/15
8 5678 foo a 2012/04/01
9 1234 baz b 2012/04/11
10 8765 bar a 2012/05/03
11 4321 bar a 2012/05/04
12 5678 baz c 2012/06/01
13 1234 bar b 2012/11/01
我正在使用以下命令:
df.pivot(index='StudentID', columns='QuestionID')
但我收到以下错误:
ReshapeError: Index contains duplicate entries, cannot reshape
请注意,没有最后一行的相同数据框
13 1234 bar b 2012/11/01
枢轴结果成功如下:
Answer DateRecorded
QuestionID bar baz bop foo bar baz bop foo
StudentID
1234 a b NaN c 2012/01/21 2012/04/11 NaN 2012/01/22
4321 a b a NaN 2012/05/04 2012/02/15 2012/01/22 NaN
5678 a c c a 2012/01/24 2012/06/01 2012/03/15 2012/04/01
8765 a b b NaN 2012/05/03 2012/02/13 2012/02/16 NaN
我是旋转的新手,想知道为什么重复的 StudentID、QuestionID 对会导致这个问题?而且,如何使用 df.pivot() 函数解决此问题?
谢谢你。