我正在使用 Python,我需要先“聚合”列“R”然后“J”,这样对于每个 R,每一行都是唯一的“J”。
我不想丢失 C 中的数据,所以我需要为 T=1 创建名为 C1 的新列,为 T=2 创建名为 C2 的新列,为 T=3 创建名为 C2 的新列,将相应的数据从 C 写入 C1, C2 或 C3 使用 T。
所以我需要从:
#______________ _______________________________
#| R J T C | |# R J C(T=1) C(T=2) C(T=3)|
#| a 1 1 x | |# a 1 x y z |
#| a 1 2 y | |# b 1 w |
#| a 1 3 z | -----> |# b 2 v |
#| b 1 1 w | |# b 3 s |
#| b 2 1 v | |# c 1 t r |
#| b 3 1 s | |# c 2 u |
#| c 1 1 t | |______________________________|
#| c 1 2 r |
#| c 2 1 u |
#|____________|
data = {'R': ['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c'],
'J': [1, 1, 1, 1, 2, 3, 1, 1, 2],
'T': [1, 2, 3, 1, 1, 1, 1, 2, 1],
'C': ['x', 'y', 'z', 'w', 'v', 's', 't', 'r', 'u'] }
df = pd.DataFrame(data=data)
PS。如果有帮助,J 列和 T 列都有一个具有唯一 ID 的额外列。
J_ID = [1,1,1,2,3,4,5,5,6]
T_ID = [1,2,3,4,5,6,7,8,9]
任何帮助将不胜感激。