我有一个有点像这样的数据集(显示的第一行):
Sample Detector Cq
P_1 106 23.53152
P_1 106 23.152458
P_1 106 23.685083
P_1 135 24.465698
P_1 135 23.86892
P_1 135 23.723469
P_1 17 22.524242
P_1 17 20.658733
P_1 17 21.146122
“Sample”和“Detector”列都包含重复值(“Cq”是唯一的):准确地说,每个“Detector”对于每个样本出现 3 次,因为它是数据中的重复。
我需要做的是:
- 重塑表格,使列包含样本和行检测器
- 重命名重复的列,以便我知道它是哪个副本
我认为这DataFrame.pivot
可以解决问题,但由于重复数据而失败。最好的方法是什么?重命名重复项,然后重塑,还是有更好的选择?
编辑:我考虑了一下,我认为最好说明目的。我需要为每个“样本”存储其“检测器”的平均值和标准偏差。