我遇到的问题是我有一个大型数据框(约 300,000 行),每个主题的多行代表不同条件下的给定值。简化版如下所示:
In [12]: df1
Out[12]:
SubID Condition Value
0 1 1 0.123
1 1 2 0.234
2 2 1 0.345
3 2 2 0.456
4 3 1 0.567
5 3 2 0.678
6 4 1 0.789
我还有第二张表,其中只有 80 行奇数行,其中包含受试者所属的基因组。
我希望将该数据添加到第一个 DataFrame。编码表的简化版本如下所示:
In [17]: df2
Out[17]:
Subject Number Genetic Group
0 1 A
1 2 C
2 3 A
3 4 B
我想要结束的是:
In [19]: df1
Out[19]:
SubID Condition Value Genetic Group
0 1 1 0.123 A
1 1 2 0.234 A
2 2 1 0.345 C
3 2 2 0.456 C
4 3 1 0.567 A
5 3 2 0.678 A
6 4 1 0.789 B
我可以使用 for: 循环,但想知道是否有使用任何 Pandas DataFrame 合并或加入操作的方法可以避免这种情况?非常感谢,