我有一个带有以下格式的基因组箱的数据框。每个基因组范围表示为一行,并且单元格值对应于 bin 的开始。
0 1 2 3 4 5 ... 522
0 9248 9249 NaN NaN NaN NaN ... NaN
1 17291 17292 17293 17294 17295 NaN ... NaN
2 18404 18405 18406 18407 NaN NaN ... NaN
[69 rows x 522 columns]
如您所见,许多行值是不完整的,因为某些基因组范围比其他范围小。
我希望对整行中的每个索引进行成对组合。如果每个成对的交互都存储为一个单独的数据框(最好,甚至),那会很好。
我想要这样的东西:
0 - 1 Pairwise:
0 1
9248 17291
9248 17292
9248 17293
9248 17294
9248 17295
9249 17291
9249 17292
9249 17293
9249 17294
9249 17295
[10 rows x 2 columns]
0 - 2 Pairwise:
0 2
9248 18404
9248 18405
9248 18406
9248 18407
9249 18404
9249 18405
9249 18406
9249 18407
[8 rows x 2 columns]
我需要每个成对行组合的每个值组合。我想我需要使用 itertools.product() 来做这种事情,但不知道如何编写适当的循环。任何帮助是极大的赞赏!