我有一个 490 行(特征;F1..F490)和 350 列(350 个样本;s1..s350)的矩阵。第一列如下所示:
Drug T T T C T
Sample s1 s2 s3 s4 s5 .....
Pair 16 81 -16 32 -81 .....
Cond B D B B D .....
F1 34 23 12 9 .....
F2 78 11 87 10 .....
...
(有数据缺失,正常)。
有2个条件;B 和 D。有 2 种药物(T 和 C)。样本是配对的。例如,s1 和 s3 是配对的,因为它们的 Pair 值相同(绝对值)。
我正在尝试做的是将药物标签排列 1000 次,同时保留配对信息(配对值)。因此,一对应始终具有相同的条件(本例中为 B)和相同的 Pair 值(本例中为 16 和 -16)。此外,它们必须具有相同的药物标签。例子; s1 和 s3 是一对;具有相同的 Pair 值,都是 B 并且都具有药物标签 T。
因此,1000 个置换文件中的 1 个应该如下所示:
Drug C T C T T
Sample s1 s2 s3 s4 s5 .....
Pair 16 81 -16 32 -81 .....
Cond B D B B D .....
F1 34 23 12 9 .....
F2 78 11 87 10 .....
...
我不介意样品是否按顺序排列。
我已经尝试过置换和采样(在 R 中),但在包含上述条件的同时,我似乎无法找到一种方法。如果这很明显,我很抱歉。
我想将这些置换文件 (n=1000) 用于我已经编码的下游分析。
非常感谢您的意见。