-1

我有一个 data.frame(9 列和 5 行),看起来像:

 List    Count 
  R472    1   RAP1GDS1    AKT1    ERC1    ZRSR2   SMAD4   ASXL1   NA
  R47     1   TCF12       DICER1  OLIG2   GATA3   CLP1    SMAD4   NA
  R844    2   RNF213      LHFP    MLLT6   TTL    SMARCA4   AKT2   TSC2
  R845    2   MLL         MYH9    FBXW7   VTI1A   CLP1     NF2    PIK3CA
  R975    2   TCF12       ELK4    PDE4DIP FANCG   ZRSR2   FAM123B FCRL4

我想根据“计数”列将数据分组,然后比较相应的元素以找出差异(并注释它们)和相似之处。例如:所需的输出:

 Count1      Common   How_many_similar   Differences   How_many_different
             SMAD4           1            RAP1GDS1             10  
                                            AKT1
                                            ERC1
                                            ....

谁能帮我?

谢谢。

4

1 回答 1

0

缺少有关如何构建输入数据的详细信息(dput那里会很棒!),很难提供准确的信息。毕竟,数据框不允许元素是列表,也不允许行具有不同的列数。所以很难说你是如​​何按数量将输入分成块的。

为了进行比较,我建议您将用于比较的所有数据转换为一个因子,然后使用table该因子来计算每个元素在给定向量中出现的次数。这意味着您必须简单地连接行,并且任何将单个组的行作为单个向量提供的数据结构都非常适合于此。

于 2012-10-17T15:48:27.717 回答