1

我有一个 16 列的 data.frame。这是一个示例行。

    > data[16,]
                      V1              V2              V3                 V4
    16 comp27182_c0_seq4 ENSP00000442096 ENSG00000011143 ENSFCAP00000011376
                       V5                V6                V7                V8
    16 ENSFCAG00000012261 comp48601_c0_seq1 comp19130_c0_seq3 comp22796_c2_seq3
                       V9 V10                V11                V12
    16 comp146901_c0_seq1     comp157916_c0_seq1 comp158124_c0_seq1
                      V13               V14 V15 V16
    16 comp229797_c0_seq1 comp61875_c0_seq2

我只对第 1 列和第 6-16 列感兴趣。第一列包含我想用作矩阵中列名的名称,6 到 16 可能包含字符串或“”(无)。我想将此 data.frame 转换为显示 1 或 0 的矩阵,以反映第 6-16 列中的内容。

                  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
comp27182_c0_seq4 1  1  1  1  0  1  1  1  1   0   0

我试图使用面具但没有成功。我敢肯定那里有一个非常简单的选择。

谢谢你的帮助。

4

2 回答 2

4

试试这个:

do.call(cbind, lapply(c(1,6:16), 
        function(x) as.numeric(nchar(as.character(data[,x])) > 0)))
于 2012-10-10T18:52:58.013 回答
0

我根据我的确切需要稍微修改了您的代码。现在第一列是命名行。

a<-do.call(cbind, lapply(c(6:16), 
        function(x) as.numeric(nchar(as.character(data[,x])) > 0)))
rownames(a)<-data[,1]

效果很好,谢谢!

于 2012-10-10T19:02:55.940 回答