4

我有以下类型的数据,尽管 data.frame 非常大。

A1 <- c("A/B", "A/A", "B/B", "A/A")
B1 <- c("B/B", "C/C", "C/B", "D/A")
C1 <- c("B/B", "C/C", "C/B", "D/A")
mydf <- data.frame (A1, B1, C1)
mymat <- as.matrix (mydf)
mymat
         A1    B1    C1   
[1,] "A/B" "B/B" "B/B"
[2,] "A/A" "C/C" "C/C"
[3,] "B/B" "C/B" "C/B"
[4,] "A/A" "D/A" "D/A"

我想将每列分成两个“/”是sperator。因此输出看起来像:

    A1a  A1b   B1a  B1b    C1a  C1b   
[1,] A   B      B    B     B     B 
[2,] A   A      C    C     C     C
[3,] B   B      C    B     C     B
[4,] A   A      D    A     D     A
4

4 回答 4

6

这是一个稍微有点迂回的方法。在字符之间添加“/”并将其作为分隔符读入:

splitdf <- read.table(text=capture.output(write.table(mydf, quote=FALSE, 
                                        sep="/",col.names=FALSE,row.names=FALSE)),
                       sep="/")
names(splitdf) <- paste( rep(names(mydf), each=2), c("a","b"), sep="")
 splitdf
#------------
  A1a A1b B1a B1b C1a C1b
1   A   B   B   B   B   B
2   A   A   C   C   C   C
3   B   B   C   B   C   B
4   A   A   D   A   D   A
于 2012-04-18T04:10:23.973 回答
4

这是使用 reshape2 的 colsplit 的一种解决方案:

require(reshape2)
mymat <- as.data.frame(mymat)

LS <- lapply(seq_along(mymat), function(i){
    colsplit(mymat[, i], "/", paste0(colnames(mymat)[i], letters[1:2]))
    }
)

do.call('cbind', LS)

产生:

  A1a A1b B1a B1b C1a C1b
1   A   B   B   B   B   B
2   A   A   C   C   C   C
3   B   B   C   B   C   B
4   A   A   D   A   D   A
于 2012-04-18T03:09:40.070 回答
4

以下应该在基础 R 中执行。

l <- apply(mymat, 2, function(m) data.frame(matrix(unlist(strsplit(m, '/')), ncol = 2, byrow = TRUE)))
do.call(cbind, l)
于 2012-04-18T03:24:42.280 回答
0

在我的“splitstackshape”包的无耻自我推销中,这是另一个解决方案:

您的数据(停在data.frame舞台上,而不是matrix像您在问题中所做的那样将其转换为 a ):

A1 <- c("A/B", "A/A", "B/B", "A/A")
B1 <- c("B/B", "C/C", "C/B", "D/A")
C1 <- c("B/B", "C/C", "C/B", "D/A")
mydf <- data.frame (A1, B1, C1)
mydf
#    A1  B1  C1
# 1 A/B B/B B/B
# 2 A/A C/C C/C
# 3 B/B C/B C/B
# 4 A/A D/A D/A

安装并加载“splitstackshape”包,并使用“concat.split.multiple”(它可以让你一次拆分多个列)来获得你想要的输出:

## install.packages("splitstackshape")
library(splitstackshape)
concat.split.multiple(mydf, 1:3, "/")
#   A1_1 A1_2 B1_1 B1_2 C1_1 C1_2
# 1    A    B    B    B    B    B
# 2    A    A    C    C    C    C
# 3    B    B    C    B    C    B
# 4    A    A    D    A    D    A
于 2013-08-26T16:40:31.503 回答