我有一个 6 列的矩阵,例如:
c_1 C_2 A_1 A_2 D_1 D_2 ..
2 3 3 3 3 3 3
4 4 4 4 2 2 2
我想打破这三个具有相同前缀的矩阵:
c_1 c_2
2 3
4 4
A_1 A_2
3 3
4 4
我有一个 6 列的矩阵,例如:
c_1 C_2 A_1 A_2 D_1 D_2 ..
2 3 3 3 3 3 3
4 4 4 4 2 2 2
我想打破这三个具有相同前缀的矩阵:
c_1 c_2
2 3
4 4
A_1 A_2
3 3
4 4
假设矩阵中混合大小写的小写/大写c
是错字,这样的事情应该可以工作:
m <- matrix(1:12,2,6)
colnames(m) <- paste(rep(letters[1:3],each = 2),1:2,sep = '_')
out <- split.data.frame(t(m),f = substr(rownames(t(m)),1,1))
out <- lapply(out,t)
> out
$a
a_1 a_2
[1,] 1 3
[2,] 2 4
$b
b_1 b_2
[1,] 5 7
[2,] 6 8
$c
c_1 c_2
[1,] 9 11
[2,] 10 12
这有点取决于你到底想做什么。这里有一些例子:
mat <- structure(c(3L, 4L, 3L, 4L, 3L, 4L, 3L, 2L, 3L, 2L, 3L, 2L),
.Dim = c(2L,6L),
.Dimnames = list(c("2", "4"), c("c_1", "c_2", "A_1", "A_2","D_1", "D_2")))
如果您只想手动提取一些行,您可以使用
mat[,1:2]
mat[,3:4]
mat[,5:6]
如果您想根据列名的第一个字母来执行此操作,您可以手动选择您想要的列名:
mat[,substr(colnames(mat), 1, 1)=="A"]
或者你可以得到一个包含所有可能的列名的列表
lst <- lapply(unique(substr(colnames(mat),1,1)),
function(x) mat[,substr(colnames(mat), 1, 1)==x])
names(lst) <- unique(substr(colnames(mat),1,1))
lst
尝试类似:
library(stringr)
spl <- read.table(header=TRUE, text='
c_1 C_2 A_1 A_2 D_1 D_2 ..
2 3 3 3 3 3 3
4 4 4 4 2 2 2')
spl
names(spl) <- lapply(names(spl), tolower) # not sure if you want "c_1" w/ "C_2"
lapply(split(data.frame(t(spl)), str_extract(names(spl), "[A-Za-z]")), t)
# $a
# a_1 a_2
# X1 3 3
# X2 4 4
#
# $c
# c_1 c_2
# X1 2 3
# X2 4 4
#
# $d
# d_1 d_2
# X1 3 3
# X2 2 2
#or
lapply(split(data.frame(t(spl)), substr(names(spl), 1, 1)), t) # includes ".."