r - R - 从列中的值中删除逗号并将分隔值放入新行中

Question

我有一列直接从数据库中检索到的基因符号，其中一些行包含两个或多个以逗号分隔的符号（参见下面的示例）。

SLC6A13
ATP5J2-PTCD1,BUD31,PTCD1
ACOT7
BUD31,PDAP1
TTC26

我想删除逗号，并将分隔符号放入新行，如下所示：

SLC6A13
ATP5J2-PTCD1
BUD31
PTCD1
ACOT7
BUD3
PDAP1
TTC26

我一直无法在 R 中找到直接的方法来做到这一点，有人有什么建议吗？

score 4 · Accepted Answer

您可以使用此向量结果放入矩阵或 data.frame：

vec <- scan(text="SLC6A13
 ATP5J2-PTCD1,BUD31,PTCD1
 ACOT7
 BUD31,PDAP1
 TTC26", what=character(), sep=",")
Read 8 items
 vec
[1] "SLC6A13"      "ATP5J2-PTCD1" "BUD31"        "PTCD1"        "ACOT7"        "BUD31"        "PDAP1"       
[8] "TTC26"

也许：

 as.matrix(vec)

（该scan函数也可以从文件中读取。“text”参数是最近才添加的，但它可以节省输入file=textConnection("...")。）

score 1 · Accepted Answer

另一种选择是使用readLinesand strsplit：

unlist(strsplit(readLines(textConnection(txt)),','))
 "SLC6A13"      "ATP5J2-PTCD1" "BUD31"        "PTCD1"        "ACOT7"        
 "BUD31"        "PDAP1"        "TTC26"

r - R - 从列中的值中删除逗号并将分隔值放入新行中

2 回答 2

Related

Reference