我有两个数据集要比较它们的相似性,比如 hapmap.table 和 crowd_genomes.table。我正在使用 merge() 函数搜索和检索类似的记录。但在 hapmap 文件中,染色体编号输入为 chr1 , chr2 等,而其他仅表示为数字。在合并之前如何从整个数据集中删除字符 chr,非常感谢。
问问题
159 次
1 回答
1
假设 chrom 是 hapmap.table 中的染色体编号列
gsub("^chr","",hapmap.table$chrom)
例子:
hh<-structure(list(hh = structure(1:3, .Label = c("chr12", "chr23",
"chr45"), class = "factor")), .Names = "hh", row.names = c(NA,
-3L), class = "data.frame")
hh
hh
1 chr12
2 chr23
3 chr45
hh$hh<- gsub("^chr","",hh$hh)
hh
hh
1 12
2 23
3 45
于 2013-10-18T21:08:59.223 回答