我无法在问题或 R 包中找到这个,希望是直截了当的。
取两个假设的基因序列:
Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA
我想让 R 代码生成两个序列之间单核苷酸的百分比差异(例如 15%)。
有什么想法吗?提前致谢。
我无法在问题或 R 包中找到这个,希望是直截了当的。
取两个假设的基因序列:
Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA
我想让 R 代码生成两个序列之间单核苷酸的百分比差异(例如 15%)。
有什么想法吗?提前致谢。
如果我正确理解你的问题,那么你只需要做一个简单的字符串比较。例如,
R> seq1 = c("A", "T", "G", "C", "G", "C",
"A", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "T")
R> seq2 = c("A", "T", "G", "G", "G", "C",
"T", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "A")
R> seq1 != seq2
[1] FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE TRUE
R> sum(seq1 != seq2)/length(seq1)*100
[1] 16.67
要以上述格式获取数据,请查看strsplit
函数。