我想在这篇文章的开头说我是 R 和生物信息学编码的新手,我非常感谢这个知识渊博的社区提供的一些意见。我对下面发布的代码的目标是生成饼图,显示 BLAST 结果中每种蛋白质的氨基酸丰度。我从 UniProt 上传了一个 csv 文件,将其转换为矩阵,并写出下面的代码。我不断收到错误消息:在 AAs[i] = table(strsplit(BLAST_AA_seqs[i], "", useBytes = TRUE)) 中:要替换的项目数不是替换长度的倍数。第 8 列是包含氨基酸序列的输出列。提前致谢!
mydata=read.table("CDPKbeta_BLAST_results.csv",header=TRUE,sep=",")
mydata=as.matrix(mydata)
AAs=c()
BLAST_AA_seqs=c()
for(i in 1:nrow(mydata)){
print(i)
BLAST_AA_seqs[i]=mydata[i,8]
AAs[i]=table(strsplit(BLAST_AA_seqs[i],"", useBytes=TRUE))
pie(AAs, col=rainbow(length(AAs)), main="Residue abundance")
}