我有一个 FASTA 格式的文件,它本质上是一个特殊的文本文件,包含许多条目,其中一个如下所示,我在 R 中用名称“FASTA”分配了它。原始文件是红色的,格式如下所示R 中的 seqinr 包。
FASTA<- structure(list(`tr|A1Z6G9|A1Z6G9_DROME` = structure("MSISASHPCGLNADGTATQYKESTATIQTSGLQSSPRSFLPEREDTLEYFIKFPKPSSKNEFVLAKDHDGEDSHVPIVMLLGWAGCQDRYLMKYSKIYEERGLITVRYTAPVDSLFWKRSEMIPIGEKILKLIQDMNFDAHPLIFHIFSNGGAYLYQHINLAVIKHKSPLQVRGVIFDSAPGERRIISLYRAITAIYGREKRCNCLAALVITITLSIMWFVEESISALKSLFVPSSPVRPSPFCDLKNEANRYPQLFLYSKGDIVIPYRDVEKFIRLRRDQGIQVSSVCFEDAEHVKIYTKYPKQYVQCVCNFIRNCMTIPPLKEAVNSEPSESVSRVNLKYD", name = "tr|A1Z6G9|A1Z6G9_DROME", Annot = ">tr|A1Z6G9|A1Z6G9_DROME CG8245 OS=Drosophila melanogaster GN=CG8245-RA PE=2 SV=1", class = "SeqFastaAA")))
现在虽然这种格式允许我获取条目/条目的名称索引,但当我使用 grep 搜索它时,如下所示
grep("A1Z6G9_DROME", names(FASTA))
或使用
as.vector(sapply(names(attributes(FASTA)), function(x) attr(FASTA, x)))
但是,我不能 grep/regexpr 属性部分中的任何文本/信息或隔离任何属性,例如 name= 或 Annot= 部分之后的文本。谁能帮我这个?
据我所知,当在 R 中使用谷歌搜索 read.fasta 时,与 seqinr 包相关的手册说明了一些注释/属性被忽略的内容(我认为),但这些属性部分包含有关条目身份的重要信息,我迫切需要!我已经尝试使用粘贴功能取消列出或折叠,但它们删除了我需要的所有属性!