Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
什么是测试给定文件是否为有效 FASTA 的简单方法:
valid_example.fasta
>genename1 atgcgtcactgNNNNNactgat >genename 2 ACACTTACAGGGCTAC >genename3 ATCCaACTACGGCTGGACTTGCGGCAT
我尝试了以下方法,但如果至少有 1 个有效基因,而不是所有基因,它会给出匹配
grep -Pli "(>.+\n[atgcn]\n+)*" valid_example.fasta
使用-v标志来反转匹配。然后检查是否有任何行匹配。
-v
你可能想做
grep -qv [other options] [pattern] $file || echo $file matches
正则表达式到核苷酸 fasta 格式:
>.+\n[acgtnACGTN\n]+