我有几个序列要测试以查看它们是否存在于我的文件中,并且我想将它们提取到另一个文件中。序列以必须保留的唯一 ID 开头,并以我不想保留的“>”结尾。我做了一个测试,但我的正则表达式有问题
#!/bin/bash
cat data.fsa | grep "Qrob" | wc -l
for gene_id in 'gene1' 'gene2'
do
if cat "data.fsa" |grep $gene_id >/dev/null 2>&1
then
echo "data.fsa" | sed -n "s/.*${gene_id}\(.*\)>.*/\"\1\"/p"
else
continue
fi
done
我该怎么做呢?谢谢你的帮助