我有一个包含序列数据的文件,其中每个新段落(由两个空行分隔)都包含一个新序列:
#example
ASDHJDJJDMFFMF
AKAKJSJSJSL---
SMSM-....SKSKK
....SK
SKJHDDSNLDJSCC
AK..SJSJSL--HG
AHSM---..SKSKK
-.-GHH
我想得到一个看起来像这样的文件:
ASDHJDJJDMFFMFAKAKJSJSJSL---SMSM-....SKSKK....SK
SKJHDDSNLDJSCCAK..SJSJSL--HGAHSM---..SKSKK-.-GHH
每个序列的长度相同(如果有帮助的话)。
我还希望对存储在不同目录中的多个文件执行此操作。
我刚试过
sed -e '/./{H;$!d;}' -e 'x;/regex/!d' ./text.txt
但是这只是删除了整个文件:S
任何帮助都将不胜感激 - 不必在 sed 中,如果你知道如何在 perl 或其他东西中做到这一点,那也很棒。
谢谢。