我有一个包含以下内容的文件“abc.txt”..
EMBOSS_001 601 FEDSESRRDSLFVPHRPGERRNSNGTTTETEVRKRRLSSYQISMEMLEDS 650
:...::.||...||....|..|.|.... |..:.|.|.|..:
EMBOSS_002 1 -----NPSLTVTVPIAVGESDFENLNTEEFSSE----SELEESKEKLNAT 41
EMBOSS_001 651 SGRQRS-MSIASILTNTMEELE-ESRQKCPPCW-------YRFANVFLIW 691
|..:.| :.:|........|:| |...|...|: :.|..|....
EMBOSS_002 42 SSSEGSTVDVAPPREGEQAEIEPEEDLKPEACFTEGCIKKFPFCQVSTEE 91
我想创建三个字符串..第一个字符串“a”应该包含在 EMBOSS_001 (两行)之后写的所有字符,即
A="FEDSESRRDSLFVPHRPGERRNSNGTTTETEVRKRRLSSYQISMEMLEDSSGRQRS-MSIASILTNTMEELE-ESRQKCPPCW-------YRFANVFLIW"
第二个字符串应该在 EMBOSS_002 (两行)减去数字之后写下所有内容,即
B="-----NPSLTVTVPIAVGESDFENLNTEEFSSE----SELEESKEKLNATSSSEGSTVDVAPPREGEQAEIEPEEDLKPEACFTEGCIKKFPFCQVSTEE"
第三个字符串 C 应该是两行中 EMBOSS_1 和 EMBOSS_2(字母数字字符或 -)之间的任何内容
C=" :...::.||...||....|..|.|.... |..:.|.|.|..|..:.| :.:|........|:| |...|...|: :.|..|...."
C 开头、结尾(如果有)和中间的原始空格应该是完整的。在这种情况下,5 个空格在开头,因为 C 从 A 的“F”和 B 的“-”开始
谢谢