-1

我有一个包含以下内容的文件“abc.txt”..

EMBOSS_001       601 FEDSESRRDSLFVPHRPGERRNSNGTTTETEVRKRRLSSYQISMEMLEDS    650
                          :...::.||...||....|..|.|....    |..:.|.|.|..:
EMBOSS_002         1 -----NPSLTVTVPIAVGESDFENLNTEEFSSE----SELEESKEKLNAT     41

EMBOSS_001       651 SGRQRS-MSIASILTNTMEELE-ESRQKCPPCW-------YRFANVFLIW    691
                     |..:.| :.:|........|:| |...|...|:       :.|..|....
EMBOSS_002        42 SSSEGSTVDVAPPREGEQAEIEPEEDLKPEACFTEGCIKKFPFCQVSTEE     91

我想创建三个字符串..第一个字符串“a”应该包含在 EMBOSS_001 (两行)之后写的所有字符,即

A="FEDSESRRDSLFVPHRPGERRNSNGTTTETEVRKRRLSSYQISMEMLEDSSGRQRS-MSIASILTNTMEELE-ESRQKCPPCW-------YRFANVFLIW"

第二个字符串应该在 EMBOSS_002 (两行)减去数字之后写下所有内容,即

B="-----NPSLTVTVPIAVGESDFENLNTEEFSSE----SELEESKEKLNATSSSEGSTVDVAPPREGEQAEIEPEEDLKPEACFTEGCIKKFPFCQVSTEE"

第三个字符串 C 应该是两行中 EMBOSS_1 和 EMBOSS_2(字母数字字符或 -)之间的任何内容

C="     :...::.||...||....|..|.|....    |..:.|.|.|..|..:.| :.:|........|:| |...|...|:       :.|..|...."

C 开头、结尾(如果有)和中间的原始空格应该是完整的。在这种情况下,5 个空格在开头,因为 C 从 A 的“F”和 B 的“-”开始

谢谢

4

1 回答 1

2

没有人会为您编写代码。但是,我会告诉您,您可能想要使用正则表达式/正则表达式(Python 中的“re”模块)。阅读http://docs.python.org/library/re.htmlhttp://docs.python.org/howto/regex.html

于 2011-07-02T11:17:07.630 回答