我有一个包含以下内容的纯文本文件:
@M00964: XXXXX
YYY
+
ZZZZ
@M00964: XXXXX
YYY
+
ZZZZ
@M00964: XXXXX
YYY
+
ZZZZ
我想将其读入根据 ID 代码拆分为项目的列表@M00964
,即:
['@M00964: XXXXX
YYY
+
ZZZZ'
'@M00964: XXXXX
YYY
+
ZZZZ'
'@M00964: XXXXX
YYY
+
ZZZZ']
我试过使用
in_file = open(fileName,"r")
sequences = in_file.read().split('@M00964')[1:]
in_file.close()
但这会删除 ID 序列@M00964
。有什么办法可以保留这个 ID 序列吗?
作为另一个问题,是否有任何方法可以在列表中维护空白(而不是 /n 符号)。
我的总体目标是读入这组项目,以前 2 个项目为例,然后将它们写回保持所有原始格式的文本文件。