我正在尝试编辑文件的格式,不对,它看起来像这样:
>Cluster 0
L07510
>Cluster 1
AF480591
AY457083
>Cluster 2
M88154
>Cluster 3
CP000924
L09161
>Cluster 4
AY742307
>Cluster 5
L09163
L09162
>Cluster 6
AF321086
> Cluster 7
DQ66288691
我想在 python 中写一些东西,它将通过每一行,停在说“>Cluster x”(x 是一个数字)的行处,然后将该数字添加到它后面的任何行中。然后,当到达新的“>集群 x”时,它会以新的 x 值重新开始。
所以它看起来像这样:
>群集0
0 L07510
>簇1
1 AF480591
1 AY457083
>群集2 2
M88154 >
群集 3 3
CP000924
3 L09161 >
群集 4
4 AY742307
> DQ288691
我在想我可以使用regex
, 搜索">Cluster x"
(正则表达式会像这样吗?('\>Cluster \d+')
),然后让程序在匹配的正则表达式后面附加每一行\d+
。我只是不确定如何实际写这个。任何帮助将不胜感激!