我正在尝试解析来自 samtools mpileup 的文本输出。我从一个字符串开始
s = '.$......+2AG.+2AG.+2AGGG'
每当我+
后面有一个整数n
时,我想选择该整数后面的 n 个字符并将整个内容替换为*
. 所以对于这个测试用例,我会有
'.$......+2AG.+2AG.+2AGGG' ---> '.$......*.*.*GG'
我有正则表达式 \+[0-9]+[ACGTNacgtn]+
,但这会导致输出.$......*.*.*
和尾随的 G 也丢失。如何选择 n 个字符,其中 n 事先不知道但在字符串本身中指定?