我正在尝试使用 替换TSV
文件中的一些文本sed
,但我被正则表达式卡住了。
这是一行的示例:
0 NA intron (NR_045393, intron 2 of 2) intron (NR_045393, intron 2 of 2) 1089
我想替换intron (NR_045393, intron 2 of 2)
为intron
, 以获得:
0 NA intron intron 1089
要匹配的模式可以是内含子(NM_001081221, intron 1 of 20)
或intron (NM_144536, intron 5 of 15)
我尝试替换模式如下,但我正在努力做到这一点
sed -i 's/intron.(\([a-zA-Z0-9\/_]\+\)\/,\s[a-zA-Z]\s[0-9]\s[a-z]\s[0-9])/intron/g' test