我有一个包含 2 行样本 DNA 序列的文本文件,使用pcregrep
,我想找到匹配“CCC”的模式,尤其是跨越多行的模式 (参见 test.txt 中第 1 行的结尾到第 2 行的开头下面)。
测试.txt:
AGAGUGGCAAUAUGCGUAUAACGAUUAUUCUGGUCGCACCCGCCAGAGCAGAAAAUAUUGGGGCAGCGCC
CAUGCUGGGUCGCACAUGGAUCUGGUGAUAUUAUUGAUAAUAUUAAAGUUUUCCCGACAUUGGCUGAAUA
使用命令:
pcregrep -M --color "C[\n]?C[\n]?C" test.txt
回报:
AGAGUGGCAAUAUGCGUAUAACGAUUAUUCUGGUCGCA**CCC**GCCAGAGCAGAAAAUAUUGGGGCAGCG**CC**
**C**CAUGCUGGGUCGCACAUGGAUCUGGUGAUAUUAUUGAUAAUAUUAAAGUUUU**CCC**GACAUUGGCUGAAUA
它似乎正确地突出显示了第 1 行中的 2 个 C,但是,它突出显示了第 2 行中的第一个 C,然后继续完全打印出第二行;给我一份C的副本。
我在这里做错了什么,如何避免在第 2 行中重复“C”?