我正在尝试取消标记文本,但保留其标记。例如,我有这样的字符串:
. Lorem ipsum *dolor sit amet*, __consectetur adipisicing__ elit,
_sed do_ eiusmod tempor incididunt ut labore et __dolore magna aliqua__.
我使用正则表达式模式\s+[\*_]{1,2}(.*)[\*_]{1,2}
,但它也需要以空格和双下划线开头的错误条目,并在正确条目开始的地方结束。
如何编写满足以下要求的正则表达式:
- 它可以以单星号或双星号或单下划线或双下划线开头。
- 它必须是非贪婪的(标有“?”)。
- 它必须以与它开始的完全相同的组结束。