我在使用 R 中的正则表达式时遇到问题。目标是在 R 中解析 Markdown/reST/knitr 报告文本文件以删除我自己的自定义注释。这些评论以下列形式呈现:
Some sentence is about something <find a citation to this>.
由于 Markdown 使用 <> 作为 HTML 标签,我需要删除这些注释(使用我的自定义函数)以避免混淆。在我这样做之后,句子采用以下形式:
Some sentence is about something .
注意最后一个单词和点之间的空格。删除它很容易,但是文本可能包含包含 R 代码 (knitr) 的 reST 注释,其中以 开头..
:
.. {r chunk-name}
.. some R code
.. ..
所以基本上我需要替换“。” 在前一种情况下,但不是在后一种情况下。我虽然可以使用 R 正则表达式原子的重复修饰符来实现这一点:
gsub(pattern=" \\.{1}",replacement=".",x="Something ..")
[1] "Something.."
我期待这个表达式会匹配一个空格,后跟一个(但不是更多)点。但是,无论是一个点还是两个点,字符串都会被替换。我是一个真正的新手,所以可能遗漏了一些明显的东西。即便如此,任何帮助将不胜感激。
问候, 马克西姆