我正在尝试提取单词之间的字符串。考虑这个例子 -
x <- "There are 2.3 million species in the world"
这也可能采取另一种形式,即
x <- "There are 2.3 billion species in the world"
There
我需要'million
或之间的文本billion
,包括它们。百万或十亿的存在是由运行时间决定的,而不是事先决定的。所以我需要从这句话中得到的输出是
[1] There are 2.3 million
或者
[2] There are 2.3 billion
我正在使用包中的rm_between
功能qdapRegex
。使用此命令,我一次只能提取其中一个。
library(qdapRegex)
rm_between(x, 'There', 'million', extract=TRUE, include.markers = TRUE)
或者我必须使用
rm_between(x, 'There', 'billion', extract=TRUE, include.markers = TRUE)
我如何编写一个可以检查是否存在million
或billion
在同一个句子中的命令。像这样的东西-
rm_between(x, 'There', 'billion' || 'million', extract=TRUE, include.markers = TRUE)
我希望这很清楚。任何帮助,将不胜感激。