r - 使用 rm_between 提取复杂句子

Question

我正在使用rm_between（来自qdapregex）试图从下面的句子中提取文本（文本以粗体突出显示只是为了澄清问题，在原始数据集中，所有文本都是相同的。试图根据2个指定字符串之间的位置进行提取）。

需要提取：

\n解释\n酸增加，与节点有显着相关性。与 ber 一致。\ne由 KMN MA 签名，2020 年 6 月 1 日；数据；报告；

或提取这个

\n解释\n酸增加，与节点有显着相关性。与 ber 一致。\ne由 KMN MA 签名，2020 年 6 月 1 日；数据；报告；

我尝试了以下代码，但它们一直返回 NA

有什么建议么？我更喜欢使用相同的包（因为我已经从同一个数据集中提取了其他短语），但如果你建议我愿意尝试其他的

x$Impression2 = rm_between(x$nam, "Interpretations\\n", ";data", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "data;reports", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "[[:digit:]];data", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "\\d;data", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "\\d;data", fixed = FALSE, extract=TRUE)

x$Impression2 = rm_between_multiple(x$nam, "Interpretations\\n", "[ ]{2,}", extract=TRUE)

我认为问题在于我要提取的文本中有换行符，所以我想我可以将所有换行符更改为空格然后提取（例如使用此方法从使用 R 的字符串中删除所有换行符（输入符号））但我如果可能的话，更喜欢保留换行符，任何建议都非常感谢

谢谢你

r - 使用 rm_between 提取复杂句子

0 回答 0

Related

Reference