0

我正在使用rm_between(来自qdapregex)试图从下面的句子中提取文本(文本以粗体突出显示只是为了澄清问题,在原始数据集中,所有文本都是相同的。试图根据2个指定字符串之间的位置进行提取)。

需要提取:

\n解释\n酸增加,与节点有显着相关性。与 ber 一致。\ne由 KMN MA 签名,2020 年 6 月 1 日;数据;报告;

或提取这个

\n解释\n酸增加,与节点有显着相关性。与 ber 一致。\ne由 KMN MA 签名,2020 年 6 月 1 日;数据;报告;

我尝试了以下代码,但它们一直返回 NA

有什么建议么 ?我更喜欢使用相同的包(因为我已经从同一个数据集中提取了其他短语),但如果你建议我愿意尝试其他的

x$Impression2 = rm_between(x$nam, "Interpretations\\n", ";data", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "data;reports", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "[[:digit:]];data", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "\\d;data", extract=TRUE)

x$Impression2 = rm_between(x$nam, "Interpretations\\n", "\\d;data", fixed = FALSE, extract=TRUE)

x$Impression2 = rm_between_multiple(x$nam, "Interpretations\\n", "[ ]{2,}", extract=TRUE)


我认为问题在于我要提取的文本中有换行符,所以我想我可以将所有换行符更改为空格然后提取(例如使用此方法从使用 R 的字符串中删除所有换行符(输入符号))但我如果可能的话,更喜欢保留换行符,任何建议都非常感谢

谢谢你

4

0 回答 0